Joon Son Chung

FlexiAST permite que modelos se adaptem a tamanhos de áudio variados de forma eficiente.

2025-10-07T09:56:55+00:00 ― 6 min ler

Melhorando a forma como identificamos fontes de som usando dados áudio-visuais.

2025-09-08T12:49:35+00:00 ― 7 min ler

Um novo método melhora a verificação de falantes gerenciando a variabilidade das sessões de forma eficaz.

2025-09-03T08:56:20+00:00 ― 7 min ler

Esse artigo fala sobre um método automatizado pra gerar trailers de filmes de forma eficiente.

2025-08-22T11:59:06+00:00 ― 8 min ler

Novos métodos melhoram a sumarização de vídeos usando grandes conjuntos de dados e modelos avançados.

2025-08-22T11:11:42+00:00 ― 8 min ler

ElasticAST permite processar áudio de comprimento variável de forma eficiente sem perder detalhes importantes.

2025-07-18T02:31:05+00:00 ― 6 min ler

Um estudo sobre como melhorar a localização de fontes sonoras aproveitando melhor as informações audiovisuais.

2025-07-14T06:12:35+00:00 ― 8 min ler

Uma visão geral dos avanços no reconhecimento de fala através do VoxCeleb Challenge.

2025-06-23T13:02:25+00:00 ― 5 min ler