Haibin Wu

AV-SUPERB avalia modelos de áudio e vídeo em várias tarefas pra melhorar o desempenho.

2025-09-08T22:32:35+00:00 ― 6 min ler

O projeto EMO-SUPERB melhora o reconhecimento de emoção na fala com técnicas aprimoradas e colaboração da comunidade.

2025-08-23T00:52:20+00:00 ― 8 min ler

Um novo sistema pra avaliar o desempenho de codec de áudio em várias aplicações.

2025-08-22T23:15:10+00:00 ― 8 min ler

Um novo modelo pra avaliar modelos de fundação em tarefas de fala.

2025-08-11T09:31:05+00:00 ― 9 min ler

Analisando como os codecs mantêm os tons emocionais nos dados de voz.

2025-07-12T06:26:10+00:00 ― 6 min ler

Esse artigo fala sobre métodos de treinamento eficientes para modelos de fala usando aprendizado auto-supervisionado.

2025-06-16T15:02:50+00:00 ― 5 min ler

O modelo MCMamba melhora a qualidade do som em ambientes barulhentos usando informações espaciais e espectrais.

2025-06-09T21:54:45+00:00 ― 5 min ler

Este estudo avalia métodos de baixa latência para melhorar a qualidade do áudio em condições barulhentas.

2025-06-09T20:17:35+00:00 ― 8 min ler

Um olhar sobre os resultados do desafio Codec-SUPERB e as métricas de desempenho do codec.

2025-06-05T06:58:50+00:00 ― 6 min ler

O ESPnet-Codec melhora o treinamento e a avaliação de codecs neurais para áudio e fala.

2025-06-03T03:09:30+00:00 ― 8 min ler

Um novo método melhora a eficiência em cargas de atenção para sistemas de IA.

2025-06-01T21:34:30+00:00 ― 8 min ler

A VERSA avalia a qualidade de fala, áudio e música de forma eficaz.

2025-01-28T09:33:18+00:00 ― 10 min ler