O projeto EMO-SUPERB melhora o reconhecimento de emoção na fala com técnicas aprimoradas e colaboração da comunidade.
― 8 min ler
Ciência de ponta explicada de forma simples
O projeto EMO-SUPERB melhora o reconhecimento de emoção na fala com técnicas aprimoradas e colaboração da comunidade.
― 8 min ler
Um novo sistema pra avaliar o desempenho de codec de áudio em várias aplicações.
― 8 min ler
Um novo modelo pra avaliar modelos de fundação em tarefas de fala.
― 9 min ler
Analisando como os codecs mantêm os tons emocionais nos dados de voz.
― 6 min ler
Esse artigo fala sobre métodos de treinamento eficientes para modelos de fala usando aprendizado auto-supervisionado.
― 5 min ler
O modelo MCMamba melhora a qualidade do som em ambientes barulhentos usando informações espaciais e espectrais.
― 5 min ler
Este estudo avalia métodos de baixa latência para melhorar a qualidade do áudio em condições barulhentas.
― 8 min ler
Um olhar sobre os resultados do desafio Codec-SUPERB e as métricas de desempenho do codec.
― 6 min ler
O ESPnet-Codec melhora o treinamento e a avaliação de codecs neurais para áudio e fala.
― 8 min ler
Um novo método melhora a eficiência em cargas de atenção para sistemas de IA.
― 8 min ler
A VERSA avalia a qualidade de fala, áudio e música de forma eficaz.
― 10 min ler