Um novo sistema pra avaliar o desempenho de codec de áudio em várias aplicações.
― 8 min ler
Ciência de ponta explicada de forma simples
Um novo sistema pra avaliar o desempenho de codec de áudio em várias aplicações.
― 8 min ler
Analisando como os codecs mantêm os tons emocionais nos dados de voz.
― 6 min ler
Um novo conjunto de dados destaca os preconceitos em modelos de fala baseados em gênero e idade.
― 8 min ler
Esse artigo fala sobre métodos de treinamento eficientes para modelos de fala usando aprendizado auto-supervisionado.
― 5 min ler
O modelo MCMamba melhora a qualidade do som em ambientes barulhentos usando informações espaciais e espectrais.
― 5 min ler
Este estudo melhora os sistemas de reconhecimento de emoções para línguas menos comuns usando dados de alta qualidade.
― 7 min ler
Um olhar sobre os resultados do desafio Codec-SUPERB e as métricas de desempenho do codec.
― 6 min ler
Criando um modelo de IA pra conversas naturais em mandarim taiwanês.
― 5 min ler