Yi-Cheng Lin

Um novo sistema pra avaliar o desempenho de codec de áudio em várias aplicações.

2025-08-22T23:15:10+00:00 ― 8 min ler

Analisando como os codecs mantêm os tons emocionais nos dados de voz.

2025-07-12T06:26:10+00:00 ― 6 min ler

Um novo conjunto de dados destaca os preconceitos em modelos de fala baseados em gênero e idade.

2025-06-30T19:07:50+00:00 ― 8 min ler

Esse artigo fala sobre métodos de treinamento eficientes para modelos de fala usando aprendizado auto-supervisionado.

2025-06-16T15:02:50+00:00 ― 5 min ler

O modelo MCMamba melhora a qualidade do som em ambientes barulhentos usando informações espaciais e espectrais.

2025-06-09T21:54:45+00:00 ― 5 min ler

Este estudo melhora os sistemas de reconhecimento de emoções para línguas menos comuns usando dados de alta qualidade.

2025-06-08T07:51:20+00:00 ― 7 min ler

Um olhar sobre os resultados do desafio Codec-SUPERB e as métricas de desempenho do codec.

2025-06-05T06:58:50+00:00 ― 6 min ler

Criando um modelo de IA pra conversas naturais em mandarim taiwanês.

2025-05-20T03:51:26+00:00 ― 5 min ler