Xie Chen

Novos métodos para selecionar dados de fala minimizam a rotulagem enquanto melhoram a precisão do reconhecimento.

2025-09-20T13:53:50+00:00 ― 6 min ler

A ELLA-V melhora a qualidade e o controle de texto para fala, superando os modelos anteriores.

2025-08-30T01:17:40+00:00 ― 6 min ler

Um novo modelo melhora a compreensão de áudio espacial pelas máquinas.

2025-08-26T15:30:45+00:00 ― 5 min ler

O AniTalker cria animações super realistas usando retratos e áudio, pegando as dinâmicas faciais bem sutis.

2025-08-13T18:14:24+00:00 ― 8 min ler

O GigaSpeech 2 oferece um montão de dados pra línguas de baixo recurso pra melhorar o reconhecimento de fala.

2025-07-29T02:29:15+00:00 ― 6 min ler

O BPE acústico melhora a inteligibilidade e a qualidade da fala em sistemas TTS.

2025-07-22T08:32:35+00:00 ― 7 min ler

Explorando a importância dos defeitos topológicos na física e na ciência dos materiais.

2025-07-15T04:02:54+00:00 ― 6 min ler

Um novo método melhora o desempenho do modelo de fala em várias tarefas.

2025-06-21T02:44:25+00:00 ― 7 min ler

O VQTalker cria avatares falantes realistas em várias línguas, melhorando as interações digitais.

2025-03-09T22:14:42+00:00 ― 8 min ler