Xuankai Chang

VoxtLM combina reconhecimento de fala, síntese, geração de texto e continuação em um só modelo.

2025-09-13T11:02:45+00:00 ― 5 min ler

Explorando os avanços na legendagem automática de áudio e seu impacto na acessibilidade.

2025-09-02T01:21:35+00:00 ― 5 min ler

Um novo modelo pra avaliar modelos de fundação em tarefas de fala.

2025-08-11T09:31:05+00:00 ― 9 min ler

Um novo modelo integra dados de áudio e visual para reconhecimento de fala e tradução.

2025-07-06T20:04:15+00:00 ― 7 min ler

A EVA combina sinais de áudio e visuais pra melhorar a precisão do reconhecimento de fala.

2025-06-07T22:08:20+00:00 ― 5 min ler