VoxtLM combina reconhecimento de fala, síntese, geração de texto e continuação em um só modelo.
― 5 min ler
Ciência de ponta explicada de forma simples
VoxtLM combina reconhecimento de fala, síntese, geração de texto e continuação em um só modelo.
― 5 min ler
Explorando os avanços na legendagem automática de áudio e seu impacto na acessibilidade.
― 5 min ler
Um novo modelo pra avaliar modelos de fundação em tarefas de fala.
― 9 min ler
Um novo modelo integra dados de áudio e visual para reconhecimento de fala e tradução.
― 7 min ler
A EVA combina sinais de áudio e visuais pra melhorar a precisão do reconhecimento de fala.
― 5 min ler