Novo modelo melhora o reconhecimento de fala em ambientes barulhentos ao focar em um único falante.
― 4 min ler
Ciência de ponta explicada de forma simples
Novo modelo melhora o reconhecimento de fala em ambientes barulhentos ao focar em um único falante.
― 4 min ler
Modelos de linguagem modernos melhoram a precisão e a qualidade da normalização de texto.
― 5 min ler
A família Nemotron-4 340B oferece modelos poderosos para aplicações diversas e geração de dados sintéticos.
― 8 min ler
Um novo modelo melhora a clareza da fala, atacando ruídos e ecos.
― 6 min ler
O NEST oferece uma abordagem mais rápida e eficiente para tarefas de fala auto-supervisionadas.
― 7 min ler
O Sortformer integra diarização de falantes e ASR pra melhorar o processamento de áudio.
― 6 min ler
Explorando o desafio GenSEC pra melhorar a precisão da transcrição de voz.
― 5 min ler
Um novo framework simplifica o reconhecimento de fala em ambientes movimentados.
― 6 min ler
Novo método para modelos de linguagem falada reduz a necessidade de dados extensivos.
― 7 min ler
NeKo melhora a comunicação entre máquinas corrigindo erros de fala, traduções e texto.
― 7 min ler
A Star Attention melhora a forma como os modelos de linguagem lidam com longas sequências de texto.
― 5 min ler