VoxtLM combina reconhecimento de fala, síntese, geração de texto e continuação em um só modelo.
― 5 min ler
Ciência de ponta explicada de forma simples
VoxtLM combina reconhecimento de fala, síntese, geração de texto e continuação em um só modelo.
― 5 min ler
AV-SUPERB avalia modelos de áudio e vídeo em várias tarefas pra melhorar o desempenho.
― 6 min ler
Melhorando traduções em tempo real com métodos inovadores e políticas inteligentes.
― 6 min ler
Uma olhada nas melhorias em reconhecimento de fala pra aumentar a velocidade e a precisão.
― 6 min ler
Novos métodos melhoram a tradução de fala ao focar em informações contextuais.
― 6 min ler
Um novo método melhora o reconhecimento de voz para usuários que alternam entre idiomas.
― 5 min ler
Essa pesquisa apresenta um modelo pra melhorar a clareza da fala em diferentes condições.
― 6 min ler
Explorando os avanços na legendagem automática de áudio e seu impacto na acessibilidade.
― 5 min ler
Um novo método ajuda a preservar línguas em risco através de documentação detalhada.
― 9 min ler
Um novo modelo pra avaliar modelos de fundação em tarefas de fala.
― 9 min ler
Explorando estados de ouriço e antiouriço em materiais magnéticos únicos.
― 6 min ler
Um novo sistema melhora a clareza da fala em ambientes com várias pessoas falando.
― 6 min ler
Um novo modelo melhora o reconhecimento de fala usando vários métodos de decodificação.
― 8 min ler
Novos métodos melhoram a precisão e a eficiência nos sistemas de reconhecimento de fala.
― 7 min ler
Um novo modelo integra dados de áudio e visual para reconhecimento de fala e tradução.
― 7 min ler
Esse sistema traduz a fala em inglês pra texto em alemão na hora, pra uma comunicação tranquila.
― 6 min ler
Novas variantes da COVID-19 desafiam as vacinas atuais e mostram que ainda rola uma necessidade de pesquisa contínua.
― 5 min ler
Uma ferramenta fácil de usar pra ajustar modelos de fala sem precisar de código complicado.
― 7 min ler
Explorando o desafio GenSEC pra melhorar a precisão da transcrição de voz.
― 5 min ler
Novos métodos melhoram a precisão e a eficiência da tradução para várias línguas.
― 7 min ler
Descubra como o alinhamento de preferências melhora os sistemas de texto para fala, proporcionando experiências melhores para os usuários.
― 6 min ler
Um estudo mostra que i-vectors podem competir com modelos complexos em reconhecimento de fala.
― 5 min ler
Um estudo sobre como as escolhas de design afetam os modelos de fala.
― 8 min ler
A EVA combina sinais de áudio e visuais pra melhorar a precisão do reconhecimento de fala.
― 5 min ler
Um olhar sobre os resultados do desafio Codec-SUPERB e as métricas de desempenho do codec.
― 6 min ler
O ESPnet-Codec melhora o treinamento e a avaliação de codecs neurais para áudio e fala.
― 8 min ler
Novos métodos melhoram como as máquinas reconhecem a linguagem falada.
― 9 min ler
A VERSA avalia a qualidade de fala, áudio e música de forma eficaz.
― 10 min ler
Descubra como o AV-ASR combina áudio e visuais pra melhorar o reconhecimento de fala.
― 7 min ler