Novos métodos para selecionar dados de fala minimizam a rotulagem enquanto melhoram a precisão do reconhecimento.
― 6 min ler
Ciência de ponta explicada de forma simples
Novos métodos para selecionar dados de fala minimizam a rotulagem enquanto melhoram a precisão do reconhecimento.
― 6 min ler
Novos métodos melhoram a ligação entre descrições de texto e eventos sonoros.
― 8 min ler
A ELLA-V melhora a qualidade e o controle de texto para fala, superando os modelos anteriores.
― 6 min ler
Um novo modelo melhora a compreensão de áudio espacial pelas máquinas.
― 5 min ler
MuPT usa a notação ABC pra gerar música com IA de jeito eficaz.
― 6 min ler
O MAP-Neo busca transparência e desempenho na modelagem de linguagem em IA.
― 6 min ler
O GigaSpeech 2 oferece um montão de dados pra línguas de baixo recurso pra melhorar o reconhecimento de fala.
― 6 min ler
Um novo método melhora o desempenho do modelo de fala em várias tarefas.
― 7 min ler
O VQTalker cria avatares falantes realistas em várias línguas, melhorando as interações digitais.
― 8 min ler