O BASS melhora a sumarização de áudio longo processando em blocos.
― 6 min ler
Ciência de ponta explicada de forma simples
O BASS melhora a sumarização de áudio longo processando em blocos.
― 6 min ler
Um novo método treina sistemas de legendagem de áudio usando só descrições em texto.
― 7 min ler
Uma nova estrutura melhora o aprendizado a partir de rótulos de dados incompletos.
― 7 min ler
Novas estratégias melhoram o aprendizado com rótulos fracos ao selecionar exemplos negativos relevantes.
― 7 min ler
A PAM oferece um jeito novo de medir a qualidade do áudio sem precisar de gravações de referência.
― 8 min ler
Novos métodos melhoram a compreensão das emoções humanas na fala pela máquina.
― 5 min ler
Este estudo avalia as habilidades de raciocínio de modelos de áudio-linguagem com uma nova tarefa.
― 9 min ler
Esse estudo analisa como diferentes métodos de resumo afetam a qualidade e o conteúdo.
― 6 min ler
Um novo framework melhora a precisão na confirmação da identidade vocal.
― 6 min ler