Um novo conjunto de dados melhora a síntese de fala ao capturar a expressão emocional sem depender de texto.
― 6 min ler
Ciência de ponta explicada de forma simples
Um novo conjunto de dados melhora a síntese de fala ao capturar a expressão emocional sem depender de texto.
― 6 min ler
Um estudo sobre como melhorar as saídas de áudio a partir de comandos de texto usando otimização de preferências.
― 8 min ler
Um novo modelo melhora a correspondência do som com as ações visuais em vídeos.
― 13 min ler
Regras essenciais para enviar trabalhos para o NeurIPS 2024.
― 4 min ler