Uma nova abordagem para legendagem de áudio reduz a dependência de dados pareados.
― 6 min ler
Ciência de ponta explicada de forma simples
Uma nova abordagem para legendagem de áudio reduz a dependência de dados pareados.
― 6 min ler
Novos métodos melhoram a forma como as máquinas reconhecem emoções na fala humana.
― 6 min ler
Investigando vulnerabilidades em métodos de marca d'água de áudio contra ameaças do mundo real.
― 9 min ler
PianoMotion10M oferece movimentos de mãos detalhados pra ajudar quem tá aprendendo piano.
― 7 min ler
Um novo modelo melhora a correspondência do som com as ações visuais em vídeos.
― 13 min ler
Novo modelo melhora experiências de áudio realista em ambientes virtuais.
― 8 min ler
Este estudo analisa métodos de áudio para rastrear o movimento de pedestres em áreas urbanas.
― 8 min ler
Um novo conjunto de dados melhora a criação de áudio foley para conteúdo multimídia.
― 7 min ler
Novos métodos melhoram o reconhecimento de fala em ambientes barulhentos usando técnicas adaptativas.
― 8 min ler
O SPEAR prevê o comportamento do som em espaços 3D usando uma coleta mínima de dados.
― 6 min ler
Um novo método melhora a tradução de fala em línguas misturadas para o inglês.
― 6 min ler
Um novo método melhora a precisão da verificação de falantes em ambientes de rádio difíceis.
― 8 min ler
Novo método foca em mudanças de ritmo para ataques de fala discretos.
― 6 min ler
A GAMA melhora o processamento de áudio juntando informações de som e linguagem.
― 7 min ler
O GigaSpeech 2 oferece um montão de dados pra línguas de baixo recurso pra melhorar o reconhecimento de fala.
― 6 min ler
Um novo modelo melhora a tecnologia de texto pra fala com eficiência e adaptação.
― 7 min ler
Um método novo que otimiza a análise e a síntese de fala usando os movimentos do trato vocal.
― 8 min ler
Esse estudo analisa como os gestos afetam o aprendizado com agentes virtuais.
― 8 min ler
Aprenda sobre diarização de falantes online e sua importância em várias aplicações.
― 7 min ler
Nova ferramenta de referência avalia tokens de áudio discretos para várias tarefas de processamento de fala.
― 10 min ler
Um novo método pra geração de música usando matrizes de auto-similaridade e sistemas de atenção.
― 8 min ler
Novas técnicas melhoram a modelagem de amplificadores de guitarra usando dados não emparelhados e GANs.
― 8 min ler
Um novo método pra entender como modelos de áudio fazem previsões.
― 6 min ler
Apresentando a conversão de voz espacial para melhorar o realismo e a imersão do áudio.
― 7 min ler
Pesquisas exploram como a análise da fala pode prever o risco de suicídio, levando em conta as diferenças de gênero.
― 6 min ler
Este artigo apresenta um sistema para criar visuais que respondem à música.
― 8 min ler
Um novo sistema ajuda robôs a aprender tarefas usando áudio de demonstrações da vida real.
― 8 min ler
Novos métodos melhoram a precisão em reconhecer sons sobrepostos de diferentes fontes de áudio.
― 7 min ler
Um novo método combina recursos acústicos e pontuações de confiança pra melhorar a correção de erros.
― 6 min ler
A SecureSpectra oferece uma nova maneira de proteger a identidade auditiva contra ameaças de deepfake.
― 6 min ler
Combinando física e geometria pra melhorar as previsões de dispersão acústica.
― 6 min ler
Um novo sistema pra tradução de fala precisa e rápida em várias línguas.
― 7 min ler
Um método simples pra criar vozes e controlar emoções na síntese de fala.
― 6 min ler
Melhorando o MMDenseNet pra separar música de forma rápida e eficiente.
― 6 min ler
Um novo método melhora o diálogo da máquina através de dados pseudo-estéreo.
― 7 min ler
Este estudo apresenta um conjunto de dados e um método pra melhorar a precisão do ASR chinês usando Pinyin.
― 8 min ler
Técnicas inovadoras melhoram o design de alto-falantes e a direção do som.
― 5 min ler
Este estudo foca em melhorar a detecção de áudio deepfake usando métodos avançados.
― 5 min ler
Usando interfaces visuais e modelos pra melhorar a geração de música.
― 6 min ler
Um novo esquema pra criar efeitos sonoros sincronizados em vídeos.
― 7 min ler