Apresentando um novo modelo pra identificar técnicas de canto em faixas de áudio.
― 6 min ler
Ciência de ponta explicada de forma simples
Apresentando um novo modelo pra identificar técnicas de canto em faixas de áudio.
― 6 min ler
Um novo modelo melhora a extração de fala usando informações de áudio e vídeo.
― 7 min ler
A Wespeaker simplifica o reconhecimento de falantes com ferramentas fáceis de usar e modelos pré-treinados.
― 7 min ler
Um novo método transforma sinais mono em experiências estéreo envolventes.
― 7 min ler
Um estudo sobre como melhorar a detecção de emoções na fala para grupos diversos.
― 6 min ler
Estudo usa dispositivo multi-dados pra rastrear padrões de sono de bebês de forma mais precisa.
― 5 min ler
O 3D-Speaker oferece uma enorme coleção de gravações de áudio para uma análise de fala avançada.
― 6 min ler
O GenerTTS melhora a tecnologia de texto-para-fala para aplicativos multilíngues.
― 6 min ler
Um novo sistema melhora a detecção de áudio manipulado com técnicas inovadoras.
― 6 min ler
Melhorar o reconhecimento de fala para vozes sobrepostas aumenta a usabilidade em várias situações.
― 6 min ler
Novos métodos melhoram a separação de vozes em ambientes de áudio misturado.
― 5 min ler
Descubra como novas técnicas melhoram a clareza da fala em ambientes barulhentos.
― 6 min ler
Um novo método pra deixar a síntese de voz mais personalizada usando menos dados de fala.
― 6 min ler
Novos métodos melhoram a localização do som usando matrizes de microfones distribuídas.
― 6 min ler
Este estudo analisa métodos para proteger a privacidade enquanto se analisa conversas faladas.
― 7 min ler
Ataques recentes de backdoor expõem riscos nas tecnologias de identificação por voz.
― 8 min ler
Um novo modelo melhora a extração de fala de fundos barulhentos usando aprendizado profundo.
― 5 min ler
O GOLF traz uma nova maneira de criar cantoria parecida com a humana usando menos recursos.
― 7 min ler
Pesquisa sobre como prever idade e gênero a partir de dados de voz usando modelos inovadores.
― 5 min ler
Um jeito novo de entender as relações musicais através de árvores de dependência.
― 7 min ler
Este artigo fala sobre novos modelos que melhoram a precisão do reconhecimento de fala considerando um contexto mais longo.
― 6 min ler
LyricWhiz junta modelos avançados pra melhorar a precisão da transcrição de letras em várias línguas.
― 7 min ler
Um estudo sobre como usar gravações sonoras pra identificar diferentes espécies de pássaros na África.
― 7 min ler
Saiba como os sistemas de recomendação sugerem músicas com base nas preferências dos usuários.
― 6 min ler
Este artigo discute os desafios e técnicas para lidar com o desequilíbrio de dados na classificação de áudio.
― 7 min ler
Uma nova abordagem melhora o reconhecimento de fala em romeno usando inibição lateral.
― 6 min ler
Pesquisa destaca métodos para proteger a privacidade de gênero em áudio falado.
― 7 min ler
Um olhar sobre como capturar emoções por trás das palavras faladas de forma mais precisa.
― 5 min ler
Usar embeddings de áudio pré-treinados leva a modelos de classificação musical melhores.
― 8 min ler
Novo sistema melhora a clareza da fala em vídeos silenciosos através de um processamento aprimorado.
― 7 min ler
Descubra a mistura de arte e ciência ao estudar o mridangam.
― 8 min ler
Um novo método melhora o reconhecimento de palavras personalizadas em sistemas de ASR para idiomas com dados limitados.
― 6 min ler
Pesquisadores desenvolvem um modelo Conformer pra melhorar a detecção de áudio falso.
― 5 min ler
Novos métodos melhoram a detecção precoce do Alzheimer usando análise de fala e áudio.
― 8 min ler
Explore dados de som de 41 instrumentos musicais com gravações detalhadas.
― 7 min ler
Novas tecnologias melhoram a comunicação para pessoas com distúrbios de fala.
― 7 min ler
Um novo sistema combina transcrição e tradução pra melhorar a comunicação.
― 5 min ler
Whisper-AT junta reconhecimento de fala e marcação de áudio pra melhorar o desempenho.
― 7 min ler
Uma nova abordagem que combina fala com modelos de linguagem pra melhorar a tradução.
― 5 min ler
Novo método melhora a precisão na transformação de áudio de piano em partituras.
― 5 min ler