Explore dois métodos inovadores para alterar o timbre vocal usando Processamento Digital de Sinais.
― 5 min ler
Ciência de ponta explicada de forma simples
Explore dois métodos inovadores para alterar o timbre vocal usando Processamento Digital de Sinais.
― 5 min ler
Artigos mais recentes
Artigos mais recentes
Investigando como a tecnologia de voz pode evitar a participação duplicada de pacientes em testes.
― 8 min ler
Um novo conjunto de dados ajuda a identificar sinais de depressão e ansiedade por meio da análise da fala.
― 8 min ler
Novo método reconstrói som a partir de sinais do cérebro, revelando informações sobre o processamento auditivo.
― 6 min ler
Um guia pra usar modelos de IA pra música na plataforma Bela.
― 6 min ler
Um novo método avalia sistemas de ASR sem precisar de textos de referência.
― 5 min ler
NoRefER oferece um jeito novo de avaliar os resultados do reconhecimento de fala sem precisar de transcrições.
― 7 min ler
Esse artigo fala sobre um método pra melhorar as legendas de vídeo usando áudio.
― 7 min ler
Um novo modelo melhora a conversão de voz ao simplificar técnicas de separação de fala.
― 7 min ler
A pesquisa tem como objetivo combinar dados de áudio e simbólicos para analisar a similaridade musical.
― 8 min ler
Novos métodos melhoram a segmentação da fala em conversas multilíngues.
― 7 min ler
NoisyILRMA melhora a extração de som do ruído de fundo pra ter uma experiência de áudio mais clara.
― 5 min ler
Esse artigo fala sobre o papel do aprendizado auto-supervisionado na tecnologia musical.
― 6 min ler
Um novo framework melhora o ASR para línguas com poucos recursos e escalabilidade multilíngue.
― 6 min ler
Sistemas de ASR personalizados melhoram muito a comunicação para pessoas DHH.
― 6 min ler
Novos métodos usam resumos de conversas pra melhorar o reconhecimento de falantes.
― 6 min ler
Aprimorando sistemas de feedback para aprendizes de inglês resolvendo o problema do início frio.
― 7 min ler
Pesquisando métodos pra localizar fontes de som de turbinas eólicas pra reduzir o barulho.
― 5 min ler
Apresentando um novo modelo pra identificar técnicas de canto em faixas de áudio.
― 6 min ler
Um novo modelo melhora a extração de fala usando informações de áudio e vídeo.
― 7 min ler
A Wespeaker simplifica o reconhecimento de falantes com ferramentas fáceis de usar e modelos pré-treinados.
― 7 min ler
Um novo método transforma sinais mono em experiências estéreo envolventes.
― 7 min ler
Um estudo sobre como melhorar a detecção de emoções na fala para grupos diversos.
― 6 min ler
Esse artigo fala sobre como melhorar o reconhecimento de fala usando métodos de ensemble baseados em confiança.
― 6 min ler
Estudo usa dispositivo multi-dados pra rastrear padrões de sono de bebês de forma mais precisa.
― 5 min ler
O 3D-Speaker oferece uma enorme coleção de gravações de áudio para uma análise de fala avançada.
― 6 min ler
O GenerTTS melhora a tecnologia de texto-para-fala para aplicativos multilíngues.
― 6 min ler
Um novo sistema melhora a detecção de áudio manipulado com técnicas inovadoras.
― 6 min ler
Melhorar o reconhecimento de fala para vozes sobrepostas aumenta a usabilidade em várias situações.
― 6 min ler
Novos métodos melhoram a separação de vozes em ambientes de áudio misturado.
― 5 min ler
Descubra como novas técnicas melhoram a clareza da fala em ambientes barulhentos.
― 6 min ler
Um novo método pra deixar a síntese de voz mais personalizada usando menos dados de fala.
― 6 min ler
Novos métodos melhoram a localização do som usando matrizes de microfones distribuídas.
― 6 min ler
Este estudo analisa métodos para proteger a privacidade enquanto se analisa conversas faladas.
― 7 min ler
Ataques recentes de backdoor expõem riscos nas tecnologias de identificação por voz.
― 8 min ler
Um novo modelo melhora a extração de fala de fundos barulhentos usando aprendizado profundo.
― 5 min ler
O GOLF traz uma nova maneira de criar cantoria parecida com a humana usando menos recursos.
― 7 min ler
Pesquisa sobre como prever idade e gênero a partir de dados de voz usando modelos inovadores.
― 5 min ler
Um jeito novo de entender as relações musicais através de árvores de dependência.
― 7 min ler
Este artigo fala sobre novos modelos que melhoram a precisão do reconhecimento de fala considerando um contexto mais longo.
― 6 min ler
LyricWhiz junta modelos avançados pra melhorar a precisão da transcrição de letras em várias línguas.
― 7 min ler