Aprenda sobre diarização de falantes online e sua importância em várias aplicações.
― 7 min ler
Ciência de ponta explicada de forma simples
Aprenda sobre diarização de falantes online e sua importância em várias aplicações.
― 7 min ler
Novas técnicas melhoram a modelagem de amplificadores de guitarra usando dados não emparelhados e GANs.
― 8 min ler
Apresentando a conversão de voz espacial para melhorar o realismo e a imersão do áudio.
― 7 min ler
Um novo sistema ajuda robôs a aprender tarefas usando áudio de demonstrações da vida real.
― 8 min ler
Um método simples pra criar vozes e controlar emoções na síntese de fala.
― 6 min ler
Uma nova abordagem pra melhorar a clareza do som usando técnicas avançadas de deep learning.
― 8 min ler
Técnicas inovadoras melhoram o design de alto-falantes e a direção do som.
― 5 min ler
Este estudo foca em melhorar a detecção de áudio deepfake usando métodos avançados.
― 5 min ler
Pesquisas mostram como o vídeo ajuda a melhorar o reconhecimento de fala em ambientes barulhentos.
― 6 min ler
Avanços na classificação de sons melhoram a precisão do reconhecimento de áudio.
― 6 min ler
Novo conjunto de dados melhora a geração de áudio a partir de descrições textuais detalhadas.
― 5 min ler
Um novo método ajuda modelos menores a se saírem melhor usando dicas de modelos maiores.
― 7 min ler
ElasticAST permite processar áudio de comprimento variável de forma eficiente sem perder detalhes importantes.
― 6 min ler
Uma nova abordagem melhora a detecção de clipes de áudio mistos, reais e falsos.
― 7 min ler
Um novo conjunto de dados que combina imagens, texto e áudio para pesquisa de cenários internos.
― 5 min ler
CADE melhora a detecção de áudio contra ameaças de spoofing em evolução usando técnicas de aprendizado contínuo.
― 8 min ler
Um novo conjunto de dados visa melhorar a captura de voz usando sensores de condução pelo corpo.
― 7 min ler
Uma equipe melhora o processamento de áudio para identificação de falantes e idiomas.
― 5 min ler
Um novo modelo de texto pra áudio usando só dados públicos.
― 6 min ler
Uma nova tecnologia simplifica a equalização de gravações de áudio.
― 5 min ler
Melhorando a qualidade do áudio em dispositivos através de técnicas de expansão de largura de banda.
― 7 min ler
Um novo método melhora a separação de vozes em ambientes barulhentos com vários falantes.
― 6 min ler
O Wavespace oferece ferramentas inovadoras para criar e controlar som de um jeito melhor.
― 7 min ler
A pesquisa foca em identificar discurso abusivo em gravações de áudio em várias línguas.
― 6 min ler
Um método pra criar áudios que combinam com vídeos em primeira pessoa.
― 9 min ler
Um estudo sobre como melhorar os métodos para detectar compressão de áudio com perdas e melhorar a qualidade do som.
― 7 min ler
Analisando técnicas pra proteger a privacidade enquanto analisa conversas gravadas.
― 6 min ler
Melhorando a reprodução de som binaural pra ter experiências de áudio melhores em vários dispositivos.
― 8 min ler
Novo modelo de aprendizado de máquina melhora as técnicas de separação de fontes de áudio.
― 6 min ler
Music2Latent simplifica a compressão de áudio, mantendo a qualidade alta para várias aplicações.
― 6 min ler
Um sistema pra melhorar a clareza da fala em ambientes barulhentos usando óculos inteligentes.
― 6 min ler
Um estudo sobre como identificar momentos de discurso de ódio em áudios usando técnicas novas.
― 6 min ler
Apresentando o PeriodWave, um modelo que melhora a velocidade e a qualidade da geração de áudio.
― 7 min ler
O PeriodWave-Turbo melhora a velocidade e a qualidade da geração de som em várias aplicações.
― 6 min ler
MAT-SED usa um modelo Transformer novo pra detecção eficaz de eventos sonoros.
― 6 min ler
Auptimize melhora a colocação de sons pra uma interação melhor do usuário em XR.
― 7 min ler
Malacopula questiona a confiabilidade das tecnologias de verificação automática de falantes.
― 7 min ler
Os clipes de áudio falsos são uma preocupação séria; métodos de detecção eficazes são essenciais.
― 7 min ler
Um novo método melhora a precisão na detecção de áudio sintético.
― 6 min ler
Um novo algoritmo melhora a segurança do áudio ao embutir mensagens secretas de um jeito menos perceptível.
― 6 min ler