O RECAP usa técnicas avançadas pra gerar legendas de áudio precisas sem precisar de re-treinamento.
― 5 min ler
Ciência de ponta explicada de forma simples
O RECAP usa técnicas avançadas pra gerar legendas de áudio precisas sem precisar de re-treinamento.
― 5 min ler
Uma nova abordagem melhora a diarização de falantes ao integrar dados semânticos no processo.
― 6 min ler
Melhorando a forma como identificamos fontes de som usando dados áudio-visuais.
― 7 min ler
Uma nova abordagem avalia a qualidade do áudio usando vários microfones em diferentes ambientes.
― 6 min ler
Um novo método melhora a separação de som em diferentes frequências.
― 6 min ler
Explore os avanços em cancelamento de eco pra melhorar a qualidade das chamadas.
― 5 min ler
Investigando áudio deepfake pra melhorar modelos de transcrição pra línguas menos comuns.
― 10 min ler
Um método novo pra marcar áudio criado por modelos de difusão pra proteger a propriedade.
― 7 min ler
Estudo compara a precisão de localização do som em formatos de áudio de quatro canais e dois canais.
― 6 min ler
Um novo método de processamento de áudio melhora o anonimato do falante enquanto mantém a clareza da fala.
― 6 min ler
Apresentando novos modelos pra melhorar a extração de fala em ambientes barulhentos.
― 6 min ler
A Melodia da Synthia ajuda os pesquisadores a testarem modelos de áudio com dados variados.
― 6 min ler
A pesquisa foca em melhorar os sistemas de ASR para áudio não segmentado.
― 5 min ler
A pesquisa foca em otimizar sintetizadores para vocalizações humanas em diferentes mídias.
― 6 min ler
A pesquisa apresenta um método eficaz para melhorar a clareza da fala em ambientes barulhentos.
― 8 min ler
Saiba como os polinômios ultrasféricos melhoram a tecnologia de áudio e a direcionalidade do som.
― 7 min ler
Usando IA pra melhorar como a gente recria som em diferentes ambientes.
― 6 min ler
Aprenda sobre beamforming com valores reais e seus benefícios para arrays de microfone.
― 6 min ler
Descubra como os sistemas MIMO melhoram a análise de som em vários ambientes.
― 8 min ler
Novas técnicas melhoram a estimativa de direção do som para vários tipos de áudio.
― 6 min ler
Pesquisas mostram maneiras de ajustar o som nos cômodos pra melhorar a clareza.
― 5 min ler
Um estudo sobre síntese de som e sua avaliação em ambientes controlados.
― 5 min ler
A PAM oferece um jeito novo de medir a qualidade do áudio sem precisar de gravações de referência.
― 8 min ler
Um novo modelo melhora a compreensão de áudio espacial pelas máquinas.
― 5 min ler
Uma nova ferramenta ajuda os usuários a modificar sons facilmente através de instruções de texto simples.
― 10 min ler
Um novo sistema pra avaliar o desempenho de codec de áudio em várias aplicações.
― 8 min ler
Pesquisas mostram novos modelos pra melhorar a qualidade do áudio em vários ambientes.
― 8 min ler
O CLAPSep melhora a separação de som usando modelos pré-treinados e consultas do usuário pra ter mais precisão.
― 6 min ler
Explorando como a reconstrução do campo sonoro impacta as experiências de áudio em várias aplicações.
― 8 min ler
Novas ferramentas melhoram a edição de gravações de voz e a qualidade de produção.
― 6 min ler
Descubra como a equalização generativa dá uma nova vida a gravações antigas de músicas.
― 8 min ler
Um novo método melhora o processamento de som através da afinação automática de Redes de Atraso com Feedback.
― 7 min ler
Este estudo investiga a eficácia de modelos multilíngues na detecção de deepfakes em áudio.
― 6 min ler
Explorando métodos avançados para projeção de som em drivers de compressão.
― 6 min ler
Um estudo sobre como melhorar as saídas de áudio a partir de comandos de texto usando otimização de preferências.
― 8 min ler
Um novo codec de áudio que oferece compressão de alta qualidade e conteúdo semântico rico.
― 7 min ler
Um novo método melhora a edição de áudio usando modelos de difusão pra mudanças precisas.
― 6 min ler
Um novo sistema melhora a clareza da fala em ambientes com várias pessoas falando.
― 6 min ler
Novos métodos melhoram a clareza na separação de vozes de misturas de áudio.
― 5 min ler
Novo modelo melhora experiências de áudio realista em ambientes virtuais.
― 8 min ler