Novos métodos melhoram a detecção precoce de problemas de voz usando características da fonte glotal.
― 6 min ler
Ciência de ponta explicada de forma simples
Novos métodos melhoram a detecção precoce de problemas de voz usando características da fonte glotal.
― 6 min ler
Melhorando modelos de fala pra reconhecer e se adaptar melhor a diferentes sotaques.
― 5 min ler
DCLS melhora o desempenho na classificação de áudio aprendendo as posições do núcleo durante o treinamento.
― 5 min ler
Um novo método melhora o aprendizado de máquina de dados áudio-visuais.
― 6 min ler
Apresentando novos modelos pra melhorar a extração de fala em ambientes barulhentos.
― 6 min ler
Um novo método melhora a eficiência do reconhecimento de fala usando adaptação de baixo rank.
― 6 min ler
Juntando áudio, vídeo e texto pra melhorar as avaliações de saúde mental.
― 6 min ler
Uma olhada nas melhorias em reconhecimento de fala pra aumentar a velocidade e a precisão.
― 6 min ler
Melhorando a comunicação entre médico e paciente com tecnologias avançadas de reconhecimento de voz.
― 7 min ler
A Melodia da Synthia ajuda os pesquisadores a testarem modelos de áudio com dados variados.
― 6 min ler
A pesquisa foca em melhorar os sistemas de ASR para áudio não segmentado.
― 5 min ler
A pesquisa foca em otimizar sintetizadores para vocalizações humanas em diferentes mídias.
― 6 min ler
Um novo método melhora a verificação de falantes gerenciando a variabilidade das sessões de forma eficaz.
― 7 min ler
Os LLMs melhoram a precisão e a correção de erros em sistemas de reconhecimento de fala.
― 6 min ler
Um novo método melhora o reconhecimento de som e a localização da fonte sem precisar de rótulos.
― 6 min ler
Um novo padrão pra melhorar a precisão do ASR usando modelos de linguagem.
― 7 min ler
Novos métodos melhoram a tradução de fala ao focar em informações contextuais.
― 6 min ler
Um novo método melhora o reconhecimento de voz para usuários que alternam entre idiomas.
― 5 min ler
Aprenda como a análise de som ajuda a identificar problemas em máquinas de forma eficiente.
― 6 min ler
Esse projeto melhora a tradução de fala em tempo real e os sistemas automáticos de legendagem.
― 4 min ler
Explorando como a nitidez dos mínimos influencia o desempenho do modelo em dados de áudio não vistos.
― 6 min ler
Novo método melhora a verificação de falantes ao combinar dados de áudio e visuais.
― 6 min ler
Um estudo sobre como usar transformers para uma boa marcação e representação de música.
― 8 min ler
Um novo método melhora o rastreamento de falantes usando dados de áudio e vídeo.
― 7 min ler
Uma nova maneira de avaliar a dificuldade de música para piano usando imagens de partituras.
― 7 min ler
O PP-MeT quer melhorar a precisão na transcrição de reuniões com várias pessoas.
― 5 min ler
Essa pesquisa apresenta um modelo pra melhorar a clareza da fala em diferentes condições.
― 6 min ler
Explorando os avanços na legendagem automática de áudio e seu impacto na acessibilidade.
― 5 min ler
A pesquisa apresenta um método eficaz para melhorar a clareza da fala em ambientes barulhentos.
― 8 min ler
Um novo método simplifica a transferência de estilo de áudio usando efeitos não diferenciáveis.
― 8 min ler
A pesquisa analisa como a música feita por computador se compara à performance humana por meio de testes de audição.
― 8 min ler
Saiba como os polinômios ultrasféricos melhoram a tecnologia de áudio e a direcionalidade do som.
― 7 min ler
Um novo método melhora o reconhecimento de voz usando menos rótulos e recursos.
― 8 min ler
Novos métodos melhoram a ligação entre descrições de texto e eventos sonoros.
― 8 min ler
Métodos inovadores melhoram como os robôs processam a direção do som enquanto estão em movimento.
― 6 min ler
Aprenda sobre beamforming com valores reais e seus benefícios para arrays de microfone.
― 6 min ler
MusicAOG simplifica a criação e a compreensão da música através de uma representação gráfica inovadora.
― 7 min ler
Um novo framework pra combinar arrays de microfones e alto-falantes esféricos em estudos sonoros.
― 6 min ler
Um novo framework pra melhorar a detecção de som em robôs humanoides através do design de arranjos de microfone.
― 9 min ler
Descubra como os sistemas MIMO melhoram a análise de som em vários ambientes.
― 8 min ler