Melhorando a comunicação entre médico e paciente com tecnologias avançadas de reconhecimento de voz.
― 7 min ler
Ciência de ponta explicada de forma simples
Melhorando a comunicação entre médico e paciente com tecnologias avançadas de reconhecimento de voz.
― 7 min ler
Artigos mais recentes
Os LLMs melhoram a precisão e a correção de erros em sistemas de reconhecimento de fala.
― 6 min ler
Um novo método melhora o reconhecimento de som e a localização da fonte sem precisar de rótulos.
― 6 min ler
Um novo padrão pra melhorar a precisão do ASR usando modelos de linguagem.
― 7 min ler
Novos métodos melhoram a tradução de fala ao focar em informações contextuais.
― 6 min ler
Um novo método melhora o reconhecimento de voz para usuários que alternam entre idiomas.
― 5 min ler
Aprenda como a análise de som ajuda a identificar problemas em máquinas de forma eficiente.
― 6 min ler
Esse projeto melhora a tradução de fala em tempo real e os sistemas automáticos de legendagem.
― 4 min ler
Explorando como a nitidez dos mínimos influencia o desempenho do modelo em dados de áudio não vistos.
― 6 min ler
Novo método melhora a verificação de falantes ao combinar dados de áudio e visuais.
― 6 min ler
Um estudo sobre como usar transformers para uma boa marcação e representação de música.
― 8 min ler
Um novo método melhora o rastreamento de falantes usando dados de áudio e vídeo.
― 7 min ler
Uma nova maneira de avaliar a dificuldade de música para piano usando imagens de partituras.
― 7 min ler
O PP-MeT quer melhorar a precisão na transcrição de reuniões com várias pessoas.
― 5 min ler
Essa pesquisa apresenta um modelo pra melhorar a clareza da fala em diferentes condições.
― 6 min ler
Explorando os avanços na legendagem automática de áudio e seu impacto na acessibilidade.
― 5 min ler
A pesquisa apresenta um método eficaz para melhorar a clareza da fala em ambientes barulhentos.
― 8 min ler
Um novo método simplifica a transferência de estilo de áudio usando efeitos não diferenciáveis.
― 8 min ler
A pesquisa analisa como a música feita por computador se compara à performance humana por meio de testes de audição.
― 8 min ler
Saiba como os polinômios ultrasféricos melhoram a tecnologia de áudio e a direcionalidade do som.
― 7 min ler
Usando IA pra melhorar como a gente recria som em diferentes ambientes.
― 6 min ler
Um novo método melhora o reconhecimento de voz usando menos rótulos e recursos.
― 8 min ler
Novos métodos melhoram a ligação entre descrições de texto e eventos sonoros.
― 8 min ler
Métodos inovadores melhoram como os robôs processam a direção do som enquanto estão em movimento.
― 6 min ler
Aprenda sobre beamforming com valores reais e seus benefícios para arrays de microfone.
― 6 min ler
Uma nova abordagem para a geração de fala pequena, eficiente e com som natural.
― 10 min ler
MusicAOG simplifica a criação e a compreensão da música através de uma representação gráfica inovadora.
― 7 min ler
Um novo framework pra combinar arrays de microfones e alto-falantes esféricos em estudos sonoros.
― 6 min ler
Um novo framework pra melhorar a detecção de som em robôs humanoides através do design de arranjos de microfone.
― 9 min ler
Descubra como os sistemas MIMO melhoram a análise de som em vários ambientes.
― 8 min ler
Novas técnicas melhoram a estimativa de direção do som para vários tipos de áudio.
― 6 min ler
Pesquisas mostram maneiras de ajustar o som nos cômodos pra melhorar a clareza.
― 5 min ler
Um novo modelo identifica momentos engraçados em vídeos usando dados visuais, de áudio e de texto.
― 7 min ler
Elastômeros dielétricos transformam energia elétrica em movimento mecânico, oferecendo várias aplicações.
― 9 min ler
Transcrições de ASR com erros podem ajudar a identificar o Alzheimer de forma mais precisa.
― 9 min ler
A ELLA-V melhora a qualidade e o controle de texto para fala, superando os modelos anteriores.
― 6 min ler
Uma nova abordagem melhora a precisão na detecção de chamados de animais sem limites arbitrários.
― 8 min ler
Um novo modelo integra áudio e texto pra melhorar a classificação da fala.
― 8 min ler
Uma nova iniciativa pra melhorar a tecnologia de transcrição em reuniões em salas grandes.
― 9 min ler
Novos métodos melhoram a precisão no reconhecimento de fala ruidosa usando grandes modelos de linguagem.
― 7 min ler
Analisar os sons das galinhas ajuda a melhorar a saúde delas e a produtividade da fazenda.
― 9 min ler