Unindo pistas de áudio e visuais pra melhorar o reconhecimento de fala em ambientes barulhentos.
― 6 min ler
Ciência de ponta explicada de forma simples
Unindo pistas de áudio e visuais pra melhorar o reconhecimento de fala em ambientes barulhentos.
― 6 min ler
A tecnologia de melhoria de áudio se adapta pra reduzir barulho e melhorar a comunicação.
― 5 min ler
Nova tecnologia combina som e imagens para melhorar a detecção de drones.
― 7 min ler
Uma nova abordagem combina fala e texto para fazer avaliações de disartria de forma mais eficaz.
― 6 min ler
Explorando novas tecnologias que detectam sons de fontes invisíveis.
― 6 min ler
Descubra como o Smooth-Foley aprimora a geração de áudio em vídeos.
― 6 min ler
Técnica inovadora conecta letras e melodias pra criar músicas melhores.
― 8 min ler
Aprimorando a compreensão das máquinas sobre a dinâmica de turnos de fala em diálogos humanos.
― 9 min ler
Explorando como a língua afeta a precisão na detecção de DeepFake em várias línguas.
― 7 min ler
A VERSA avalia a qualidade de fala, áudio e música de forma eficaz.
― 10 min ler
Descubra como os modelos de áudio-linguagem estão mudando a tecnologia de reconhecimento de som.
― 7 min ler
Novos métodos melhoram o diálogo natural na tecnologia de fala.
― 6 min ler
Descubra como o SpeechSSM transforma a geração de fala longa para interações melhores.
― 5 min ler
Descubra como a tradução em tempo real transforma a comunicação entre idiomas.
― 7 min ler
Um modelo leve projetado pra separar fala misturada em ambientes barulhentos.
― 6 min ler
Pesquisadores enfrentam a falsificação de áudio pra melhorar a segurança do reconhecimento de voz.
― 10 min ler
Descubra como o AV-ASR combina áudio e visuais pra melhorar o reconhecimento de fala.
― 7 min ler
Um novo método tá transformando como as máquinas aprendem com música.
― 7 min ler
Nova tecnologia transforma murmurinhos silenciosos em comunicação audível para quem precisa.
― 7 min ler
Novos métodos em síntese de voz melhoram a clareza e a adaptabilidade para várias aplicações.
― 9 min ler
Descubra a rica tradição dos cânticos da Igreja Ortodoxa Etíope Tewahedo.
― 8 min ler
Um novo conjunto de dados destaca a beleza dos cantos ortodoxos etíopes.
― 8 min ler
Novos avanços ajudam a tecnologia de reconhecimento de voz a atender melhor pessoas com distúrbios na fala.
― 7 min ler
Descubra como a ETTA transforma palavras em experiências sonoras criativas.
― 6 min ler
Uma nova perspectiva sobre como a música afeta nossas emoções.
― 8 min ler
Um novo modelo pra gerar danças em grupo sincronizadas e naturais.
― 10 min ler
Nova abordagem em reconhecimento de emoções foca nos movimentos da boca em vez dos sons.
― 7 min ler
Descubra como o Stable-TTS melhora a tecnologia de texto para fala, proporcionando uma experiência mais parecida com a humana.
― 8 min ler
Tecnologia inovadora de ondas sonoras traz novas perspectivas sobre a velocidade de caminhada indoor.
― 7 min ler
Os assistentes de áudio estão ficando mais espertos com o AQA-K, melhorando as respostas através do conhecimento.
― 7 min ler
Pesquisadores estudam como nosso cérebro controla a fala e as implicações disso para a recuperação.
― 7 min ler
Descubra como o texto pode se transformar em áudio com modelos de ponta.
― 4 min ler