Descubra como a tradução em tempo real transforma a comunicação entre idiomas.
Sara Papi, Peter Polak, Ondřej Bojar
― 7 min ler
Ciência de ponta explicada de forma simples
Descubra como a tradução em tempo real transforma a comunicação entre idiomas.
Sara Papi, Peter Polak, Ondřej Bojar
― 7 min ler
Um modelo leve projetado pra separar fala misturada em ambientes barulhentos.
Shaoxiang Dang, Tetsuya Matsumoto, Yoshinori Takeuchi
― 6 min ler
Pesquisadores enfrentam a falsificação de áudio pra melhorar a segurança do reconhecimento de voz.
Xuechen Liu, Junichi Yamagishi, Md Sahidullah
― 10 min ler
Descubra como o AV-ASR combina áudio e visuais pra melhorar o reconhecimento de fala.
Yihan Wu, Yichen Lu, Yifan Peng
― 7 min ler
Um novo método tá transformando como as máquinas aprendem com música.
Julien Guinot, Elio Quinton, György Fazekas
― 7 min ler
Nova tecnologia transforma murmurinhos silenciosos em comunicação audível para quem precisa.
Neil Shah, Shirish Karande, Vineet Gandhi
― 7 min ler
Novos métodos em síntese de voz melhoram a clareza e a adaptabilidade para várias aplicações.
Neil Shah, Ayan Kashyap, Shirish Karande
― 9 min ler
Descubra a rica tradição dos cânticos da Igreja Ortodoxa Etíope Tewahedo.
Mequanent Argaw Muluneh, Yan-Tsung Peng, Li Su
― 8 min ler
Um novo conjunto de dados destaca a beleza dos cantos ortodoxos etíopes.
Mequanent Argaw Muluneh, Yan-Tsung Peng, Worku Abebe Degife
― 8 min ler
Novos avanços ajudam a tecnologia de reconhecimento de voz a atender melhor pessoas com distúrbios na fala.
Jimmy Tobin, Katrin Tomanek, Subhashini Venugopalan
― 7 min ler
Descubra como a ETTA transforma palavras em experiências sonoras criativas.
Sang-gil Lee, Zhifeng Kong, Arushi Goel
― 6 min ler
Uma nova perspectiva sobre como a música afeta nossas emoções.
Dengming Zhang, Weitao You, Ziheng Liu
― 8 min ler
Um novo modelo pra gerar danças em grupo sincronizadas e naturais.
Kaixing Yang, Xulong Tang, Haoyu Wu
― 10 min ler
Nova abordagem em reconhecimento de emoções foca nos movimentos da boca em vez dos sons.
Shreya G. Upadhyay, Ali N. Salman, Carlos Busso
― 7 min ler
Descubra como o Stable-TTS melhora a tecnologia de texto para fala, proporcionando uma experiência mais parecida com a humana.
Wooseok Han, Minki Kang, Changhun Kim
― 8 min ler
Tecnologia inovadora de ondas sonoras traz novas perspectivas sobre a velocidade de caminhada indoor.
Sheng Lyu, Chenshu Wu
― 7 min ler
Os assistentes de áudio estão ficando mais espertos com o AQA-K, melhorando as respostas através do conhecimento.
Abhirama Subramanyam Penamakuri, Kiran Chhatre, Akshat Jain
― 7 min ler
Pesquisadores estudam como nosso cérebro controla a fala e as implicações disso para a recuperação.
Eric Easthope
― 7 min ler
Descubra como o texto pode se transformar em áudio com modelos de ponta.
Chia-Yu Hung, Navonil Majumder, Zhifeng Kong
― 4 min ler