SpikeSCR combina eficiência e precisão no reconhecimento de comandos de voz usando redes neurais de pulso.
Jiaqi Wang, Liutao Yu, Liwei Huang
― 9 min ler
Ciência de ponta explicada de forma simples
SpikeSCR combina eficiência e precisão no reconhecimento de comandos de voz usando redes neurais de pulso.
Jiaqi Wang, Liutao Yu, Liwei Huang
― 9 min ler
Descubra como a IA facilita a coleta de dados de fala por meio de crowdsourcing.
Beomseok Lee, Marco Gaido, Ioan Calapodescu
― 6 min ler
Novos modelos identificam fala sintética e combatem o uso indevido da tecnologia de voz.
Mahieyin Rahmun, Rafat Hasan Khan, Tanjim Taharat Aurpa
― 6 min ler
Descubra como o CAMEL melhora a compreensão de conversas em línguas misturadas.
He Wang, Xucheng Wan, Naijun Zheng
― 7 min ler
Um novo método melhora o desempenho de RNNs no processamento de sequências.
Bojian Yin, Federico Corradi
― 7 min ler
Pesquisadores melhoram o reconhecimento de fala em suíço-alemão com uma geração de dados inovadora.
Vincenzo Timmel, Claudio Paonessa, Reza Kakooee
― 7 min ler
Saiba como o SpeechRAG melhora a resposta a perguntas em áudio sem erros de ASR.
Do June Min, Karel Mundnich, Andy Lapastora
― 6 min ler
Saiba como a anonimização de voz protege informações pessoais em um mundo movido pela tecnologia.
Natalia Tomashenko, Emmanuel Vincent, Marc Tommasi
― 7 min ler
Unindo pistas de áudio e visuais pra melhorar o reconhecimento de fala em ambientes barulhentos.
Zhaofeng Lin, Naomi Harte
― 6 min ler
A VERSA avalia a qualidade de fala, áudio e música de forma eficaz.
Jiatong Shi, Hye-jin Shim, Jinchuan Tian
― 10 min ler
Descubra como o AV-ASR combina áudio e visuais pra melhorar o reconhecimento de fala.
Yihan Wu, Yichen Lu, Yifan Peng
― 7 min ler
Nova tecnologia transforma murmurinhos silenciosos em comunicação audível para quem precisa.
Neil Shah, Shirish Karande, Vineet Gandhi
― 7 min ler
Novos métodos em síntese de voz melhoram a clareza e a adaptabilidade para várias aplicações.
Neil Shah, Ayan Kashyap, Shirish Karande
― 9 min ler