Uma visão geral das tecnologias de reconhecimento de palavras-chave e seus desafios com a língua urdu.
Syed Muhammad Aqdas Rizvi
― 7 min ler
Ciência de ponta explicada de forma simples
Uma visão geral das tecnologias de reconhecimento de palavras-chave e seus desafios com a língua urdu.
Syed Muhammad Aqdas Rizvi
― 7 min ler
Um estudo sobre como as escolhas de design afetam os modelos de fala.
Li-Wei Chen, Takuya Higuchi, He Bai
― 8 min ler
Este artigo fala sobre métodos para melhorar o reconhecimento de fala para sotaques.
Francesco Nespoli, Daniel Barreda, Patrick A. Naylor
― 6 min ler
Este estudo fala sobre os desafios em modelos de linguagem áudio para línguas com poucos recursos.
Potsawee Manakul, Guangzhi Sun, Warit Sirichotedumrong
― 6 min ler
Aprimorando a síntese de fala em línguas indianas usando unidades inter-pausais.
Anusha Prakash, Hema A Murthy
― 7 min ler
CADA-GAN melhora o desempenho dos sistemas de ASR em vários ambientes de gravação.
Chien-Chun Wang, Li-Wei Chen, Cheng-Kang Chou
― 7 min ler
Llama-AVSR junta áudio e vídeo pra melhorar a precisão do reconhecimento de fala.
Umberto Cappellazzo, Minsu Kim, Honglie Chen
― 8 min ler
Um novo método usa sombreamento virtual pra melhorar o feedback de pronúncia dos aprendizes de línguas.
Haopeng Geng, Daisuke Saito, Nobuaki Minematsu
― 7 min ler
Um novo método de ASR ajuda a tecnologia a entender melhor a fala das crianças.
Zhonghao Shi, Harshvardhan Srivastava, Xuan Shi
― 6 min ler
YOSS usa áudio pra melhorar a identificação de objetos em imagens.
Wenhao Yang, Jianguo Wei, Wenhuan Lu
― 5 min ler
Um projeto que tá desenvolvendo conjuntos de dados de fala e texto pra línguas com poucos recursos.
Nikola Ljubešić, Peter Rupnik, Danijel Koržinek
― 6 min ler
Um novo modelo melhora o reconhecimento de voz e se adapta a várias tarefas de fala.
Junyi Peng, Ladislav Mošner, Lin Zhang
― 5 min ler
Novos métodos melhoram o reconhecimento de fala para línguas de baixo recurso sem texto.
Krithiga Ramadass, Abrit Pal Singh, Srihari J
― 5 min ler
Novos métodos melhoram a precisão em sistemas de reconhecimento de fala usando entendimento fonético.
Leonid Velikovich, Christopher Li, Diamantino Caseiro
― 6 min ler
Novas características acústicas melhoram o desempenho dos sistemas de ASR em ambientes barulhentos.
Muhammad A. Shah, Bhiksha Raj
― 5 min ler
Novo modelo consegue transcrever fala mais rápido sem perder precisão.
Yael Segal-Feldman, Aviv Shamsian, Aviv Navon
― 5 min ler
Descubra como as embeddings Matryoshka melhoram a eficiência e flexibilidade do reconhecimento de falantes.
Shuai Wang, Pengcheng Zhu, Haizhou Li
― 6 min ler
Novo modelo VoiceGuider melhora TTS para diferentes falantes.
Jiheum Yeom, Heeseung Kim, Jooyoung Choi
― 7 min ler
Um novo método melhora o reconhecimento de fala para gravações longas.
Hao Yen, Shaoshi Ling, Guoli Ye
― 6 min ler
Novo método para modelos de linguagem falada reduz a necessidade de dados extensivos.
Ke-Han Lu, Zhehuai Chen, Szu-Wei Fu
― 7 min ler
Como novos métodos estão transformando a identificação de falantes em gravações de áudio.
Petr Pálka, Federico Landini, Dominik Klement
― 6 min ler
Saiba como o TSE melhora o reconhecimento de fala em ambientes cheios usando dicas de texto.
Ziyang Jiang, Xinyuan Qian, Jiahe Lei
― 6 min ler
Assistentes de voz ajudam a identificar sinais precoces de problemas de memória em idosos.
Nana Lin, Youxiang Zhu, Xiaohui Liang
― 8 min ler
A Mamba melhora o reconhecimento de fala com rapidez e precisão, transformando a interação com os dispositivos.
Yoshiki Masuyama, Koichi Miyazaki, Masato Murata
― 5 min ler
Novo método melhora a clareza da fala usando informações visuais do ambiente.
Xinyuan Qian, Jiaran Gao, Yaodan Zhang
― 6 min ler
A SAMOS oferece uma nova maneira de medir a qualidade da fala, melhorando a naturalidade.
Yu-Fei Shi, Yang Ai, Ye-Xin Lu
― 7 min ler
Tiny-Align melhora assistentes de voz pra uma interação mais legal em dispositivos pequenos.
Ruiyang Qin, Dancheng Liu, Gelei Xu
― 7 min ler
Apresentando o VQalAttent, um modelo mais simples pra gerar fala de máquina realista.
Armani Rodriguez, Silvija Kokalj-Filipovic
― 6 min ler
Um novo sistema de reconhecimento de fala melhora o reconhecimento médico pra um atendimento mais preciso com os pacientes.
Sourav Banerjee, Ayushi Agarwal, Promila Ghosh
― 7 min ler
Explorando como modelos de ASR ajudam a identificar deepfakes de voz de forma eficaz.
Davide Salvi, Amit Kumar Singh Yadav, Kratika Bhagtani
― 8 min ler
Rastreia os falantes de forma eficiente em ambientes multilíngues usando reconhecimento automático de fala.
Thai-Binh Nguyen, Alexander Waibel
― 7 min ler
Melhorando a transcrição de máquina pra entender melhor os distúrbios da fala.
Jiachen Lian, Xuanru Zhou, Zoe Ezzes
― 7 min ler
Novo modelo melhora significativamente a precisão do reconhecimento de fala em chinês.
Junhong Liang
― 7 min ler
A Noro melhora a conversão de voz, tornando-a eficaz até em ambientes barulhentos.
Haorui He, Yuchen Song, Yuancheng Wang
― 7 min ler
Um novo chatbot que oferece conversas parecidas com as humanas e com consciência emocional.
Aohan Zeng, Zhengxiao Du, Mingdao Liu
― 3 min ler
Descubra como a avaliação sem estilo melhora os sistemas de Reconhecimento Automático de Fala.
Quinten McNamara, Miguel Ángel del Río Fernández, Nishchal Bhandari
― 8 min ler
Aprenda como o dropout adaptativo melhora a eficiência em sistemas de reconhecimento de fala.
Yotaro Kubo, Xingyu Cai, Michiel Bacchiani
― 8 min ler
Pesquisas testam a habilidade da IA de se comunicar com crianças como cuidadores.
Jing Liu, Abdellah Fourtassi
― 7 min ler
Uma ferramenta de fala pra texto transforma matemática falada em LaTeX sem esforço.
Evangelia Gkritzali, Panagiotis Kaliosis, Sofia Galanaki
― 6 min ler
Revolucionando o texto-para-fala com vozes mais naturais e eficiência melhorada.
Haowei Lou, Helen Paik, Pari Delir Haghighi
― 7 min ler