Um novo sistema detecta gritos pra melhorar a segurança dos trabalhadores em canteiros de obras.
Bikalpa Gautam, Anmol Guragain, Sarthak Giri
― 9 min ler
Ciência de ponta explicada de forma simples
Um novo sistema detecta gritos pra melhorar a segurança dos trabalhadores em canteiros de obras.
Bikalpa Gautam, Anmol Guragain, Sarthak Giri
― 9 min ler
Explorando novas maneiras de reconhecer emoções na fala usando modelos avançados.
Pourya Jafarzadeh, Amir Mohammad Rostami, Padideh Choobdar
― 9 min ler
Um sistema novo pra misturar áudios e ajudar criadores de música a inovar de boa.
Christopher Tralie, Ben Cantil
― 6 min ler
Uma olhada em como a compressão de faixa dinâmica melhora as experiências de áudio.
Haoran Sun, Dominique Fourer, Hichem Maaref
― 6 min ler
Assistentes de voz ajudam a identificar sinais precoces de problemas de memória em idosos.
Nana Lin, Youxiang Zhu, Xiaohui Liang
― 8 min ler
Um sistema cria música em tempo real baseado em narrativas de jogos de interpretação de papéis de mesa.
Felipe Marra, Lucas N. Ferreira
― 8 min ler
Analisando os pontos fortes, fracos e o futuro do SLAM-ASR na reconhecimento de fala.
Shashi Kumar, Iuliia Thorbecke, Sergio Burdisso
― 5 min ler
Um novo método pra esclarecer e visualizar imagens de campo sonoro.
Risako Tanigawa, Kenji Ishikawa, Noboru Harada
― 8 min ler
Um projeto melhora o reconhecimento de fala pra língua Malasar usando recursos em Tamil.
Leena G Pillai, Kavya Manohar, Basil K Raju
― 5 min ler
Descubra como o som melhora as experiências virtuais através da renderização de volume acústico.
Zitong Lan, Chenhao Zheng, Zhiwei Zheng
― 9 min ler
Esse estudo usa análise de som pra identificar falhas em máquinas de forma eficaz.
Tito Spadini, Kenji Nose-Filho, Ricardo Suyama
― 6 min ler
Um novo modelo melhora a identificação e localização de sons de forma eficaz.
Jinbo Hu, Yin Cao, Ming Wu
― 8 min ler
AuscultaBase melhora a precisão no diagnóstico de condições de saúde usando dados de sons corporais variados.
Pingjie Wang, Zihan Zhao, Liudan Zhao
― 4 min ler
ArPA ajuda crianças que falam árabe a melhorar a pronúncia através de atividades interativas.
Lamia Berriche, Maha Driss, Areej Ahmed Almuntashri
― 5 min ler
Um novo conjunto de dados ajuda a encontrar música através de um diálogo amigável.
SeungHeon Doh, Keunwoo Choi, Daeyong Kwon
― 8 min ler
Juntando gravações de áudio com partituras pra praticar melhor.
Irmak Bukey, Michael Feffer, Chris Donahue
― 6 min ler
AEROMamba melhora áudio de baixa qualidade pra um som rico e de alta fidelidade.
Wallace Abreu, Luiz Wagner Pereira Biscainho
― 6 min ler
Um modelo de áudio-linguagem inovador ajuda a estudar os sons e comportamentos dos animais.
David Robinson, Marius Miron, Masato Hagiwara
― 8 min ler
Criando um modelo de IA pra conversas naturais em mandarim taiwanês.
Chih-Kai Yang, Yu-Kuan Fu, Chen-An Li
― 5 min ler
A Mamba melhora o reconhecimento de fala com rapidez e precisão, transformando a interação com os dispositivos.
Yoshiki Masuyama, Koichi Miyazaki, Masato Murata
― 5 min ler
Novo método melhora a clareza da fala usando informações visuais do ambiente.
Xinyuan Qian, Jiaran Gao, Yaodan Zhang
― 6 min ler
Explorando os desafios e as implicações da tecnologia deepfake no cenário midiático atual.
Ammarah Hashmi, Sahibzada Adil Shahzad, Chia-Wen Lin
― 8 min ler
Pesquisas mostram como as ondas cerebrais podem ajudar na comunicação silenciosa.
Soowon Kim, Ha-Na Jo, Eunyeong Ko
― 6 min ler
A pesquisa busca traduzir sinais do cérebro em vários tipos de fala.
Jung-Sun Lee, Ha-Na Jo, Seo-Hyun Lee
― 7 min ler
Novos modelos melhoram a detecção de vozes falsas na tecnologia de fala.
Yang Xiao, Rohan Kumar Das
― 5 min ler
Esse projeto tem como objetivo padronizar os dialetos bengaleses pra ter uma comunicação mais clara.
Md. Nazmus Sadat Samin, Jawad Ibn Ahad, Tanjila Ahmed Medha
― 7 min ler
A SAMOS oferece uma nova maneira de medir a qualidade da fala, melhorando a naturalidade.
Yu-Fei Shi, Yang Ai, Ye-Xin Lu
― 7 min ler
Explore a ciência fascinante por trás dos sons de bebidas sendo servidas.
Piyush Bagad, Makarand Tapaswi, Cees G. M. Snoek
― 5 min ler
Um novo sistema avalia vozes cantando usando afinação e espectro.
Yu-Fei Shi, Yang Ai, Ye-Xin Lu
― 6 min ler
Descubra como o deep learning molda as recomendações de música.
Aditya Sridhar
― 8 min ler
Aprenda como as máquinas classificam sons usando imagens de espectrograma.
Satvik Dixit, Laurie M. Heller, Chris Donahue
― 5 min ler
Descubra métodos inovadores de compressão de áudio e como eles impactam o som imersivo.
Toni Hirvonen, Mahmoud Namazi
― 5 min ler
A análise da voz pode ajudar a identificar sinais precoces de depressão em jovens.
Klaus R. Scherer, Felix Burkhardt, Uwe D. Reichel
― 7 min ler
Novos testes têm como objetivo melhorar a justiça nas avaliações de vozes de TTS.
Praveen Srinivasa Varadhan, Amogh Gulati, Ashwin Sankar
― 6 min ler
A pesquisa foca em ensinar os computadores a entender conversas sobre música.
Daeyong Kwon, SeungHeon Doh, Juhan Nam
― 5 min ler
Aprenda como a tecnologia interpreta nossas vozes através da análise de ondas sonoras.
Nirmal Joshua Kapu, Raghav Karan
― 7 min ler
Tiny-Align melhora assistentes de voz pra uma interação mais legal em dispositivos pequenos.
Ruiyang Qin, Dancheng Liu, Gelei Xu
― 7 min ler
FabuLight-ASD melhora a detecção de falantes juntando dados de áudio, visual e de movimento do corpo.
Hugo Carneiro, Stefan Wermter
― 5 min ler
Um sistema de som novinho consegue identificar de onde vem o som, melhorando a detecção em lugares barulhentos.
Erik Tegler, Magnus Oskarsson, Kalle Åström
― 5 min ler
Descubra como a comunicação melhora o trabalho em equipe e o desempenho nos esports.
Aymeric Vinot, Nicolas Perez
― 9 min ler