Come i nuovi metodi stanno trasformando l'identificazione degli oratori nelle registrazioni audio.
Petr Pálka, Federico Landini, Dominik Klement
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Come i nuovi metodi stanno trasformando l'identificazione degli oratori nelle registrazioni audio.
Petr Pálka, Federico Landini, Dominik Klement
― 6 leggere min
Uno sguardo ai suoni tradizionali dell'arpa-lira seperewa.
Kelvin L Walls, Iran R Roman, Kelsey Van Ert
― 6 leggere min
Scopri come TSE migliora il riconoscimento vocale in ambienti affollati usando indizi testuali.
Ziyang Jiang, Xinyuan Qian, Jiahe Lei
― 6 leggere min
Un nuovo sistema rileva le urla per migliorare la sicurezza dei lavoratori nei cantieri.
Bikalpa Gautam, Anmol Guragain, Sarthak Giri
― 8 leggere min
Esplorare nuovi metodi per riconoscere le emozioni nel parlato usando modelli avanzati.
Pourya Jafarzadeh, Amir Mohammad Rostami, Padideh Choobdar
― 8 leggere min
Un sistema nuovo per unire campioni audio e aiutare i creatori di musica a innovare facilmente.
Christopher Tralie, Ben Cantil
― 5 leggere min
Uno sguardo a come la compressione della gamma dinamica migliora le esperienze audio.
Haoran Sun, Dominique Fourer, Hichem Maaref
― 6 leggere min
Gli assistenti vocali aiutano a identificare i primi segnali di problemi di memoria negli anziani.
Nana Lin, Youxiang Zhu, Xiaohui Liang
― 7 leggere min
Un sistema crea musica in tempo reale basata sulle narrazioni dei giochi di ruolo da tavolo.
Felipe Marra, Lucas N. Ferreira
― 7 leggere min
Esaminando i punti di forza, le debolezze e il futuro dello SLAM-ASR nel riconoscimento vocale.
Shashi Kumar, Iuliia Thorbecke, Sergio Burdisso
― 5 leggere min
Un nuovo metodo per chiarire e visualizzare le immagini del campo sonoro.
Risako Tanigawa, Kenji Ishikawa, Noboru Harada
― 7 leggere min
Un progetto migliora il riconoscimento vocale per la lingua Malasar usando risorse in Tamil.
Leena G Pillai, Kavya Manohar, Basil K Raju
― 5 leggere min
Scopri come il suono migliora le esperienze virtuali attraverso il rendering acustico.
Zitong Lan, Chenhao Zheng, Zhiwei Zheng
― 8 leggere min
Questo studio usa l'analisi del suono per identificare i guasti delle macchine in modo efficace.
Tito Spadini, Kenji Nose-Filho, Ricardo Suyama
― 5 leggere min
Un nuovo modello migliora l'identificazione e la localizzazione dei suoni in modo efficace.
Jinbo Hu, Yin Cao, Ming Wu
― 7 leggere min
AuscultaBase migliora l'accuratezza nella diagnosi di condizioni di salute utilizzando diversi dati sui suoni del corpo.
Pingjie Wang, Zihan Zhao, Liudan Zhao
― 4 leggere min
ArPA aiuta i bambini di lingua araba a migliorare la loro pronuncia tramite attività interattive.
Lamia Berriche, Maha Driss, Areej Ahmed Almuntashri
― 5 leggere min
Un nuovo set di dati aiuta a trovare musica attraverso un dialogo amichevole.
SeungHeon Doh, Keunwoo Choi, Daeyong Kwon
― 7 leggere min
Combinare registrazioni audio con spartiti per praticare meglio.
Irmak Bukey, Michael Feffer, Chris Donahue
― 6 leggere min
AEROMamba migliora l'audio di bassa qualità trasformandolo in un suono ricco e ad alta fedeltà.
Wallace Abreu, Luiz Wagner Pereira Biscainho
― 5 leggere min
Un modello audio-linguistico innovativo aiuta a studiare i suoni e i comportamenti degli animali.
David Robinson, Marius Miron, Masato Hagiwara
― 7 leggere min
Creare un modello di intelligenza artificiale per conversazioni naturali in mandarino taiwanese.
Chih-Kai Yang, Yu-Kuan Fu, Chen-An Li
― 5 leggere min
Mamba migliora il riconoscimento vocale con velocità e precisione, cambiando il modo di interagire con i dispositivi.
Yoshiki Masuyama, Koichi Miyazaki, Masato Murata
― 4 leggere min
Un nuovo metodo migliora la chiarezza del parlato usando informazioni visive dall'ambiente circostante.
Xinyuan Qian, Jiaran Gao, Yaodan Zhang
― 5 leggere min
Esplorando le sfide e le implicazioni della tecnologia deepfake nel panorama mediatico di oggi.
Ammarah Hashmi, Sahibzada Adil Shahzad, Chia-Wen Lin
― 7 leggere min
La ricerca svela come le onde cerebrali possano aiutare la comunicazione silenziosa.
Soowon Kim, Ha-Na Jo, Eunyeong Ko
― 6 leggere min
La ricerca cerca di tradurre i segnali cerebrali in vari tipi di linguaggio.
Jung-Sun Lee, Ha-Na Jo, Seo-Hyun Lee
― 6 leggere min
Nuovi modelli migliorano il riconoscimento delle voci false nella tecnologia del parlato.
Yang Xiao, Rohan Kumar Das
― 5 leggere min
Questo progetto punta a standardizzare i dialetti bangla per una comunicazione più chiara.
Md. Nazmus Sadat Samin, Jawad Ibn Ahad, Tanjila Ahmed Medha
― 6 leggere min
SAMOS offre un modo nuovo per misurare la qualità del parlato, migliorando la naturalezza.
Yu-Fei Shi, Yang Ai, Ye-Xin Lu
― 6 leggere min
Esplora la scienza affascinante dietro i suoni del versare le bevande.
Piyush Bagad, Makarand Tapaswi, Cees G. M. Snoek
― 5 leggere min
Un nuovo sistema valuta le voci cantate usando il tono e lo spettro.
Yu-Fei Shi, Yang Ai, Ye-Xin Lu
― 6 leggere min
Scopri come il deep learning modifica le raccomandazioni musicali.
Aditya Sridhar
― 7 leggere min
Scopri come le macchine classificano i suoni usando immagini di spettrogrammi.
Satvik Dixit, Laurie M. Heller, Chris Donahue
― 4 leggere min
Scopri metodi innovativi per la compressione audio e il loro impatto sul suono immersivo.
Toni Hirvonen, Mahmoud Namazi
― 5 leggere min
L'analisi della voce potrebbe aiutare a rilevare i segni precoci di depressione nei giovani.
Klaus R. Scherer, Felix Burkhardt, Uwe D. Reichel
― 7 leggere min
Nuovi test puntano a migliorare l'equità nelle valutazioni delle voci TTS.
Praveen Srinivasa Varadhan, Amogh Gulati, Ashwin Sankar
― 6 leggere min
La ricerca si concentra sull'insegnare ai computer a capire le conversazioni sulla musica.
Daeyong Kwon, SeungHeon Doh, Juhan Nam
― 5 leggere min
Scopri come la tecnologia interpreta le nostre voci attraverso l'analisi delle onde sonore.
Nirmal Joshua Kapu, Raghav Karan
― 6 leggere min
Tiny-Align migliora gli assistenti vocali per una migliore interazione personale su dispositivi piccoli.
Ruiyang Qin, Dancheng Liu, Gelei Xu
― 6 leggere min