SAMOS offre un modo nuovo per misurare la qualità del parlato, migliorando la naturalezza.
Yu-Fei Shi, Yang Ai, Ye-Xin Lu
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
SAMOS offre un modo nuovo per misurare la qualità del parlato, migliorando la naturalezza.
Yu-Fei Shi, Yang Ai, Ye-Xin Lu
― 6 leggere min
Articoli più recenti
Piyush Bagad, Makarand Tapaswi, Cees G. M. Snoek
― 5 leggere min
Yu-Fei Shi, Yang Ai, Ye-Xin Lu
― 6 leggere min
Satvik Dixit, Laurie M. Heller, Chris Donahue
― 4 leggere min
L'analisi della voce potrebbe aiutare a rilevare i segni precoci di depressione nei giovani.
Klaus R. Scherer, Felix Burkhardt, Uwe D. Reichel
― 7 leggere min
Nuovi test puntano a migliorare l'equità nelle valutazioni delle voci TTS.
Praveen Srinivasa Varadhan, Amogh Gulati, Ashwin Sankar
― 6 leggere min
La ricerca si concentra sull'insegnare ai computer a capire le conversazioni sulla musica.
Daeyong Kwon, SeungHeon Doh, Juhan Nam
― 5 leggere min
Scopri come la tecnologia interpreta le nostre voci attraverso l'analisi delle onde sonore.
Nirmal Joshua Kapu, Raghav Karan
― 6 leggere min
Tiny-Align migliora gli assistenti vocali per una migliore interazione personale su dispositivi piccoli.
Ruiyang Qin, Dancheng Liu, Gelei Xu
― 6 leggere min
FabuLight-ASD migliora il riconoscimento degli speaker combinando dati audio, visivi e di movimento del corpo.
Hugo Carneiro, Stefan Wermter
― 5 leggere min
Un nuovo impianto audio identifica le direzioni dei suoni, migliorando il rilevamento in ambienti rumorosi.
Erik Tegler, Magnus Oskarsson, Kalle Åström
― 4 leggere min
Scopri come la comunicazione migliora il lavoro di squadra e le performance negli esports.
Aymeric Vinot, Nicolas Perez
― 8 leggere min
Il dataset HARP cambia il modo in cui viviamo il suono negli ambienti virtuali.
Shivam Saini, Jürgen Peissig
― 5 leggere min
Scopri come la nuova tecnologia trasforma le immagini in esperienze sonore immersive.
Wei Guo, Heng Wang, Jianbo Ma
― 7 leggere min
Un nuovo metodo raggiunge un'alta precisione nel riconoscimento vocale usando pochissimi dati.
Irfan Nafiz Shahan, Pulok Ahmed Auvi
― 6 leggere min
Rivoluzionando la creazione del suono per i musicisti con infinite opzioni di effetti audio.
Alec Wright, Alistair Carson, Lauri Juvela
― 7 leggere min
Uno strumento che collega l'IA e le intuizioni umane nell'analisi musicale.
Prashanth Thattai Ravikumar
― 6 leggere min
Esplorare come i trucchi audio confondono i modelli linguistici.
Wanqi Yang, Yanda Li, Meng Fang
― 7 leggere min
Scopri come DiM-Gestor migliora i gesti dei personaggi virtuali in tempo reale.
Fan Zhang, Siyuan Zhao, Naye Ji
― 4 leggere min
Una panoramica sui deepfake, i loro rischi e un nuovo dataset in hindi.
Sukhandeep Kaur, Mubashir Buhari, Naman Khandelwal
― 6 leggere min
La ricerca mostra come le emozioni influenzano i nostri ricordi grazie a tecnologie innovative.
Joonwoo Kwon, Heehwan Wang, Jinwoo Lee
― 8 leggere min
Un nuovo sistema ASR migliora il riconoscimento vocale medico per una cura precisa dei pazienti.
Sourav Banerjee, Ayushi Agarwal, Promila Ghosh
― 6 leggere min
Scopri come il trasferimento di stile musicale dà nuova vita alle tue canzoni preferite.
Sooyoung Kim, Joonwoo Kwon, Heehwan Wang
― 5 leggere min
Un nuovo metodo genera discorsi dai video, migliorando il doppiaggio e l'apprendimento delle lingue.
Akshita Gupta, Tatiana Likhomanenko, Karren Dai Yang
― 6 leggere min
Esplorando come i modelli ASR aiutano a identificare efficacemente i deepfake vocali.
Davide Salvi, Amit Kumar Singh Yadav, Kratika Bhagtani
― 7 leggere min
Scopri come i CAM stanno cambiando il modo in cui produciamo e viviamo la musica.
Marco Pasini, Javier Nistal, Stefan Lattner
― 6 leggere min
Una guida per imparare una nuova lingua in modo efficace con consigli pratici.
Shih-Heng Wang, Zih-Ching Chen, Jiatong Shi
― 5 leggere min
Tiene un modo efficiente per tenere traccia dei relatori in contesti multilingue usando il riconoscimento vocale automatico.
Thai-Binh Nguyen, Alexander Waibel
― 7 leggere min
Nuovi metodi migliorano il modo in cui le macchine riconoscono il linguaggio parlato.
Shih-heng Wang, Jiatong Shi, Chien-yu Huang
― 8 leggere min
Esplorando il mondo del trasferimento di stile musicale fallito usando registrazioni audio divertenti.
Chon In Leong, I-Ling Chung, Kin-Fong Chao
― 9 leggere min
I ricercatori sviluppano tecniche per adattare i modelli musicali in modo efficace.
Yiwei Ding, Alexander Lerch
― 4 leggere min
Scopri come le zone sonore personali trasformano le esperienze audio nella vita quotidiana.
Neil Jerome A. Egarguin, Daniel Onofrei
― 7 leggere min
Scopri CoDiff-VC, un nuovo metodo per la conversione della voce.
Yuke Li, Xinfa Zhu, Hanzhao Li
― 5 leggere min
Scopri come i dati vocali emotivi stanno trasformando la tecnologia di verifica dell'identità vocale.
Nikhil Kumar Koditala, Chelsea Jui-Ting Ju, Ruirui Li
― 6 leggere min
I ricercatori hanno sviluppato un nuovo modello per video di canto vivace, migliorando le animazioni.
Yan Li, Ziya Zhou, Zhiqiang Wang
― 7 leggere min
PSA-Net punta a combattere il voice spoofing per una sicurezza dei dispositivi più smart.
Awais Khan, Ijaz Ul Haq, Khalid Mahmood Malik
― 6 leggere min
Scopri un nuovo modo per recuperare con precisione i stem musicali.
Alain Riou, Antonin Gagneré, Gaëtan Hadjeres
― 5 leggere min
Noro migliora la conversione vocale, rendendola efficace anche in ambienti rumorosi.
Haorui He, Yuchen Song, Yuancheng Wang
― 6 leggere min
L'AI sta cambiando la produzione musicale, sollevando preoccupazioni su creatività e autenticità.
Yupei Li, Manuel Milling, Lucia Specia
― 10 leggere min
La tecnologia del cloning vocale sta facendo progressi, creando discorsi realistici che imitano la conversazione umana.
Shuoyi Zhou, Yixuan Zhou, Weiqing Li
― 7 leggere min
La ricerca svela come i nostri cervelli si concentrano sui suoni nonostante le distrazioni.
Simon Geirnaert, Iustina Rotaru, Tom Francart
― 5 leggere min
Scopri come la nuova tecnologia mescola testo, immagini e suoni per contenuti creativi.
Shufan Li, Konstantinos Kallidromitis, Akash Gokul
― 6 leggere min
SyncFlow unisce la generazione di audio e video per una creazione di contenuti senza soluzione di continuità.
Haohe Liu, Gael Le Lan, Xinhao Mei
― 4 leggere min
Un nuovo chatbot che offre conversazioni simili a quelle umane con consapevolezza emotiva.
Aohan Zeng, Zhengxiao Du, Mingdao Liu
― 3 leggere min