Esplorando come i modelli ASR aiutano a identificare efficacemente i deepfake vocali.
Davide Salvi, Amit Kumar Singh Yadav, Kratika Bhagtani
― 7 leggere min
New Science Research Articles Everyday
Esplorando come i modelli ASR aiutano a identificare efficacemente i deepfake vocali.
Davide Salvi, Amit Kumar Singh Yadav, Kratika Bhagtani
― 7 leggere min
Articoli più recenti
Marco Pasini, Javier Nistal, Stefan Lattner
― 6 leggere min
Shih-Heng Wang, Zih-Ching Chen, Jiatong Shi
― 5 leggere min
Thai-Binh Nguyen, Alexander Waibel
― 7 leggere min
Shih-heng Wang, Jiatong Shi, Chien-yu Huang
― 8 leggere min
Chon In Leong, I-Ling Chung, Kin-Fong Chao
― 9 leggere min
I ricercatori sviluppano tecniche per adattare i modelli musicali in modo efficace.
Yiwei Ding, Alexander Lerch
― 4 leggere min
Scopri come le zone sonore personali trasformano le esperienze audio nella vita quotidiana.
Neil Jerome A. Egarguin, Daniel Onofrei
― 7 leggere min
Scopri CoDiff-VC, un nuovo metodo per la conversione della voce.
Yuke Li, Xinfa Zhu, Hanzhao Li
― 5 leggere min
Scopri come i dati vocali emotivi stanno trasformando la tecnologia di verifica dell'identità vocale.
Nikhil Kumar Koditala, Chelsea Jui-Ting Ju, Ruirui Li
― 6 leggere min
I ricercatori hanno sviluppato un nuovo modello per video di canto vivace, migliorando le animazioni.
Yan Li, Ziya Zhou, Zhiqiang Wang
― 7 leggere min
PSA-Net punta a combattere il voice spoofing per una sicurezza dei dispositivi più smart.
Awais Khan, Ijaz Ul Haq, Khalid Mahmood Malik
― 6 leggere min
Scopri un nuovo modo per recuperare con precisione i stem musicali.
Alain Riou, Antonin Gagneré, Gaëtan Hadjeres
― 5 leggere min
Noro migliora la conversione vocale, rendendola efficace anche in ambienti rumorosi.
Haorui He, Yuchen Song, Yuancheng Wang
― 6 leggere min
L'AI sta cambiando la produzione musicale, sollevando preoccupazioni su creatività e autenticità.
Yupei Li, Manuel Milling, Lucia Specia
― 10 leggere min
La tecnologia del cloning vocale sta facendo progressi, creando discorsi realistici che imitano la conversazione umana.
Shuoyi Zhou, Yixuan Zhou, Weiqing Li
― 7 leggere min
La ricerca svela come i nostri cervelli si concentrano sui suoni nonostante le distrazioni.
Simon Geirnaert, Iustina Rotaru, Tom Francart
― 5 leggere min
Scopri come la nuova tecnologia mescola testo, immagini e suoni per contenuti creativi.
Shufan Li, Konstantinos Kallidromitis, Akash Gokul
― 6 leggere min
SyncFlow unisce la generazione di audio e video per una creazione di contenuti senza soluzione di continuità.
Haohe Liu, Gael Le Lan, Xinhao Mei
― 4 leggere min
Un nuovo chatbot che offre conversazioni simili a quelle umane con consapevolezza emotiva.
Aohan Zeng, Zhengxiao Du, Mingdao Liu
― 3 leggere min
L'IA generativa aiuta a identificare i canti degli uccelli in ambienti rumorosi per una migliore conservazione.
Anthony Gibbons, Emma King, Ian Donohue
― 6 leggere min
Nuovi metodi migliorano la valutazione della parola per chi ha disartria.
Yerin Choi, Jeehyun Lee, Myoung-Wan Koo
― 6 leggere min
Scopri come il zero-shot learning cambia le regole del gioco nel riconoscimento audio ambientale.
Ysobel Sims, Stephan Chalup, Alexandre Mendes
― 8 leggere min
Le registrazioni sonore aiutano a monitorare gli uccelli migratori notturni in Europa.
Louis Airale, Adrien Pajot, Juliette Linossier
― 6 leggere min
Uno sguardo alla generazione di parlato senza testo usando nuovi metodi audio.
Joonyong Park, Daisuke Saito, Nobuaki Minematsu
― 6 leggere min
Trova la musica perfetta su misura per il tuo gusto unico con Diff4Steer.
Xuchan Bao, Judith Yue Li, Zhong Yi Wan
― 6 leggere min
StableVC cambia la tecnologia di conversione vocale con velocità e qualità.
Jixun Yao, Yuguang Yang, Yu Pan
― 7 leggere min
Esaminare il bias nella musica AI verso gli stili del Global North rispetto alle tradizioni del Global South.
Atharva Mehta, Shivam Chauhan, Monojit Choudhury
― 7 leggere min
Scopri come i token di discorso continuo trasformano la comunicazione con le macchine.
Ze Yuan, Yanqing Liu, Shujie Liu
― 6 leggere min
Scopri come l'IA sta trasformando la musica in esperienze visive affascinanti.
Leonardo Pina, Yongmin Li
― 7 leggere min
WavFusion combina audio, testo e immagini per migliorare il riconoscimento delle emozioni.
Feng Li, Jiusong Luo, Wanjun Xia
― 6 leggere min
Esplora l'ascesa della musica generata dalle macchine e la ricerca di metodi per rilevarla.
Yupei Li, Hanqian Li, Lucia Specia
― 7 leggere min
Combinare modelli visivi con sistemi audio aumenta l'efficienza e le prestazioni.
Juan Yeo, Jinkwan Jang, Kyubyung Chae
― 7 leggere min
Un nuovo sistema rivoluziona il modo in cui la musica si abbina ai contenuti video.
Shanti Stewart, Gouthaman KV, Lie Lu
― 6 leggere min
La tecnologia AI sta cambiando il modo in cui comunichiamo durante le emergenze.
Danush Venkateshperumal, Rahman Abdul Rafi, Shakil Ahmed
― 6 leggere min
Scopri come la separazione delle sorgenti musicali e la trascrizione cambiano il modo in cui viviamo la musica.
Bradford Derby, Lucas Dunker, Samarth Galchar
― 7 leggere min
Un nuovo modello mescola musica e IA, creando melodie innovative.
Shansong Liu, Atin Sakkeer Hussain, Qilong Wu
― 7 leggere min
AI TrackMate offre ai produttori feedback oggettivo per migliorare le loro abilità musicali.
Yi-Lin Jiang, Chia-Ho Hsiung, Yen-Tung Yeh
― 6 leggere min
Scopri la Frechet Music Distance e il suo ruolo nella valutazione della musica generata dall'IA.
Jan Retkowski, Jakub Stępniak, Mateusz Modrzejewski
― 8 leggere min
Scopri come l'IA può rivoluzionare il sound design nei video e nei giochi.
Sudha Krishnamurthy
― 5 leggere min
Analizzare la voce può svelare segni di depressione e portare a un intervento precoce.
Quang-Anh N. D., Manh-Hung Ha, Thai Kim Dinh
― 6 leggere min
Trasforma il tuo canticchiare e battere delle mani in audio di alta qualità con Sketch2Sound.
Hugo Flores García, Oriol Nieto, Justin Salamon
― 7 leggere min
Le tecniche di watermarking proteggono i diritti degli artisti nella generazione musicale con l'IA.
Pascal Epple, Igor Shilov, Bozhidar Stevanoski
― 7 leggere min
Trasformare l'audio mono in esperienze binaurali immersive con tecniche innovative.
Alon Levkovitch, Julian Salazar, Soroosh Mariooryad
― 7 leggere min
La ricerca esplora come i modelli di miglioramento del parlato mantengono l'accento delle sillabe nonostante il rumore.
Rangavajjala Sankara Bharadwaj, Jhansi Mallela, Sai Harshitha Aluru
― 6 leggere min
Un nuovo framework migliora l'allineamento di suoni e immagini nei video.
Kexin Li, Zongxin Yang, Yi Yang
― 6 leggere min