StableVC cambia la tecnologia di conversione vocale con velocità e qualità.
Jixun Yao, Yuguang Yang, Yu Pan
― 7 leggere min
Scienza all'avanguardia spiegata semplicemente
StableVC cambia la tecnologia di conversione vocale con velocità e qualità.
Jixun Yao, Yuguang Yang, Yu Pan
― 7 leggere min
Esaminare il bias nella musica AI verso gli stili del Global North rispetto alle tradizioni del Global South.
Atharva Mehta, Shivam Chauhan, Monojit Choudhury
― 7 leggere min
Scopri come i token di discorso continuo trasformano la comunicazione con le macchine.
Ze Yuan, Yanqing Liu, Shujie Liu
― 6 leggere min
Scopri come il dropout adattivo migliora l'efficienza nei sistemi di riconoscimento vocale.
Yotaro Kubo, Xingyu Cai, Michiel Bacchiani
― 7 leggere min
Scopri come l'IA sta trasformando la musica in esperienze visive affascinanti.
Leonardo Pina, Yongmin Li
― 7 leggere min
WavFusion combina audio, testo e immagini per migliorare il riconoscimento delle emozioni.
Feng Li, Jiusong Luo, Wanjun Xia
― 6 leggere min
Esplora l'ascesa della musica generata dalle macchine e la ricerca di metodi per rilevarla.
Yupei Li, Hanqian Li, Lucia Specia
― 7 leggere min
Combinare modelli visivi con sistemi audio aumenta l'efficienza e le prestazioni.
Juan Yeo, Jinkwan Jang, Kyubyung Chae
― 7 leggere min
Un nuovo sistema rivoluziona il modo in cui la musica si abbina ai contenuti video.
Shanti Stewart, Gouthaman KV, Lie Lu
― 6 leggere min
La tecnologia AI sta cambiando il modo in cui comunichiamo durante le emergenze.
Danush Venkateshperumal, Rahman Abdul Rafi, Shakil Ahmed
― 6 leggere min
Scopri come la separazione delle sorgenti musicali e la trascrizione cambiano il modo in cui viviamo la musica.
Bradford Derby, Lucas Dunker, Samarth Galchar
― 7 leggere min
Un nuovo modello mescola musica e IA, creando melodie innovative.
Shansong Liu, Atin Sakkeer Hussain, Qilong Wu
― 7 leggere min
AI TrackMate offre ai produttori feedback oggettivo per migliorare le loro abilità musicali.
Yi-Lin Jiang, Chia-Ho Hsiung, Yen-Tung Yeh
― 6 leggere min
La ricerca mostra come i suoni influenzano i nostri sentimenti e comportamenti.
Claudia Montero-Ramírez, Esther Rituerto-González, Carmen Peláez-Moreno
― 6 leggere min
Scopri la Frechet Music Distance e il suo ruolo nella valutazione della musica generata dall'IA.
Jan Retkowski, Jakub Stępniak, Mateusz Modrzejewski
― 8 leggere min
Scopri come l'IA può rivoluzionare il sound design nei video e nei giochi.
Sudha Krishnamurthy
― 5 leggere min
Scopri come CSSinger sta rivoluzionando la creazione musicale con la sintesi vocale in tempo reale.
Jianwei Cui, Yu Gu, Shihao Chen
― 5 leggere min
Un strumento di riconoscimento vocale trasforma la matematica parlata in LaTeX senza sforzo.
Evangelia Gkritzali, Panagiotis Kaliosis, Sofia Galanaki
― 6 leggere min
Analizzare la voce può svelare segni di depressione e portare a un intervento precoce.
Quang-Anh N. D., Manh-Hung Ha, Thai Kim Dinh
― 6 leggere min
Trasforma il tuo canticchiare e battere delle mani in audio di alta qualità con Sketch2Sound.
Hugo Flores García, Oriol Nieto, Justin Salamon
― 7 leggere min
Le tecniche di watermarking proteggono i diritti degli artisti nella generazione musicale con l'IA.
Pascal Epple, Igor Shilov, Bozhidar Stevanoski
― 7 leggere min
Trasformare l'audio mono in esperienze binaurali immersive con tecniche innovative.
Alon Levkovitch, Julian Salazar, Soroosh Mariooryad
― 7 leggere min
La ricerca esplora come i modelli di miglioramento del parlato mantengono l'accento delle sillabe nonostante il rumore.
Rangavajjala Sankara Bharadwaj, Jhansi Mallela, Sai Harshitha Aluru
― 6 leggere min
Un nuovo framework migliora l'allineamento di suoni e immagini nei video.
Kexin Li, Zongxin Yang, Yi Yang
― 6 leggere min
Rivoluzionando il testo parlato con voci più naturali e un'efficienza migliorata.
Haowei Lou, Helen Paik, Pari Delir Haghighi
― 6 leggere min
Scopri come i sistemi TTS stanno evolvendo per suonare più simili agli esseri umani.
Haowei Lou, Helen Paik, Wen Hu
― 7 leggere min
Un nuovo sistema trasforma il controllo audio attraverso descrizioni testuali dettagliate.
Sonal Kumar, Prem Seetharaman, Justin Salamon
― 7 leggere min
Combinare video e audio per rilevare meglio le emozioni.
Antonio Fernandez, Suzan Awinat
― 9 leggere min
YingSound trasforma la produzione video automatizzando la generazione di effetti sonori.
Zihao Chen, Haomin Zhang, Xinhan Di
― 6 leggere min
I ricercatori usano gli echi per mettere un watermark nell'audio, garantendo la protezione dei diritti dei creatori.
Christopher J. Tralie, Matt Amery, Benjamin Douglas
― 8 leggere min
I robot ora possono muoversi in ambienti complicati usando il suono grazie a SonicBoom.
Moonyoung Lee, Uksang Yoo, Jean Oh
― 6 leggere min
Il modello MASV migliora la verifica vocale, garantendo sicurezza ed efficienza.
Yang Liu, Li Wan, Yiteng Huang
― 5 leggere min
Esplorando l'impatto degli strumenti di AI sulla creazione musicale e le prospettive dei compositori.
Eleanor Row, György Fazekas
― 7 leggere min
La tecnologia di riconoscimento vocale migliora il riconoscimento dei numeri, soprattutto in ambienti rumorosi.
Ali Nasr-Esfahani, Mehdi Bekrani, Roozbeh Rajabi
― 5 leggere min
Migliorare le prestazioni dell'ASR multilingue per il giapponese tramite un fine-tuning mirato.
Mark Bajo, Haruka Fukukawa, Ryuji Morita
― 5 leggere min
Esplorare come i BCI decifrano il linguaggio immaginato per migliorare la comunicazione.
Byung-Kwan Ko, Jun-Young Kim, Seo-Hyun Lee
― 7 leggere min
SonicMesh usa il suono per migliorare il modello 3D del corpo umano a partire dalle immagini.
Xiaoxuan Liang, Wuyang Zhang, Hong Zhou
― 5 leggere min
Scopri le ultime novità nel riconoscimento vocale in tempo reale e come migliorano le nostre interazioni.
Rongxiang Wang, Zhiming Xu, Felix Xiaozhu Lin
― 5 leggere min
I ricercatori migliorano l'elaborazione del parlato usando Libri2Vox e tecniche di dati sintetici.
Yun Liu, Xuechen Liu, Xiaoxiao Miao
― 6 leggere min
Scopri come il TTS emotivo cambia la comunicazione con le macchine, rendendole più simpatiche.
Sho Inoue, Kun Zhou, Shuai Wang
― 6 leggere min