Scopri la Frechet Music Distance e il suo ruolo nella valutazione della musica generata dall'IA.
Jan Retkowski, Jakub Stępniak, Mateusz Modrzejewski
― 8 leggere min
New Science Research Articles Everyday
Scopri la Frechet Music Distance e il suo ruolo nella valutazione della musica generata dall'IA.
Jan Retkowski, Jakub Stępniak, Mateusz Modrzejewski
― 8 leggere min
Articoli più recenti
Sudha Krishnamurthy
― 5 leggere min
Zhangbin Li, Jinxing Zhou, Jing Zhang
― 6 leggere min
Kexin Li, Zongxin Yang, Yi Yang
― 6 leggere min
Haowei Lou, Helen Paik, Pari Delir Haghighi
― 6 leggere min
Antonio Fernandez, Suzan Awinat
― 9 leggere min
Nuove tecniche migliorano il modo in cui le macchine riconoscono e interpretano le scene video.
Phúc H. Le Khac, Graham Healy, Alan F. Smeaton
― 7 leggere min
YingSound trasforma la produzione video automatizzando la generazione di effetti sonori.
Zihao Chen, Haomin Zhang, Xinhan Di
― 6 leggere min
I ricercatori usano gli echi per mettere un watermark nell'audio, garantendo la protezione dei diritti dei creatori.
Christopher J. Tralie, Matt Amery, Benjamin Douglas
― 8 leggere min
Questo studio valuta quanto bene i modelli di linguaggio riconoscono le entità musicali nel testo.
Simon Hachmeier, Robert Jäschke
― 8 leggere min
Scopri come vengono identificati i brani reinterpretati su YouTube usando metodi nuovi.
Simon Hachmeier, Robert Jäschke
― 6 leggere min
Scopri come i modelli di volo tengono i droni al sicuro e in ordine.
Shuqin Zhu, Shahram Ghandeharizadeh
― 5 leggere min
Scopri come i droni creano display 3D interattivi per l'intrattenimento e la salute.
Nima Yazdani, Hamed Alimohammadzadeh, Shahram Ghandeharizadeh
― 5 leggere min
Un nuovo metodo aiuta a riassumere i contenuti video facilmente.
Shiping Ge, Qiang Chen, Zhiwei Jiang
― 6 leggere min
Un nuovo modello accelera la ricerca video migliorando l'accuratezza.
Jinpeng Wang, Niu Lian, Jun Li
― 6 leggere min
DAAN migliora come le macchine apprendono dai dati audio-visivi in scenari zero-shot.
RunLin Yu, Yipu Gong, Wenrui Li
― 6 leggere min
Trasforma il tuo filmmaking con un controllo della camera migliorato e effetti artistici.
Xi Wang, Robin Courant, Marc Christie
― 6 leggere min
Scopri come la creatività dei giocatori sta cambiando i videogiochi e il coinvolgimento nella comunità.
Yuyue Liu, Haihan Duan, Wei Cai
― 6 leggere min
Un nuovo framework migliora i video in lingua dei segni per una comunicazione migliore.
Shengeng Tang, Jiayi He, Dan Guo
― 6 leggere min
Scopri come i sistemi di raccomandazione multi-modali migliorano lo shopping online.
Rongqing Kenneth Ong, Andy W. H. Khong
― 7 leggere min
Un nuovo sistema rivoluziona il modo in cui i sound designer creano audio per i video.
Riccardo Fosco Gramaccioni, Christian Marinoni, Emilian Postolache
― 8 leggere min
Un nuovo metodo migliora la sincronizzazione labiale nei video doppiati per un'esperienza di visione più naturale.
Lucas Goncalves, Prashant Mathur, Xing Niu
― 7 leggere min
Nuova tecnologia trasforma le parole parlate in linguaggio dei segni per una comunicazione migliore.
Xu Wang, Shengeng Tang, Peipei Song
― 6 leggere min
Nuova tecnologia combina suoni e immagini per una migliore rilevazione dei droni.
Zhenyuan Xiao, Yizhuo Yang, Guili Xu
― 7 leggere min
Esplorando nuove tecnologie che rilevano suoni da fonti invisibili.
Yuhang He, Sangyun Shin, Anoop Cherian
― 5 leggere min
Un nuovo approccio prevede la qualità delle immagini sia per gli umani che per le macchine.
Qi Zhang, Shanshe Wang, Xinfeng Zhang
― 7 leggere min
VERSA valuta bene la qualità del parlato, dell'audio e della musica.
Jiatong Shi, Hye-jin Shim, Jinchuan Tian
― 9 leggere min
Scopri come RDPM trasforma la creazione di immagini usando metodi avanzati.
Xiaoping Wu, Jie Hu, Xiaoming Wei
― 8 leggere min
FACEMUG trasforma la modifica delle foto con strumenti precisi per aggiustamenti facciali.
Wanglong Lu, Jikai Wang, Xiaogang Jin
― 7 leggere min
Il riconoscimento dinamico delle espressioni facciali trasforma le interazioni tra umani e computer attraverso l'analisi delle emozioni in tempo reale.
Peihao Xiang, Kaida Wu, Chaohao Lin
― 8 leggere min
Combinare linguaggio e video per migliorare l'apprendimento nei robot.
Dejie Yang, Zijing Zhao, YangLiu
― 7 leggere min
Un nuovo approccio migliora il modo in cui i computer tracciano oggetti usando immagini e testo.
X. Feng, D. Zhang, S. Hu
― 6 leggere min
Un nuovo sistema per creare danze di gruppo sincronizzate e naturali.
Kaixing Yang, Xulong Tang, Haoyu Wu
― 8 leggere min
Gli assistenti audio stanno diventando più intelligenti con AQA-K, migliorando le risposte grazie alla conoscenza.
Abhirama Subramanyam Penamakuri, Kiran Chhatre, Akshat Jain
― 6 leggere min
Scopri come il restauro facciale per non vedenti rende più chiare le immagini sfocate.
Wanglong Lu, Jikai Wang, Tao Wang
― 6 leggere min
Emergono metodi innovativi per combattere l'aumento dei deepfake realistici.
Yi Zhang, Weize Gao, Changtao Miao
― 7 leggere min
Scopri come ChartAdapter trasforma grafici complessi in riassunti chiari.
Peixin Xu, Yujuan Ding, Wenqi Fan
― 6 leggere min