Scopri le novità nella creazione di video lunghi che catturano l'attenzione del pubblico.
Xin Yan, Yuxuan Cai, Qiuyue Wang
― 6 leggere min
New Science Research Articles Everyday
Scopri le novità nella creazione di video lunghi che catturano l'attenzione del pubblico.
Xin Yan, Yuxuan Cai, Qiuyue Wang
― 6 leggere min
Articoli più recenti
Po-Hsuan Huang, Jeng-Lin Li, Chin-Po Chen
― 8 leggere min
Ze Zhang, Enyuan Zhao, Ziyi Wan
― 6 leggere min
Vera Prohaska, Eduardo Castelló Ferrer
― 7 leggere min
Taekyung Ki, Dongchan Min, Gyeongsu Chae
― 7 leggere min
Muhammad Umar Farooq, Awais Khan, Ijaz Ul Haq
― 7 leggere min
Scopri come la nuova tecnologia mescola testo, immagini e suoni per contenuti creativi.
Shufan Li, Konstantinos Kallidromitis, Akash Gokul
― 6 leggere min
SyncFlow unisce la generazione di audio e video per una creazione di contenuti senza soluzione di continuità.
Haohe Liu, Gael Le Lan, Xinhao Mei
― 4 leggere min
SizeGS offre un modo più intelligente di comprimere contenuti 3D senza perdere qualità.
Shuzhao Xie, Jiahang Liu, Weixiang Zhang
― 6 leggere min
L'AI impara a creare arte grazie al feedback che si dà da sola per migliorare l'allineamento delle immagini.
Leigang Qu, Haochuan Li, Wenjie Wang
― 8 leggere min
Usare il machine learning per migliorare l'analisi delle gare di judo e l'allenamento.
Anthony Miyaguchi, Jed Moutahir, Tanmay Sutar
― 8 leggere min
I sistemi di intelligenza artificiale stanno imparando a orientarsi usando il linguaggio e la consapevolezza spaziale.
Xuesong Zhang, Yunbo Xu, Jia Li
― 7 leggere min
Nuovo metodo migliora il modellamento 3D da video per giochi e VR.
Jinbo Yan, Rui Peng, Luyang Tang
― 5 leggere min
Trova la musica perfetta su misura per il tuo gusto unico con Diff4Steer.
Xuchan Bao, Judith Yue Li, Zhong Yi Wan
― 6 leggere min
Scopri come la compressione semantica di più elementi cambia la condivisione e lo stoccaggio delle immagini.
Tom Bachard, Thomas Maugey
― 6 leggere min
RoboMM e RoboData cambiano il modo in cui i robot apprendono e si muovono nei veri ambienti.
Feng Yan, Fanfan Liu, Liming Zheng
― 7 leggere min
Scopri come gli agenti AI inviano messaggi nascosti attraverso azioni giocose.
Ching-Chun Chang, Isao Echizen
― 8 leggere min
Scopri come l'IA sta trasformando la musica in esperienze visive affascinanti.
Leonardo Pina, Yongmin Li
― 7 leggere min
Scopri come combinare testo e immagini migliora l'analisi del sentimento.
Nguyen Van Doan, Dat Tran Nguyen, Cam-Van Thi Nguyen
― 5 leggere min
Scopri come POINTS1.5 migliora le capacità di elaborazione di immagini e testi.
Yuan Liu, Le Tian, Xiao Zhou
― 6 leggere min
WavFusion combina audio, testo e immagini per migliorare il riconoscimento delle emozioni.
Feng Li, Jiusong Luo, Wanjun Xia
― 6 leggere min
TextRefiner aumenta le prestazioni dei modelli Vision-Language, rendendoli più veloci e precisi.
Jingjing Xie, Yuxin Zhang, Jun Peng
― 7 leggere min
Esplora l'ascesa della musica generata dalle macchine e la ricerca di metodi per rilevarla.
Yupei Li, Hanqian Li, Lucia Specia
― 7 leggere min
Un nuovo sistema rivoluziona il modo in cui la musica si abbina ai contenuti video.
Shanti Stewart, Gouthaman KV, Lie Lu
― 6 leggere min
Scopri tecniche innovative di watermarking video per la protezione dei contenuti.
Pierre Fernandez, Hady Elsahar, I. Zeki Yalniz
― 5 leggere min
Un nuovo modello mescola musica e IA, creando melodie innovative.
Shansong Liu, Atin Sakkeer Hussain, Qilong Wu
― 7 leggere min
OV-VSS rivoluziona il modo in cui le macchine comprendono i contenuti video, identificando nuovi oggetti senza sforzo.
Xinhao Li, Yun Liu, Guolei Sun
― 8 leggere min
AI TrackMate offre ai produttori feedback oggettivo per migliorare le loro abilità musicali.
Yi-Lin Jiang, Chia-Ho Hsiung, Yen-Tung Yeh
― 6 leggere min
Scopri come MMCSAL migliora l'efficienza dell'apprendimento con dati multimodali.
Meng Shen, Yake Wei, Jianxiong Yin
― 6 leggere min
Scopri la Frechet Music Distance e il suo ruolo nella valutazione della musica generata dall'IA.
Jan Retkowski, Jakub Stępniak, Mateusz Modrzejewski
― 8 leggere min
Scopri come l'IA può rivoluzionare il sound design nei video e nei giochi.
Sudha Krishnamurthy
― 5 leggere min
Un nuovo approccio migliora l'accuratezza e l'efficienza nel rispondere a domande audio-visive.
Zhangbin Li, Jinxing Zhou, Jing Zhang
― 6 leggere min
Un nuovo framework migliora l'allineamento di suoni e immagini nei video.
Kexin Li, Zongxin Yang, Yi Yang
― 6 leggere min
Rivoluzionando il testo parlato con voci più naturali e un'efficienza migliorata.
Haowei Lou, Helen Paik, Pari Delir Haghighi
― 6 leggere min
Combinare video e audio per rilevare meglio le emozioni.
Antonio Fernandez, Suzan Awinat
― 9 leggere min
Nuove tecniche migliorano il modo in cui le macchine riconoscono e interpretano le scene video.
Phúc H. Le Khac, Graham Healy, Alan F. Smeaton
― 7 leggere min
YingSound trasforma la produzione video automatizzando la generazione di effetti sonori.
Zihao Chen, Haomin Zhang, Xinhan Di
― 6 leggere min
I ricercatori usano gli echi per mettere un watermark nell'audio, garantendo la protezione dei diritti dei creatori.
Christopher J. Tralie, Matt Amery, Benjamin Douglas
― 8 leggere min
Questo studio valuta quanto bene i modelli di linguaggio riconoscono le entità musicali nel testo.
Simon Hachmeier, Robert Jäschke
― 8 leggere min
Scopri come vengono identificati i brani reinterpretati su YouTube usando metodi nuovi.
Simon Hachmeier, Robert Jäschke
― 6 leggere min
Scopri come i modelli di volo tengono i droni al sicuro e in ordine.
Shuqin Zhu, Shahram Ghandeharizadeh
― 5 leggere min
Scopri come i droni creano display 3D interattivi per l'intrattenimento e la salute.
Nima Yazdani, Hamed Alimohammadzadeh, Shahram Ghandeharizadeh
― 5 leggere min
Un nuovo metodo aiuta a riassumere i contenuti video facilmente.
Shiping Ge, Qiang Chen, Zhiwei Jiang
― 6 leggere min
Un nuovo modello accelera la ricerca video migliorando l'accuratezza.
Jinpeng Wang, Niu Lian, Jun Li
― 6 leggere min
DAAN migliora come le macchine apprendono dai dati audio-visivi in scenari zero-shot.
RunLin Yu, Yipu Gong, Wenrui Li
― 6 leggere min
Trasforma il tuo filmmaking con un controllo della camera migliorato e effetti artistici.
Xi Wang, Robin Courant, Marc Christie
― 6 leggere min