WavFusion combina audio, testo e immagini per migliorare il riconoscimento delle emozioni.
Feng Li, Jiusong Luo, Wanjun Xia
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
WavFusion combina audio, testo e immagini per migliorare il riconoscimento delle emozioni.
Feng Li, Jiusong Luo, Wanjun Xia
― 6 leggere min
LOMA combina caratteristiche visive e linguistiche per migliorare le previsioni nello spazio 3D.
Yubo Cui, Zhiheng Li, Jiaqiang Wang
― 6 leggere min
SmolTulu offre un approccio innovativo alla comprensione del linguaggio, bilanciando prestazioni ed efficienza.
Sultan Alrashed
― 6 leggere min
Un nuovo framework migliora l'etichettatura dei dati per le auto a guida autonoma.
Yushan Han, Hui Zhang, Honglei Zhang
― 6 leggere min
Nuovi metodi migliorano le previsioni video usando meno dati.
Gaurav Shrivastava, Abhinav Shrivastava
― 6 leggere min
ALoRE ottimizza l'addestramento dei modelli per un riconoscimento delle immagini efficiente e applicazioni più ampie.
Sinan Du, Guosheng Zhang, Keyao Wang
― 7 leggere min
Nuovo benchmark potenzia i dati in olandese per i modelli di recupero delle informazioni.
Nikolay Banar, Ehsan Lotfi, Walter Daelemans
― 6 leggere min
BASRec migliora le raccomandazioni bilanciando rilevanza e diversità per una maggiore soddisfazione dell'utente.
Yizhou Dang, Jiahui Zhang, Yuting Liu
― 7 leggere min
Massimizza l'efficienza della GPU mentre riduci i costi energetici negli ambienti di deep learning.
Kawsar Haghshenas, Mona Hashemi
― 6 leggere min
Un nuovo modello predittivo migliora l'accuratezza nelle risposte dei modelli linguistici.
Naryeong Kim, Sungmin Kang, Gabin An
― 8 leggere min
Scopri come l'IA risponde a domande visive e fornisce spiegazioni.
Pascal Tilli, Ngoc Thang Vu
― 6 leggere min
La tecnologia EEG apre nuove strade per la comunicazione cervello-computer.
Taveena Lotey, Aman Verma, Partha Pratim Roy
― 7 leggere min
I modelli di linguaggio grandi aiutano a organizzare i temi di ricerca in modo efficiente.
Tanay Aggarwal, Angelo Salatino, Francesco Osborne
― 6 leggere min
Come la previsione dell'occupazione 3D sta plasmando la tecnologia dei veicoli autonomi.
Bohan Li, Xin Jin, Jiajun Deng
― 6 leggere min
Esplorando come il machine learning trasforma la diagnosi e il trattamento delle malattie cardiache.
Fani Chatzopoulou, Nikolaos Mittas, Dimitrios Chatzidimitriou
― 7 leggere min
Il framework DMIC innovativo migliora il riconoscimento delle persone su diversi tipi di telecamere.
Yiming Yang, Weipeng Hu, Haifeng Hu
― 7 leggere min
Un nuovo metodo per valutare la generazione di immagini e video da parte dell'IA usando grafi di scena.
Ziqi Gao, Weikai Huang, Jieyu Zhang
― 6 leggere min
Scopri come il matching degli schemi migliora l'integrazione dei dati in diversi settori.
Yurong Liu, Eduardo Pena, Aecio Santos
― 7 leggere min
TextRefiner aumenta le prestazioni dei modelli Vision-Language, rendendoli più veloci e precisi.
Jingjing Xie, Yuxin Zhang, Jun Peng
― 7 leggere min
Impara a prevenire il collasso del modello nei modelli generativi usando dati reali.
Huminhao Zhu, Fangyikang Wang, Tianyu Ding
― 6 leggere min
Scopri come le illusioni ottiche influenzano i modelli VQA e le loro prestazioni.
Mohammadmostafa Rostamkhani, Baktash Ansari, Hoorieh Sabzevari
― 6 leggere min
Un nuovo metodo migliora l'apprendimento degli agenti attraverso strategie di esplorazione efficienti.
Ting Qiao, Henry Williams, David Valencia
― 5 leggere min
Il framework Mamba affronta le sfide nei grafi dinamici per un apprendimento e un’analisi efficienti.
Haonan Yuan, Qingyun Sun, Zhaonan Wang
― 6 leggere min
Rivoluzionare il machine learning con tecniche innovative di mixup dei grafi.
Weigang Lu, Ziyu Guan, Wei Zhao
― 7 leggere min
Scopri come i modelli AI leggeri trattengono le conoscenze in modo efficiente.
Jiaming Lv, Haoyuan Yang, Peihua Li
― 7 leggere min
Esplora l'ascesa della musica generata dalle macchine e la ricerca di metodi per rilevarla.
Yupei Li, Hanqian Li, Lucia Specia
― 7 leggere min
Scopri i segreti dietro gli autoprompt e il loro impatto sui modelli linguistici.
Nathanaël Carraz Rakotonirina, Corentin Kervadec, Francesca Franzon
― 6 leggere min
Scopri come i modelli di linguaggio visivo collegano immagini e testo per macchine più intelligenti.
Quang-Hung Le, Long Hoang Dang, Ngan Le
― 7 leggere min
Nuove tecnologie migliorano la rilevazione precoce delle fuoriuscite di petrolio per proteggere la vita marina.
Jaeho Moon, Jeonghwan Yun, Jaehyun Kim
― 6 leggere min
I modelli Vision-Language affrontano sfide nella comprensione della struttura del linguaggio per i compiti immagine-testo.
Sri Harsha Dumpala, David Arps, Sageev Oore
― 6 leggere min
Scopri come il framework HIST migliora la comprensione di immagini e testi.
Jiayun Luo, Mir Rayat Imtiaz Hossain, Boyang Li
― 7 leggere min
Uno sguardo su come Doubly-UAP inganna i modelli AI con immagini e testo.
Hee-Seon Kim, Minbeom Kim, Changick Kim
― 6 leggere min
CareBot migliora la pratica medica attraverso diagnosi precise e pianificazione dei trattamenti.
Lulu Zhao, Weihao Zeng, Xiaofeng Shi
― 5 leggere min
Video Curious Agent semplifica la ricerca dei momenti chiave in video lunghi.
Zeyuan Yang, Delin Chen, Xueyang Yu
― 6 leggere min
L'AI trasforma il modo in cui gli studenti si immergono nella fisica tramite simulazioni interattive.
Yossi Ben-Zion, Roi Einhorn Zarzecki, Joshua Glazer
― 7 leggere min
Scopri come il reinforcement learning migliora il controllo attivo del flusso per una performance migliore.
Alexandra Müller, Tobias Schesny, Ben Steinfurth
― 7 leggere min
Scopri come l'IA sta cambiando il modo in cui affrontiamo le sfide di geometria.
Shihao Xu, Yiyang Luo, Wei Shi
― 6 leggere min
Nuovo metodo migliora l'analisi del flusso dell'olio usando reti neurali per previsioni di flusso più accurate.
Jonas Schulte-Sasse, Ben Steinfurth, Julien Weiss
― 6 leggere min
RLDG migliora l'apprendimento dei robot grazie a dati di alta qualità, migliorando le prestazioni nei compiti.
Charles Xu, Qiyang Li, Jianlan Luo
― 6 leggere min
Combinare modelli visivi con sistemi audio aumenta l'efficienza e le prestazioni.
Juan Yeo, Jinkwan Jang, Kyubyung Chae
― 7 leggere min