Nuovi metodi migliorano il modo in cui le auto a guida autonoma percepiscono l'ambiente circostante.
Xiaohu Lu, Hayder Radha
― 6 leggere min
New Science Research Articles Everyday
Nuovi metodi migliorano il modo in cui le auto a guida autonoma percepiscono l'ambiente circostante.
Xiaohu Lu, Hayder Radha
― 6 leggere min
Un modello innovativo collega immagini e testo, migliorando il recupero delle informazioni.
Andreas Koukounas, Georgios Mastrapas, Bo Wang
― 7 leggere min
Le banche di memoria esterne migliorano i modelli di diffusione per una creazione di immagini e suoni migliore.
Yi Tang, Peng Sun, Zhenglin Cheng
― 6 leggere min
Un nuovo metodo migliora come i modelli elaborano le informazioni visive in modo efficiente.
Ke Wang, Hong Xuan
― 7 leggere min
Il fingerprinting delle attività potrebbe trasformare la condivisione delle conoscenze nell'imaging medico.
Patrick Godau, Akriti Srivastava, Tim Adler
― 5 leggere min
Un metodo proattivo che usa i modelli di linguaggio visivo punta a rilevare attacchi backdoor nascosti.
Kyle Stein, Andrew Arash Mahyari, Guillermo Francia
― 7 leggere min
La ricerca svela un nuovo riferimento per migliorare la comprensione della geometria da parte dell'IA.
Jiarui Zhang, Ollie Liu, Tianyu Yu
― 5 leggere min
Esplora il nuovo dataset VisionArena che migliora le interazioni dell'IA con le chat degli utenti reali.
Christopher Chou, Lisa Dunlap, Koki Mashita
― 5 leggere min
StreamChat cambia il modo in cui interagiamo con i video in streaming in tempo reale.
Jihao Liu, Zhiding Yu, Shiyi Lan
― 7 leggere min
Scopri un metodo più veloce e semplice per l'editing di mesh 3D che aumenta la creatività.
Will Gao, Dilin Wang, Yuchen Fan
― 5 leggere min
Scopri come FPA migliora la generazione di immagini a partire da descrizioni testuali in modo rapido e preciso.
Khalil Mrini, Hanlin Lu, Linjie Yang
― 6 leggere min
Questo nuovo metodo semplifica l'editing delle immagini usando comandi testuali.
Vladimir Kulikov, Matan Kleiner, Inbar Huberman-Spiegelglas
― 6 leggere min
La tecnologia avanzata colma il divario tra design e creazione di capi.
Feng Zhou, Ruiyang Liu, Chen Liu
― 6 leggere min
Scopri come ASDnB migliora il riconoscimento degli oratori attraverso il linguaggio del corpo e le espressioni facciali.
Tiago Roxo, Joana C. Costa, Pedro Inácio
― 8 leggere min
I robot AI imparano a navigare attraverso video indoor del mondo reale per migliorare i loro movimenti.
Mingfei Han, Liang Ma, Kamila Zhumakhanova
― 7 leggere min
SAM-Mix migliora l'analisi delle immagini mediche, riducendo il lavoro manuale e aumentando la precisione.
Tyler Ward, Abdullah-Al-Zubaer Imran
― 7 leggere min
Guarda i vestiti come mai prima d'ora con immagini piatte per lo shopping online.
Ioannis Xarchakos, Theodoros Koukopoulos
― 7 leggere min
Scopri un nuovo metodo per creare programmi visivi in modo veloce e economico.
Michal Shlapentokh-Rothman, Yu-Xiong Wang, Derek Hoiem
― 5 leggere min
Un nuovo strumento che combina immagini satellitari e da terra per una mappatura del territorio migliore.
Pallavi Jain, Dino Ienco, Roberto Interdonato
― 7 leggere min
Un nuovo approccio combina campi neurali e modelli di deformazione per una cattura di movimento 3D dettagliata.
Aymen Merrouche, Stefanie Wuhrer, Edmond Boyer
― 6 leggere min
Un tuffo profondo su come i computer identificano le azioni umane con gli oggetti.
Mingda Jia, Liming Zhao, Ge Li
― 7 leggere min
Scopri come combinare testo e immagini migliora l'analisi del sentimento.
Nguyen Van Doan, Dat Tran Nguyen, Cam-Van Thi Nguyen
― 5 leggere min
Scopri come l'apprendimento auto-supervisionato cambia il modo di rilevare l'Alzheimer nelle immagini del cervello.
Hao-Chun Yang, Sicheng Dai, Saige Rutherford
― 6 leggere min
Nuove tecnologie generano immagini realistiche di persone con facilità.
Zijian Zhou, Shikun Liu, Xiao Han
― 6 leggere min
Scopri come CAT migliora il machine learning con strategie di dati innovative.
Sumaiya Zoha, Jeong-Gun Lee, Young-Woong Ko
― 8 leggere min
Scopri come POINTS1.5 migliora le capacità di elaborazione di immagini e testi.
Yuan Liu, Le Tian, Xiao Zhou
― 6 leggere min
WavFusion combina audio, testo e immagini per migliorare il riconoscimento delle emozioni.
Feng Li, Jiusong Luo, Wanjun Xia
― 6 leggere min
LOMA combina caratteristiche visive e linguistiche per migliorare le previsioni nello spazio 3D.
Yubo Cui, Zhiheng Li, Jiaqiang Wang
― 6 leggere min
Un nuovo framework migliora l'etichettatura dei dati per le auto a guida autonoma.
Yushan Han, Hui Zhang, Honglei Zhang
― 6 leggere min
Nuovi metodi migliorano le previsioni video usando meno dati.
Gaurav Shrivastava, Abhinav Shrivastava
― 6 leggere min
ALoRE ottimizza l'addestramento dei modelli per un riconoscimento delle immagini efficiente e applicazioni più ampie.
Sinan Du, Guosheng Zhang, Keyao Wang
― 7 leggere min
Come la previsione dell'occupazione 3D sta plasmando la tecnologia dei veicoli autonomi.
Bohan Li, Xin Jin, Jiajun Deng
― 6 leggere min
Il framework DMIC innovativo migliora il riconoscimento delle persone su diversi tipi di telecamere.
Yiming Yang, Weipeng Hu, Haifeng Hu
― 7 leggere min
Un nuovo metodo per valutare la generazione di immagini e video da parte dell'IA usando grafi di scena.
Ziqi Gao, Weikai Huang, Jieyu Zhang
― 6 leggere min
TextRefiner aumenta le prestazioni dei modelli Vision-Language, rendendoli più veloci e precisi.
Jingjing Xie, Yuxin Zhang, Jun Peng
― 7 leggere min
Impara a prevenire il collasso del modello nei modelli generativi usando dati reali.
Huminhao Zhu, Fangyikang Wang, Tianyu Ding
― 6 leggere min
Scopri come le illusioni ottiche influenzano i modelli VQA e le loro prestazioni.
Mohammadmostafa Rostamkhani, Baktash Ansari, Hoorieh Sabzevari
― 6 leggere min
AsyncDSB offre un modo più intelligente per ripristinare immagini danneggiate in modo creativo.
Zihao Han, Baoquan Zhang, Lisai Zhang
― 6 leggere min
Scopri come i modelli AI leggeri trattengono le conoscenze in modo efficiente.
Jiaming Lv, Haoyuan Yang, Peihua Li
― 7 leggere min
Scopri come i modelli di linguaggio visivo collegano immagini e testo per macchine più intelligenti.
Quang-Hung Le, Long Hoang Dang, Ngan Le
― 7 leggere min