Nuovi metodi aiutano i robot a vedere meglio in condizioni di illuminazione difficili.
Simon Kristoffersson Lind, Rudolph Triebel, Volker Krüger
― 5 leggere min
New Science Research Articles Everyday
Nuovi metodi aiutano i robot a vedere meglio in condizioni di illuminazione difficili.
Simon Kristoffersson Lind, Rudolph Triebel, Volker Krüger
― 5 leggere min
Scopri come i nuovi metodi stanno plasmando la generazione di immagini per pose realistiche.
Donghwna Lee, Kyungha Min, Kirok Kim
― 6 leggere min
Nuove tecniche migliorano il modo in cui le macchine capiscono le immagini, imitano la percezione umana.
Simone Azeglio, Olivier Marre, Peter Neri
― 10 leggere min
Scopri come i ricercatori ricreano forme complesse da immagini semplici usando metodi innovativi.
Hui Deng, Jiawei Shi, Zhen Qin
― 6 leggere min
Scopri come metodi innovativi stanno migliorando la sintesi di immagini da descrizioni testuali.
Xu Ouyang, Ying Chen, Kaiyue Zhu
― 9 leggere min
Scopri come il collegamento di entità multimodale unisce testo e immagini per una comprensione migliore.
Zhiwei Hu, Víctor Gutiérrez-Basulto, Ru Li
― 6 leggere min
Un tuffo profondo su come i computer identificano le azioni umane con gli oggetti.
Mingda Jia, Liming Zhao, Ge Li
― 7 leggere min
Scopri come CAT migliora il machine learning con strategie di dati innovative.
Sumaiya Zoha, Jeong-Gun Lee, Young-Woong Ko
― 8 leggere min
Scopri come POINTS1.5 migliora le capacità di elaborazione di immagini e testi.
Yuan Liu, Le Tian, Xiao Zhou
― 6 leggere min
Nuovi metodi migliorano le previsioni video usando meno dati.
Gaurav Shrivastava, Abhinav Shrivastava
― 6 leggere min
ALoRE ottimizza l'addestramento dei modelli per un riconoscimento delle immagini efficiente e applicazioni più ampie.
Sinan Du, Guosheng Zhang, Keyao Wang
― 7 leggere min
Scopri come l'IA risponde a domande visive e fornisce spiegazioni.
Pascal Tilli, Ngoc Thang Vu
― 6 leggere min
Impara a prevenire il collasso del modello nei modelli generativi usando dati reali.
Huminhao Zhu, Fangyikang Wang, Tianyu Ding
― 6 leggere min
Scopri come le illusioni ottiche influenzano i modelli VQA e le loro prestazioni.
Mohammadmostafa Rostamkhani, Baktash Ansari, Hoorieh Sabzevari
― 6 leggere min
Scopri come i modelli di linguaggio visivo collegano immagini e testo per macchine più intelligenti.
Quang-Hung Le, Long Hoang Dang, Ngan Le
― 7 leggere min
Un nuovo dataset unisce la comprensione video ad alto livello e a livello pixel per ricerche avanzate.
Ali Athar, Xueqing Deng, Liang-Chieh Chen
― 9 leggere min
Scopri come V2PE migliora i modelli Vision-Language per una migliore comprensione dei contesti lunghi.
Junqi Ge, Ziyi Chen, Jintao Lin
― 6 leggere min
Scopri come i nuovi metodi migliorano la precisione del timing nell'analisi video.
Xizi Wang, Feng Cheng, Ziyang Wang
― 5 leggere min
Un nuovo approccio migliora l'analisi video con sistemi di token dinamici.
Han Wang, Yuxiang Nie, Yongjie Ye
― 9 leggere min
OV-VSS rivoluziona il modo in cui le macchine comprendono i contenuti video, identificando nuovi oggetti senza sforzo.
Xinhao Li, Yun Liu, Guolei Sun
― 8 leggere min
Esaminando l'efficacia dei Modelli di Diffusione Latente Condizionale nel ripristino delle immagini.
Yunchen Yuan, Junyuan Xiao, Xinjie Li
― 9 leggere min
I ricercatori valutano l'efficacia dei modelli U-Net nei compiti di segmentazione delle immagini.
Robin Ghyselinck, Valentin Delchevalerie, Bruno Dumas
― 6 leggere min
Combinare telecamere a eventi e basate su frame migliora le capacità di stima del movimento.
Qianang Zhou, Zhiyu Zhu, Junhui Hou
― 6 leggere min
Un nuovo metodo aiuta i sistemi di intelligenza artificiale ad adattarsi ai dati sconosciuti in modo più efficace.
Jin-Seop Lee, Noo-ri Kim, Jee-Hyong Lee
― 6 leggere min
Esplora come le macchine analizzano le immagini da diversi angoli per una migliore interpretazione.
Honggyu An, Jinhyeon Kim, Seonghoon Park
― 8 leggere min
Scopri come si insegna ai computer a riconoscere le azioni umane con gli oggetti.
Mingda Jia, Liming Zhao, Ge Li
― 8 leggere min
Scopri come STEAM sta cambiando il deep learning con meccanismi di attenzione efficienti.
Rishabh Sabharwal, Ram Samarth B B, Parikshit Singh Rathore
― 8 leggere min
DeepSeek-VL2 unisce dati visivi e testuali per interazioni AI più intelligenti.
Zhiyu Wu, Xiaokang Chen, Zizheng Pan
― 6 leggere min
Scopri come la segmentazione guidata da prompt sta cambiando la tecnologia di riconoscimento delle immagini.
Yu-Jhe Li, Xinyang Zhang, Kun Wan
― 8 leggere min
SuperGSeg porta chiarezza a scene 3D complesse grazie a tecniche di segmentazione avanzate.
Siyun Liang, Sen Wang, Kunyi Li
― 6 leggere min
Un nuovo test per le macchine per rispondere a domande su immagini e testi.
Hyeonseok Lim, Dongjae Shin, Seohyun Song
― 7 leggere min
Metodi nuovi migliorano l'etichettatura delle immagini per una migliore performance e efficienza del modello.
Niclas Popp, Dan Zhang, Jan Hendrik Metzen
― 7 leggere min
Scopri come le macchine stanno migliorando la loro comprensione di immagini e testi.
Yeyuan Wang, Dehong Gao, Lei Yi
― 7 leggere min
Un nuovo metodo migliora la distillazione dei dataset per un riconoscimento delle immagini più efficiente.
Xinhao Zhong, Shuoyang Sun, Xulin Gu
― 6 leggere min
Scopri come gli autoencoder Wasserstein abbinati generano immagini basate su condizioni specifiche.
Moritz Piening, Matthias Chung
― 6 leggere min
I ricercatori scoprono come l'IA imita la visione umana tramite le reti neurali convolutional.
Yudi Xie, Weichen Huang, Esther Alter
― 6 leggere min
RapidNet migliora la velocità e la precisione nell'elaborazione delle immagini mobili.
Mustafa Munir, Md Mostafijur Rahman, Radu Marculescu
― 6 leggere min
Scopri come la segmentazione 3D aiuta i robot a riconoscere e etichettare oggetti in ambienti complessi.
Luis Wiedmann, Luca Wiehe, David Rozenberszki
― 6 leggere min
HGT-Track combina telecamere visibili e termiche per un tracciamento efficace di oggetti piccoli.
Qingyu Xu, Longguang Wang, Weidong Sheng
― 4 leggere min
Un nuovo metodo migliora l'identificazione delle persone usando informazioni delle immagini vicine.
Xiao Teng, Long Lan, Dingyao Chen
― 8 leggere min