Esaminando l'efficacia dei Modelli di Diffusione Latente Condizionale nel ripristino delle immagini.
Yunchen Yuan, Junyuan Xiao, Xinjie Li
― 9 leggere min
Scienza all'avanguardia spiegata semplicemente
Esaminando l'efficacia dei Modelli di Diffusione Latente Condizionale nel ripristino delle immagini.
Yunchen Yuan, Junyuan Xiao, Xinjie Li
― 9 leggere min
I ricercatori valutano l'efficacia dei modelli U-Net nei compiti di segmentazione delle immagini.
Robin Ghyselinck, Valentin Delchevalerie, Bruno Dumas
― 6 leggere min
Combinare telecamere a eventi e basate su frame migliora le capacità di stima del movimento.
Qianang Zhou, Zhiyu Zhu, Junhui Hou
― 6 leggere min
Un nuovo metodo aiuta i sistemi di intelligenza artificiale ad adattarsi ai dati sconosciuti in modo più efficace.
Jin-Seop Lee, Noo-ri Kim, Jee-Hyong Lee
― 6 leggere min
Esplora come le macchine analizzano le immagini da diversi angoli per una migliore interpretazione.
Honggyu An, Jinhyeon Kim, Seonghoon Park
― 8 leggere min
Scopri come si insegna ai computer a riconoscere le azioni umane con gli oggetti.
Mingda Jia, Liming Zhao, Ge Li
― 8 leggere min
Scopri come STEAM sta cambiando il deep learning con meccanismi di attenzione efficienti.
Rishabh Sabharwal, Ram Samarth B B, Parikshit Singh Rathore
― 8 leggere min
DeepSeek-VL2 unisce dati visivi e testuali per interazioni AI più intelligenti.
Zhiyu Wu, Xiaokang Chen, Zizheng Pan
― 6 leggere min
Scopri come la segmentazione guidata da prompt sta cambiando la tecnologia di riconoscimento delle immagini.
Yu-Jhe Li, Xinyang Zhang, Kun Wan
― 8 leggere min
SuperGSeg porta chiarezza a scene 3D complesse grazie a tecniche di segmentazione avanzate.
Siyun Liang, Sen Wang, Kunyi Li
― 6 leggere min
Un nuovo test per le macchine per rispondere a domande su immagini e testi.
Hyeonseok Lim, Dongjae Shin, Seohyun Song
― 7 leggere min
Metodi nuovi migliorano l'etichettatura delle immagini per una migliore performance e efficienza del modello.
Niclas Popp, Dan Zhang, Jan Hendrik Metzen
― 7 leggere min
Scopri come le macchine stanno migliorando la loro comprensione di immagini e testi.
Yeyuan Wang, Dehong Gao, Lei Yi
― 7 leggere min
Un nuovo metodo migliora la distillazione dei dataset per un riconoscimento delle immagini più efficiente.
Xinhao Zhong, Shuoyang Sun, Xulin Gu
― 6 leggere min
Scopri come gli autoencoder Wasserstein abbinati generano immagini basate su condizioni specifiche.
Moritz Piening, Matthias Chung
― 6 leggere min
I ricercatori scoprono come l'IA imita la visione umana tramite le reti neurali convolutional.
Yudi Xie, Weichen Huang, Esther Alter
― 6 leggere min
RapidNet migliora la velocità e la precisione nell'elaborazione delle immagini mobili.
Mustafa Munir, Md Mostafijur Rahman, Radu Marculescu
― 6 leggere min
Scopri come la segmentazione 3D aiuta i robot a riconoscere e etichettare oggetti in ambienti complessi.
Luis Wiedmann, Luca Wiehe, David Rozenberszki
― 6 leggere min
HGT-Track combina telecamere visibili e termiche per un tracciamento efficace di oggetti piccoli.
Qingyu Xu, Longguang Wang, Weidong Sheng
― 4 leggere min
Un nuovo metodo migliora l'identificazione delle persone usando informazioni delle immagini vicine.
Xiao Teng, Long Lan, Dingyao Chen
― 8 leggere min
I ricercatori hanno sviluppato un nuovo metodo per migliorare il tracciamento del movimento usando la stima del flusso normale.
Dehao Yuan, Levi Burner, Jiayi Wu
― 6 leggere min
Nuovi metodi migliorano la classificazione delle immagini, concentrandosi su piccole aree in immagini grandi.
Max Riffi-Aslett, Christina Fell
― 10 leggere min
GEM trasforma la previsione dei video e l'interazione con gli oggetti grazie a tecnologia innovativa.
Mariam Hassan, Sebastian Stapf, Ahmad Rahimi
― 6 leggere min
Scopri come la calibrazione auto-debiasing migliora il riconoscimento delle categorie nel machine learning.
Wenbin An, Haonan Lin, Jiahao Nie
― 7 leggere min
Scopri come un peso adeguato migliora le performance dell'IA nel multitasking.
Hugo Monzón Maldonado, Thomas Möllenhoff, Nico Daheim
― 6 leggere min
I modelli di stato che generano grafi migliorano il modo in cui le macchine apprendono dai dati complessi.
Nikola Zubić, Davide Scaramuzza
― 6 leggere min
Nuove tecniche migliorano il modo in cui le macchine riconoscono e interpretano le scene video.
Phúc H. Le Khac, Graham Healy, Alan F. Smeaton
― 7 leggere min
Un nuovo modo di analizzare le immagini sta cambiando il modo in cui i computer vedono e interpretano le foto.
Zhibing Li, Tong Wu, Jing Tan
― 7 leggere min
SamIC rivoluziona la segmentazione delle immagini con meno risorse e un apprendimento più veloce.
Savinay Nagendra, Kashif Rashid, Chaopeng Shen
― 6 leggere min
Nuovi metodi migliorano come l'IA descrive le immagini usando modelli linguistici.
Pingchuan Ma, Lennart Rietdorf, Dmytro Kotovenko
― 6 leggere min
SegMAN migliora l'etichettatura a livello di pixel nella computer vision per varie applicazioni.
Yunxiang Fu, Meng Lou, Yizhou Yu
― 7 leggere min
Scopri come HiGDA aiuta le macchine a riconoscere le immagini meglio nonostante le sfide.
Ba Hung Ngo, Doanh C. Bui, Nhat-Tuong Do-Tran
― 8 leggere min
Combinare CNN e metodi di attenzione per migliorare le prestazioni nella classificazione delle immagini.
Nikhil Kapila, Julian Glattki, Tejas Rathi
― 7 leggere min
Questo report parla dell'impatto delle etichette rumorose sui modelli di machine learning.
Wenxiao Fan, Kan Li
― 6 leggere min
Un nuovo metodo migliora il modo in cui i computer percepiscono le scene 3D.
Jiaxu Wan, Hong Zhang, Ziqi He
― 7 leggere min
Scopri come il skip tuning migliora l'efficienza nei modelli vision-language.
Shihan Wu, Ji Zhang, Pengpeng Zeng
― 7 leggere min
Nuovo metodo migliora il rilevamento dei punti facciali, anche in condizioni difficili.
Jui-Che Chiang, Hou-Ning Hu, Bo-Syuan Hou
― 7 leggere min
Scopri come i robot identificano e gestiscono le parti apribili con metodi di rilevamento avanzati.
Siqi Li, Xiaoxue Chen, Haoyu Cheng
― 8 leggere min
Scopri le funzionalità avanzate e le applicazioni di YOLOv6 nella rilevazione di oggetti in tempo reale.
Athulya Sundaresan Geetha
― 7 leggere min
Nuovo metodo trasforma il modo in cui la tecnologia cattura i movimenti delle mani con telecamere in movimento.
Zhengdi Yu, Stefanos Zafeiriou, Tolga Birdal
― 5 leggere min