Un nuovo approccio migliora la capacità dell'IA di gestire dati insoliti.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo approccio migliora la capacità dell'IA di gestire dati insoliti.
― 6 leggere min
Una nuova strategia di allenamento migliora la resistenza dei sistemi di visione 3D a input fuorvianti.
― 5 leggere min
LLaVA-3D combina intuizioni 2D e 3D per un ragionamento spaziale più profondo.
― 6 leggere min
Esplorando l'uso di dati sintetici per migliorare il DRL nelle applicazioni reali.
― 9 leggere min
InterNet migliora la stima della omografia imparando da immagini senza dati etichettati.
― 5 leggere min
Scopri le tecniche di denoising delle immagini per migliorare la chiarezza e la qualità.
― 6 leggere min
Un nuovo set di dati affronta i cambiamenti di prospettiva nella stima della profondità per la guida autonoma.
― 6 leggere min
Un metodo che combina dati di eventi e frame tradizionali per un'analisi del movimento migliore.
― 7 leggere min
Un nuovo approccio migliora il processo di apprendimento tra i modelli di insegnante e studente.
― 7 leggere min
Un nuovo metodo per bilanciare la conoscenza generale e l'adattamento specifico ai compiti nei modelli.
― 7 leggere min
AP-VLM migliora la percezione e l'interazione dei robot tramite tecniche di percezione attiva.
― 6 leggere min
P4Q combina il fine-tuning e la quantizzazione per performance efficienti dei modelli visivi-linguistici.
― 5 leggere min
Presentiamo TA-Cleaner, un metodo per migliorare le difese dei modelli multimodali contro il data poisoning.
― 8 leggere min
Un nuovo framework per il tracciamento visivo degli oggetti, leggero ed efficace.
― 7 leggere min
CAMOT migliora il tracciamento multi-oggetto stimando angoli e profondità della telecamera.
― 7 leggere min
SimVG migliora il grounding visivo collegando il testo a zone specifiche dell'immagine in modo più efficace.
― 6 leggere min
Il modello e il dataset EAGLE migliorano la comprensione dei video egocentrici.
― 5 leggere min
Nuovo metodo migliora l'accuratezza nel conteggio delle folle e l'affidabilità del modello.
― 5 leggere min
Esaminando come i modelli SSL memorizzano i punti dati e le sue implicazioni.
― 8 leggere min
Nuovi metodi migliorano l'efficienza e l'accuratezza nei modelli di visione basati su SSM.
― 6 leggere min
Un nuovo metodo migliora l'accuratezza della forma 3D in scene dinamiche.
― 5 leggere min
Nuovi metodi migliorano la velocità e la qualità nei compiti di deblurring delle immagini.
― 6 leggere min
Un nuovo metodo migliora il trasferimento di conoscenze nei modelli di machine learning.
― 6 leggere min
Presentiamo un metodo per far generare immagini all'AI senza grandi set di dati etichettati.
― 7 leggere min
GeCo migliora il conteggio degli oggetti con meno esempi, aumentando l'accuratezza e l'affidabilità.
― 6 leggere min
CION migliora la ri-identificazione delle persone concentrandosi sulle correlazioni d'identità tra i video.
― 6 leggere min
Un nuovo metodo migliora il rilevamento del bersaglio dello sguardo con meno dati etichettati.
― 7 leggere min
Un nuovo framework migliora l'etichettatura dei pixel affrontando l'incertezza nella segmentazione semantica.
― 7 leggere min
Questo studio valuta l'efficacia dei modelli pre-addestrati nelle applicazioni di Osservazione della Terra.
― 6 leggere min
Un nuovo metodo migliora l'allineamento dei dati, soprattutto con dataset rumorosi.
― 5 leggere min
Uno sguardo a come le CNN apprendono le caratteristiche delle immagini e le loro somiglianze universali.
― 7 leggere min
Esplorare metodi per migliorare i modelli multimodali nel rispondere a domande visive.
― 6 leggere min
TrojVLM espone vulnerabilità nei modelli di linguaggio visivo a attacchi backdoor.
― 7 leggere min
Un nuovo framework migliora la generazione di dati da più fonti usando modelli basati sull'energia.
― 6 leggere min
SATA migliora la robustezza e l'efficienza dei Vision Transformers per i compiti di classificazione delle immagini.
― 5 leggere min
Un nuovo metodo migliora il riconoscimento degli oggetti usando maschere senza etichette dettagliate.
― 5 leggere min
I PPLN migliorano l'elaborazione dei dati delle telecamere a evento per capacità di visione artificiale superiori.
― 6 leggere min
Analizzando gli effetti dei metodi di potatura sulle performance e sull'interpretabilità di GoogLeNet.
― 5 leggere min
Metodi innovativi per migliorare le mappe di profondità fondamentali per la realtà aumentata e virtuale.
― 6 leggere min
Un metodo per migliorare le prestazioni del modello nonostante etichette di dati sbagliate.
― 7 leggere min