Questo studio esplora nuovi metodi per rilevare i pedoni in condizioni meteorologiche avverse.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Questo studio esplora nuovi metodi per rilevare i pedoni in condizioni meteorologiche avverse.
― 6 leggere min
DroneVis semplifica i compiti di visione artificiale per i droni, migliorando l'usabilità e la funzionalità.
― 8 leggere min
Un nuovo metodo migliora le prestazioni dei modelli visione-linguaggio con classi conosciute e sconosciute.
― 7 leggere min
Uno studio sulle prestazioni dei modelli di Diffusione rispetto ai GAN per il miglioramento della qualità delle immagini.
― 7 leggere min
Esplorare metodi per migliorare la precisione della posizione nelle immagini aeree.
― 6 leggere min
Diff-Tuning migliora i modelli di diffusione per una generazione di immagini e un'adattamento migliore.
― 5 leggere min
Combinare modelli di linguaggio visivo con l'apprendimento per rinforzo migliora l'efficienza nel completare i compiti.
― 6 leggere min
Nuovi metodi migliorano la comprensione delle interazioni dinamiche nei contenuti video.
― 7 leggere min
Nuovi metodi migliorano la stima dell'orientamento della testa per una maggiore precisione in situazioni reali.
― 9 leggere min
TransCLIP migliora le previsioni integrando dati visivi e testuali nei modelli Vision-Language.
― 7 leggere min
Questo studio valuta i tracker a trasformatore contro attacchi avversariali nel tracking degli oggetti.
― 5 leggere min
SpatialRGPT migliora la comprensione della disposizione degli oggetti nei modelli di linguaggio visivo.
― 7 leggere min
Un framework per collegare l'elaborazione delle immagini e l'interpretazione del testo nei modelli di visione.
― 6 leggere min
Un metodo che utilizza MCMC per una generazione efficace di campioni negativi nell'apprendimento contrastivo.
― 5 leggere min
Questo studio analizza i metodi di clustering delle immagini su grandi set di dati, evidenziando le variazioni nelle prestazioni.
― 7 leggere min
Nuovo modello migliora le previsioni delle interazioni tra oggetti usando video e immagini.
― 6 leggere min
Presentiamo CUT, un framework per la generazione di anomalie realistiche e diverse senza formazione extra.
― 6 leggere min
Questa ricerca mostra come le immagini e il testo interagiscono nei compiti di ragionamento.
― 7 leggere min
Un nuovo metodo per migliorare i meccanismi di attenzione nella lavorazione di dati complessi.
― 7 leggere min
Open-YOLO 3D migliora la segmentazione delle istanze 3D con velocità e precisione.
― 7 leggere min
Un nuovo approccio migliora l'apprendimento visivo incorporando la rappresentazione di oggetti 3D.
― 8 leggere min
Questo studio esamina quanto bene i modelli pre-addestrati raggruppano dati non visti.
― 6 leggere min
Scopri come MetaMixer trasforma l'efficienza e l'adattabilità dei modelli.
― 6 leggere min
La ricerca mostra come i patch di attivazione influenzano la generazione di immagini nei modelli di diffusione.
― 7 leggere min
DiffCut offre un nuovo modo di fare segmentazione delle immagini senza dati etichettati.
― 5 leggere min
Gear-NeRF migliora il rendering delle scene 3D dinamiche usando tecniche sensibili al movimento.
― 7 leggere min
Presentiamo DOMA, un modello per prevedere il movimento in scene 3D.
― 7 leggere min
Un nuovo framework migliora la registrazione delle nuvole di punti usando marker fiduciali LiDAR.
― 7 leggere min
Un nuovo metodo migliora l'accuratezza dei piccoli modelli usando dati sintetici.
― 6 leggere min
Un nuovo metodo migliora la classificazione delle immagini usando descrizioni testuali dettagliate.
― 7 leggere min
MambaDepth offre un approccio nuovo per stimare la profondità da immagini singole.
― 8 leggere min
Un metodo per bilanciare precisione e costo nei modelli di classificazione delle immagini.
― 10 leggere min
Un nuovo metodo crea modelli 3D dettagliati da immagini singole in modo rapido.
― 6 leggere min
Esaminando il ruolo dei neuroni nei modelli CLIP e le loro interazioni.
― 8 leggere min
Questo documento esplora come i MLLM memorizzano e trasferiscono informazioni nel rispondere a domande visive.
― 6 leggere min
MASA impara a seguire gli oggetti usando immagini senza etichette, migliorando l'adattabilità in situazioni diverse.
― 6 leggere min
ReDistill offre una soluzione innovativa per ridurre l'uso massimo della memoria nelle reti neurali.
― 7 leggere min
Questo articolo esamina come i modelli di diffusione migliorano la generazione e la manipolazione delle immagini.
― 7 leggere min
Un nuovo metodo migliora la segmentazione delle immagini permettendo etichette testuali flessibili.
― 7 leggere min
Un sistema che crea e modifica oggetti tenuti in mano nelle immagini.
― 10 leggere min