Ground-VIO migliora la stima della posizione del veicolo usando relazioni tra camera e terreno.
― 7 leggere min
Scienza all'avanguardia spiegata semplicemente
Ground-VIO migliora la stima della posizione del veicolo usando relazioni tra camera e terreno.
― 7 leggere min
Un nuovo modello migliora il modo in cui le macchine riconoscono le immagini mescolando caratteristiche globali e locali.
― 7 leggere min
Una nuova strategia assicura una rappresentanza equa dei tipi di dati nel machine learning.
― 7 leggere min
Un nuovo modo per aumentare la fiducia nella rilevazione degli oggetti grazie a tecniche di calibrazione affidabili.
― 6 leggere min
Un nuovo metodo mostra come i riflessi oculari possano ricostruire ambienti 3D.
― 6 leggere min
MaskDiT migliora l'efficienza dell'allenamento dei modelli di diffusione mantenendo la qualità dell'immagine.
― 7 leggere min
Uno studio sulle prestazioni dei Modelli Fondamentali Visivi sotto distorsioni reali nei compiti di segmentazione.
― 9 leggere min
DiffAug migliora i sistemi di riconoscimento delle immagini grazie a tecniche di rumore innovative.
― 6 leggere min
Presentiamo CANN, un metodo per la localizzazione visiva precisa usando caratteristiche locali.
― 7 leggere min
Un nuovo metodo migliora la generazione di immagini da testo collegando correttamente entità e modificatori.
― 5 leggere min
Nuovi metodi migliorano la segmentazione degli strumenti chirurgici per operazioni robotiche più efficaci.
― 7 leggere min
Un nuovo metodo migliora l'analisi delle immagini per applicazioni biomediche.
― 6 leggere min
FETNet migliora i metodi per rimuovere il testo dalle immagini per una privacy migliore e una ripristino dell'immagine più efficace.
― 6 leggere min
Uno sguardo alla OpenLane Topology Challenge e ai suoi metodi innovativi.
― 6 leggere min
Un nuovo framework migliora la segmentazione delle nuvole di punti usando modelli di visione di base.
― 5 leggere min
La ricerca mostra che ci sono neuroni comuni che aiutano a capire tra diversi modelli di intelligenza artificiale.
― 5 leggere min
Presentiamo DreamSim, una misura allineata con la percezione visiva umana.
― 7 leggere min
Un nuovo modello analizza le interazioni sociali usando immagini 2D per simulare comportamenti 3D.
― 4 leggere min
Introducendo un nuovo metodo per il riconoscimento di oggetti zero-shot usando descrizioni testuali.
― 8 leggere min
OpenOOD v1.5 migliora i metodi di valutazione per la rilevazione di OOD per prestazioni affidabili.
― 6 leggere min
Una panoramica dei metodi di segmentazione delle immagini di cibo e della loro importanza per la nutrizione.
― 6 leggere min
La perdita ELM migliora l'accuratezza della classificazione per le classi minoritarie nei modelli di riconoscimento delle immagini.
― 5 leggere min
Un nuovo metodo migliora l'adattamento di dominio nella segmentazione semantica usando l'apprendimento contrastivo.
― 8 leggere min
Un nuovo approccio migliora l'adattabilità degli agenti in ambienti complessi.
― 8 leggere min
Un modo semplice per creare layout di stanze 3D dettagliati usando annotazioni 2D.
― 6 leggere min
Combinare filtri passa-alto e autoencoder migliora le grafiche vettoriali dalle immagini.
― 5 leggere min
Ricerca su tecniche per migliorare le performance del Visual Question Answering.
― 6 leggere min
Nuovi metodi migliorano l'efficienza e le prestazioni del filtro inverso delle immagini.
― 6 leggere min
Uno studio su come abbinare le azioni nei video nel tempo e nello spazio.
― 6 leggere min
Questo metodo migliora la percezione 3D per le auto a guida autonoma usando i dati delle telecamere.
― 6 leggere min
Un nuovo metodo migliora le prestazioni della segmentazione delle immagini tramite tecniche innovative.
― 5 leggere min
Un nuovo modello migliora l'efficienza e l'adattabilità dell'apprendimento con pochi campioni.
― 6 leggere min
MOSAIC rivoluziona la ricostruzione delle immagini da dati limitati usando tecniche flessibili.
― 6 leggere min
Questo articolo presenta un metodo che combina il machine learning con il feedback umano per etichettare le immagini più velocemente.
― 7 leggere min
Esaminare il ruolo dell'apprendimento auto-supervisionato nel migliorare i modelli transformer per compiti di nuvole di punti.
― 10 leggere min
CID offre un nuovo modo per elaborare le nuvole di punti 3D in modo efficiente.
― 6 leggere min
Migliorare l'accuratezza nella rilevazione 3D usando tecniche innovative di mappa di profondità.
― 6 leggere min
DH-PTAM combina telecamere stereo e telecamere a eventi per mappature migliori.
― 5 leggere min
Nuovi metodi migliorano la qualità e l'efficienza della denoising delle immagini.
― 5 leggere min
Un nuovo approccio migliora le configurazioni di pooling nelle reti neurali convoluzionali.
― 7 leggere min