Nuovo dataset migliora il tracciamento di più oggetti in condizioni video difficili.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Nuovo dataset migliora il tracciamento di più oggetti in condizioni video difficili.
― 6 leggere min
VILA-U integra video, immagini e compiti di lingua in un'unica struttura.
― 6 leggere min
Un nuovo approccio per migliorare il riconoscimento delle azioni nei video usando un nuovo layer TAG.
― 5 leggere min
Un nuovo metodo migliora la precisione nel localizzare oggetti dalle immagini.
― 5 leggere min
Un nuovo framework che migliora la comprensione di immagini e testo insieme.
― 9 leggere min
Usare l'IRT per valutare meglio le performance dei modelli di visione artificiale.
― 5 leggere min
HOGraspNet offre dati preziosi per studiare le interazioni mano-oggetto nella robotica e nella visione artificiale.
― 6 leggere min
Questo lavoro migliora i modelli visivi-linguistici con strategie di dati migliori e tecniche innovative.
― 7 leggere min
Un metodo che migliora la rete neurale convoluzionale concentrandosi sulle aree chiave dell'immagine per prendere decisioni migliori.
― 4 leggere min
Un modello che distingue le immagini reali da quelle generate al computer.
― 5 leggere min
Un nuovo metodo migliora la classificazione dei video ottimizzando la selezione dei fotogrammi.
― 8 leggere min
Un metodo strutturato per etichettare immagini e dati con precisione usando il modello sigma flow.
― 5 leggere min
Presentiamo PIP, uno strumento per rilevare attacchi avversari nei LVLM.
― 5 leggere min
Un nuovo metodo migliora l'identificazione degli oggetti nelle immagini attraverso un'integrazione visiva e testuale personalizzata.
― 6 leggere min
Un nuovo metodo migliora il rilevamento delle strade usando fonti di dati diverse.
― 6 leggere min
Nuovi metodi migliorano la stima della profondità usando immagini singole grazie a un'ottimizzazione dei dati aumentati.
― 7 leggere min
Nuovo metodo migliora la qualità delle nuvole di punti con funzioni di perdita pesate.
― 6 leggere min
RPP migliora l'adattamento e la generalizzazione nei modelli Vision-Language usando prompt raffinati.
― 8 leggere min
Questo metodo migliora i dataset di addestramento per una migliore performance nella segmentazione delle immagini.
― 6 leggere min
Lo studio confronta le abilità umane e quelle dell'IA nel riconoscere forme 3D da angolazioni diverse.
― 6 leggere min
Esaminare come i modelli di visione artificiale possono allinearsi con la comprensione visiva umana.
― 6 leggere min
Nuovo metodo migliora l'apprendimento continuo nella rilevazione degli oggetti.
― 8 leggere min
Un nuovo dataset punta a migliorare i metodi di rilevamento delle morphing facciali.
― 7 leggere min
Uno sguardo ai miglioramenti e alle sfide nella navigazione delle macchine usando visione e linguaggio.
― 5 leggere min
Un nuovo framework migliora il rilevamento degli oggetti identificando istanze fuori distribuzione usando prototipi.
― 6 leggere min
KRONC offre un metodo veloce per stimare le posizioni delle camere usando punti chiave sui veicoli.
― 5 leggere min
La competizione mette in mostra gli sforzi per modelli di guida più sicuri in condizioni difficili.
― 5 leggere min
EMBA migliora l'imaging panoramico usando la tecnologia delle telecamere a eventi.
― 4 leggere min
DetailCLIP migliora la comprensione delle immagini concentrandosi sui dettagli e sul contesto.
― 6 leggere min
gsplat semplifica il Gaussian Splatting per creare immagini 3D in modo efficiente.
― 7 leggere min
Un nuovo metodo permette alle macchine di modellare con precisione forme in movimento e che cambiano.
― 7 leggere min
Questo articolo parla di metodi per confrontare immagini usando modelli di elasticità non lineare.
― 5 leggere min
Utilizzare modelli CAD può migliorare la stima della posa del robot affrontando le incertezze.
― 7 leggere min
Un metodo per migliorare la comprensione dei robot sui componenti degli edifici usando dati RGB-D.
― 4 leggere min
Nuove metriche aiutano a valutare i metodi SSL utilizzando dati non etichettati in modo efficace.
― 4 leggere min
Seg-HGNN migliora la segmentazione delle immagini usando reti neurali grafiche iperboliche.
― 5 leggere min
Un nuovo metodo migliora il rilevamento degli oggetti nelle applicazioni in tempo reale.
― 6 leggere min
Questo articolo svela metodi per interpretare modelli simili a CLIP nell'IA.
― 6 leggere min
Un framework per migliorare le performance dell'AI nei compiti visivi imitandone i giudizi umani.
― 6 leggere min
Un nuovo modulo migliora la segmentazione di oggetti sconosciuti senza dover riaddestrare i modelli principali.
― 5 leggere min