Un nuovo sistema migliora la rappresentazione delle scene 3D usando immagini 2D limitate.
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo sistema migliora la rappresentazione delle scene 3D usando immagini 2D limitate.
― 5 leggere min
Un nuovo approccio per migliorare l'abbinamento immagine-testo usando modelli dual-encoder e grafi di scena.
― 7 leggere min
Un nuovo metodo migliora l'accuratezza e la coerenza nei compiti di classificazione gerarchica.
― 9 leggere min
PartCLIPSeg migliora la segmentazione delle parti nella visione artificiale per un riconoscimento degli oggetti migliore.
― 5 leggere min
Nuove tecniche migliorano la velocità e la precisione nei compiti di ricerca delle immagini.
― 8 leggere min
L-ICV migliora le prestazioni nel rispondere a domande visive usando meno esempi.
― 6 leggere min
Esaminando come i modelli transformer migliorano con dimensione e complessità.
― 7 leggere min
Un nuovo modello migliora l'inversione e la modifica delle immagini, aumentando la qualità e la preservazione dei dettagli.
― 5 leggere min
Il nuovo modello ChangeViT migliora la rilevazione dei cambiamenti nelle immagini satellitari e dei droni.
― 8 leggere min
Presentiamo SeTAR, una soluzione senza bisogno di allenamento per rilevare dati fuori distribuzione nelle reti neurali.
― 7 leggere min
Un nuovo metodo mescola immagini reali e sintetiche per migliorare i modelli di apprendimento automatico.
― 5 leggere min
TRIP migliora l'efficienza del riconoscimento visivo delle macchine utilizzando dati provenienti da telecamere a eventi.
― 7 leggere min
Un nuovo metodo per insegnare alle macchine tramite video nonostante le differenze visive.
― 6 leggere min
Un nuovo metodo per stimare la posa degli oggetti usando dati debolmente etichettati mostra risultati promettenti.
― 7 leggere min
Un nuovo modello di diffusione migliora il restauro delle immagini a partire da versioni degradate.
― 7 leggere min
Un nuovo metodo migliora la generazione di immagini senza set di dati abbinati.
― 7 leggere min
Uno studio su come i modelli di stima della posa si comportano con immagini corrotte.
― 8 leggere min
Un'analisi approfondita su quanto bene i modelli visivi riconoscono e rappresentano più oggetti.
― 5 leggere min
Il Flusso Statistico di Corrispondenza migliora il modeling generativo per le sfide dei dati discreti.
― 5 leggere min
Uno studio sulla fiducia e l'incertezza nei risultati della segmentazione semantica.
― 7 leggere min
Un nuovo metodo migliora il riconoscimento delle azioni nei video usando il linguaggio contestuale.
― 8 leggere min
Un nuovo metodo per migliorare rapidamente la qualità delle immagini utilizzando modelli addestrati.
― 4 leggere min
DiPEx migliora i tassi di rilevamento degli oggetti usando prompt unici e diversi.
― 7 leggere min
Esaminando come i vision transformers capiscono le relazioni tra gli oggetti nelle immagini.
― 7 leggere min
Esplorando come i Transformer classificano i dati attraverso le informazioni contestuali.
― 6 leggere min
Una nuova rete migliora il rilevamento 3D degli oggetti usando etichette deboli.
― 7 leggere min
Un nuovo modello migliora il legame tra comprensione visiva e linguistica.
― 5 leggere min
I ricercatori migliorano i modelli di diffusione con modelli di coerenza più veloci, mantenendo la qualità.
― 7 leggere min
La previsione di sovrapposizione visiva migliora l'accuratezza e l'efficienza del recupero delle immagini in ambienti complessi.
― 6 leggere min
Diff-ID migliora il riconoscimento delle persone generando immagini di addestramento diverse.
― 7 leggere min
MoMo migliora la qualità dei video modellando i movimenti tra i fotogrammi.
― 7 leggere min
POPCat velocizza l'etichettatura dei video per i compiti di visione artificiale mantenendo la precisione.
― 7 leggere min
Affrontare i pregiudizi nel riconoscimento facciale attraverso dataset di addestramento bilanciati.
― 8 leggere min
Un nuovo metodo combina visione e linguaggio per stimare la posizione di oggetti non visti.
― 6 leggere min
Un nuovo modello migliora il riconoscimento delle azioni in ambienti bui usando la tecnologia dei video transformer.
― 7 leggere min
Il BPA migliora come rappresentiamo le caratteristiche in vari compiti di dati.
― 5 leggere min
Questo articolo parla di un metodo per addestrare agenti generalisti usando il linguaggio e la visione.
― 6 leggere min
Structure flow offre informazioni sui movimenti in tempo reale per robotica e veicoli autonomi.
― 8 leggere min
Un nuovo modello migliora l'accuratezza nella segmentazione 3D utilizzando nuvole di punti.
― 9 leggere min
Un nuovo metodo che combina tecniche di generazione e comprensione delle immagini per un migliore apprendimento automatico.
― 6 leggere min