Un nuovo metodo migliora il riconoscimento delle azioni nei video non editati usando pochi esempi.
― 9 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo metodo migliora il riconoscimento delle azioni nei video non editati usando pochi esempi.
― 9 leggere min
Un nuovo approccio per la stima della profondità da un'immagine singola, superando i limiti della fotocamera.
― 8 leggere min
COCO-ReM migliora il rilevamento degli oggetti affinando le annotazioni originali del dataset COCO.
― 5 leggere min
Un nuovo metodo migliora la diversità dei dati per avere modelli 3D delle mani migliori.
― 8 leggere min
Un nuovo modo per rendere più facile gestire dati ad alta dimensione.
― 7 leggere min
Un nuovo metodo migliora l'accuratezza della localizzazione della fotocamera mantenendo la privacy degli utenti.
― 5 leggere min
Un nuovo metodo per verificare le reti neurali profonde usando modelli visivi-linguistici.
― 8 leggere min
Il framework X-MIC migliora i modelli per riconoscere le azioni nei video in prima persona.
― 6 leggere min
Un nuovo metodo migliora la misurazione della profondità degli oggetti trasparenti usando segmentazione e NeRF.
― 7 leggere min
Diff-Mix migliora la classificazione delle immagini creando dati sintetici diversi.
― 7 leggere min
Un nuovo approccio migliora il captioning delle immagini con tecniche che tengono conto della posizione.
― 6 leggere min
Nuovo sistema migliora il rilevamento degli oggetti usando fonti di dati diverse.
― 6 leggere min
Un nuovo metodo migliora l'apprendimento auto-supervisionato concentrandosi su coppie di immagini di alta qualità.
― 5 leggere min
Introduzione a GlORIE-SLAM, un nuovo sistema SLAM solo RGB.
― 7 leggere min
Un nuovo approccio migliora la precisione nell'allineamento dei grafi 3D delle scene per compiti spaziali.
― 6 leggere min
Un nuovo metodo riduce l'input manuale necessario per la ricostruzione di scene 3D.
― 5 leggere min
Un nuovo metodo per migliorare il rilevamento degli oggetti affrontando il problema dello sbilanciamento tra classi.
― 6 leggere min
Le tecniche di visione attiva migliorano la resilienza del deep learning contro gli input avversariali.
― 5 leggere min
Migliorare il rilevamento di oggetti grandi negli ambienti dei veicoli autonomi.
― 6 leggere min
Nuovi metodi migliorano il rilevamento delle azioni nei video contro varie corruzioni.
― 6 leggere min
Un nuovo metodo migliora come i modelli rappresentano le relazioni tra gli oggetti nelle immagini generate.
― 6 leggere min
Un nuovo dataset migliora i metodi di tracciamento usando immagini RGB e termiche.
― 7 leggere min
NeSLAM migliora la mappatura 3D e il tracciamento delle telecamere per vari usi.
― 9 leggere min
Un nuovo framework migliora la comprensione e le prestazioni dei modelli basati su griglia.
― 6 leggere min
Nuovi metodi accelerano l'allenamento per il mascheramento delle immagini senza perdere prestazioni.
― 7 leggere min
Introduciamo un metodo veloce per l'allenamento su CIFAR-10, migliorando precisione e velocità.
― 5 leggere min
Ehi, ti presento ME-ViT, un acceleratore FPGA super efficiente in termini di memoria per i Vision Transformers.
― 7 leggere min
Un nuovo metodo migliora la mappatura dell'ambiente 3D usando il mosaico di nuvole di punti.
― 6 leggere min
Un nuovo metodo migliora l'allineamento immagine-testo riducendo il bias di un solo tag.
― 4 leggere min
Un nuovo metodo migliora le mappe di profondità concentrandosi sulla chiarezza dei bordi.
― 9 leggere min
Presentando un approccio efficiente per il matching delle forme con mappe funzionali.
― 7 leggere min
DPA-Net crea modelli 3D strutturati da immagini minime, semplificando i processi di design.
― 7 leggere min
Un metodo per migliorare il rilevamento di oggetti 3D usando i dati LiDAR.
― 6 leggere min
Un nuovo modello migliora l'efficienza nella creazione di immagini usando tecniche nel dominio della frequenza.
― 6 leggere min
Nuovo approccio migliora il riconoscimento dei marciapiedi per i veicoli autonomi.
― 7 leggere min
Questo studio esamina come la profondità del trasformatore influisce sui compiti di apprendimento.
― 5 leggere min
Un nuovo modello migliora il riconoscimento delle azioni nei video non tagliati riducendo al minimo l'uso della memoria.
― 8 leggere min
Questo studio si concentra sul miglioramento dell'accuratezza spaziale nella generazione di immagini a partire dal testo.
― 7 leggere min
Un nuovo metodo migliora l'efficienza nella creazione di avatar umani.
― 6 leggere min
TEAR allinea in modo efficiente grandi set di punti 3D, superando problemi di outliers e di memoria.
― 6 leggere min