Un nuovo approccio semplifica l'adattamento per il rilevamento degli oggetti in diversi ambienti.
― 7 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo approccio semplifica l'adattamento per il rilevamento degli oggetti in diversi ambienti.
― 7 leggere min
M 3D migliora la comprensione delle macchine dei dati visivi usando immagini e informazioni di profondità.
― 5 leggere min
Un nuovo metodo migliora il fine-tuning dei vision transformer, riducendo le esigenze di calcolo.
― 5 leggere min
ObVi-SLAM migliora la localizzazione dei robot combinando caratteristiche visive e rilevamento di oggetti.
― 9 leggere min
Un metodo per trasformare i volti in cartoni mantenendo le caratteristiche uniche.
― 6 leggere min
Un nuovo approccio traduce le descrizioni testuali in sequenze video.
― 5 leggere min
Un nuovo approccio semplifica il design dei modelli per dispositivi con potenza di calcolo limitata.
― 6 leggere min
Migliorare il Zero-Shot NAS con la correzione dei bias per prestazioni migliori del modello.
― 5 leggere min
Mask4D migliora il tracciamento e il riconoscimento degli oggetti in ambienti dinamici utilizzando dati LiDAR.
― 6 leggere min
Presentiamo un metodo di apprendimento attivo che unisce incertezza e diversità per migliorare l'efficienza dell'etichettatura.
― 8 leggere min
Combinare punti e linee migliora l'accuratezza nel valutare le relazioni tra le immagini.
― 4 leggere min
Presentiamo Q-REG, un metodo che ottimizza la registrazione delle nuvole di punti 3D attraverso un allenamento end-to-end.
― 7 leggere min
Nuovi metodi migliorano le performance del VideoQA usando pochissimi dati per il training.
― 6 leggere min
STRPCA migliora la sottrazione dello sfondo per una migliore rilevazione degli oggetti nei video.
― 6 leggere min
Un nuovo metodo per creare immagini velocemente basate sulle posizioni delle fotocamere in spazi reali.
― 8 leggere min
Nuovo dataset e metodo migliorano la precisione e l'efficienza del parsing delle facciate.
― 6 leggere min
Combinare modelli di linguaggio e visione migliora la risposta a domande su immagini senza bisogno di un allenamento intensivo.
― 6 leggere min
Uno studio mostra che l'apprendimento contrastivo supervisionato migliora le prestazioni del modello su diversi dataset.
― 5 leggere min
Scopri nuove tecniche che migliorano l'orientamento della fotocamera nella ricostruzione di scene 3D.
― 5 leggere min
Un nuovo modello migliora il riconoscimento delle immagini adattandosi in modo unico alle trasformazioni.
― 6 leggere min
Presentiamo MetaCLIP per una migliore raccolta di dati immagine-testo.
― 8 leggere min
Model2Scene usa modelli CAD e linguaggio per migliorare l'apprendimento delle scene 3D.
― 5 leggere min
Un nuovo metodo migliora il monitoraggio e l'elaborazione nell'analisi video.
― 6 leggere min
Nuovo metodo riduce i token visivi per un allenamento più economico.
― 5 leggere min
Scopri i metodi per gestire in modo efficiente i dati multi-dimensionali usando il recupero dei tensori.
― 8 leggere min
Un nuovo metodo migliora il rilevamento degli oggetti integrando dati RGB e IR.
― 5 leggere min
Un nuovo set di dati migliora l'apprendimento automatico per rispondere con precisione a domande visive.
― 7 leggere min
Un nuovo framework migliora la precisione del rilevamento degli oggetti in ambienti reali.
― 6 leggere min
Questo articolo parla di un nuovo modo per migliorare la navigazione dei robot usando il riconoscimento dei luoghi.
― 6 leggere min
Questo articolo parla di come usare l'entropia per migliorare le prestazioni e l'interpretabilità delle reti neurali.
― 5 leggere min
Un nuovo dataset migliora l'apprendimento zero-shot per il riconoscimento delle azioni nei video.
― 7 leggere min
Scopri l'impatto delle reti di filtraggio dei dati sui dataset di machine learning e sulle prestazioni del modello.
― 7 leggere min
Un nuovo metodo migliora il rendering di scene dinamiche usando tecniche di warping in avanti.
― 6 leggere min
Geal migliora l'efficienza nella selezione dei dati nella visione computerizzata usando modelli generali.
― 7 leggere min
Nuovo dataset e modello migliorano l'identificazione degli oggetti da query complesse.
― 5 leggere min
APNet combina immagini aeree e nuvole di punti per un'analisi urbana migliore.
― 6 leggere min
Un nuovo sistema migliora il tracciamento degli oggetti in ambienti dinamici per robot e auto a guida autonoma.
― 6 leggere min
Questo studio esplora YOLOv5 per la rilevazione efficace del layout dei documenti e l'estrazione dei dati.
― 7 leggere min
Ricerca su come migliorare la stima della posa umana attraverso dataset diversi e il ridimensionamento dei modelli.
― 7 leggere min
Un confronto delle misure di qualità delle immagini nella generazione di immagini moderna.
― 5 leggere min