Questo dataset aiuta i robot a capire meglio gli ambienti urbani.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Questo dataset aiuta i robot a capire meglio gli ambienti urbani.
― 6 leggere min
Un nuovo metodo offre molteplici motivi per le classificazioni delle immagini, migliorando comprensione e fiducia.
― 5 leggere min
SINCERE migliora l'apprendimento contrastivo supervisionato con una migliore separazione e rappresentazione delle classi.
― 6 leggere min
Valutare modelli grandi su compiti visivi di basso livello tramite Q-Bench.
― 5 leggere min
AsymFormer migliora la comprensione dell'ambiente da parte dei robot con un'elaborazione RGB-D efficiente.
― 5 leggere min
Strategie per migliorare l'interpretabilità nei sistemi di intelligenza artificiale per una comprensione migliore.
― 6 leggere min
Questo articolo esplora il ruolo dei modelli linguistici nel rispondere a domande tratte dai documenti.
― 7 leggere min
Un nuovo set di dati pensato per migliorare il riconoscimento degli oggetti durante il taglio.
― 7 leggere min
Un nuovo metodo permette ai modelli di riconoscere sia oggetti conosciuti che sconosciuti.
― 7 leggere min
Un nuovo metodo genera etichette dettagliate per la segmentazione semantica usando dati sintetici.
― 10 leggere min
Nuovi metodi migliorano la valutazione delle prestazioni di piccoli oggetti in WSSS.
― 6 leggere min
Il metodo BoIR migliora il tracciamento di più persone nelle immagini, aumentando l'accuratezza in scenari affollati.
― 5 leggere min
Un nuovo metodo migliora l'apprendimento di oggetti 3D senza dati etichettati.
― 6 leggere min
Un nuovo metodo migliora il posizionamento delle telecamere per la generazione di immagini 3D di alta qualità.
― 6 leggere min
Nuovi metodi migliorano l'efficienza della memoria e la precisione nella segmentazione degli oggetti nei video.
― 7 leggere min
Un nuovo metodo migliora la stima della posa 3D da immagini 2D di più persone.
― 5 leggere min
Un nuovo approccio semplifica l'adattamento per il rilevamento degli oggetti in diversi ambienti.
― 7 leggere min
M 3D migliora la comprensione delle macchine dei dati visivi usando immagini e informazioni di profondità.
― 5 leggere min
Un nuovo metodo migliora il fine-tuning dei vision transformer, riducendo le esigenze di calcolo.
― 5 leggere min
ObVi-SLAM migliora la localizzazione dei robot combinando caratteristiche visive e rilevamento di oggetti.
― 9 leggere min
Un metodo per trasformare i volti in cartoni mantenendo le caratteristiche uniche.
― 6 leggere min
Un nuovo approccio traduce le descrizioni testuali in sequenze video.
― 5 leggere min
Un nuovo approccio semplifica il design dei modelli per dispositivi con potenza di calcolo limitata.
― 6 leggere min
Migliorare il Zero-Shot NAS con la correzione dei bias per prestazioni migliori del modello.
― 5 leggere min
Mask4D migliora il tracciamento e il riconoscimento degli oggetti in ambienti dinamici utilizzando dati LiDAR.
― 6 leggere min
Presentiamo un metodo di apprendimento attivo che unisce incertezza e diversità per migliorare l'efficienza dell'etichettatura.
― 8 leggere min
Combinare punti e linee migliora l'accuratezza nel valutare le relazioni tra le immagini.
― 4 leggere min
Presentiamo Q-REG, un metodo che ottimizza la registrazione delle nuvole di punti 3D attraverso un allenamento end-to-end.
― 7 leggere min
Nuovi metodi migliorano le performance del VideoQA usando pochissimi dati per il training.
― 6 leggere min
STRPCA migliora la sottrazione dello sfondo per una migliore rilevazione degli oggetti nei video.
― 6 leggere min
Un nuovo metodo per creare immagini velocemente basate sulle posizioni delle fotocamere in spazi reali.
― 8 leggere min
Nuovo dataset e metodo migliorano la precisione e l'efficienza del parsing delle facciate.
― 6 leggere min
Combinare modelli di linguaggio e visione migliora la risposta a domande su immagini senza bisogno di un allenamento intensivo.
― 6 leggere min
Uno studio mostra che l'apprendimento contrastivo supervisionato migliora le prestazioni del modello su diversi dataset.
― 5 leggere min
Scopri nuove tecniche che migliorano l'orientamento della fotocamera nella ricostruzione di scene 3D.
― 5 leggere min
Un nuovo modello migliora il riconoscimento delle immagini adattandosi in modo unico alle trasformazioni.
― 6 leggere min
Presentiamo MetaCLIP per una migliore raccolta di dati immagine-testo.
― 8 leggere min
Model2Scene usa modelli CAD e linguaggio per migliorare l'apprendimento delle scene 3D.
― 5 leggere min
Un nuovo metodo migliora il monitoraggio e l'elaborazione nell'analisi video.
― 6 leggere min
Nuovo metodo riduce i token visivi per un allenamento più economico.
― 5 leggere min