M IST migliora l'interazione tra modelli visivi e linguistici per una performance migliore.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
M IST migliora l'interazione tra modelli visivi e linguistici per una performance migliore.
― 6 leggere min
Un nuovo strumento per migliorare l'analisi delle forme nella scienza e nella tecnologia.
― 7 leggere min
LatentDEM affronta in modo efficace i problemi inversi ciechi nella visione e grafica computerizzata.
― 6 leggere min
Nuovi metodi migliorano la generazione di immagini allineando i risultati con descrizioni testuali specifiche.
― 7 leggere min
Una rete leggera per la stima in tempo reale della posa sui dispositivi mobili.
― 7 leggere min
Proponiamo un metodo per migliorare l'efficienza dei vision transformers sui dispositivi edge.
― 6 leggere min
Scopri come confrontare misure di probabilità su strutture dati complesse.
― 7 leggere min
Un nuovo metodo migliora la capacità dei robot di trovare oggetti in ambienti aperti.
― 8 leggere min
Nuovi metodi migliorano il riconoscimento di piccoli oggetti nella visione artificiale.
― 7 leggere min
Un nuovo metodo riduce la necessità di dati etichettati nei compiti di visione artificiale.
― 6 leggere min
Il modello GCF migliora la precisione nel riconoscimento delle espressioni facciali grazie a tecniche innovative di deep learning.
― 6 leggere min
Un nuovo framework punta a rilevare e correggere gli errori nei risultati degli LVLM.
― 7 leggere min
Nuovi metodi migliorano la creazione di più oggetti nelle immagini con maggiore precisione.
― 7 leggere min
Un nuovo approccio migliora la previsione delle azioni future usando intuizioni visive e semantiche.
― 6 leggere min
Un nuovo metodo che usa la topologia migliora il rilevamento dei punti chiave nelle immagini.
― 7 leggere min
HRSAM migliora l'efficienza e l'accuratezza della segmentazione delle immagini per input ad alta risoluzione.
― 6 leggere min
HTCL migliora la comprensione delle scene 3D usando i dati della fotocamera dai frame passati.
― 4 leggere min
Label Anything migliora la segmentazione con meno esempi e vari prompt.
― 5 leggere min
CountFormer migliora il conteggio delle folle attraverso l'elaborazione multi-view, aumentando precisione e flessibilità.
― 5 leggere min
Presentiamo un nuovo modello che combina in modo efficiente testo e layout per una migliore comprensione dei documenti.
― 5 leggere min
FlowTrack migliora il tracciamento concentrandosi sui singoli spostamenti dei punti e sui dati storici.
― 5 leggere min
Un nuovo metodo semplifica la modellazione 3D negli spazi usando sistemi di telecamere-proiettori non calibrati.
― 5 leggere min
Un nuovo metodo migliora il rilevamento e il tracciamento nei veicoli autonomi usando telecamere multi-view.
― 6 leggere min
Nuovo metodo migliora l'accuratezza della previsione visiva tramite rappresentazione degli oggetti.
― 5 leggere min
CLAMP-ViT offre un nuovo modo per comprimere i vision transformer usando dati sintetici.
― 7 leggere min
Esplora l'evoluzione e i vantaggi di YOLO nella rilevazione degli oggetti.
― 5 leggere min
Un nuovo metodo migliora la ricostruzione di scene urbane 3D da diversi punti di vista.
― 6 leggere min
Un nuovo framework analizza e riduce il bias nei modelli vision-linguaggio attraverso interventi mirati.
― 6 leggere min
Un nuovo metodo migliora l'apprendimento auto-supervisionato aggiungendo un componente di memoria.
― 6 leggere min
Un nuovo design per i layer convoluzionali riduce i parametri e migliora l'interpretabilità nei modelli di intelligenza artificiale.
― 6 leggere min
Nuovo dataset migliora la generazione di immagini e testi nei modelli Vision-Language.
― 4 leggere min
Un nuovo metodo migliora il modeling 3D dai video di una sola camera.
― 5 leggere min
Introducendo un nuovo metodo per una migliore generalizzazione del dominio nel machine learning.
― 8 leggere min
Un nuovo dataset aiuta a prevedere i tratti individuali dalle immagini a figura intera.
― 5 leggere min
Un nuovo metodo aiuta i robot a vedere chiaramente l'ambiente circostante senza input umani.
― 5 leggere min
Questa ricerca esamina come i problemi visivi influenzano i modelli di Risposta a Domande Visive.
― 7 leggere min
Nuovi metodi di normalizzazione migliorano la capacità di Slot Attention di riconoscere oggetti nelle immagini.
― 6 leggere min
Un nuovo metodo migliora la stima della profondità usando immagini provenienti da più telecamere.
― 5 leggere min
Un metodo di ensemble innovativo migliora l'accuratezza dei modelli linguistici e visivi.
― 7 leggere min
Scopri come i modelli di diffusione migliorano l'augmentazione dei dati delle immagini nel machine learning.
― 8 leggere min