Un nuovo modello migliora il legame tra i video e le loro descrizioni testuali.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo modello migliora il legame tra i video e le loro descrizioni testuali.
― 6 leggere min
Un nuovo metodo migliora la precisione del rilevamento dei punti chiave nella visione artificiale.
― 7 leggere min
Un nuovo framework combina vari tipi di guida per migliorare le prestazioni di segmentazione.
― 7 leggere min
Crowd-SAM migliora il rilevamento degli oggetti in ambienti affollati con meno immagini etichettate.
― 5 leggere min
Un nuovo metodo migliora la generazione delle immagini organizzando lo spazio latente nei modelli di diffusione.
― 6 leggere min
Un nuovo metodo migliora l'accuratezza nella stima della profondità usando l'imaging a campo luminoso.
― 7 leggere min
Una nuova metrica migliora l'accuratezza del riconoscimento delle immagini riducendo i costi computazionali.
― 8 leggere min
Scopri come il transfer learning migliora i risultati dei modelli usando conoscenze da compiti correlati.
― 7 leggere min
LookupViT migliora i compiti di riconoscimento visivo tramite un'elaborazione efficiente dei token.
― 6 leggere min
Il framework CHOSEN migliora i Vision Transformers per un uso efficiente degli FPGA.
― 5 leggere min
Un nuovo metodo migliora la segmentazione semi-supervisionata concentrandosi su pseudo-etichettature affidabili.
― 7 leggere min
Un nuovo metodo unisce i dati delle telecamere a eventi e delle telecamere a frame per una migliore rilevazione degli oggetti.
― 5 leggere min
Questo articolo esamina l'efficacia dei modelli multimodali che usano dati linguistici e visivi.
― 8 leggere min
Sviluppare metodi adattivi per la segmentazione dei dati 3D per identificare nuove classi di oggetti.
― 6 leggere min
Presentiamo un nuovo metodo per una migliore segmentazione delle immagini senza dover etichettare tanto.
― 7 leggere min
GLARE migliora le immagini in condizioni di scarsa illuminazione usando un approccio unico con un codice e controlli per l'utente.
― 5 leggere min
Questo studio analizza come i moderni metodi VPR migliorano la fusione delle submap nei sistemi di SLAM visivo.
― 6 leggere min
Nuovo modello migliora la precisione delle previsioni delle immagini e la chiarezza delle spiegazioni.
― 8 leggere min
Un nuovo metodo automatizza la creazione di dati per i compiti di ancoraggio visivo, migliorando l'efficienza del machine learning.
― 7 leggere min
I ricercatori migliorano l'apprendimento delle forme 3D usando fonti di dati diverse per una migliore comprensione delle macchine.
― 6 leggere min
X-Former migliora come i modelli combinano la comprensione di immagini e testo.
― 8 leggere min
GroupMamba migliora l'efficienza e la precisione dell'elaborazione delle immagini nei compiti di visione artificiale.
― 6 leggere min
Nuovo metodo migliora il modeling 3D da video singoli.
― 5 leggere min
Un nuovo metodo migliora il rilevamento 3D usando solo annotazioni 2D.
― 5 leggere min
Un nuovo modello migliora il riconoscimento da parte delle macchine di combinazioni di oggetti e attributi mai visti prima.
― 5 leggere min
Presentiamo un metodo per migliorare la resilienza dei sistemi AI attraverso attacchi avversariali multitasking.
― 6 leggere min
MeshSegmenter migliora la segmentazione dei modelli 3D usando texture e metodi innovativi.
― 7 leggere min
Un nuovo metodo crea immagini di alta qualità da layout senza usare set di dati estesi.
― 6 leggere min
Il Dynamic Semantic Adjuster migliora le prestazioni dell'apprendimento autosupervisionato in vari compiti.
― 6 leggere min
Nuovi metodi migliorano il riconoscimento delle azioni nei dati visivi con l'analisi dello scheletro.
― 4 leggere min
CycleMix migliora i modelli di intelligenza artificiale mescolando stili delle immagini per prestazioni migliori.
― 6 leggere min
Un nuovo modulo migliora la navigazione dei robot stimando l'incertezza nella segmentazione delle immagini.
― 6 leggere min
DACCA migliora il riconoscimento delle corsie attraverso un migliore apprendimento delle caratteristiche e un'aggregazione del contesto.
― 8 leggere min
Esaminando l'aumento del riconoscimento delle azioni few-shot nell'analisi video.
― 8 leggere min
MetaAug riduce l'overfitting nel PTQ tramite innovative trasformazioni dei dati.
― 7 leggere min
Una nuova tecnica migliora la classificazione delle scene usando reti neurali grafiche ibride.
― 6 leggere min
Ti presento ESCAPE, un framework che migliora la precisione e la velocità del riconoscimento della posa 3D umana.
― 7 leggere min
Questo studio valuta i modelli CNN e Modified VGG16 nei compiti di riconoscimento delle emozioni.
― 7 leggere min
Uno studio su come le CNN riconoscono le emozioni tramite l'analisi delle immagini.
― 7 leggere min
Un nuovo metodo migliora la distillazione dei dataset, aumentando l'efficienza dell'addestramento del modello.
― 5 leggere min