RayMVSNet e il suo upgrade migliorano l'accuratezza della modellazione 3D a partire da immagini 2D.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
RayMVSNet e il suo upgrade migliorano l'accuratezza della modellazione 3D a partire da immagini 2D.
― 6 leggere min
Esplora il funzionamento e i miglioramenti dei Transformers in vari compiti di elaborazione dei dati.
― 5 leggere min
Introducendo un nuovo metodo per un'animazione fluida delle pose umane nei video.
― 6 leggere min
ReSample usa modelli di diffusione latente per migliorare la ricostruzione delle immagini in diverse applicazioni.
― 8 leggere min
Come i modelli pre-addestrati influenzano le prestazioni su nuovi dati.
― 4 leggere min
Nuovo metodo migliora le patch avversarie, unendo efficacia di fusione e aspetto naturale.
― 8 leggere min
SEED collega immagini e testo, migliorando il modo in cui le macchine elaborano informazioni visive e scritte.
― 5 leggere min
Nuovo metodo migliora la rilevazione di più oggetti in movimento nelle immagini.
― 5 leggere min
Esplorando il potenziale dei modelli a peso legato multi-maschera nel machine learning.
― 6 leggere min
Un nuovo framework migliora il rilevamento di oggetti 3D affrontando le sfide dell'adattamento al dominio.
― 6 leggere min
Nuovo metodo migliora il matching dei grafi senza dati etichettati usando la coerenza del ciclo.
― 7 leggere min
Un nuovo metodo migliora l'efficienza e le prestazioni nei compiti di visione-linguaggio.
― 6 leggere min
Una nuova tecnica per una classificazione delle immagini più efficiente con dati limitati.
― 6 leggere min
Un nuovo metodo usa la matematica di base per analizzare i contenuti video in modo efficace.
― 5 leggere min
Nuovo metodo migliora la visione artificiale in condizioni di scarsa illuminazione senza dati di addestramento notturni.
― 5 leggere min
Esplorando modelli di diffusione per la generazione e classificazione delle immagini.
― 5 leggere min
Un nuovo modello migliora i collegamenti tra testo, immagini e audio.
― 6 leggere min
Un nuovo modello che migliora le prestazioni nei compiti visivi combinando CNN e Transformer.
― 5 leggere min
Il framework MonoLiG migliora il rilevamento 3D usando telecamere monoculari e dati LiDAR.
― 7 leggere min
NORIS migliora la selezione delle immagini per addestrare modelli di rilevamento oggetti in modo efficiente.
― 7 leggere min
Robust-Depth migliora la stima della profondità in diverse condizioni meteorologiche.
― 8 leggere min
Un nuovo metodo migliora la generazione di immagini usando dati etichettati e non etichettati meno affidabili.
― 6 leggere min
Il framework HST mostra miglioramenti significativi nel tracciare oggetti tra i frame video.
― 5 leggere min
LOAF offre un nuovo dataset per rilevare persone usando telecamere fisheye dall'alto.
― 7 leggere min
Un nuovo metodo migliora il modo in cui le macchine rispondono a domande sulle immagini.
― 5 leggere min
SDS-CLIP migliora le capacità di ragionamento immagine-testo di CLIP.
― 7 leggere min
RepViT combina CNN e ViT per applicazioni di visione mobile efficienti.
― 6 leggere min
Il modello ConViT migliora il riconoscimento delle azioni umane nelle immagini fisse usando il deep learning.
― 6 leggere min
La ricerca rivela un nuovo dataset che migliora le prestazioni dei modelli VQA nel tempo.
― 5 leggere min
OnlineRefer migliora la segmentazione degli oggetti video collegando i fotogrammi attraverso la propagazione delle query.
― 6 leggere min
Questo studio valuta l'efficacia dei modelli VQA per scenari di guida.
― 5 leggere min
Un metodo per il grounding visivo 3D usando poche annotazioni.
― 5 leggere min
Un nuovo approccio migliora l'identificazione delle persone nelle immagini con l'estrazione avanzata delle caratteristiche.
― 6 leggere min
LW PLG-ViT offre prestazioni efficienti per compiti visivi su dispositivi con risorse limitate.
― 5 leggere min
Un nuovo modulo migliora la stima della posa 3D integrando informazioni sulle azioni.
― 5 leggere min
Un nuovo metodo migliora la regressione ordinale distinguendo meglio le categorie vicine.
― 5 leggere min
Un nuovo metodo migliora le nuvole di punti per un'analisi 3D migliore.
― 5 leggere min
Questo articolo parla di un nuovo modello per migliorare la percezione della profondità nei robot usando più sensori.
― 9 leggere min
Delle didascalie migliori possono migliorare le performance dei modelli multimodali usando immagini prese dal web.
― 6 leggere min
Un dataset innovativo punta a migliorare l'accuratezza del rendering umano nei media digitali.
― 4 leggere min