ELMOS migliora la classificazione few-shot usando ensemble e statistiche multi-ordine.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
ELMOS migliora la classificazione few-shot usando ensemble e statistiche multi-ordine.
― 6 leggere min
Esaminando i campi neurali come decodificatori per migliorare la precisione della segmentazione semantica.
― 5 leggere min
Un nuovo approccio alla segmentazione semantica riduce lo sforzo umano e riconosce classi sconosciute.
― 6 leggere min
Un nuovo metodo auto-supervisionato migliora l'accuratezza della segmentazione dei documenti usando dati visivi.
― 6 leggere min
Uno sguardo a due metodi chiave di apprendimento auto-supervisionato nella visione artificiale.
― 6 leggere min
Un sistema flessibile per riconoscere le azioni umane da vari punti di vista.
― 6 leggere min
Un dataset sintetico da GTA-V migliora l'accuratezza nella stima della profondità.
― 7 leggere min
Introducendo un nuovo approccio al ragionamento visivo delle macchine con compiti basati sulle trasformazioni.
― 6 leggere min
Un approccio innovativo usa le riflessioni termiche per identificare le forme e le posizioni umane.
― 6 leggere min
Esplorando il ruolo del Segment Anything Model nella WSSS e il suo impatto.
― 6 leggere min
Uno sguardo all'apprendimento few-shot e al ruolo del training bootstrap per migliorare i modelli.
― 5 leggere min
I modelli di deep learning migliorano il rilevamento delle fuoriuscite di petrolio con le immagini satellitari.
― 5 leggere min
NeRD migliora la qualità delle immagini trasformando i modelli raw Bayer in immagini RGB.
― 5 leggere min
Uno sguardo a modi migliori per stimare la cross-correlazione.
― 5 leggere min
Le macchine imparano a descrivere i cambiamenti tra le immagini attraverso il Visual Transformation Telling.
― 7 leggere min
ClustSeg semplifica i compiti di segmentazione delle immagini con un approccio unificato.
― 6 leggere min
Un nuovo modello migliora il riconoscimento degli oggetti nei robot che affrontano immagini incerte.
― 5 leggere min
Esplorare i vantaggi della Neural Architecture Search per il VPU Movidius di Intel.
― 5 leggere min
Nuovi metodi migliorano il rilevamento degli attacchi di morphing facciale sui sistemi biometrici.
― 6 leggere min
AReAM migliora il rilevamento degli oggetti nelle immagini usando tecniche di supervisione debole.
― 5 leggere min
CMT migliora l'accuratezza del rilevamento degli oggetti usando dati rumorosi nell'adattamento non supervisionato del dominio.
― 6 leggere min
Migliorare l'accuratezza del rilevamento degli oggetti usando il flusso della scena nella lavorazione delle nuvole di punti.
― 7 leggere min
Scopri le ultime tecniche per proteggere i video da usi non autorizzati.
― 6 leggere min
Un nuovo approccio migliora il riconoscimento delle tabelle usando meno dati etichettati.
― 6 leggere min
Migliorare l'accuratezza della stima della profondità usando dati video stereo e nuove funzioni di perdita.
― 6 leggere min
Prompt-ICM migliora la compressione delle immagini per l'analisi delle macchine con soluzioni orientate al compito.
― 7 leggere min
Un nuovo metodo affronta il problema dell'impatto delle classi per avere prestazioni più eque del modello.
― 8 leggere min
Questo articolo parla di come migliorare i modelli visione-linguaggio per abbinare meglio oggetti e attributi.
― 5 leggere min
HSCNet++ migliora l'accuratezza e l'efficienza della localizzazione visiva usando l'apprendimento gerarchico e i trasformatori.
― 5 leggere min
Nuovi metodi migliorano l'efficienza e l'accessibilità del design delle CNN.
― 5 leggere min
AGCSC offre un nuovo modo per raggruppare dati complessi in modo efficace.
― 7 leggere min
Nuovi approcci per migliorare le prestazioni dei modelli su classi rare nel riconoscimento visivo.
― 6 leggere min
Nuovi metodi migliorano precisione ed efficienza nel riconoscere il testo nei video.
― 5 leggere min
Esaminare il ruolo dei Vision Transformers nelle tecniche di segmentazione semantica e nelle applicazioni.
― 7 leggere min
Un nuovo dataset migliora la ricerca VQA per l'elaborazione della lingua vietnamita.
― 7 leggere min
Un nuovo metodo migliora la rilevazione degli elementi del grafico utilizzando il contesto.
― 6 leggere min
PointCMP affronta le sfide nell'apprendere da video di nuvole di punti 3D in modo efficiente.
― 6 leggere min
Un nuovo approccio aumenta la precisione del riconoscimento facciale usando immagini di profondità più chiare.
― 5 leggere min
Un nuovo metodo migliora il riconoscimento di categorie rare nelle immagini.
― 6 leggere min
Scopri come Tensor PCA semplifica efficacemente l'analisi dei dati ad alta dimensione.
― 7 leggere min