Un nuovo modello riduce l'eccesso di fiducia nelle previsioni, garantendo applicazioni più sicure.
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo modello riduce l'eccesso di fiducia nelle previsioni, garantendo applicazioni più sicure.
― 5 leggere min
Un nuovo metodo migliora la visualizzazione delle caratteristiche delle reti neurali per una migliore interpretabilità.
― 7 leggere min
Un nuovo approccio integrato migliora la segmentazione degli oggetti nei video.
― 5 leggere min
Migliorare le prestazioni del modello usando strategie semi-supervisionate nel machine learning.
― 5 leggere min
Un metodo per generare domande da immagini e didascalie per un'interazione migliore con l'IA.
― 5 leggere min
Nuovi metodi migliorano l'accuratezza e la coerenza nei modelli di riconoscimento delle immagini.
― 7 leggere min
Un nuovo approccio che usa l'augmentazione dei dati su base istanza per migliorare la robustezza dei modelli contro attacchi avversari.
― 6 leggere min
Un nuovo metodo migliora i Vision Transformer per una migliore comprensione delle immagini con meno risorse.
― 6 leggere min
Un approccio strutturato per posizionare efficacemente i sensori nei compiti di visione robotica.
― 5 leggere min
Un nuovo metodo migliora il realismo delle immagini attraverso il controllo della forma 3D nei modelli di diffusione.
― 7 leggere min
Il sistema AVIS migliora la risposta a domande visive attraverso flussi di lavoro strutturati e grafi di transizione.
― 6 leggere min
Esplorando il potenziale delle telecamere a eventi per migliorare il riconoscimento dei pedoni nei veicoli autonomi.
― 5 leggere min
Un benchmark per valutare la somiglianza delle immagini in base a condizioni definite dall'utente.
― 6 leggere min
Un nuovo metodo migliora la stima della profondità usando sensori dual-pixel in vari dispositivi di imaging.
― 6 leggere min
Un metodo per creare forme 3D realistiche usando solo dati 2D.
― 6 leggere min
Un nuovo metodo migliora le tecniche di rimozione del testo nelle immagini.
― 4 leggere min
Gli esempi avversariali possono confondere i sistemi di rilevamento degli oggetti, rivelando falle di sicurezza.
― 5 leggere min
Un nuovo modello migliora la velocità e l'accuratezza del riconoscimento delle azioni nell'analisi video in tempo reale.
― 7 leggere min
L'anisotropia influisce sulle prestazioni dei modelli Transformer su vari tipi di dati.
― 6 leggere min
Un nuovo metodo migliora come i modelli comprendono le relazioni tra immagini e testo.
― 6 leggere min
OCAtari si concentra sugli oggetti di gioco per migliorare il machine learning.
― 6 leggere min
Un nuovo metodo utilizza la ricerca dell'architettura neurale per migliorare il rilevamento delle falsificazioni facciali.
― 7 leggere min
Un nuovo modello migliora il legame tra le immagini e le loro descrizioni testuali.
― 5 leggere min
Un nuovo metodo crea avatar 3D realistici da una sola foto.
― 6 leggere min
Nuovi metodi migliorano la qualità e la velocità nei modelli da testo a immagine.
― 7 leggere min
Questo studio esplora come l'IA può imparare le parole collegandole alle immagini.
― 8 leggere min
Un nuovo metodo prevede forme 3D da immagini RGB singole utilizzando dati di profondità.
― 5 leggere min
TomoSAM semplifica la segmentazione delle immagini 3D, migliorando l'efficienza e la precisione per i ricercatori.
― 5 leggere min
La ricerca migliora il riconoscimento dei schizzi per un abbinamento migliore delle forme 3D.
― 6 leggere min
P2D migliora il rilevamento di oggetti 3D nelle auto a guida autonoma usando la previsione del movimento.
― 6 leggere min
Nuovi metodi migliorano la qualità delle immagini usando dati reali del campo luminoso.
― 6 leggere min
Ground-VIO migliora la stima della posizione del veicolo usando relazioni tra camera e terreno.
― 7 leggere min
Un nuovo modello migliora il modo in cui le macchine riconoscono le immagini mescolando caratteristiche globali e locali.
― 7 leggere min
Una nuova strategia assicura una rappresentanza equa dei tipi di dati nel machine learning.
― 7 leggere min
Un nuovo modo per aumentare la fiducia nella rilevazione degli oggetti grazie a tecniche di calibrazione affidabili.
― 6 leggere min
Un nuovo metodo mostra come i riflessi oculari possano ricostruire ambienti 3D.
― 6 leggere min
MaskDiT migliora l'efficienza dell'allenamento dei modelli di diffusione mantenendo la qualità dell'immagine.
― 7 leggere min
Uno studio sulle prestazioni dei Modelli Fondamentali Visivi sotto distorsioni reali nei compiti di segmentazione.
― 9 leggere min
DiffAug migliora i sistemi di riconoscimento delle immagini grazie a tecniche di rumore innovative.
― 6 leggere min
Presentiamo CANN, un metodo per la localizzazione visiva precisa usando caratteristiche locali.
― 7 leggere min