BEVSpread migliora l'accuratezza del rilevamento degli oggetti per una guida più sicura.
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
BEVSpread migliora l'accuratezza del rilevamento degli oggetti per una guida più sicura.
― 5 leggere min
Nuovi metodi migliorano il riconoscimento delle immagini per identificare le persone in diversi ambienti.
― 6 leggere min
mOSCAR offre un dataset multilingue per migliorare la comprensione del testo e delle immagini da parte dell'IA.
― 7 leggere min
Un nuovo benchmark valuta come i LVLM si basano sui linguaggi precedenti.
― 7 leggere min
Un nuovo metodo aiuta le auto a guida autonoma a prevedere l'ambiente usando dati grezzi.
― 6 leggere min
Scopri come CMC-Bench sta rivoluzionando le tecniche di compressione delle immagini.
― 6 leggere min
Il metodo FSBI migliora il rilevamento dei media digitali manipolati.
― 6 leggere min
PianoMotion10M offre movimenti delle mani dettagliati per aiutare chi impara a suonare il pianoforte.
― 6 leggere min
Un nuovo approccio migliora la rilevazione di immagini false create dall'IA.
― 6 leggere min
RetiZero migliora l'identificazione delle malattie oculari usando tecniche AI avanzate e un sacco di dati.
― 5 leggere min
Un metodo per migliorare i modelli degli studenti usando le intuizioni dai modelli dei maestri più forti.
― 5 leggere min
Un nuovo sistema permette di creare modelli 3D usando singole immagini del mondo reale.
― 6 leggere min
Un nuovo approccio alla segmentazione degli oggetti nei video migliora la precisione limitando l'uso della memoria.
― 8 leggere min
Nuovo metodo trasforma singole immagini in avatar 3D realistici.
― 4 leggere min
Un nuovo modello migliora il match del suono con le azioni visive nei video.
― 11 leggere min
Un nuovo metodo per ricostruire oggetti complessi usando input visivi e tecniche di codifica.
― 6 leggere min
Un metodo nuovo per creare immagini a partire da testo usando modelli specializzati.
― 5 leggere min
Un dataset completo che unisce immagini e testo per aiutare il machine learning.
― 7 leggere min
Un nuovo benchmark mira a valutare gli MLLM nella comprensione dei video su più argomenti.
― 7 leggere min
Un nuovo modello genera effetti di font unici per più lingue.
― 5 leggere min
Un nuovo set di dati migliora la valutazione della qualità delle immagini nella microscopia.
― 8 leggere min
ConSoR migliora la comprensione delle connessioni sociali attraverso l'analisi del contesto visivo.
― 7 leggere min
Un nuovo approccio migliora la robustezza dei Vision Transformers contro attacchi avversari.
― 5 leggere min
Un nuovo modello migliora l'accuratezza della stima della profondità usando tecniche di apprendimento auto-supervisionato.
― 7 leggere min
hGCA automatizza la creazione di scene 3D realistiche usando dati LiDAR sparsi.
― 6 leggere min
Nuovi metodi migliorano i dataset di immagini garantendo privacy e prestazioni.
― 6 leggere min
La ricerca si concentra sul miglioramento dell'efficienza nei modelli di comprensione dei documenti.
― 8 leggere min
Un nuovo benchmark testa il ragionamento composizionale nei modelli avanzati.
― 7 leggere min
CFG++ migliora la generazione e modifica delle immagini, offrendo una migliore corrispondenza con i suggerimenti testuali.
― 6 leggere min
ABTrack migliora la velocità e l'efficienza del tracciamento visivo su vari dispositivi.
― 6 leggere min
Un benchmark creato per migliorare la comprensione di contenuti video lunghi.
― 7 leggere min
Utilizzando immagini satellitari e deep learning per migliorare la mappatura delle baraccopoli e le condizioni di vita.
― 7 leggere min
Un nuovo dataset migliora la creazione di audio foley per contenuti multimediali.
― 6 leggere min
Nuovo metodo migliora la selezione delle bande per l'imaging iperspettrale senza bisogno di riaddestramento.
― 5 leggere min
Un nuovo metodo migliora l'accuratezza dei modelli di machine learning su dati non visti.
― 6 leggere min
Un dataset completo per il riconoscimento e la ricerca di testo arabo scritto a mano.
― 7 leggere min
ImageNet3D migliora la comprensione delle macchine sugli oggetti 3D nelle immagini.
― 6 leggere min
Una nuova rete neurale migliora il riconoscimento dei colori per una migliore classificazione delle immagini.
― 5 leggere min
Nuovo dataset migliora le abilità di presa dei robot usando comandi in linguaggio naturale.
― 6 leggere min
SeMOPO migliora l'apprendimento da dati di bassa qualità separando le informazioni utili dal rumore.
― 5 leggere min