Un nuovo metodo di allenamento migliora la composizionalità dei modelli di visione-linguaggio.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo metodo di allenamento migliora la composizionalità dei modelli di visione-linguaggio.
― 6 leggere min
Un framework per allineare immagini di oggetti simili nello spazio 3D.
― 7 leggere min
Il framework PriViLege migliora l'apprendimento nel Few-Shot Class Incremental Learning con modelli grandi.
― 7 leggere min
Nuovo metodo migliora il controllo del movimento della camera nella creazione di video da testo.
― 6 leggere min
Un nuovo approccio per scenari di traffico realistici nei test dei veicoli autonomi.
― 6 leggere min
Le telecamere a 360 gradi migliorano la sicurezza alla guida ma hanno a che fare con problemi dovuti ad artefatti ottici.
― 6 leggere min
IISAN migliora l'efficienza nei sistemi di raccomandazione multimodali mantenendo le performance.
― 8 leggere min
Un nuovo metodo migliora la chiarezza nelle immagini scure per vari usi.
― 6 leggere min
Un nuovo modo per migliorare l'apprendimento quando i dati etichettati sono pochi.
― 6 leggere min
Esaminare l'affidabilità delle spiegazioni visive nei modelli di visione artificiale.
― 5 leggere min
Bi-LORA migliora il riconoscimento delle immagini generate dall'AI usando modelli di visione-linguaggio.
― 7 leggere min
Il modello ASTRA migliora la precisione nell'identificare le azioni durante le partite di calcio.
― 6 leggere min
Un nuovo approccio migliora l'efficienza nel rilevamento degli oggetti usando telecamere basate su eventi.
― 6 leggere min
Nuovo metodo migliora il rilevamento degli oggetti usando meno dati etichettati.
― 6 leggere min
Un nuovo metodo migliora l'imaging di campioni sensibili in condizioni di scarsa illuminazione.
― 6 leggere min
MotionChain crea movimenti umani realistici attraverso la conversazione, combinando testo, immagini e dati di movimento.
― 6 leggere min
Un nuovo metodo migliora le immagini a bassa risoluzione per compiti di riconoscimento più precisi.
― 8 leggere min
Presentiamo EARL: un nuovo metodo per un apprendimento continuo online efficace.
― 6 leggere min
Un nuovo approccio stima le pose 3D da più angolazioni senza dati di verità a terra.
― 8 leggere min
BodyMAP combina dati di profondità e pressione per migliorare la cura dei pazienti costretti a letto.
― 7 leggere min
Un nuovo metodo permette agli artisti di personalizzare le immagini generate con maggiore controllo.
― 7 leggere min
Un nuovo metodo per migliorare la classificazione multi-etichetta usando la generazione di immagini sintetiche.
― 6 leggere min
Un nuovo metodo migliora il riconoscimento degli oggetti nei veicoli autonomi usando dati provenienti da sensori combinati.
― 9 leggere min
LidarDM genera video LiDAR realistici per l'addestramento e il test dei veicoli autonomi.
― 6 leggere min
Un nuovo metodo migliora le prestazioni dei Vision Transformers su dataset sbilanciati.
― 8 leggere min
La ricerca svela modi per migliorare i sistemi da testo a immagine in modo efficiente e conveniente.
― 6 leggere min
Questo studio analizza l'efficacia di vari algoritmi per rilevare aerei nelle immagini satellitari.
― 6 leggere min
ProtoVerse migliora l'interpretabilità nella classificazione delle fratture vertebrali usando il deep learning.
― 7 leggere min
Il dataset MuLAn migliora il controllo nella generazione di immagini a partire da testo grazie a annotazioni a strati.
― 6 leggere min
DIBS migliora i sottotitoli degli eventi video perfezionando i confini usando dati non etichettati.
― 8 leggere min
Esplorando l'impatto dell'approssimazione di matrici a basso rango nell'imaging medico.
― 6 leggere min
Nuovo framework migliora la spiegabilità nei sistemi di deep learning.
― 6 leggere min
Nuovi metodi puntano a tenere le immagini al sicuro da manipolazioni e usi impropri.
― 6 leggere min
TSNet migliora la qualità dell'immagine in condizioni di nebbia utilizzando un approccio a rete a due fasi.
― 9 leggere min
VAR rivoluziona la generazione di immagini con qualità e efficienza migliorate.
― 6 leggere min
Parla dei rischi per la privacy nell'apprendimento auto-supervisionato e introduce PartCrop.
― 6 leggere min
Questo articolo esplora come i dati di addestramento influenzano le prestazioni del modello nei sistemi multimodali.
― 7 leggere min
Un nuovo modello migliora la diagnosi automatizzata delle radiografie toraciche attraverso l'apprendimento auto-supervisionato.
― 7 leggere min
Un nuovo modello migliora il rilevamento dei linfonodi nelle TC per una diagnosi del cancro migliore.
― 6 leggere min
Un nuovo metodo migliora la previsione del movimento per veicoli autonomi, concentrandosi su sicurezza e incertezza.
― 7 leggere min