Questo studio valuta quanto bene i modelli grandi gestiscono più oggetti nelle immagini.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Questo studio valuta quanto bene i modelli grandi gestiscono più oggetti nelle immagini.
― 6 leggere min
Un nuovo metodo migliora la comprensione dell'AI riguardo ai contenuti video.
― 5 leggere min
Un nuovo approccio migliora i tempi e l'efficienza dell'addestramento delle CNN.
― 5 leggere min
Uno sguardo a come i modelli di deep learning apprendono e danno priorità alle caratteristiche.
― 5 leggere min
Esplorando LaFAM: Un metodo senza etichette per capire meglio le decisioni dell'IA.
― 6 leggere min
TrCAM-V offre un modo nuovo per localizzare oggetti nei video usando informazioni minime.
― 5 leggere min
RHRSegNet migliora la segmentazione semantica per le immagini notturne, fondamentale per la guida autonoma.
― 6 leggere min
Un nuovo metodo migliora la segmentazione delle parti del corpo in immagini complesse.
― 5 leggere min
Un nuovo metodo migliora la segmentazione degli oggetti nei video sfruttando le relazioni contestuali.
― 6 leggere min
Un nuovo metodo migliora la segmentazione degli oggetti nei video con dati debolmente etichettati.
― 6 leggere min
Nuovi metodi migliorano il rilevamento di oggetti angolati nelle immagini aeree.
― 6 leggere min
Dynamic Net Architecture offre un nuovo approccio ai sistemi visivi intelligenti.
― 4 leggere min
Uno studio mostra che si abbina meglio i veicoli attraverso aree di cattura immagine strategiche.
― 6 leggere min
Un nuovo approccio migliora la compressione dei dataset e l'efficienza dell'addestramento dei modelli.
― 6 leggere min
Usare video non etichettati per migliorare il riconoscimento delle azioni in video lunghi.
― 6 leggere min
Un metodo per aiutare i robot a valutare forme e posizioni degli oggetti.
― 7 leggere min
Un nuovo approccio affronta l'eccesso di fiducia nei sistemi che riconoscono più etichette.
― 6 leggere min
Migliorare il rilevamento con immagini RGB e di profondità per affrontare le sfide del mondo reale.
― 7 leggere min
Un nuovo modello combina ConvNets e Transformer per migliorare la classificazione delle immagini.
― 5 leggere min
Il framework CEIA migliora la comprensione tra i dati degli eventi e le immagini.
― 5 leggere min
Un nuovo metodo migliora l'augmented data per una qualità dell'immagine migliore.
― 5 leggere min
Una panoramica sui metodi di deep learning per la modellazione 3D a partire dalle immagini.
― 6 leggere min
Nuovo metodo migliora l'accuratezza nell'allineamento delle immagini nel tempo.
― 5 leggere min
MambaVision unisce Mamba e Transformers per un riconoscimento delle immagini migliore.
― 5 leggere min
Un nuovo metodo che migliora il rilevamento degli oggetti usando etichette rumorose e crowdsourced.
― 6 leggere min
Un nuovo approccio aiuta i robot a imparare compiti generando immagini delle azioni.
― 8 leggere min
OV-DINO migliora il riconoscimento degli oggetti riconoscendo nomi mai visti durante l'addestramento.
― 6 leggere min
Un nuovo approccio migliora l'identificazione dei veicoli da angolazioni diverse delle telecamere.
― 6 leggere min
PaliGemma unisce comprensione delle immagini e del testo per applicazioni versatili.
― 6 leggere min
Migliorare le immagini sintetiche per potenziare le prestazioni dei sistemi di riconoscimento facciale.
― 7 leggere min
DisMAE migliora la generalizzazione del modello tra i vari domini usando dati non etichettati.
― 5 leggere min
Il DINO svizzero migliora il riconoscimento degli oggetti personali nei robot domestici e nei dispositivi mobili.
― 7 leggere min
Un nuovo metodo per combinare più scansioni e migliorare l'accuratezza della registrazione della nuvola di punti.
― 7 leggere min
Metodi innovativi migliorano la classificazione dei funghi tossici usando il deep learning.
― 6 leggere min
Un nuovo metodo riduce la dipendenza dalle annotazioni umane nella segmentazione delle immagini.
― 6 leggere min
LAPT semplifica la rilevazione OOD, migliorando l'affidabilità dell'IA in situazioni di incertezza.
― 5 leggere min
Il framework KGpose migliora il riconoscimento degli oggetti stimando pose 6D dalle immagini.
― 6 leggere min
Una panoramica delle tecniche e delle applicazioni nel tracciamento multi-oggetto.
― 7 leggere min
BiEquiFormer migliora la registrazione delle nuvole di punti per un allineamento 3D preciso.
― 6 leggere min
I modelli VQA possono rivelare informazioni private nonostante le tecniche avanzate.
― 4 leggere min