Un nuovo metodo per valutare meglio le proposte di oggetti nei compiti di visione e linguaggio.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo metodo per valutare meglio le proposte di oggetti nei compiti di visione e linguaggio.
― 6 leggere min
L'attenzione D-LKA migliora l'accuratezza e l'efficienza della segmentazione delle immagini mediche.
― 7 leggere min
Un nuovo modello migliora la segmentazione delle immagini mediche concentrandosi sui dettagli ad alta frequenza.
― 5 leggere min
Un generatore di romanzi migliora la creazione di immagini in varie categorie usando metodi di trasporto ottimale.
― 8 leggere min
Un nuovo metodo che usa modelli generativi per migliorare i compiti di segmentazione delle immagini.
― 7 leggere min
Nuovi metodi migliorano il tracciamento dei giocatori e della palla nelle partite di calcio.
― 5 leggere min
Un nuovo modello migliora l'analisi dei documenti per i paper in lingua bengalese.
― 6 leggere min
GNFactor aiuta i robot a imparare compiti tramite dimostrazioni visive, migliorando la loro adattabilità.
― 7 leggere min
Un nuovo metodo migliora il rilevamento degli oggetti utilizzando descrizioni testuali.
― 5 leggere min
Un nuovo modello migliora il rilevamento delle azioni nei video grazie agli attributi e alle relazioni degli oggetti.
― 6 leggere min
Uno sguardo su come migliorare il machine learning con il Clustering per Reciproco di Vicinato.
― 5 leggere min
SQLdepth migliora la stima della profondità imparando dal movimento nelle scene.
― 5 leggere min
Un nuovo metodo migliora l'identificazione precisa degli oggetti che producono suoni nei video.
― 7 leggere min
DiffuGen genera in modo efficiente set di dati di immagini etichettati di alta qualità per il machine learning.
― 5 leggere min
Tecniche per migliorare l'efficienza nei modelli visivi usando potatura e decomposizione delle matrici.
― 5 leggere min
Un nuovo approccio migliora la comprensione del processo decisionale nelle reti neurali profonde.
― 6 leggere min
Un nuovo metodo che combina la stima della profondità monoculare e binoculari per una maggiore precisione.
― 6 leggere min
Un metodo per una migliore segmentazione delle nuvole di punti usando tecniche debolmente supervisionate.
― 6 leggere min
Un nuovo metodo riduce il bias della scena per un riconoscimento dell'azione nei video migliore.
― 5 leggere min
Un nuovo approccio dell'IA migliora la chiarezza nelle immagini sfocate in movimento.
― 6 leggere min
MILA migliora il riconoscimento degli oggetti in vari settori usando un approccio memoria.
― 6 leggere min
Un framework per un'adattamento efficace di modelli di linguaggio multimodali.
― 5 leggere min
Migliorare la capacità dell'IA di classificare categorie mai viste attraverso metodi innovativi.
― 6 leggere min
Un nuovo metodo allena i modelli usando immagini generate senza etichette umane.
― 5 leggere min
Un metodo per regolare le prestazioni delle DNN in tempo reale per efficienza.
― 5 leggere min
Un nuovo framework migliora l'identificazione degli strumenti chirurgici utilizzando dati più semplici.
― 5 leggere min
Un nuovo metodo migliora la segmentazione 3D delle istanze eliminando la dipendenza dall'attenzione delle maschere.
― 5 leggere min
Usare l'Active Learning e la distillazione online per migliorare l'addestramento dei modelli in HPE.
― 5 leggere min
L'attenzione deformabile migliora l'efficienza e l'accuratezza nei compiti di riconoscimento visivo.
― 7 leggere min
Metodi recenti migliorano la qualità delle immagini grazie a algoritmi innovativi.
― 5 leggere min
Questo studio presenta metodi per il riconoscimento dei pedoni in tempo reale usando una potenza di elaborazione limitata.
― 6 leggere min
Il nuovo modello migliora l'outpainting video per una qualità e coerenza migliori.
― 6 leggere min
Scopri metodi per rendere i Vision Transformers più efficienti per le applicazioni nel mondo reale.
― 7 leggere min
DETRack offre una soluzione efficiente per il tracciamento visivo con strategie di allenamento avanzate.
― 5 leggere min
Rendere i trasformatori di visione più efficienti per droni e dispositivi mobili per migliorare i compiti visivi.
― 6 leggere min
Questo articolo presenta un nuovo metodo per schematizzare immagini 3D compatibili con deep learning.
― 6 leggere min
Delta-LoRA semplifica il fine-tuning per i grandi modelli di linguaggio, offrendo prestazioni migliori e un minor consumo di risorse.
― 5 leggere min
Usare prototipi per migliorare il confronto dei dataset nella visione artificiale.
― 8 leggere min
Un nuovo approccio combina dati testuali e immagini per un'analisi migliore.
― 5 leggere min
Nuovi metodi migliorano il modo in cui le macchine capiscono le interazioni tra gli oggetti.
― 6 leggere min