Un framework che unisce diversi tipi di conoscenza per migliorare le prestazioni del modello.
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
Un framework che unisce diversi tipi di conoscenza per migliorare le prestazioni del modello.
― 5 leggere min
Un nuovo metodo migliora il rilevamento del bersaglio dello sguardo con meno dati etichettati.
― 7 leggere min
Un nuovo approccio migliora le prestazioni dei modelli di deep learning nonostante il rumore.
― 5 leggere min
Un nuovo framework migliora l'etichettatura dei pixel affrontando l'incertezza nella segmentazione semantica.
― 7 leggere min
Questo studio valuta l'efficacia dei modelli pre-addestrati nelle applicazioni di Osservazione della Terra.
― 6 leggere min
Il framework Temporal2Seq semplifica molteplici compiti di comprensione video in un unico modello.
― 8 leggere min
TAKFL ottimizza la condivisione della conoscenza nell'apprendimento federato per le diverse capacità dei dispositivi.
― 6 leggere min
Un metodo che allinea forme 3D con immagini 2D senza punti corrispondenti.
― 6 leggere min
Esplora i concetti essenziali della fisica molecolare e le loro applicazioni pratiche.
― 4 leggere min
Questo nuovo metodo semplifica la generazione di immagini nei modelli di intelligenza artificiale, migliorando l'efficienza e la velocità.
― 6 leggere min
Un nuovo framework migliora la qualità dei dataset video-lingua attraverso un raffinamento iterativo.
― 5 leggere min
Combinando immagini di street view con dati per analizzare gli esterni degli edifici.
― 6 leggere min
Un modello per valutare la qualità della segmentazione senza riferimenti di verità di terreno.
― 8 leggere min
MedCLIP-SAMv2 migliora il rilevamento dei tumori usando tecniche di segmentazione avanzate e pochi dati etichettati.
― 6 leggere min
Uno sguardo a come le CNN apprendono le caratteristiche delle immagini e le loro somiglianze universali.
― 7 leggere min
I ricercatori usano CRISP per migliorare il monitoraggio della biodiversità tramite un'analisi delle immagini migliore.
― 7 leggere min
Un nuovo indice aiuta a valutare la diversità nelle immagini mediche generate dall'AI.
― 9 leggere min
Nuovi metodi accelerano la codifica e la decodifica video.
― 5 leggere min
Un nuovo framework migliora il legame tra immagini e testo.
― 7 leggere min
Scopri come i modelli di machine learning possono migliorare quando si confrontano con dati nuovi e mai visti prima.
― 8 leggere min
Uno sguardo al ruolo e ai metodi dei modelli di diffusione nella creazione di immagini.
― 8 leggere min
Esplorare metodi per migliorare i modelli multimodali nel rispondere a domande visive.
― 6 leggere min
Un nuovo modello genera rapporti da scansioni CT 3D in modo efficiente e preciso.
― 8 leggere min
Un nuovo sistema per creare modelli 3D da immagini 2D in modo efficiente.
― 5 leggere min
TrojVLM espone vulnerabilità nei modelli di linguaggio visivo a attacchi backdoor.
― 7 leggere min
Questo studio svela metodi efficaci per riconoscere i gesti delle mani attraverso l'imaging ad ultrasuoni.
― 6 leggere min
Un nuovo framework migliora la generazione di dati da più fonti usando modelli basati sull'energia.
― 6 leggere min
SATA migliora la robustezza e l'efficienza dei Vision Transformers per i compiti di classificazione delle immagini.
― 5 leggere min
Un nuovo metodo migliora il riconoscimento degli oggetti usando maschere senza etichette dettagliate.
― 5 leggere min
Un nuovo metodo semplifica la rimozione di contenuti indesiderati nei dataset visivi.
― 6 leggere min
Esplorando il ruolo del Federated Learning nel migliorare l'imaging medico proteggendo la privacy dei pazienti.
― 6 leggere min
Un nuovo metodo aiuta i robot a imparare compiti usando video umani online, riducendo le necessità di addestramento.
― 6 leggere min
I PPLN migliorano l'elaborazione dei dati delle telecamere a evento per capacità di visione artificiale superiori.
― 6 leggere min
Un nuovo metodo migliora la rilevazione delle firme genuine rispetto alle contraffazioni.
― 5 leggere min
Analizzando gli effetti dei metodi di potatura sulle performance e sull'interpretabilità di GoogLeNet.
― 5 leggere min
Metodi innovativi per migliorare le mappe di profondità fondamentali per la realtà aumentata e virtuale.
― 6 leggere min
FAST migliora la classificazione delle malattie usando immagini a scorrimento completo con il minimo input di esperti.
― 6 leggere min
Un metodo per migliorare le prestazioni del modello nonostante etichette di dati sbagliate.
― 7 leggere min
MedViLaM integra diversi tipi di dati medici per un'analisi e decisioni migliori.
― 5 leggere min
Un nuovo metodo per accelerare l'output del modello di diffusione senza perdere qualità.
― 7 leggere min