Questo studio migliora i modelli di testo integrando dettagli di layout per una migliore comprensione dei documenti.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Questo studio migliora i modelli di testo integrando dettagli di layout per una migliore comprensione dei documenti.
― 6 leggere min
Esplorando l'integrazione dei modelli di deep learning nell'analisi della remote sensing.
― 6 leggere min
Un tool che personalizza le immagini a partire dal testo mantenendo i dettagli di riferimento.
― 6 leggere min
MIM-Refiner migliora le prestazioni del modello MIM attraverso un apprendimento delle caratteristiche più raffinato.
― 6 leggere min
Un approccio fresco per chiarire come le immagini influenzano le decisioni delle reti neurali.
― 5 leggere min
SpLiCE aiuta a chiarire i dati complessi di CLIP per una comprensione migliore.
― 6 leggere min
Nuovo metodo migliora l'adattamento delle immagini satellitari senza domini predefiniti.
― 6 leggere min
Uno studio mostra che l'IA migliora la rilevazione dei problemi dentali nelle radiografie.
― 6 leggere min
Nuovi metodi migliorano la comprensione delle scene 3D grazie alla consapevolezza semantica nei NeRF.
― 7 leggere min
Un dataset per valutare le difficoltà nei compiti di assemblaggio usando annotazioni video.
― 8 leggere min
Un metodo per la stima della postura corporea 3D che affronta le sfide dell'occlusione.
― 6 leggere min
Control Color semplifica il processo di colorazione delle immagini in bianco e nero con il controllo dell'utente.
― 5 leggere min
Un nuovo metodo permette di creare facilmente avatar 3D realistici usando solo un video.
― 5 leggere min
La ricerca svela vulnerabilità nella tecnologia di riconoscimento della camminata degli smartphone.
― 6 leggere min
Uno studio su quanto bene le miniature delle notizie corrispondano ai loro articoli.
― 5 leggere min
Esaminando il pregiudizio di genere nei modelli T2I attraverso il Test degli Stereotipi Abbinati.
― 7 leggere min
Un nuovo approccio migliora la sicurezza delle immagini nei modelli da testo a immagine attraverso l'ottimizzazione dei prompt.
― 7 leggere min
BioFusionNet combina immagini dei tumori, dati genetici e informazioni cliniche per una migliore valutazione del rischio.
― 10 leggere min
SegmentAnyBone migliora l'accuratezza dell'imaging osseo nelle risonanze magnetiche per una diagnosi migliore.
― 7 leggere min
Un nuovo metodo migliora la rilevazione di oggetti nei documenti usando strutture a grafo.
― 9 leggere min
Un nuovo metodo migliora l'efficienza nella ricerca degli oggetti più vicini approssimati basata su grafi.
― 6 leggere min
Un nuovo approccio migliora i compiti di riconoscimento visivo attraverso meccanismi di attenzione residua.
― 9 leggere min
Questo benchmark valuta le performance dei modelli di linguaggio medico nella sanità.
― 8 leggere min
Presentiamo FOMO, un metodo per migliorare le DNN contro gli attacchi avversari tramite il dimenticare.
― 6 leggere min
Scopri come l'invarianza condizionale migliora le prestazioni del modello su diversi tipi di dati.
― 6 leggere min
Uno sguardo al potenziale e alle sfide dei sensori neuromorfici per l'analisi facciale.
― 8 leggere min
Un nuovo sistema impara le preferenze degli utenti in tempo reale per suggerire abbigliamento.
― 6 leggere min
Un nuovo framework di deep learning classifica immagini di diverse dimensioni per una previsione della permeabilità migliore.
― 7 leggere min
I ricercatori migliorano l'accuratezza nella rilevazione dei tumori usando tecniche di imaging avanzate.
― 6 leggere min
MVDiffusion++ crea modelli 3D dettagliati partendo da una sola immagine o da poche.
― 5 leggere min
Uno studio su come l'IA impara le relazioni tra gli oggetti attraverso compiti di ragionamento visivo.
― 8 leggere min
Le telecamere basate su eventi migliorano la lettura di codici a barre sfuocati e segnali.
― 7 leggere min
Affrontare il cambiamento di dominio e il drift concettuale nei modelli AI.
― 6 leggere min
Presentiamo CAMixer, un nuovo metodo per rilevare cambiamenti nelle immagini radar a apertura sintetica.
― 5 leggere min
Usare telecamere e punti di riferimento migliora il tracciamento della posizione in ambienti senza GPS.
― 6 leggere min
Nuovi metodi aiutano i robot a orientarsi usando input visivi senza mappe complesse.
― 10 leggere min
Un nuovo metodo migliora l'inferenza delle scene 3D nonostante le sfide ambientali.
― 5 leggere min
Un nuovo modo di navigare per le truppe usando punti di riferimento visivi invece del GPS.
― 7 leggere min
Nuovo framework migliora l'efficienza e la qualità della compressione video.
― 6 leggere min
AnyGPT elabora testi, immagini, musica e parole per usi diversi.
― 4 leggere min