Nuovi metodi migliorano la trasformazione del testo in modelli 3D precisi.
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
Nuovi metodi migliorano la trasformazione del testo in modelli 3D precisi.
― 5 leggere min
I modelli di deep learning migliorano l'accuratezza nella segmentazione degli ictus per ottenere risultati migliori per i pazienti.
― 9 leggere min
Esplorando l'importanza delle relazioni spaziali nelle interpretazioni della visione artificiale.
― 6 leggere min
Llip migliora il modo in cui le immagini vengono abbinate a diverse descrizioni testuali.
― 7 leggere min
Modifica immagini 3D con precisione usando vari metodi di input per cambiamenti locali.
― 6 leggere min
Esplorare il ruolo della tecnologia nel migliorare la diagnosi del cancro tramite l'analisi istologica.
― 7 leggere min
EMOPortraits migliora il realismo degli avatar animati rendendo più precisa l'espressione delle emozioni.
― 5 leggere min
Uno sguardo conciso sulle allucinazioni nei MLLM e strategie per migliorare l'affidabilità.
― 6 leggere min
Un nuovo metodo per modificare scene 3D più velocemente e con alta qualità usando descrizioni testuali.
― 7 leggere min
Un nuovo sistema migliora la qualità delle immagini usando adattatori specializzati basati su richieste testuali.
― 6 leggere min
TheaterGen combina modelli linguistici e visivi per racconti visivi coerenti.
― 8 leggere min
Un dataset completo di immagini di street view per progetti di geolocalizzazione in tutto il mondo.
― 7 leggere min
Esplorando le complessità nella gestione delle immagini mediche nella ricerca radiologica.
― 7 leggere min
I modelli quantistici migliorano l'accuratezza della classificazione delle immagini affrontando variazioni e rotazioni.
― 8 leggere min
Un metodo per verificare l'affidabilità del modello senza etichette vere.
― 6 leggere min
Questo articolo parla dei progressi di PyLaia nel riconoscimento del testo usando modelli linguistici.
― 6 leggere min
Nuove metriche migliorano la valutazione dei sistemi di estrazione delle informazioni nei documenti scritti a mano.
― 7 leggere min
Il metodo FOOL migliora il trasferimento dei dati satellitari riducendo la dimensione mantenendo la qualità.
― 6 leggere min
Un nuovo framework per migliorare l'analisi dei dati di telerilevamento usando i metadati.
― 6 leggere min
Un nuovo metodo migliora le TC a bassa dose riducendo efficacemente il rumore.
― 7 leggere min
Nuovi benchmark rivelano le sfide per i MLLM nei compiti reali con contesti lunghi.
― 8 leggere min
Un modello si adatta a vari compiti d'immagine usando pochi esempi.
― 8 leggere min
Nuovo metodo migliora la rimozione delle ombre nelle immagini grazie al deep learning e ai trasformatori.
― 9 leggere min
Med-Gemini migliora la sanità con intelligenza artificiale avanzata per diagnosi e interazione con i pazienti.
― 5 leggere min
DragPoser fa avanzare il motion capture con meno sensori mantenendo animazioni di alta qualità.
― 8 leggere min
Nuovi metodi migliorano l'analisi delle scene visive usando tecniche di codifica efficienti.
― 6 leggere min
Un progetto per elaborare e condividere 100 anni di registri censuari francesi.
― 5 leggere min
Uno studio svela informazioni sul bilanciamento tra input visivi e testuali nei VLM.
― 6 leggere min
Scopri come i modelli generativi stanno cambiando le tecniche di inpainting video.
― 7 leggere min
Un nuovo metodo migliora il modo in cui contiamo le azioni nei video usando degli esempi.
― 5 leggere min
Un nuovo approccio semi-supervisionato migliora il rilevamento delle tabelle nelle immagini di documenti.
― 8 leggere min
Nuovi metodi migliorano la comprensione e l'analisi di eventi insoliti nei video.
― 5 leggere min
MV-RGBT offre un dataset realistico per valutare i metodi di tracking RGBT.
― 6 leggere min
Nuovi componenti migliorano l'efficienza della memoria e la velocità di elaborazione nella generazione 3D.
― 7 leggere min
Introducendo un nuovo framework per animazioni realistiche di pedoni nell'addestramento degli AV.
― 7 leggere min
Nuove fotocamere a basso costo offrono soluzioni di imaging 3D efficienti in vari settori.
― 5 leggere min
Presentiamo LVOS: un dataset per tenere traccia degli oggetti in video lunghi.
― 7 leggere min
Un metodo per migliorare la classificazione delle immagini riducendo i pregiudizi nei dataset.
― 6 leggere min
Un modello per capire meglio l'impatto dell'olio di palma sulle foreste e sulla sostenibilità.
― 7 leggere min
GMS migliora la segmentazione delle immagini mediche usando modelli generativi per una maggiore precisione.
― 6 leggere min