VISTA migliora il modo in cui troviamo informazioni integrando testo e immagini.
― 7 leggere min
Scienza all'avanguardia spiegata semplicemente
VISTA migliora il modo in cui troviamo informazioni integrando testo e immagini.
― 7 leggere min
Il benchmark MLVU punta a migliorare la comprensione delle macchine per i video lunghi.
― 6 leggere min
Uno sguardo all'evoluzione del campo degli avatar umani 3D e delle loro applicazioni.
― 7 leggere min
Questo documento esplora come i MLLM memorizzano e trasferiscono informazioni nel rispondere a domande visive.
― 6 leggere min
Introducendo un dataset per migliorare gli sforzi di osservazione della Terra usando dati satellitari diversi.
― 7 leggere min
MASA impara a seguire gli oggetti usando immagini senza etichette, migliorando l'adattabilità in situazioni diverse.
― 6 leggere min
Esplorare come gli esseri umani e le reti neurali profonde percepiscono le scene 3D tramite VPT.
― 8 leggere min
Un nuovo metodo migliora la privacy e l'efficienza nella verifica facciale utilizzando immagini senza lenti.
― 7 leggere min
EquiLoPO Network offre nuove soluzioni per analizzare dati volumetrici nonostante le rotazioni.
― 4 leggere min
Questo studio usa l'apprendimento automatico per classificare le forme delle antiche tavolette cuneiformi.
― 7 leggere min
Una nuova tecnica mette in evidenza le vulnerabilità nei sistemi di intelligenza artificiale avanzata che combinano immagini e testo.
― 6 leggere min
I progressi nella segmentazione automatica dei linfonodi migliorano la precisione nel trattamento del cancro.
― 6 leggere min
I modelli Mamba migliorano l'accuratezza e l'efficienza nell'interpretare le immagini mediche.
― 8 leggere min
Un dataset per identificare la propaganda nei meme arabi per una migliore alfabetizzazione mediatica.
― 5 leggere min
Bench2Drive offre un metodo di valutazione equo per le tecnologie di guida autonoma.
― 7 leggere min
LLplace semplifica la progettazione di layout 3D usando input in linguaggio naturale.
― 6 leggere min
La distillazione della conoscenza migliorala precisione della segmentazione nelle immagini medicali con dati limitati.
― 10 leggere min
Una nuova metrica si concentra su confronti di immagini significativi per una comunicazione migliore.
― 5 leggere min
Un nuovo approccio migliora il riconoscimento delle attività combinando vari tipi di dati.
― 7 leggere min
ReDistill offre una soluzione innovativa per ridurre l'uso massimo della memoria nelle reti neurali.
― 7 leggere min
Questo articolo esamina come i modelli di diffusione migliorano la generazione e la manipolazione delle immagini.
― 7 leggere min
Combinare i tipi di dati migliora la rilevazione precoce e il trattamento del cancro al seno.
― 5 leggere min
Un nuovo metodo migliora il restauro delle immagini riducendo il rumore e mantenendo i dettagli.
― 5 leggere min
Un nuovo metodo migliora la segmentazione delle immagini permettendo etichette testuali flessibili.
― 7 leggere min
Un nuovo framework punta a migliorare l'accuratezza e l'efficienza nell'analisi delle immagini mediche.
― 7 leggere min
Un nuovo metodo rivela informazioni su come i modelli da testo a immagine generano immagini.
― 7 leggere min
Setokim migliora la fusione tra comprensione visiva e testuale grazie a un'innovativa tokenizzazione.
― 8 leggere min
Un nuovo sistema valuta i rischi di sicurezza nelle immagini generate da modelli di AI.
― 8 leggere min
Esplora tecniche e sfide per rendere i modelli di intelligenza artificiale più comprensibili.
― 7 leggere min
Un sistema che crea e modifica oggetti tenuti in mano nelle immagini.
― 10 leggere min
La ricerca esplora funzioni di perdita avanzate per migliorare le prestazioni delle GAN usando la programmazione genetica.
― 5 leggere min
Nuovi metodi migliorano la chiarezza delle immagini per gli studi sulle galassie.
― 5 leggere min
Un nuovo metodo migliora il rendering delle immagini aeree usando meno input.
― 9 leggere min
Un nuovo modo di capire le metafore nei video tramite sottotitoli automatici.
― 8 leggere min
Scopri come il deep learning migliora le previsioni del tempo a breve termine.
― 8 leggere min
Un nuovo metodo migliora il modeling 3D usando solo due immagini per una maggiore precisione.
― 7 leggere min
Uno studio presenta un nuovo riferimento per le prestazioni dei prompt nella creazione e recupero di immagini.
― 11 leggere min
Un nuovo approccio migliora l'affidabilità del modello nelle previsioni cruciali.
― 5 leggere min
La sfida ULS23 punta a migliorare la segmentazione dei tumori nelle TC per una cura del cancro migliore.
― 5 leggere min
Un nuovo framework migliora il riconoscimento degli oggetti usando veicoli aerei e terrestri.
― 5 leggere min