Articoli più recenti per Modelli visione-linguaggio

TextRefiner aumenta le prestazioni dei modelli Vision-Language, rendendoli più veloci e precisi.

Jingjing Xie, Yuxin Zhang, Jun Peng

2025-03-19T10:57:27+00:00 ― 7 leggere min

I modelli Vision-Language affrontano sfide nella comprensione della struttura del linguaggio per i compiti immagine-testo.

Sri Harsha Dumpala, David Arps, Sageev Oore

2025-03-19T00:31:30+00:00 ― 6 leggere min

I ricercatori migliorano il modo in cui i computer analizzano e categorizzano le immagini.

Roberto Alcover-Couso, Marcos Escudero-Viñolo, Juan C. SanMiguel

2025-03-15T14:40:12+00:00 ― 7 leggere min

Nuovi metodi migliorano come l'IA descrive le immagini usando modelli linguistici.

Pingchuan Ma, Lennart Rietdorf, Dmytro Kotovenko

2025-03-02T15:18:00+00:00 ― 6 leggere min

Scopri come il skip tuning migliora l'efficienza nei modelli vision-language.

Shihan Wu, Ji Zhang, Pengpeng Zeng

2025-02-28T07:07:30+00:00 ― 7 leggere min

Perché i modelli vision-linguaggio faticano di più con le immagini rispetto al testo.

Ido Cohen, Daniela Gottesman, Mor Geva

2025-02-19T08:03:18+00:00 ― 7 leggere min

Scopri come i VLM stanno cambiando la classificazione delle serie temporali con i dati visivi.

Vinay Prithyani, Mohsin Mohammed, Richa Gadgil

2025-01-29T05:40:39+00:00 ― 6 leggere min

Scopri come i modelli di linguaggio visivo migliorano la comprensione di immagini e testo.

Tenghui Li, Guoxu Zhou, Xuyang Zhao

2025-01-27T13:33:09+00:00 ― 8 leggere min

KALAHash migliora l'efficienza della ricerca di immagini con dati di addestramento minimi.

Shu Zhao, Tan Yu, Xiaoshuai Hao

2025-01-25T03:46:21+00:00 ― 7 leggere min

Metodi innovativi rendono chiare le immagini scure, trasformando le nostre catture notturne.

Han Zhou, Wei Dong, Xiaohong Liu

2025-01-18T04:51:09+00:00 ― 6 leggere min