Shunian Chen

La ricerca mostra dei bias significativi nelle valutazioni delle risposte tra gli umani e i LLM.

2025-09-07T05:12:36+00:00 ― 7 leggere min

Nuovi benchmark rivelano le sfide per i MLLM nei compiti reali con contesti lunghi.

2025-08-15T10:16:00+00:00 ― 8 leggere min

LongLLaVA migliora la comprensione di più immagini per diverse applicazioni.

2025-06-17T07:57:12+00:00 ― 5 leggere min

Il metodo TRIM riduce i token delle immagini nei modelli di linguaggio multimodali mantenendo le prestazioni.

2025-06-10T11:06:24+00:00 ― 5 leggere min

Un nuovo framework identifica quando i modelli multimodali usano dati di addestramento inappropriati.

2025-05-29T07:11:33+00:00 ― 5 leggere min