Shunian Chen

Des recherches montrent des biais importants dans les évaluations des réponses par les humains et les LLM.

2025-09-07T05:12:36+00:00 ― 8 min lire

De nouveaux référentiels révèlent des défis pour les MLLMs dans des tâches du monde réel avec de longs contextes.

2025-08-15T10:16:00+00:00 ― 10 min lire

LongLLaVA améliore la compréhension de plusieurs images pour différentes applis.

2025-06-17T07:57:12+00:00 ― 6 min lire

La méthode TRIM réduit les tokens d'image dans les modèles de langage multimodaux tout en maintenant la performance.

2025-06-10T11:06:24+00:00 ― 6 min lire

Un nouveau cadre identifie quand les modèles multimodaux utilisent des données d'entraînement inappropriées.

2025-05-29T07:11:33+00:00 ― 6 min lire