Shunian Chen

La investigación revela sesgos significativos en las evaluaciones humanas y de LLM sobre las respuestas.

2025-09-07T05:12:36+00:00 ― 8 minilectura

Nuevos benchmarks revelan desafíos para los MLLMs en tareas del mundo real con contextos largos.

2025-08-15T10:16:00+00:00 ― 9 minilectura

LongLLaVA mejora la comprensión de múltiples imágenes para varias aplicaciones.

2025-06-17T07:57:12+00:00 ― 6 minilectura

El método TRIM reduce los tokens de imagen en modelos de lenguaje multimodal sin perder rendimiento.

2025-06-10T11:06:24+00:00 ― 6 minilectura

Un nuevo marco identifica cuándo los modelos multimodales usan datos de entrenamiento inapropiados.

2025-05-29T07:11:33+00:00 ― 6 minilectura