Kaijie Zhu

Un nuevo método equilibra la robustez del modelo y la generalización frente a entradas complicadas.

2025-10-13T16:16:00+00:00 ― 6 minilectura

Presentando un enfoque nuevo para evaluar modelos de lenguaje grande de manera efectiva.

2025-09-05T09:14:00+00:00 ― 7 minilectura

NPHardEval4V evalúa las capacidades de razonamiento de modelos de lenguaje grande multimodal.

2025-09-01T13:19:48+00:00 ― 10 minilectura

Este estudio examina cómo los LLMs manejan el razonamiento en situaciones abstractas y contextuales.

2025-08-02T16:24:18+00:00 ― 6 minilectura

Examinando los problemas y posibles mejoras en la revisión por pares académica.

2025-07-27T05:49:42+00:00 ― 9 minilectura