Evaluando el razonamientoEvaluando el razonamientode código de LLMlógica de programación.Nuevo marco prueba la comprensión de laIngeniería del softwareEvaluando el razonamiento de código en modelos de lenguaje grandesUn nuevo marco para evaluar la comprensión de tareas de código en LLMs.2025-09-08T08:35:48+00:00 ― 11 minilectura