Pengcheng He

Evaluando la capacidad de los LLMs para detectar instrucciones dañinas en las solicitudes de los usuarios.

2025-10-07T17:56:06+00:00 ― 7 minilectura

HERON simplifica el diseño de recompensas, mejorando la eficiencia y flexibilidad del aprendizaje por refuerzo.

2025-09-30T13:50:48+00:00 ― 7 minilectura

Un nuevo método mejora la eficiencia de los modelos de lenguaje sin sacrificar la calidad.

2025-08-13T02:02:42+00:00 ― 6 minilectura