Kyungjae Lee

Un marco que mejora la precisión en sistemas de respuesta a preguntas en dominio abierto.

2025-10-10T19:00:36+00:00 ― 6 minilectura

Presentamos RLRF: un marco para mejorar el rendimiento de modelos de lenguaje a través de comentarios detallados.

2025-08-27T01:24:00+00:00 ― 7 minilectura

Un nuevo método mejora la seguridad en el aprendizaje por refuerzo a través de la gestión de riesgos.

2025-08-06T01:14:54+00:00 ― 8 minilectura

Este estudio examina el uso de preguntas estructuradas para mejorar las respuestas de los LLM.

2025-07-21T11:11:00+00:00 ― 5 minilectura

Una mirada a cómo el RL de distribución transforma la toma de decisiones al entender las distribuciones de resultados.

2025-06-24T05:55:32+00:00 ― 8 minilectura