Utsav Singh

PIPER mejora el aprendizaje por refuerzo usando retroalimentación basada en preferencias para lidiar con recompensas escasas.

2025-08-17T22:02:36+00:00 ― 8 minilectura

LGR2 mejora el rendimiento en tareas robóticas a través de instrucciones en lenguaje y aprendizaje jerárquico.

2025-07-31T10:25:18+00:00 ― 8 minilectura

DIPPER optimiza el aprendizaje de robots a través de la retroalimentación humana, mejorando el rendimiento en las tareas.

2025-07-28T05:00:06+00:00 ― 8 minilectura

Un nuevo método ayuda a los robots a hacer tareas de manera más efectiva al desglosar los objetivos.

2025-06-01T13:48:24+00:00 ― 6 minilectura