Rafael Rafailov

MOTO mejora el aprendizaje de los robots al combinar el entrenamiento offline con el ajuste online.

2025-09-18T17:26:48+00:00 ― 7 minilectura

Este estudio evalúa métodos para mejorar modelos de lenguaje grandes usando datos de preferencias de los usuarios.

2025-08-17T07:09:54+00:00 ― 7 minilectura

Examinando la sobreoptimización en los DAAs y su impacto en el rendimiento del modelo.

2025-08-02T17:35:24+00:00 ― 9 minilectura

Un nuevo modelo permite que los robots aprendan tareas mejor usando entradas visuales y de lenguaje.

2025-07-29T08:31:12+00:00 ― 8 minilectura

Un nuevo método para evaluar los valores diversos de los usuarios en modelos de lenguaje.

2025-07-07T16:18:18+00:00 ― 9 minilectura