Jiafei Lyu

SEABO genera recompensas a partir de datos de expertos, simplificando el aprendizaje por imitación sin conexión.

2025-09-10T14:58:30+00:00 ― 7 minilectura

Este artículo habla sobre los desafíos y soluciones en el rendimiento del aprendizaje por refuerzo visual.

2025-09-05T23:46:56+00:00 ― 9 minilectura

Nueva método mejora la adaptabilidad de la IA en diferentes entornos.

2025-08-07T12:55:48+00:00 ― 8 minilectura

DLLM combina el aprendizaje por refuerzo con modelos de lenguaje para mejorar el rendimiento en tareas.

2025-07-30T11:46:30+00:00 ― 7 minilectura

SUMO mejora la toma de decisiones en el aprendizaje por refuerzo offline al mejorar la estimación de la incertidumbre.

2025-06-23T02:28:00+00:00 ― 8 minilectura