Giorgia Ramponi

Nuevos métodos mejoran la seguridad en el aprendizaje por refuerzo mientras optimizan el rendimiento en entornos con restricciones.

2025-08-27T01:07:52+00:00 ― 7 minilectura

Un nuevo algoritmo combina el RL offline y la retroalimentación de preferencias para mejorar la toma de decisiones.

2025-07-23T23:37:06+00:00 ― 12 minilectura