Melih Kandemir

Un nuevo método mejora las predicciones en sistemas dinámicos complejos.

2025-09-22T07:58:16+00:00 ― 8 minilectura

El algoritmo PAC mejora el equilibrio entre exploración y explotación en el aprendizaje por refuerzo.

2025-09-11T03:05:18+00:00 ― 7 minilectura

MOMBO mejora la toma de decisiones en el aprendizaje por refuerzo offline con una mejor estimación de la incertidumbre.

2025-08-01T09:12:00+00:00 ― 6 minilectura