Debmalya Mandal

Desarrollando algoritmos para mejorar el aprendizaje por refuerzo usando retroalimentación humana a pesar de la corrupción de datos.

2025-09-09T15:24:24+00:00 ― 6 minilectura

Este estudio presenta un método para asignar recompensas en entornos desconocidos.

2025-09-09T09:44:42+00:00 ― 7 minilectura

Un nuevo enfoque del aprendizaje por refuerzo considera los cambios ambientales causados por las acciones del agente.

2025-09-07T14:09:48+00:00 ― 7 minilectura

Examinando el impacto de la corrupción de datos en las estrategias de aprendizaje en juegos de Markov de suma cero para dos jugadores.

2025-09-01T23:36:00+00:00 ― 8 minilectura

Un nuevo método mejora la precisión de las elecciones al centrarse en preferencias parciales.

2025-08-03T13:28:18+00:00 ― 8 minilectura

Este estudio se centra en simetrías ocultas en bandidos lineales de alta dimensión.

2025-07-29T13:43:16+00:00 ― 8 minilectura

Explorando cómo el RL performativo cambia la dinámica del juego y la estabilidad de la política.

2025-05-28T22:03:27+00:00 ― 6 minilectura

Una mirada a cómo votar puede aclarar opiniones en grupos grandes.

2025-05-23T21:07:39+00:00 ― 5 minilectura