Aritra Mitra

Des recherches montrent comment les retards ralentissent les algos dans les tâches d'optimisation min-max.

2025-10-09T00:01:04+00:00 ― 6 min lire

Explorer des techniques de contrôle sans modèle avec des canaux de communication limités.

2025-09-03T03:14:14+00:00 ― 7 min lire

Cette étude examine comment les retards affectent l'approximation stochastique dans l'apprentissage par renforcement.

2025-08-20T21:34:43+00:00 ― 8 min lire

Cette recherche simplifie la preuve de convergence pour l'apprentissage TD avec approximation linéaire des fonctions.

2025-08-16T02:13:31+00:00 ― 8 min lire

Examiner comment les agents apprennent plus vite ensemble malgré les délais de communication.

2025-07-05T17:57:30+00:00 ― 7 min lire

Une nouvelle approche pour que les agents partagent des stratégies et améliorent leurs performances dans des contextes variés.

2025-06-10T04:53:29+00:00 ― 7 min lire

Améliorer la performance du Q-learning avec des retours corrompus dans des applis du monde réel.

2025-06-09T06:16:48+00:00 ― 7 min lire