Aritra Mitra

Diese Studie untersucht, wie Verzögerungen die stochastische Annäherung im Reinforcement Learning beeinflussen.

2025-08-20T21:34:43+00:00 ― 6 min Lesedauer

Diese Forschung vereinfacht den Beweis der Konvergenz für TD-Lernen mit linearer Funktionsapproximation.

2025-08-16T02:13:31+00:00 ― 7 min Lesedauer

Untersuchen, wie Agenten trotz Kommunikationsverzögerungen schneller zusammen lernen.

2025-07-05T17:57:30+00:00 ― 6 min Lesedauer

Ein neuer Ansatz für Agenten, um Strategien auszutauschen und die Leistung in verschiedenen Umgebungen zu verbessern.

2025-06-10T04:53:29+00:00 ― 6 min Lesedauer

Verbesserung der Q-Learning-Leistung bei fehlerhaften Rückmeldungen in realen Anwendungen.

2025-06-09T06:16:48+00:00 ― 6 min Lesedauer