Michał Bortkiewicz

Untersuchen von Möglichkeiten, um Fähigkeiten im RL während des Feintunings beizubehalten.

2025-09-11T00:51:00+00:00 ― 7 min Lesedauer

Forschung zeigt, dass allgemeine Regularisierungsmethoden die Leistung von Off-Policy RL-Agenten bei verschiedenen Aufgaben verbessern.

2025-09-02T06:58:24+00:00 ― 10 min Lesedauer

Forscher schlagen neue Methoden vor, um Lernsysteme kontinuierlich anpassen zu können.

2025-07-31T05:09:18+00:00 ― 6 min Lesedauer