Melih Kandemir

Eine neue Methode verbessert die Vorhersagen in komplexen dynamischen Systemen.

2025-09-22T07:58:16+00:00 ― 7 min Lesedauer

Der PAC-Algorithmus verbessert das Gleichgewicht zwischen Erkundung und Ausnutzung im Reinforcement Learning.

2025-09-11T03:05:18+00:00 ― 6 min Lesedauer

MOMBO verbessert die Entscheidungsfindung im Offline-RL mit besserer Unsicherheitsabschätzung.

2025-08-01T09:12:00+00:00 ― 5 min Lesedauer