Jannis Blüml

Kombination von Mixture of Experts und Monte Carlo Tree Search für bessere Schachleistung.

2025-09-13T04:35:42+00:00 ― 6 min Lesedauer

Ein neues Framework, um das Lernen von KI-Agenten durch modifizierte Atari-Spiele zu verbessern.

2025-08-01T07:53:00+00:00 ― 8 min Lesedauer

Eine neue Methode, um Belohnungen für Reinforcement-Learning-Agenten mit Hilfe von Sprachmodellen zu definieren.

2025-07-24T22:23:48+00:00 ― 7 min Lesedauer