Jannis Blüml

Combiner un mélange d'experts et une recherche d'arbre de Monte Carlo pour une meilleure performance aux échecs.

2025-09-13T04:35:42+00:00 ― 7 min lire

Un nouveau cadre pour améliorer l'apprentissage des agents IA grâce à des jeux Atari modifiés.

2025-08-01T07:53:00+00:00 ― 9 min lire

Une nouvelle méthode pour définir des récompenses pour les agents d'apprentissage par renforcement en utilisant des modèles de langage.

2025-07-24T22:23:48+00:00 ― 9 min lire