Marcel Hussing

Traiter la surestimation de la valeur et le biais de récence pour améliorer la performance des agents.

2025-08-31T00:12:00+00:00 ― 7 min lire

Explorer comment les machines peuvent apprendre les unes des autres grâce à l'apprentissage continu distribué.

2025-08-08T16:34:48+00:00 ― 9 min lire

Présentation d'un algorithme efficace qui utilise les politiques existantes pour de meilleurs résultats d'apprentissage.

2025-08-03T18:31:15+00:00 ― 7 min lire