Andi Nika

Développer des algos pour améliorer l'apprentissage par renforcement en utilisant les retours humains malgré la corruption des données.

2025-09-09T15:24:24+00:00 ― 7 min lire

Examen de l'impact de la corruption des données sur les stratégies d'apprentissage dans des jeux de Markov à somme nulle à deux joueurs.

2025-09-01T23:36:00+00:00 ― 8 min lire