Melih Kandemir

Une nouvelle méthode améliore les prédictions dans des systèmes dynamiques complexes.

2025-09-22T07:58:16+00:00 ― 9 min lire

L'algorithme PAC améliore l'équilibre exploration-exploitation dans l'apprentissage par renforcement.

2025-09-11T03:05:18+00:00 ― 7 min lire

MOMBO améliore la prise de décision dans l'apprentissage par renforcement hors ligne avec une meilleure estimation de l'incertitude.

2025-08-01T09:12:00+00:00 ― 6 min lire