Emmanuel Rachelson

Un nouveau cadre améliore l'optimisation en apprentissage automatique en utilisant des infos sur le comportement.

2025-08-13T00:04:12+00:00 ― 8 min lire

Présentation d'ExpectRL pour s'attaquer à la surestimation dans l'apprentissage par renforcement grâce aux expectiles.

2025-08-01T08:48:18+00:00 ― 9 min lire

Un nouveau banc d'essai pour tester des méthodes d'apprentissage par renforcement robustes dans différents environnements.

2025-07-29T22:12:48+00:00 ― 8 min lire

Des chercheurs améliorent l'apprentissage par renforcement avec un nouveau cadre pour des environnements incertains.

2025-07-29T22:04:54+00:00 ― 7 min lire

La méthode LEADS renforce la diversité des compétences pour une meilleure exploration de l'IA.

2025-07-28T21:19:42+00:00 ― 8 min lire

SGDrop aide les CNN à mieux apprendre avec peu de données en élargissant leur perspective.

2025-06-06T04:16:30+00:00 ― 8 min lire

RAMP aide les agents à explorer de nouvelles voies pour mieux apprendre.

2025-05-14T05:49:20+00:00 ― 8 min lire