Antonia Wüst

Une nouvelle méthode pour définir des récompenses pour les agents d'apprentissage par renforcement en utilisant des modèles de langage.

2025-07-24T22:23:48+00:00 ― 9 min lire

Cet article examine les problèmes d'apprentissage par raccourci en apprentissage automatique et comment les régler.

2025-04-07T05:57:45+00:00 ― 8 min lire