Sukai Huang

Cette étude présente BiMI pour améliorer les systèmes de récompense en apprentissage par renforcement.

2025-06-06T14:01:06+00:00 ― 8 min lire

Une nouvelle méthode améliore l'efficacité de la planification sans dépendre d'experts.

2025-06-06T13:37:24+00:00 ― 7 min lire

Examiner les capacités des grands modèles de langage dans les tâches de planification.

2025-03-13T13:43:03+00:00 ― 7 min lire