Une nouvelle méthode améliore le RL hors ligne en utilisant des modèles de diffusion pour une prise de décision améliorée.
― 9 min lire
La science de pointe expliquée simplement
Une nouvelle méthode améliore le RL hors ligne en utilisant des modèles de diffusion pour une prise de décision améliorée.
― 9 min lire