Cette étude met en avant des méthodes de RL offline pour améliorer les agents VLN en utilisant des données sous-optimales.
― 11 min lire
La science de pointe expliquée simplement
Cette étude met en avant des méthodes de RL offline pour améliorer les agents VLN en utilisant des données sous-optimales.
― 11 min lire