Un nouveau cadre utilise les Reward Machines pour améliorer les performances de l'RL en cas d'incertitude.
― 9 min lire
La science de pointe expliquée simplement
Un nouveau cadre utilise les Reward Machines pour améliorer les performances de l'RL en cas d'incertitude.
― 9 min lire
Être sympa aide l'IA à mieux servir les humains.
― 6 min lire