Que signifie "Récompenses cumulées"?
Table des matières
Les récompenses cumulées, c'est le total des points ou des bénéfices qu'un agent reçoit au fil du temps en essayant de compléter une tâche ou d'atteindre un objectif. Dans le cas des systèmes d'apprentissage, comme des robots ou des programmes informatiques, ces agents prennent des décisions en se basant sur ce qu'ils ont appris de leurs expériences passées.
Quand un agent agit dans un environnement, il gagne des récompenses qui montrent à quel point il s'en sort. Avec le temps, ces récompenses s'accumulent. L'idée principale, c'est que plus un agent collecte de récompenses, mieux il réussit dans ses tâches.
Dans beaucoup de scénarios d'apprentissage, l'agent apprend à choisir des actions qui lui rapportent le plus de récompenses cumulées, ce qui veut dire qu'il vise à faire les meilleurs choix au fil du temps. Cette approche aide l'agent à améliorer sa performance, car il apprend à partir des bonnes comme des mauvaises expériences pour prendre des décisions plus intelligentes à l'avenir.