Simple Science

La science de pointe expliquée simplement

# Biologie# Neurosciences

Comment le cerveau apprend grâce au feedback de récompense

Cette étude examine l'activité cérébrale pendant des tâches d'apprentissage basées sur les récompenses.

― 8 min lire


Activité cérébrale dansActivité cérébrale dansl'apprentissage desrécompensesd'apprentissage.s'adapte pendant les tâchesUne étude montre comment le cerveau
Table des matières

Dans nos activités quotidiennes, on ajuste souvent nos actions pour répondre aux exigences de différentes situations. La capacité de faire ça dépend de la façon dont notre cerveau apprend de nos actions et des retours qu'on reçoit. Quand on effectue des tâches, le cerveau doit traiter des infos sur si nos actions mènent à du succès ou à un échec. Ces retours nous aident à changer nos comportements en conséquence. Mais c'est pas toujours facile parce que beaucoup de tâches ne donnent qu'une seule mesure de succès, donc le cerveau doit Apprendre à s'adapter en fonction de ça.

Pas mal de zones de notre cerveau bossent ensemble pour nous aider à évaluer si nos actions correspondent à nos attentes. Ça comprend des régions qui traitent des infos sensorielles et celles qui contrôlent nos mouvements. Un ensemble spécifique de zones cérébrales, appelé le cortex préfrontal médian et le striatum, joue un rôle important pour vérifier si nos actions s'alignent avec ce qu'on anticipait. Quand il y a un décalage entre ce qu'on attendait et ce qui s'est réellement passé, ça crée une "erreur de prédiction." Cette info sert de signal pour modifier notre comportement futur. Cependant, comment cette info est partagée à travers les différentes parties du cerveau n'est pas encore totalement clair.

Le rôle des systèmes cérébraux dans le comportement

Les chercheurs ont identifié différents systèmes neuronaux liés à divers aspects du comportement. Par exemple, le cortex sensoriel nous aide à comprendre notre environnement, tandis que le cortex moteur est chargé d'exécuter les mouvements. Les régions de haut niveau dans le cerveau, comme celles impliquées dans l'attention et la prise de décision, jouent aussi des rôles cruciaux pour guider nos actions.

Pendant l'apprentissage, on ne sait pas trop comment ces systèmes cérébraux bosser ensemble. Des études récentes suggèrent qu'un réseau appelé le Réseau par défaut (DMN) pourrait aider à coordonner ces activités. On pensait au départ que le DMN était moins actif pendant les tâches difficiles, mais il est maintenant reconnu pour son rôle dans la prise de décision et les tâches de mémoire. Ce réseau pourrait surveiller les activités à travers différentes zones cérébrales, aidant à passer d'un mode de comportement à un autre, comme explorer de nouvelles options ou exploiter celles déjà connues.

L'importance du réseau par défaut

Le DMN a traditionnellement été associé à la pensée introspective, comme se souvenir de souvenirs. Cependant, il a été montré qu'il s'active pendant des tâches qui nécessitent la prise de décision et la mémoire de travail. Les chercheurs pensent que la position unique du DMN dans le cerveau lui permet de connecter différentes fonctions cérébrales, ce qui est crucial pour coordonner le comportement.

Certaines études indiquent que différentes zones du DMN aident à gérer différents types de comportements au fil du temps. Par exemple, certaines régions du DMN semblent aider à passer de la collecte d'infos à l'utilisation de ces infos lors de tâches impliquant des Récompenses. Cela pourrait expliquer pourquoi le DMN est vital pour la performance, surtout quand on doit s'appuyer sur des connaissances tirées d'expériences passées plutôt que sur des retours sensoriels immédiats.

Tâche et méthodologie

Dans notre étude, on voulait examiner comment l'activité cérébrale change pendant l'apprentissage impliquant des récompenses. On a conçu une tâche motrice où les participants devaient apprendre à tracer un chemin de mouvement spécifique sans retour visuel de la position de leur doigt. Les participants ont reçu un retour de score basé sur la précision avec laquelle ils ont tracé un chemin caché, ce qui nous a permis d'étudier les processus d'apprentissage uniquement à partir de retours basés sur les récompenses.

Chaque participant a d'abord effectué une tâche de base sans retour. Ensuite, ils ont participé à une tâche d'apprentissage, où ils ont tracé un chemin courbe et ont reçu des scores basés sur leur performance. Ce cadre offrait une chance unique de comprendre comment les changements liés à l'apprentissage dans l'activité cérébrale se déroulent.

Les participants ont utilisé un pavé tactile pour tracer un chemin affiché sur un écran. Au départ, ils n'ont reçu aucun retour, ce qui nous a permis d'établir une performance de base. Ensuite, pendant la phase d'apprentissage, ils ont reçu des scores basés sur leur précision dans le traçage, bien que les récompenses réelles étaient basées sur une forme cachée.

Analyser l'activité cérébrale

Pour analyser l'activité cérébrale pendant la tâche, on a divisé l'étude en trois périodes principales : de base, apprentissage précoce et apprentissage tardif. On a évalué comment les connexions cérébrales changeaient pendant chaque phase, en se concentrant sur les interactions entre différentes régions du cerveau.

On a utilisé des techniques avancées pour comparer les modèles d'activité cérébrale à travers ces phases. En mesurant comment différentes régions du cerveau interagissaient entre elles, on a pu observer comment la communication à l'intérieur et entre ces régions évoluait au fil du temps.

Résultats : phase d'apprentissage précoce

Pendant la phase d'apprentissage précoce, alors que les participants cherchaient à comprendre comment leurs mouvements affectaient leurs scores, on a observé que certaines régions cérébrales devenaient plus distinctes les unes des autres. C'était particulièrement vrai pour les zones associées au mouvement et à l'attention. Le DMN a aussi montré des changements dans ses modèles d'activité, indiquant qu'il jouait un rôle important dans le traitement des retours de récompense.

Les augmentations de connectivité au sein du DMN et du réseau associé au Contrôle moteur ont mis en lumière comment ces systèmes ont commencé à travailler plus étroitement ensemble. Étonnamment, certaines zones du DMN ont montré une diminution de leur connexion avec les régions environnantes, suggérant un focus sur le traitement des infos sur les récompenses plutôt que sur leur intégration avec d'autres réseaux.

Résultats : phase d'apprentissage tardif

À mesure que les participants progressaient vers la phase d'apprentissage tardif, les modèles qu'on observait pendant l'apprentissage précoce ont commencé à changer. Les zones au sein du DMN et des réseaux moteurs ont montré une séparation réduite, indiquant une intégration accrue. Cela suggérait qu'une fois que les participants avaient appris à relier leurs actions aux récompenses, leurs cerveaux avaient commencé à coordonner plus harmonieusement entre différents réseaux.

Les changements durant l'apprentissage tardif ont aussi suggéré que les zones spécifiques chargées de gérer le retour sensoriel avaient changé. Les connexions précédemment établies avec le réseau d'attention sont devenues plus fortes, reflétant presque un retour à une fonction cérébrale plus unifiée qui intégrait les expériences passées pour guider les comportements actuels.

Différences individuelles dans l'apprentissage

Un aspect intéressant de notre étude était comment les différences individuelles dans les capacités d'apprentissage affectaient l'activité cérébrale. Tandis que le groupe global montrait des améliorations au cours de la tâche, certains participants apprenaient plus vite que d'autres. On voulait comprendre comment ces différences s'associaient aux changements qu'on observait dans l'activité cérébrale.

Pour quantifier à quel point chaque participant a bien appris, on a calculé un score d'apprentissage basé sur leur performance tout au long de la tâche. On a ensuite examiné la relation entre ces scores et les changements de Connectivité cérébrale. Bien que des différences individuelles soient apparentes, établir une corrélation claire s'est avéré difficile.

Cependant, on a remarqué un schéma cohérent dans certaines zones du cerveau. Alors que les participants qui apprenaient efficacement montraient certains changements dans leur connectivité cérébrale, ceux qui avaient du mal à apprendre affichaient des modèles différents. Cela renforce l'idée que comprendre la variabilité individuelle est crucial pour interpréter l'activité cérébrale dans des contextes d'apprentissage.

Conclusion

Dans l'ensemble, nos résultats éclairent le fonctionnement du cerveau pendant les tâches d'apprentissage basées sur les récompenses. L'étude a mis en lumière des changements significatifs au sein et entre divers réseaux neuronaux à mesure que les participants progressaient. Pendant l'apprentissage initial, des zones distinctes devenaient plus séparées ; cependant, à mesure que l'apprentissage avançait, il y avait un passage vers une plus grande intégration.

Ces résultats suggèrent que la capacité du cerveau à adapter sa fonctionnalité est essentielle pour l'apprentissage. De plus, les différences individuelles dans le comportement d'apprentissage sont liées à ces changements neuronaux, soulignant l'importance de comprendre comment différentes personnes apprennent en utilisant différents chemins neuronaux.

À travers notre étude, on contribue à une compréhension plus profonde du processus dynamique de l'apprentissage moteur, révélant comment l'activité cérébrale évolue durant cette expérience. Les recherches futures peuvent s'appuyer sur ces résultats pour explorer des aspects plus nuancés de l'apprentissage et les schémas uniques d'activité cérébrale qui le soutiennent.

Source originale

Titre: Reconfigurations of cortical manifold structure during reward-based motor learning

Résumé: Adaptive motor behavior depends on the coordinated activity of multiple neural systems distributed across the brain. While the role of sensorimotor cortex in motor learning has been well-established, how higher-order brain systems interact with sensorimotor cortex to guide learning is less well understood. Using functional MRI, we examined human brain activity during a reward-based motor task where subjects learned to shape their hand trajectories through reinforcement feedback. We projected patterns of cortical and striatal functional connectivity onto a low-dimensional manifold space and examined how regions expanded and contracted along the manifold during learning. During early learning, we found that several sensorimotor areas in the Dorsal Attention Network exhibited increased covariance with areas of the salience/ventral attention network and reduced covariance with areas of the default mode network (DMN). During late learning, these effects reversed, with sensorimotor areas now exhibiting increased covariance with DMN areas. However, areas in posteromedial cortex showed the opposite pattern across learning phases, with its connectivity suggesting a role in coordinating activity across different networks over time. Our results establish the neural changes that support reward-based motor learning and identify distinct transitions in the functional coupling of sensorimotor to transmodal cortex when adapting behavior.

Auteurs: Jason Gallivan, Q. Nick, D. J. Gale, C. Areshenkoff, A. J. De Brouwer, J. Y. Nashed, J. Wammes, T. Zhu, J. R. Flanagan, J. Smallwood

Dernière mise à jour: 2024-02-08 00:00:00

Langue: English

Source URL: https://www.biorxiv.org/content/10.1101/2023.07.05.547880

Source PDF: https://www.biorxiv.org/content/10.1101/2023.07.05.547880.full.pdf

Licence: https://creativecommons.org/licenses/by-nc/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires