Simple Science

La science de pointe expliquée simplement

# Biologie# Neurosciences

Les souris révèlent des schémas de prise de décision en cherchant à manger

Une étude montre comment les souris équilibrent les récompenses et la patience en cherchant de la nourriture.

― 9 min lire


Souris et décisions deSouris et décisions derecherche de nourriturela recherche de nourriture.de prise de décision des souris lors deUne étude révèle le processus complexe
Table des matières

Les animaux, comme les humains, doivent faire des choix sur comment passer leur temps et leur énergie. Une décision importante qu'ils doivent prendre est quand quitter un endroit où la nourriture ou d'autres ressources sont en baisse et chercher un meilleur spot. On appelle ça la recherche de ressources en patches. Les scientifiques ont étudié cette question pour découvrir la meilleure façon pour les animaux de décider quand bouger. Une des idées clés dans cette recherche s'appelle le Théorème de la valeur marginale (TVM). Selon cette théorie, les animaux devraient quitter un patch quand le rythme d'obtention de ressources, comme la nourriture, tombe au niveau moyen qu'ils s'attendent à trouver dans la zone environnante.

Les chercheurs ont découvert que, bien que le TVM offre un guide sur quand les animaux devraient quitter un patch, ça ne correspond pas toujours à ce que font réellement les animaux. Il y a encore débat sur le fait que les animaux suivent exactement le TVM. De plus, les scientifiques étudient les processus biologiques qui influencent ces décisions.

Pour comprendre comment les animaux prennent ces choix, les chercheurs ont essayé d'établir des règles simples. Une de ces règles est connue sous le nom de « règle du temps d'abandon ». Cette règle suggère qu'un animal devrait quitter un patch après qu'un certain temps se soit écoulé depuis sa dernière récompense. Une autre approche est similaire aux modèles utilisés en psychologie, qui suivent les décisions comme un processus de comparaison entre le temps passé à chercher et les récompenses reçues.

En termes simples, les modèles de recherche de ressources fonctionnent en gardant une trace de deux choses : le temps passé dans un patch et les récompenses reçues. Quand le temps s'allonge et que les récompenses ralentissent, l'animal est susceptible de partir. S'il y a encore beaucoup de récompenses qui arrivent, l'animal a tendance à rester plus longtemps.

Dans des études précédentes, les scientifiques ont remarqué une connexion entre certaines zones du cerveau et les choix de recherche. Des recherches sur des singes ont montré que des neurones spécifiques dans le cerveau deviennent plus actifs quand ils sont sur le point de quitter un patch. Des résultats similaires ont été observés chez les humains et les rongeurs. Cependant, les processus cérébraux exacts impliqués dans la prise de ces décisions sont encore à l'étude.

Nouvelle recherche sur la recherche de ressources en patches

Dans cette nouvelle étude, les chercheurs voulaient approfondir comment les souris prennent des décisions lorsqu'elles cherchent de l'eau dans un environnement contrôlé. Ils ont créé un setup en réalité virtuelle où les souris pouvaient courir sur un tapis roulant et rencontrer différents patches où elles pouvaient collecter des récompenses en eau. La quantité et le timing des récompenses variaient entre les patches.

Les chercheurs ont remarqué que les souris passaient plus de temps dans les patches qui avaient beaucoup de récompenses, ce qui était en accord avec le modèle TVM. Toutefois, quand ils ont examiné les détails de plus près, ils ont trouvé que les souris ne quittaient pas toujours les patches aux moments prévus selon le TVM. Au lieu de ça, ils ont vu un schéma où la décision de partir semblait être influencée par la Patience ressentie par les souris ce jour-là.

En utilisant des modèles qui suivaient le processus de prise de décision dans le temps, ils ont pu expliquer le comportement des souris mieux que les modèles précédents. Le processus d'intégration fonctionnait comme une balance, pesant le temps passé à chercher contre les récompenses reçues. Ils ont découvert que les neurones dans le cortex frontal des souris étaient liés à ce processus de prise de décision. En gros, les souris semblaient utiliser une méthode de « montée » où les signaux cérébraux augmentaient progressivement en réponse au temps passé dans le patch et aux récompenses reçues.

Mise en place de l'expérience

Dans l'expérience, les souris ont été entraînées à chercher de l'eau dans une tâche de réalité virtuelle. Elles couraient sur un tapis roulant, et après avoir parcouru une certaine distance, elles rencontraient un indice visuel signalant le début d'un essai de patch. Les souris pouvaient alors recevoir des récompenses en eau de tailles variées selon le patch dans lequel elles se trouvaient.

Les chercheurs ont mis en place la tâche de manière à ce que la première récompense soit toujours disponible juste après que les souris se soient arrêtées. Cependant, après cela, les récompenses venaient à différentes probabilités, qui diminuaient avec le temps. Il y avait neuf types différents de patches basés sur la taille et la fréquence des récompenses offertes.

L'expérience a permis d'observer de près le comportement des souris en réponse aux différents patches. Les chercheurs ont noté combien de temps les souris restaient dans chaque patch et comment leur comportement pouvait changer selon les récompenses disponibles.

Modèles de comportement observés

Les scientifiques ont constaté qu'en général, les souris ajustaient leurs temps de recherche en fonction des statistiques de récompenses. Par exemple, quand les patches offraient de plus grandes récompenses, les souris avaient tendance à rester plus longtemps avant de partir. Cependant, des différences individuelles dans le comportement ont aussi été notées ; certaines souris montraient moins de disposition à attendre que d'autres.

En analysant les données, ils ont découvert que le temps moyen que les souris passaient dans chaque patch variait significativement selon la taille des récompenses. Mais surtout, il y avait des variations entre les souris dans le temps qu'elles étaient prêtes à attendre pour les récompenses, ce qu'ils ont appelé « patience ». Cette patience semblait influencer leur processus de décision d'une manière que le TVM n'avait pas complètement capturée.

Pour expliquer ces comportements, les chercheurs ont utilisé un modèle qui s'adaptait à la patience de chaque souris. Ils ont découvert que ce modèle pouvait prédire combien de temps une souris resterait dans un patch en fonction des récompenses disponibles. Les souris qui affichaient plus de patience avaient tendance à montrer une plus grande différence dans le temps qu'elles passaient dans différents patches. Cela signifie que leur décision de partir était largement influencée par leur état motivationnel actuel.

Analyse de la base neuronale

Pour étudier plus en profondeur la biologie sous-jacente de ces comportements, les chercheurs ont enregistré l'Activité neuronale des souris pendant qu'elles réalisaient la tâche de recherche. Les enregistrements provenaient principalement du cortex frontal, qui est connu pour être impliqué dans la prise de décisions.

L'activité neuronale présentait souvent un schéma de « montée », avec des neurones montrant des augmentations progressives des taux de décharge à mesure que les souris continuaient à rester sur un patch en attendant des récompenses. Notamment, cette montée était influencée par la taille des récompenses reçues. Quand une récompense était délivrée, il y avait une chute des taux de décharge neuronale, reflétant une réinitialisation temporaire du processus d'accumulation.

En utilisant ces données, les chercheurs ont identifié une population spécifique de neurones qui exhibait ce comportement de montée. Ils ont découvert que l'activité de ces neurones était non seulement corrélée avec les modèles de prise de décision qu'ils avaient développés, mais aussi indicative de l'état général de patience des animaux pendant la tâche.

Intégration des résultats

Les résultats de la recherche suggèrent que les souris n'utilisaient pas seulement une règle de prise de décision simple pour quitter les patches, mais que leurs choix étaient influencés par une interaction plus complexe de facteurs, incluant la taille des récompenses et leur état motivationnel interne. Les modèles d'intégration qu'ils ont employés ont été capables d'expliquer les écarts par rapport au TVM et ont suggéré que, bien que les animaux aient des stratégies générales, celles-ci peuvent changer selon leur état actuel.

Cette idée est particulièrement importante. Cela indique que, plutôt que de simplement réagir à des indices externes, les souris (et potentiellement d'autres animaux) intègrent dynamiquement leurs expériences avec les récompenses et leurs niveaux de patience internes. Cela pourrait refléter un principe plus large applicable à de nombreuses espèces, y compris les humains, où la prise de décision et les facteurs motivationnels sont étroitement liés.

Conclusion

En résumé, cette étude a éclairé la manière dont les animaux prennent des décisions de recherche, montrant que les comportements sont influencés à la fois par des récompenses externes et des états internes. Les chercheurs ont fourni des preuves qu'un modèle simple de prise de décision pourrait ne pas saisir pleinement les complexités de ces processus. Au lieu de cela, les comportements peuvent varier en fonction des différences individuelles en motivation et de la manière dont ces différences influencent les stratégies de prise de décision dans le temps.

L'interaction entre comportement et activité cérébrale soutient l'idée d'une stratégie d'intégration continue pour la recherche. Cette compréhension peut aider à saisir comment les animaux adaptent leurs comportements dans des environnements changeants et pourrait offrir des perspectives applicables à la compréhension des processus de prise de décision humains également. D'autres recherches pourraient explorer comment ces dynamiques se manifestent à travers différentes espèces et contextes, enrichissant notre compréhension de l'écologie comportementale et des neurosciences.

Source originale

Titre: Competitive integration of time and reward explains value-sensitive foraging decisions and frontal cortex ramping dynamics

Résumé: Patch foraging presents a ubiquitous decision-making process in which animals decide when to abandon a resource patch of diminishing value to pursue an alternative. We developed a virtual foraging task in which mouse behavior varied systematically with patch value. Mouse behavior could be explained by a model integrating time and rewards antagonistically, scaled by a latent patience state. The model accounted for deviations from predictions of optimal foraging theory. Neural recordings throughout frontal areas revealed encoding of decision variables from the integrator model, most robustly in frontal cortex. Regression modeling followed by unsupervised clustering identified a subset of ramping neurons. These neurons firing rates ramped up gradually (up to tens of seconds), were inhibited by rewards, and were better described as a continuous ramp than a discrete stepping process. Together, these results identify integration via frontal cortex ramping dynamics as a candidate mechanism for solving patch foraging problems.

Auteurs: Naoshige Uchida, M. Bukwich, M. G. Campbell, D. Zoltowski, L. Kingsbury, M. S. Tomov, J. Stern, H. R. Kim, J. Drugowitsch, S. W. Linderman

Dernière mise à jour: 2024-09-14 00:00:00

Langue: English

Source URL: https://www.biorxiv.org/content/10.1101/2023.09.05.556267

Source PDF: https://www.biorxiv.org/content/10.1101/2023.09.05.556267.full.pdf

Licence: https://creativecommons.org/licenses/by-nc/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires