Como os Ratos Fazem Escolhas: Recompensa e Repetição
Estudo revela como ações passadas influenciam decisões futuras em camundongos.
― 6 min ler
Índice
Aprender é uma parte importante de como os animais, inclusive os humanos, se adaptam ao ambiente. Os cientistas estudam como diferentes ações, recompensas e experiências passadas moldam o comportamento futuro. Duas ideias principais nesse campo são a "lei do efeito" e a "lei do exercício." A lei do efeito diz que ações seguidas de recompensas são mais prováveis de serem repetidas, enquanto a lei do exercício sugere que simplesmente realizar uma ação aumenta a chance dela acontecer de novo, mesmo que não seja recompensada.
A Lei do Efeito
A lei do efeito é um conceito crucial na psicologia e neurociência. Essa teoria gerou vários estudos e modelos que ajudam a entender como recompensas passadas impactam nossas escolhas. Os pesquisadores costumam usar modelos computacionais inspirados pelo aprendizado por reforço, que examina como as recompensas influenciam os processos de tomada de decisão. Estudos mostraram que áreas do cérebro envolvidas no aprendizado baseado em recompensas, principalmente no córtex frontal, têm papéis importantes em guiar nossas escolhas.
A Lei do Exercício
Embora a lei do exercício seja menos conhecida, ela descreve uma dimensão diferente do comportamento. Ela prevê que os animais continuarão repetindo ações mesmo sem receber recompensas. Esse comportamento, conhecido como "perseveração," pode ser observado em várias espécies e tarefas. Alguns pesquisadores desenvolveram modelos computacionais para analisar e prever esse tipo de comportamento.
Os benefícios da perseveração podem não ser totalmente claros, mas uma ideia é que repetir ações poderia simplificar processos cognitivos ou facilitar a execução física. Estudos mostraram que ações familiares são frequentemente realizadas de maneira mais rápida e confiável. Além disso, quando o tempo é limitado, os animais tendem a manter as escolhas anteriores.
Explorando os Mecanismos Neurais da Perseveração
Apesar do interesse na perseveração, ainda há muito a aprender sobre as regiões do cérebro responsáveis por esse comportamento. Questões chave incluem identificar áreas específicas do cérebro relacionadas a ações perseverativas e se essas áreas operam separadamente das envolvidas na tomada de decisões baseadas em recompensas.
Para investigar essas questões, os pesquisadores projetaram um experimento usando uma tarefa de aprendizado de recompensa dinâmica com camundongos. Nessa tarefa, as escolhas eram influenciadas principalmente por escolhas passadas, em vez de recompensas passadas. Esse comportamento mostrou fortes correlações com modelos de perseveração, indicando que o córtex motor secundário teve um papel significativo em guiar essas escolhas.
A Configuração do Experimento
No experimento, os camundongos foram colocados em um ambiente onde realizavam uma tarefa para receber recompensas líquidas com base em suas escolhas. O comportamento deles foi registrado enquanto giravam uma roda para indicar sua escolha. Em cada tentativa, uma direção para girar levava a uma probabilidade maior de receber uma recompensa, enquanto a outra direção tinha uma probabilidade menor. A escolha correta era consistente por várias tentativas antes de mudar aleatoriamente.
Os camundongos frequentemente mostravam um comportamento subótimo em comparação a um modelo ideal de observador que previa escolhas apenas com base nas probabilidades de recompensa. Após mudar a escolha correta, os camundongos tendiam a continuar escolhendo a opção anteriormente correta por muito mais tempo do que o modelo ideal faria.
Analisando Desempenho e Comportamento
Para analisar a interação entre busca de recompensas e perseveração, os pesquisadores usaram modelos de regressão de histórico de tentativas para prever escolhas com base em ações e recompensas passadas. O modelo destacou a influência maior da perseveração em relação à busca por recompensas. Essa descoberta mostrou que os camundongos eram fortemente influenciados por suas escolhas passadas.
Os pesquisadores também descobriram que escolhas repetidas resultavam em tempos de resposta mais rápidos. Por exemplo, tentativas onde os camundongos repetiram a mesma ação tiveram tempos de resposta mais curtos em comparação com tentativas onde mudaram de escolha. Esse padrão indicou que a perseveração contribuía para decisões mais rápidas.
Compreendendo a Atividade Neuronal
Para entender os mecanismos neurais subjacentes, os pesquisadores registraram a atividade de neurônios em várias regiões do cérebro enquanto os camundongos realizavam a tarefa. Eles descobriram que os neurônios no córtex motor secundário estavam especialmente ativos durante o período de fixação antes que os camundongos fizessem suas escolhas. Essa atividade estava associada à previsão da escolha futura.
Além disso, o estudo mostrou que o córtex motor secundário foi a única área onde a atividade neural durante o período de fixação poderia prever de forma confiável a escolha futura. Outras regiões do cérebro não mostraram essa correlação significativa, ressaltando o papel único do córtex motor secundário na previsão de escolhas.
Efeitos Causais da Atividade Neural
Para investigar mais a fundo o papel do córtex motor secundário, os pesquisadores aplicaram técnicas optogenéticas para inibir essa área durante tentativas específicas. Desativar essa região durante o período de escolha diminuiu tanto a precisão das escolhas dos camundongos quanto a tendência deles de repetir escolhas anteriores. No entanto, inibir o Córtex pré-frontal medial não teve os mesmos efeitos, sugerindo que o córtex motor secundário é essencial para guiar o comportamento perseverativo.
Curiosamente, quando o córtex motor secundário foi desativado, os camundongos levaram mais tempo para responder durante as tentativas. Embora ainda fizessem escolhas, o tempo que levavam para chegar a uma decisão aumentou. Esse atraso sugeriu que o córtex motor secundário desempenhou um papel crucial não apenas em guiar escolhas, mas também em permitir a execução rápida dessas escolhas.
O Papel do Aprendizado por Recompensa
Em contraste com o córtex motor secundário, o córtex pré-frontal medial parecia estar envolvido no aprendizado por recompensa. Desativar essa área durante o período de resultado desacelerou a taxa de aprendizado relacionada às mudanças de bloco na tarefa. Essa descoberta indicou uma função distinta entre as duas regiões do cérebro: o córtex motor secundário principalmente guiava escolhas perseverativas, enquanto o córtex pré-frontal medial gerenciava o aprendizado baseado em recompensas.
Conclusão
No geral, essa pesquisa lança luz sobre as complexidades do aprendizado e da tomada de decisão. O córtex motor secundário surge como um jogador chave em reforçar o comportamento perseverativo, permitindo respostas mais rápidas e influenciando escolhas futuras com base em ações passadas. Por outro lado, o papel do córtex pré-frontal medial em entender recompensas destaca a importância de diferentes regiões do cérebro em aspectos únicos do aprendizado.
Para avançar nosso conhecimento ainda mais, vai ser essencial explorar regiões e mecanismos adicionais envolvidos nesses processos, especialmente como eles interagem para moldar o comportamento e a tomada de decisão nos animais.
Título: Dorsal prefrontal cortex drives perseverative behavior in mice
Resumo: Perseveration - repeating one choice when others would generate larger rewards - is a common behavior, but neither its purpose nor neuronal mechanisms are understood. Here we demonstrate a neural correlate and causal role of dorsal prefrontal cortex (area MOs) in perseveration in mice performing a dynamic reward learning task. An auditory go cue signaled mice to turn a wheel either left or right, with the reward probability of each action switching in blocks. Mice perseverated, gaining suboptimal reward, but were faster when making repeated choices. Neuropixels recordings found neurons whose activity correlated with perseveration and predicted rapid reaction times, almost exclusively in MOs. Optogenetically inhibiting MOs reduced perseveration and slowed reaction times. In contrast, inactivating medial prefrontal cortex at choice time did not have any effect but impaired learning if delivered after reward delivery. In this task, therefore, MOs encodes a perseverative decision variable, and is necessary for mediating the effect of this decision variable on choice and reaction time.
Autores: Kenneth D Harris, A. Lebedeva, Y. Wang, L. Funnell, B. Terry, J. Oh, K. Miller
Última atualização: 2024-05-04 00:00:00
Idioma: English
Fonte URL: https://www.biorxiv.org/content/10.1101/2024.05.02.592241
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.05.02.592241.full.pdf
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.