Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Biología# Neurociencia

Cómo el cerebro aprende del feedback de recompensa

Este estudio analiza la actividad cerebral durante tareas de aprendizaje basadas en recompensas.

― 8 minilectura


Actividad cerebral en elActividad cerebral en elaprendizaje derecompensasadapta durante tareas de aprendizaje.Un estudio revela cómo el cerebro se
Tabla de contenidos

En nuestras actividades diarias, a menudo ajustamos nuestras acciones para cumplir con las demandas de diferentes situaciones. La capacidad de hacer esto depende de qué tan bien nuestro cerebro aprende de nuestras acciones y la retroalimentación que recibimos. Cuando realizamos tareas, el cerebro debe procesar información sobre si nuestras acciones llevan al éxito o al fracaso. Esta retroalimentación nos ayuda a cambiar nuestro comportamiento en consecuencia. Sin embargo, esto puede ser complicado porque muchas tareas solo proporcionan una medida de éxito, así que el cerebro tiene que aprender a ajustarse en base a esa información.

Muchas áreas de nuestro cerebro trabajan juntas para ayudarnos a evaluar si nuestras acciones coinciden con nuestras expectativas. Esto incluye regiones responsables de procesar información sensorial y aquellas que controlan nuestros movimientos. Un conjunto específico de áreas del cerebro, llamado corteza prefrontal medial y estriado, juega un papel importante al verificar si nuestras acciones se alinean con lo que anticipamos. Cuando hay una discrepancia entre lo que esperábamos y lo que realmente sucedió, se crea un "error de predicción". Esta información sirve como una señal para modificar nuestro comportamiento futuro. Sin embargo, cómo se comparte esta información en varias partes del cerebro aún no está completamente claro.

El rol de los sistemas cerebrales en el comportamiento

Los investigadores han identificado diferentes sistemas neuronales relacionados con varios aspectos del comportamiento. Por ejemplo, la corteza sensorial nos ayuda a entender nuestro entorno, mientras que la corteza motora es responsable de ejecutar movimientos. Las regiones de nivel superior en el cerebro, como las involucradas en la atención y la toma de decisiones, también juegan papeles críticos en guiar nuestras acciones.

Durante el aprendizaje, cómo estos sistemas cerebrales trabajan juntos no está claro. Estudios recientes sugieren que una red llamada red de modo por defecto (DMN) podría ayudar a coordinar estas actividades. Inicialmente se pensaba que estaba menos activa durante tareas desafiantes, pero ahora se reconoce su papel en la toma de decisiones y tareas de memoria. Esta red podría supervisar las actividades en diferentes áreas del cerebro, ayudándonos a cambiar entre diferentes modos de comportamiento, como explorar nuevas opciones o explotar las que ya conocemos.

La importancia de la red de modo por defecto

La DMN se ha asociado tradicionalmente con el pensamiento introspectivo, como recordar memorias. Sin embargo, se ha demostrado que se activa durante tareas que requieren toma de decisiones y memoria de trabajo. Los investigadores creen que la posición única de la DMN en el cerebro le permite conectar varias funciones cerebrales, lo cual es clave para coordinar el comportamiento.

Algunos estudios indican que diferentes áreas de la DMN ayudan a gestionar diferentes tipos de comportamientos a lo largo del tiempo. Por ejemplo, algunas regiones de la DMN parecen ayudar a alternar entre recopilar información y usar esa información durante tareas que implican Recompensas. Esto podría explicar por qué la DMN es vital para el rendimiento, especialmente cuando necesitamos basarnos en conocimientos adquiridos de experiencias anteriores en lugar de en retroalimentación sensorial inmediata.

Tarea y metodología

En nuestro estudio, queríamos examinar cómo cambia la actividad cerebral durante el aprendizaje que involucra recompensas. Diseñamos una tarea motora donde los participantes tenían que aprender a trazar un camino de movimiento específico sin retroalimentación visual de la posición de su dedo. Los participantes recibieron retroalimentación de puntajes basada en qué tan precisamente trazaron un camino oculto, lo que nos permitió estudiar los procesos de aprendizaje únicamente a través de retroalimentación basada en recompensas.

Cada participante primero realizó una tarea base sin retroalimentación. Después, participaron en una tarea de aprendizaje, donde trazaron un camino curvado y recibieron puntajes basados en su desempeño. Este planteamiento ofreció una oportunidad única para entender cómo se producen los cambios en la actividad cerebral relacionados con el aprendizaje.

Los participantes usaron un panel táctil para trazar un camino mostrado en una pantalla. Al principio, no recibieron ninguna retroalimentación, lo que nos permitió establecer un rendimiento base. Después, durante la fase de aprendizaje, recibieron puntajes basados en su precisión al trazar el camino, aunque las recompensas reales se basaron en una forma oculta.

Análisis de la actividad cerebral

Para analizar la actividad cerebral durante la tarea, dividimos el estudio en tres períodos principales: base, aprendizaje temprano y aprendizaje tardío. Evaluamos cómo cambiaron las conexiones cerebrales durante cada fase, enfocándonos en las interacciones entre diferentes regiones del cerebro.

Utilizamos técnicas avanzadas para comparar los patrones de actividad cerebral en estas fases. Al medir cómo diferentes regiones del cerebro interactuaban entre sí, pudimos observar cómo la comunicación dentro y entre estas regiones cambiaba con el tiempo.

Resultados: Fase de aprendizaje temprano

Durante la fase de aprendizaje temprano, cuando los participantes estaban descubriendo cómo sus movimientos afectaban sus puntajes, observamos que ciertas regiones del cerebro se hacían más distintas entre sí. Esto fue especialmente cierto para áreas asociadas con movimiento y atención. La DMN también mostró cambios en sus patrones de actividad, indicando que estaba desempeñando un papel significativo en el procesamiento de la retroalimentación de recompensa.

El aumento en la conectividad dentro de la DMN y la red asociada al Control Motor destacó cómo estos sistemas empezaron a trabajar más cercanamente juntos. Curiosamente, algunas áreas de la DMN mostraron una disminución en su conexión con regiones circundantes, sugiriendo un enfoque en procesar la información de recompensa en lugar de integrarla con otras redes.

Resultados: Fase de aprendizaje tardío

A medida que los participantes avanzaban a la fase de aprendizaje tardío, los patrones que observamos durante el aprendizaje temprano comenzaron a cambiar. Las áreas dentro de la DMN y las redes motoras mostraron una separación reducida entre sí, indicando una mayor integración. Esto sugiere que una vez que los participantes aprendieron a conectar sus acciones con las recompensas, sus cerebros comenzaron a coordinarse de manera más fluida entre diferentes redes.

Los cambios durante el aprendizaje tardío también sugirieron que las áreas específicas responsables de manejar la retroalimentación sensorial cambiaron. Las conexiones previamente establecidas con la red de atención se hicieron más fuertes, reflejando casi un regreso a una función cerebral más unificada que integraba experiencias pasadas para guiar comportamientos actuales.

Diferencias individuales en el aprendizaje

Un aspecto interesante de nuestro estudio fue cómo las diferencias individuales en las habilidades de aprendizaje afectaron la actividad cerebral. Mientras que el grupo en general mostró mejoras a lo largo de la tarea, algunos participantes aprendieron más rápido que otros. Queríamos entender cómo estas diferencias se relacionaban con los cambios que observamos en la actividad cerebral.

Para cuantificar qué tan bien aprendió cada participante, calculamos un puntaje de aprendizaje basado en su desempeño a lo largo de la tarea. Luego examinamos la relación entre estos puntajes y los cambios en la Conectividad cerebral. Aunque las diferencias individuales eran evidentes, establecer una correlación clara resultó complicado.

Sin embargo, notamos un patrón consistente en áreas específicas del cerebro. A medida que los participantes que aprendieron eficientemente mostraron ciertos cambios en su conectividad cerebral, aquellos que tuvieron dificultades para aprender exhibieron patrones diferentes. Esto refuerza la idea de que entender la variabilidad individual es crucial para interpretar la actividad cerebral en contextos de aprendizaje.

Conclusión

En general, nuestros hallazgos arrojan luz sobre cómo funciona el cerebro durante tareas de aprendizaje basadas en recompensas. El estudio destacó cambios significativos dentro y entre varias redes neuronales a medida que los participantes progresaban. Durante el aprendizaje inicial, áreas distintas se separaron más; sin embargo, a medida que el aprendizaje avanzó, hubo un cambio hacia una mayor integración.

Estos resultados sugieren que la capacidad del cerebro para adaptar su funcionalidad es esencial para el aprendizaje. Además, las diferencias individuales en el comportamiento de aprendizaje están ligadas a estos cambios neuronales, enfatizando la importancia de entender cómo diferentes personas aprenden usando diferentes vías neuronales.

A través de nuestro estudio, contribuimos a una comprensión más profunda del proceso dinámico del aprendizaje motor, revelando cómo evoluciona la actividad cerebral durante esta experiencia. Investigaciones futuras pueden construir sobre estos hallazgos para explorar aspectos más matizados del aprendizaje y los patrones únicos de actividad cerebral que lo apoyan.

Fuente original

Título: Reconfigurations of cortical manifold structure during reward-based motor learning

Resumen: Adaptive motor behavior depends on the coordinated activity of multiple neural systems distributed across the brain. While the role of sensorimotor cortex in motor learning has been well-established, how higher-order brain systems interact with sensorimotor cortex to guide learning is less well understood. Using functional MRI, we examined human brain activity during a reward-based motor task where subjects learned to shape their hand trajectories through reinforcement feedback. We projected patterns of cortical and striatal functional connectivity onto a low-dimensional manifold space and examined how regions expanded and contracted along the manifold during learning. During early learning, we found that several sensorimotor areas in the Dorsal Attention Network exhibited increased covariance with areas of the salience/ventral attention network and reduced covariance with areas of the default mode network (DMN). During late learning, these effects reversed, with sensorimotor areas now exhibiting increased covariance with DMN areas. However, areas in posteromedial cortex showed the opposite pattern across learning phases, with its connectivity suggesting a role in coordinating activity across different networks over time. Our results establish the neural changes that support reward-based motor learning and identify distinct transitions in the functional coupling of sensorimotor to transmodal cortex when adapting behavior.

Autores: Jason Gallivan, Q. Nick, D. J. Gale, C. Areshenkoff, A. J. De Brouwer, J. Y. Nashed, J. Wammes, T. Zhu, J. R. Flanagan, J. Smallwood

Última actualización: 2024-02-08 00:00:00

Idioma: English

Fuente URL: https://www.biorxiv.org/content/10.1101/2023.07.05.547880

Fuente PDF: https://www.biorxiv.org/content/10.1101/2023.07.05.547880.full.pdf

Licencia: https://creativecommons.org/licenses/by-nc/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares