報酬フィードバックから脳がどのように学ぶか
この研究は、報酬に基づく学習タスク中の脳の活動を調べてるよ。
― 1 分で読む
日常生活の中で、いろんな状況に合わせて行動を調整することがあるよね。これができるかどうかは、脳が自分の行動やもらうフィードバックからどれだけ学べるかにかかってる。タスクを実行する時、脳は自分の行動が成功したか失敗したかの情報を処理する必要があるんだ。このフィードバックがあれば、行動を変える助けになるんだけど、成功の測り方が一つだけだったりするから、脳がその情報に基づいて調整するのが難しいこともある。
脳のいろんなエリアが一緒に働いて、自分の行動が期待に合ってるかどうかを評価する手助けをしてるよ。これには、感覚情報を処理する部分や動きを制御する部分が含まれる。特に内側前頭前皮質と線状体という脳のエリアが、行動が予想と一致してるかをチェックするのに重要なんだ。期待と実際に起こったことの間にズレがあると、「予測エラー」が生じる。この情報は、今後の行動を変える信号になるんだけど、この情報が脳のいろんな部分でどのように共有されるかは、まだ完全にはわからないんだ。
行動における脳システムの役割
研究者たちは行動のいろんな側面にリンクした神経システムを特定してる。たとえば、感覚皮質は環境を理解する手助けをし、運動皮質は動きを実行する役割を担ってる。注意や意思決定に関与する高次の領域も、行動を導くのに重要な役割を果たしてるんだ。
学習中、これらの脳システムがどのように協力しているかは不明だよ。最近の研究では、デフォルトモードネットワーク(DMN)というネットワークがこれらの活動を調整する手助けをするかもしれないと示唆されてる。最初は、難しいタスクの時にはあまり活発でないと考えられてたけど、今では意思決定や記憶タスクでの役割が認識されてる。このネットワークは、探求する行動と既知のものを利用する行動を切り替えるのを助けてるかもしれない。
デフォルトモードネットワークの重要性
DMNは伝統的に内省的な思考、たとえば記憶を思い出すことと関連づけられてきた。でも、意思決定や作業記憶が必要なタスクを行うときにも活発になることが示されてるんだ。研究者たちは、DMNが脳内のさまざまな機能をつなげるユニークな位置を持ってるため、行動の調整に不可欠であると考えているよ。
いくつかの研究によると、DMNの異なるエリアが時間の経過とともに異なるタイプの行動を管理するのに役立っていることが示されている。たとえば、DMNの一部の地域は、情報を集める行動と、その情報を報酬を伴うタスクに使用する行動の切り替えを助けているように見える。これが、特に過去の経験から得た知識に依存する必要がある時に、DMNがパフォーマンスにとって重要である理由かもしれない。
タスクと方法論
私たちの研究では、報酬が関与する学習中に脳の活動がどのように変化するかを調べたいと思った。参加者が自分の指の位置の視覚的フィードバックなしで特定の動きのパスをトレースすることを学ぶ運動タスクをデザインしたんだ。参加者は隠されたパスをどれだけ正確にトレースできたかに基づいてスコアのフィードバックを受け取った。それによって、報酬ベースのフィードバックを通じて学習プロセスを研究できたんだ。
参加者は最初にフィードバックなしでベースラインタスクを行った。その後、学習タスクに取り組み、曲がったパスをトレースしてパフォーマンスに基づくスコアを受けた。この設定は、学習に関連する脳の活動の変化がどう展開するかを理解するユニークな機会を提供してくれた。
参加者はタッチパッドを使って画面に表示されたパスをトレースした。最初はフィードバックがなかったから、ベースラインパフォーマンスを確立することができた。その後、学習フェーズ中に、パスをトレースする正確さに基づいてスコアが与えられたけど、実際の報酬は隠された形状に基づいていた。
脳活動の分析
タスク中の脳活動を分析するために、私たちは研究を三つの主な期間(ベースライン、初期学習、後期学習)に分けた。それぞれのフェーズ中に脳の接続がどう変化したかを評価し、異なる脳領域間の相互作用に焦点を当てたんだ。
高度な技術を使って、これらのフェーズ間で脳の活動パターンを比較した。異なる脳の領域がどのように相互作用しているかを測定することで、時間の経過とともにこれらの領域内外のコミュニケーションがどのように変わるかを観察できたよ。
結果:初期学習フェーズ
参加者が自分の動きがスコアにどのように影響するかを理解し始めた初期学習フェーズでは、特定の脳領域が互いにより明確に区別されるようになった。この傾向は特に運動や注意に関連する領域で顕著だった。DMNも活動パターンに変化を示し、報酬フィードバックを処理する重要な役割を果たしていることが示されたんだ。
DMN内の接続性の増加と運動制御に関連するネットワークの高まりは、これらのシステムがより緊密に連携し始めたことを示している。興味深いことに、DMN内のいくつかのエリアは周囲の領域との接続が減少し、他のネットワークと統合するよりも報酬情報を処理することに集中していることを示唆していた。
結果:後期学習フェーズ
参加者が後期学習フェーズに進むにつれて、初期学習中に観察したパターンが変わり始めた。DMNと運動ネットワークの両方の領域が互いからの分離が減少し、統合が高まっていることが示唆された。これは、参加者が自分の行動と報酬をつなげる方法を学んだことで、脳が異なるネットワーク間でよりスムーズに調整を始めることを示している。
後期学習中の変化は、感覚フィードバックを処理する特定の領域の役割が変わったことも示唆している。かつて注意ネットワークとの接続が強くなり、過去の経験を現在の行動に結びつけるより統一された脳機能への戻りを反映しているみたい。
学習における個人差
研究の面白い点は、学習能力の個人差が脳活動にどう影響するかだった。全体のグループはタスクを通じて改善を見せたけど、速く学ぶ参加者もいれば、そうでない参加者もいた。私たちは、これらの違いが脳活動の変化にどう関連しているかを理解したかったんだ。
各参加者がどれだけ学習したかを定量化するために、タスクのパフォーマンスに基づいて学習スコアを計算した。それから、これらのスコアと脳の接続の変化の関係を調べた。個人差は明らかだったけど、明確な相関関係を確立するのは難しかった。
しかし、特定の脳領域において一貫したパターンを観察した。効率的に学習した参加者は特定の変化を示し、学ぶのに苦労した参加者は異なるパターンを示した。このことは、個人の変動を理解することが学習の文脈で脳活動を解釈するのに重要であるという考えを強調している。
結論
全体として、私たちの発見は報酬ベースの学習タスク中の脳の機能についての理解を深めるものだ。研究では、参加者が進むにつれてさまざまな神経ネットワークの内部と間の大きな変化が強調された。初期学習中は異なるエリアがより分離されていたけど、学習が進むにつれて統合が進んでいったんだ。
これらの結果は、脳がその機能を適応させる能力が学習にとって不可欠であることを示唆しているよ。さらに、学習行動の個人差はこれらの神経変化と関連しており、異なる人が異なる神経経路を使って学ぶことを理解することが重要だってことを強調している。
私たちの研究を通じて、運動学習の動的プロセスについての理解に貢献し、この経験中に脳活動がどう変化するかを明らかにすることができた。今後の研究は、これらの発見を基に、学習のより微妙な側面や、それを支える脳活動のユニークなパターンを探求できるかもしれない。
タイトル: Reconfigurations of cortical manifold structure during reward-based motor learning
概要: Adaptive motor behavior depends on the coordinated activity of multiple neural systems distributed across the brain. While the role of sensorimotor cortex in motor learning has been well-established, how higher-order brain systems interact with sensorimotor cortex to guide learning is less well understood. Using functional MRI, we examined human brain activity during a reward-based motor task where subjects learned to shape their hand trajectories through reinforcement feedback. We projected patterns of cortical and striatal functional connectivity onto a low-dimensional manifold space and examined how regions expanded and contracted along the manifold during learning. During early learning, we found that several sensorimotor areas in the Dorsal Attention Network exhibited increased covariance with areas of the salience/ventral attention network and reduced covariance with areas of the default mode network (DMN). During late learning, these effects reversed, with sensorimotor areas now exhibiting increased covariance with DMN areas. However, areas in posteromedial cortex showed the opposite pattern across learning phases, with its connectivity suggesting a role in coordinating activity across different networks over time. Our results establish the neural changes that support reward-based motor learning and identify distinct transitions in the functional coupling of sensorimotor to transmodal cortex when adapting behavior.
著者: Jason Gallivan, Q. Nick, D. J. Gale, C. Areshenkoff, A. J. De Brouwer, J. Y. Nashed, J. Wammes, T. Zhu, J. R. Flanagan, J. Smallwood
最終更新: 2024-02-08 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2023.07.05.547880
ソースPDF: https://www.biorxiv.org/content/10.1101/2023.07.05.547880.full.pdf
ライセンス: https://creativecommons.org/licenses/by-nc/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。