Simple Science

最先端の科学をわかりやすく解説

# 生物学# 神経科学

主観的価値: 選択が知覚をどう形作るか

個人や動物が意思決定を通じて報酬をどう評価するかを調査してる。

― 1 分で読む


選択の価値:もっと深く見て選択の価値:もっと深く見てみようどう影響するかを調べる。動物と人間の意思決定において主観的価値が
目次

物の美しさや価値は、人によって大きく異なることがあるんだ。この考え方は、アートや自然だけじゃなくて、個人が報酬をどう感じるかにも当てはまる。それぞれが自分の経験や感情に基づいて異なる価値を報酬に見出しているから、これらの認識は主観的で直接測れるものじゃないんだ。だから、違う選択肢に直面したときに人々がどんな行動をするかから推測しないといけない。

研究者たちは、人や動物がどうやって選択をするかを見て、報酬の価値を理解しようとしている。キーとなるアイデアは、いくつかの選択肢が与えられた時に、各選択肢がその瞬間の価値を個人的に評価させるってこと。一般的には、個人が最も価値があると見なす選択肢を選ぶだろうって前提があるんだ。その選択を何度も分析することで、科学者たちは人や動物が異なる報酬にどれだけ価値を置いているかを推定できるんだ。

研究の一大分野は、脳内の化学物質、特にドーパミンが、どうやってこれらの主観的な価値が形成されるかに関係しているかに焦点を当てている。この化学物質は、食べ物や飲み物を摂取した後の空腹感や満足感に応じて、濃度が変化することが示されている。選択が素早く行われる場合や、不確実な結果が伴う場合など、異なる状況でこの価値がどう認識されるかを定量化するために、いろんな数学的モデルが使われているんだ。

主観的価値の測定方法

主観的な価値が選択ごとにどう変わるかを発見するために、科学者たちは通常、試行ごとの評価を使ってきた。これには、個人が選択を行い、その決定がどれだけ自分の価値観を反映しているかを記録することが含まれる。多くの場合、統計的手法が使われて、時系列で行われた決定を分析し、決定のタイミングや以前の結果、期待される報酬などの要素が現在の選択にどんな影響を与えているかを見るんだ。

これまでの研究では、ドーパミンニューロンの反応が、報酬に対する人の価値観を示すことができるってことが分かってきた。例えば、サルがいくつかのジュースの量の中から選ぶとき、ドーパミンのレベルの変化がその選択に対するサルの評価を反映しているんだ。でも、従来の方法では、同じ報酬サイズの試行の間で主観的価値がどのように変わるかについての十分な探求がなされていなかったから、研究者たちはこれらの変動を捉えるより良い方法を探しているんだ。

最近出てきた効果的な方法の一つが、ベッカー・デグロート・マーシャーク(BDM)オークションのようなメカニズムだ。この設定では、参加者がコンピュータからランダムに選ばれた入札に対して報酬にいくら払う意志があるかを言うんだ。この方法は、オーバービッディングすると失うリスクがあり、アンダービッディングすると高くつくリスクがあるから、参加者が報酬に対する本当の価値を示すことを促すんだ。このアプローチは、人間や動物の主観的価値を評価するのに役立つことが証明されている。

入札行動と報酬の価値

サルを使った実験では、研究者たちはBDMタスクで十分なトレーニングを受けた後、動物たちが一貫した意味のある入札行動を示し始めたことを発見した。サルは、異なる画像を特定のジュースの量と関連付けるようにトレーニングされ、その過程でジュースのためにどれだけ水を捨てるつもりかを表現することを学んでいった。

プロセスは、サルがジュースの量を示す画像を見るところから始まる。その後、入札フェーズに入って、水をどれだけ払うつもりかをレバーで示すんだ。サルが入札を安定させると、コンピュータがランダムに競争入札を選ぶ。サルの入札が同じかそれ以上なら、ジュースと水の一部を勝ち取るけど、低ければ水だけをもらうことになる。

研究者たちは、サルの入札がしばしば正規分布していて、セッションや個々の入札間で大きく変わることを観察した。同じ報酬サイズの入札に対する変動の重要性は、時間に伴う主観的価値の変化によるものだということを示唆している。

ドーパミンニューロンの役割を探る

研究が進む中で、研究者たちは入札プロセス中のドーパミンニューロンの活動を詳しく調べた。これらのニューロンは、サルが行った異なる入札に対して特定のパターンを示した。多くのドーパミン細胞は入札に対して段階的な反応を示し、つまり入札が高ければ高いほどニューロンがより活発に働くことがわかった。実際の報酬の大きさに関わらずなんだ。

神経科学者たちは、これらのニューロンの反応を分析するためにさまざまな技術を利用して、サルの入札行動と関連付けた。彼らは、単一のドーパミンニューロンがサルの入札にどれだけ近い活性を示しているかによって分類できることを発見した。特に、報酬の量が同じでもパターンが一貫していたことは、ニューロンが実際のジュースの量ではなく、主観的価値を编码していることを示している。

発見と含意

実験の結果は、ドーパミン信号がサルの入札に基づいて変動する価値を反映していることを確認した。BDMメカニズムは、個々の主観的評価を一貫して明らかにするのに効果的だった。ドーパミンの反応は報酬によって予測可能な方法で変化していたけど、これらの変化の背後にある本当の力は、入札によって表現された主観的価値だったんだ。

さらに、研究はドーパミン反応が過去の活動に基づいて未来の入札を予測することもできることを示した。これは、ドーパミン信号を使って動物がどのように意思決定を行っているかをよりよく理解する可能性を示唆していて、これが人間にも適用できるかもしれないんだ。

結論

この研究は、主観的報酬の評価の複雑さを強調している。シンプルなオークションのようなタスクを使うことで、サルと彼らの脳内のメカニズムが、彼らの行動を通じて急速に変化する主観的価値を反映することができることを示した。この動物たちの行動を調べることで得られた洞察は、一般的な意思決定の理解に貢献するかもしれないし、経済学や行動科学など他の文脈での評価を理解するアプローチにも役立つかもしれない。

主観的価値のユニークさは、報酬に直面した時の私たちの解釈や行動が深く個人的で、さまざまな要素に影響されるってことなんだ。これらのプロセスが行動的かつ神経的なレベルでどう働くかを理解することができれば、特に報酬に基づく意思決定が重要な分野での新しい研究や実用的な応用に向けた新たな道が開かれるかもしれない。

オリジナルソース

タイトル: Dopamine neurons encode trial-by-trial subjective reward value in an auction-like task

概要: The dopamine reward prediction error signal is known to be subjective but has so far only been assessed in aggregate choices. However, personal choices fluctuate across trials and thus reflect the instantaneous subjective reward value. In the well-established Becker-DeGroot-Marschak (BDM) auction-like mechanism, participants are encouraged to place bids that accurately reveal their instantaneous subjective reward value; inaccurate bidding results in suboptimal reward ( incentive compatibility). In our experiment, male rhesus monkeys became experienced over several years to place accurate BDM bids for juice rewards without specific external constraints. Their bids for physically identical rewards varied trial by trial and increased overall for larger rewards. In these highly experienced animals, responses of midbrain dopamine neurons followed the trial-by-trial variations of bids despite constant, explicitly predicted reward amounts. Inversely, dopamine responses were similar with similar bids for different physical reward amounts. Support Vector Regression demonstrated accurate prediction of the animals bids by as few as twenty dopamine neurons. Thus, the phasic dopamine reward signal reflects instantaneous subjective reward value.

著者: Daniel F. Hill, R. W. Hickman, A. Al-Mohammad, A. Stasiak, W. Schultz

最終更新: 2024-05-10 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2023.01.20.524896

ソースPDF: https://www.biorxiv.org/content/10.1101/2023.01.20.524896.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

類似の記事