変わる世界に合わせて学習速度を調整する
研究が、新しい情報に基づいて学習速度をどう調整するかを明らかにしたよ。
― 0 分で読む
人間は常に変わり続ける環境の中で生きてるんだよね。新しいことが起きると、私たちの知識もアップデートする必要がある。例えば、普段通ってる道で工事が始まったら、そこに行くのにどれくらい時間がかかるかを考え直さなきゃいけない。こうやって、周りで起こっていることに適応していくのが、進行中の学びなんだ。
学ぶことはそんなに簡単じゃないこともあるし、環境が予測不可能だから余計に難しかったりする。公共交通機関の例を挙げると、ある日にはどうしようもない遅れで通勤時間が長くなったり、別の日には道路閉鎖みたいな特定のイベントが原因で遅れることもある。遅れが起こると、期待してた移動時間を変えた方がいいのかどうか不安になるよね。その遅れが単なるランダムな変動なのか、それとも長期間考え方を変えなきゃいけないサインなのかを判断しなきゃならない。私たちは目にする情報にどれくらい重みを置くべきかを考えなきゃいけない。
期待をどれだけ調整するかを測る方法の一つが「学習率」と呼ばれるもの。学習率は、新しい情報に基づいて以前の予測をどれだけ変えたかを理解するのに役立つんだ。新しいことに気づいたときに、どれくらい早く信念をアップデートできるかを示してる。
学びにはいくつかのレベルがある。最初のレベルはかなり基本的で、実際の情報からどれだけ予測が外れていたかによって調整をする感じ。このシンプルなモデルは心理学や神経科学などいろんな分野で使われてきたけど、実際の世界はもっと複雑なんだ。もっと進んだ学びは、周りの状況に基づいて学び方を変えることが含まれてる。こういう進んだ学びには二つの重要なレベルがある。
一つ目の進んだレベルは、一連の出来事を通じて全体的な学習率を調整すること。例えば、交通システムに多くの変化があった場合、新しい情報に早く反応するために学習率を調整することがあるよ。変化がたくさんあれば、期待をすぐに更新するために高い学習率を使うんだ。研究によると、変化がある環境の方が安定している環境よりも早く学ぶ傾向があるんだって。
二つ目の進んだレベルは、ケースバイケースでその調整を行うこと。つまり、各々の観察に基づいて学習率を変えるってこと。例えば、急な交通渋滞みたいな異常事態に気づいたら、その瞬間だけ学習率を上げてすぐに反応するかもしれない。こういう動的な調整が起こることは分かってるけど、全ての種類の学びに対してどのように機能するかは完全には理解できていない。
過去の研究では、人々が数字や位置といった異なる種類の情報をどのように学ぶかを調べてきたけど、確率学習についてはあまり深く調べられていないんだ。これは、交通渋滞や他の遅延が起こる確率を理解して、それに基づいて期待する通勤時間を調整することを含むかもしれない。
確率については多くの研究があったけど、学習率がダイナミックに調整されるかどうかは不明なんだ。多くの以前の研究は選択行動に依存していて、研究者は多くの選択に対する平均的な学習率を推定することしかできなかったから、一つの観察から次への学びがどう起こるかを見つけるのが難しかった。
確率を学ぶことと他の情報を学ぶことを考えると、明確な違いがある。確率に関する一つの情報は、位置などの物理量に関する一つの観察よりも信頼できるデータをあまり提供しないんだ。だから、学習率は受け取る情報の量に影響されるべきだと思う。もし有用なデータがたくさんあれば、学習率をもっと更新できるはず。でも、情報があまり有益でなければ、本当に反応すべき変化があるかどうか分かりにくくなる。
確率について人々がどう学ぶかを調べるために、私たちは研究を行った。主な質問は、確率を学ぶときに人々は学習率を調整するのか? また、その調整に影響を与える要因は何か?ってことだった。
研究では、参加者は二つのタスクに取り組んだ。一つは大きさ(位置みたいなやつ)を学ぶこと、もう一つは確率を学ぶこと。私たちは参加者が各観察の後に予測を報告することで学習率を測る新しい方法を作ったんだ。
私たちは学習率の変化に影響を与える要因を特定することに焦点を当てた。私たちのアプローチは、学習問題を数学的に解決するベストな方法を調べ、これを参加者でテストすることだった。私たちは参加者が特定の方法を使って学ぶとは仮定せず、彼らの学びの特徴を識別したいと考えていた。
研究を通じて、学習率に影響を与える二つの主な要因を特定した。これらの要因は、二つの学習タスクで異なる役割を果たしていることが分かった。
学習率を測るために、参加者には各タスクについての観察をする際に、自分の予測を報告するように頼んだ。参加者はスライダーを動かして自分の予測を示すことで、リアルタイムで予測を更新した。これにより、彼らの学習率を各観察に対して簡単に計算できるようになった。
両方のタスクで、参加者は提示された刺激に基づいて隠れた量を推定することを目指していた。タスクの途中で、隠れた量は予測できないタイミングで変化していた。大きさ学習タスクでは、参加者は画面上のポイントの平均位置を推定し、確率タスクでは、特定の色が現れる確率を推定していた。
参加者は両方のタスクで高い精度の予測を示した。彼らは理想的または標準的な予測に近い精度のある予測を出すことができた。
次に、参加者が変化点を経験した後、学習率をどのように調整したのかを見てみた。理想的な学習者は、変化点の後に学習率を上げてすぐに予測を更新し、再びそれを下げて安定させるはずだ。
大きさ学習タスクでは、参加者は変化点の直後に迅速に学習率を上げた。一方、確率学習タスクでは、増加はより滑らかで、長く続いた。確率学習の難しさにもかかわらず、参加者は効果的に学習率を調整した。彼らが示したパターンは、私たちが理想的な行動として特定したものに非常によく一致していた。
今度は、学習率の調整を引き起こした原因が何なのか知りたかった。予測を行うプロセスや、参加者が以前の予測についてどれほど不確かだったかを調べた。学習率に影響を与える二つの重要な要因を発見した:事前の不確実性と変化点の確率。
事前の不確実性は、参加者が新しい観察を見る前にどれほど以前の予測について不確かだったかに関するもの。もし参加者が不確かだと感じたら、新しい情報に基づいて推測を更新しやすくなる。一方、変化点の確率は、参加者が新しい観察の直前に変化点が発生したとどれくらい信じていたかに関係している。変化点の確率が高いと感じると、学習率を調整する可能性が高くなる。
これら二つの要因が、二つのタスクで学習率にどのように異なる影響を与えるかを調べた。大きさ学習タスクでは、変化点の確率がより大きな影響を与え、確率学習タスクでは、事前の不確実性がより大きな役割を果たした。これらの要因の変動の異なるレベルが、異なる影響を及ぼす理由を説明しているんだ。
さらに、これら二つの要因は一緒に働いて、参加者が学習率を調整する方法を形作っていた。私たちが要因と行動の関係を見たとき、参加者の学習率が予想通りに影響を受けていることが確認できた。これは、人々が受け取った情報に基づいて自然に学びを調整していることを示している。
参加者が一般的に予測通りに行動したことが分かったけど、彼らの行動がどれほど一貫性があるのかも知りたかった。私たちは、彼らの平均的な予測が標準的な予測と体系的に異なるかどうかを測った。参加者の予測の全体的な精度と変動性を理想的な反応と関連付けて調べたんだ。
参加者がさまざまな観察を通じて平均的な予測を比較してみると、彼らの予測の大部分の変動は、体系的なバイアスよりもランダムな変動から来ていることが分かった。これは、変動があっても、学習において重要な予測可能な誤りがなかったことを示しているんだ。
一つの重要な点は、参加者がリアルタイムで積極的に予測を更新していたこと。私たちの研究では、彼らが頻繁に更新する意欲を示していて、これは以前の研究が参加者がたまにしか更新しないと示していたこととは対照的だった。これらの違いは、タスクの設計や更新にかかる労力の違いから来ている可能性が高いね。
私たちの研究の結果にはいくつかの重要な意味がある。まず、動的な適応学習が確率と大きさのタスクの両方で起こることを示している。この種の学習は、私たちの環境の変化に迅速に対応するために重要なんだ。
こういった学びのプロセスを理解することで、関与する神経メカニズムについての洞察が得られるかもしれない。神経科学の今後の研究は、私たちの研究に基づいて、動的な学習中に脳で何が起こるかを特定するために同様の方法を適用するかもしれない。
さらに、私たちの研究は実験室を超えた重要性も持っている。私たちが観察した動的な適応学習は、機械学習や人工知能システムの改善に役立つかもしれない。私たちが人間の学びに重要だと見なした要因を考慮することで、開発者はより反応が良くて効率的なアルゴリズムを作る可能性がある。
要するに、人々は新しい情報に基づいて学習率を調整するのが得意なんだ。彼らは確率や大きさに基づいて学ぶ方法を動的に変えることができる。これらの調整に影響を与える要因を特定することによって、私たちは人間の学びをよりよく理解することができるし、教育やテクノロジーなど他の分野で学びを向上させる方法を見つけられるかもしれない。
タイトル: Two determinants of dynamic adaptive learning for magnitudes and probabilities
概要: Humans face a dynamic world that requires them to constantly update their knowledge. Each observation should influence their knowledge to a varying degree depending on whether it arises from a stochastic fluctuation or an environmental change. Thus, humans should dynamically adapt their learning rate based on each observation. Although crucial for characterizing the learning process, these dynamic adjustments have only been investigated empirically in magnitude learning. Another important type of learning is probability learning. The latter differs from the former in that individual observations are much less informative and a single one is insufficient to distinguish environmental changes from stochasticity. Do humans dynamically adapt their learning rate for probabilities? What determinants drive their dynamic adjustments in magnitude and probability learning? To answer these questions, we measured the subjects learning rate dynamics directly through real-time continuous reports during magnitude and probability learning. We found that subjects dynamically adapt their learning rate in both types of learning. After a change point, they increase their learning rate suddenly for magnitudes and prolongedly for probabilities. Their dynamics are driven differentially by two determinants: change-point probability, the main determinant for magnitudes, and prior uncertainty, the main determinant for probabilities. These results are fully in line with normative theory, both qualitatively and quantitatively. Overall, our findings demonstrate a remarkable human ability for dynamic adaptive learning under uncertainty, and guide studies of the neural mechanisms of learning, highlighting different determinants for magnitudes and probabilities. Significance statementIn a dynamic world, we must constantly update our knowledge based on the observations we make. However, how much should we update our knowledge after each observation? Here, we have demonstrated two principles in humans that govern their updating and by which they are capable of dynamic adaptive learning. The first principle is that when they observe a highly surprising event indicating a likely change in the environment, humans reset their knowledge and perform one-shot learning. The second principle is that when their knowledge is more uncertain, humans update it more quickly. We further found that these two principles are differentially called upon in two key learning contexts that could be associated with different brain mechanisms: magnitude learning (which primarily requires adaptation to surprise, under the first principle) and probability learning (which primarily requires adaptation to uncertainty, under the second principle). Our findings advance understanding of the mechanisms of human learning, with implications for the brain and the development of adaptive machines.
著者: Cedric Foucault, F. Meyniel
最終更新: 2024-04-01 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2023.08.18.553813
ソースPDF: https://www.biorxiv.org/content/10.1101/2023.08.18.553813.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。
参照リンク
- https://github.com/cedricfoucault/ada-learn
- https://www.w3.org/TR/css-values-3/#reference-pixel
- https://run.pavlovia.org/cedricfoucault/ada-learn-task/ada-pos-study.html?skipConsent
- https://run.pavlovia.org/cedricfoucault/ada-learn-task/ada-prob-study.html?skipConsent
- https://run.pavlovia.org/cedricfoucault/ada-learn-task/ada-pos-prob-study.html
- https://run.pavlovia.org/cedricfoucault/ada-learn-task/ada-prob-pos-study.html
- https://github.com/florentmeyniel/TransitionProbModel