Simple Science

最先端の科学をわかりやすく解説

# 生物学 # 神経科学

制限ボルツマンマシンを使った跨教科学習の改善

新しいアルゴリズムが、個々の脳活動のマッピングを強化する。

Suya Wu, H. Yang, M. Angjelichinoski, J. Putney, S. Sponberg, V. Tarokh

― 1 分で読む


神経データマッピングの進展 神経データマッピングの進展 化する。 新しいRBMアプローチが脳の活動分析を強
目次

神経科学の学習アルゴリズムは、いろんな被験者にうまく機能する必要があるんだ。でも、異なる個人にわたって動作する信頼できるアルゴリズムを作るのは結構難しいんだよね。最大の課題の1つは、脳からの信号が、記録方法のちょっとした変化でもかなり変わること。だから、ある人のために作ったアルゴリズムが、別の人にはうまくいかないことが多いんだ。例えば、あるアルゴリズムが一人のデータを使って訓練された場合、別の人で試すと全然機能しないことがあるんだよね、たとえ両方の被験者が同じタスクをしていても。

こういう問題は、トレーニングデータとテストデータが異なるグループから来ている場合に機械学習でよく見られるんだ。転移学習っていう方法があって、特にこういう問題に対処するためのものなんだ。これらの方法は、脳波信号を使ってデバイスを制御する脳-コンピュータインターフェースみたいな神経科学の応用にとっても役立つと思う。

ここで提示された問題に関しては、いくつかの戦略が開発されてきたんだ。初期の研究では、一人のデータを別の人にマッピングすることに焦点を当ててた。生成モデルって呼ばれる別の方法もあって、これも既存のデータパターンに基づいて新しいデータを作るのに役立つ。ただ、これには新しいタスクや新しい個人ごとに別のモデルが必要になることが多いんだ。

こういう問題に対処するためのもっと適応性のある方法は、特定のタスクに依存しないものだね。既存のアプローチの中には、トレーニンググループとテストグループのデータ分布を整えることを目指しているものもある。こういう方法は、結果が信頼できるように特定の厳しい要件があるんだ。例えば、ある方法は特定の変換を通じてデータを整えられると仮定してて、データセットに明確なクラスタがあることが必要なんだ。

これらの整列方法はさまざまな状況で役立ってきたけど、複数の被験者が関与するより複雑なシナリオではうまくいかないこともあるんだ。個人間のつながりが単純じゃないことも多いし、高次元データを扱うときには計算が重くなることもある。

これらの方法はよく使われているけど、限界もあって新しい戦略の必要性を浮き彫りにしてるんだ。一つの有望なアプローチは深層学習技術で、非線形モデルを使ってこういう問題を解決することができるんだ。ただ、既存の多くの技術は各個人ごとに別のモデルが必要になって、被験者が増えると現実的じゃなくなっちゃう。

この文章では、神経科学におけるクロスサブジェクトマッピングを効率的に処理するために、制限ボルツマン機械(RBM)という特定のモデルを使った新しいアルゴリズムを紹介するよ。このモデルは、神経画像や脳活動の分析を含むさまざまなタスクで良い結果を示してるんだ。

クロスサブジェクト学習の目的

クロスサブジェクト学習の目標は、ある個人の脳活動パターンを他の人の特徴空間に正確に翻訳すること。特定の個人を使ってRBMを訓練した後は、どのターゲット被験者のデータでも、どのソース被験者の特徴空間にマッピングできるようにすることなんだ。この能力は、各被験者ごとに別個の訓練が必要な従来の方法とは対照的だね。

学習アルゴリズムとその課題

被験者間のマッピングを理解するためには、特徴ベクトルの関係を見る必要があるよ。各被験者の神経活動はベクトルで表現できて、これを正しくマッピングしないと運動意図を正確にデコードできないんだ。このタスクは、ある人の脳からの信号を他の人の脳に翻訳するための正しい関数を形成することになるんだ。

これを達成するためには、これらの特徴ベクトルを結ぶ条件付き確率分布を見ていくことができるよ。そうすることで、出所とターゲットの関係を探ることができるんだ。従来は生成モデルみたいな方法が使われてたけど、これらは通常、異なる個人間のノイズや複雑さに対処するのが難しいことが多いんだ。

RBMとその役割

RBMは、観察データ(神経信号みたいなの)を表す可視ユニットと、データ全体に共通する特徴を捉える隠れユニットからなる2層の機械学習モデルだよ。これらの層の間の接続によって、モデルは強い仮定をせずにデータの複雑なパターンを学ぶことができるんだ。

私たちの文脈でRBMを適用することで、一人の被験者の神経データの特徴を、別の被験者の特徴空間に変換できる枠組みを確立できるんだ。つまり、各個人用に別のモデルが必要ないんだ。

RBMの訓練

RBMの訓練は、モデルのパラメータを調整して、基礎的なデータ分布を正確に表現できるようにすることなんだ。従来の方法は、これを行うためにコントラストダイバージェンスに頼ることが多いけど、このアプローチは非効率で、一貫した結果を出さないこともあるんだ。

そこで、フィッシャーダイバージェンスを最小化する新しい方法を提案するよ。これにより、計算が簡単で効率的になるんだ。この方法は、勾配を計算してパラメータを更新するのを簡単にして、一般的な訓練プロセスを改善してるんだ。

実験のセットアップ

提案した方法の効果を評価するために、9匹のタカモスから集めたデータセットに焦点を当てるよ。これらの被験者は、さまざまな視覚刺激にさらされながら、運動機能が記録されたんだ。各モスは視覚的な手がかりに応じて特定の動きをするから、私たちの目標はこれらの神経データに基づいて運動反応をデコードすることなんだ。

収集したデータは、モスの飛行を制御する主要な筋肉からのスパイキング活動で構成されてるよ。各モスは6種類の視覚刺激でテストされ、その結果得られたスパイク列は、飛行中の神経活動に関する詳細な情報を提供してるんだ。

特徴抽出

データをマッピングする前に、生のスパイク列を使いやすい特徴表現に変換する必要があるんだ。これには、ガウスカーネルを使ってスパイクデータをスムーズにして、一様な表現を作ることが含まれるよ。その結果得られた特徴ベクトルは、PCAみたいな次元削減技術にかけられて、解釈や分析がしやすくなるんだ。

これらの表現が得られたら、次に私たちのクロスサブジェクト学習タスクに取り組むことができるんだ。

クロスサブジェクトマッピングのための方法論

ターゲットの特徴をソースの特徴に効果的にマッピングするために、訓練済みのRBMを使って表現を推測するんだ。このプロセスは、ターゲット特徴に基づいてモデルを初期化して、その後RBMを使用してサンプリングプロセスを通じてソース表現を生成することを含むよ。

サンプリング段階では、モデルを繰り返し実行して出力を洗練させ、最終的にターゲットデータをソースの特徴空間に合わせるための最終的な表現を生成するんだ。

評価シナリオ

私たちの方法の性能を評価するために、2つの主要なシナリオでテストするよ。一つは、単一の被験者のデータをソースとして提示して、すべての他の被験者をその上にマッピングしようとするもの。もう一つは、一つの被験者をターゲットとし、他のすべてがソースとして機能するものだ。

両方のシナリオで、私たちのモデルの性能を、特定の被験者のデータのみに基づいてモデルを訓練する被験者特異的神経デコーディングのような既存の方法と比較するよ。しかし、これは異なる個人や条件でうまくいかないことが多いんだ。

結果

結果は、私たちの方法が従来の整列技術を含む既存の戦略を大幅に上回っていることを示しているよ。ターゲットの特徴を適切なソースの特徴空間にマッピングすることで、視覚的な刺激に関連する行動状態のデコードで高い精度を達成してるんだ。

また、フィッシャーダイバージェンス訓練アプローチを使うことで、従来の方法に比べてより良い結果が得られることを示していて、私たちの提案したフレームワークの利点を強調しているよ。

結論

このRBMを使ったクロスサブジェクトマッピングの新しいフレームワークは、神経科学において有望な結果を示しているんだ。さまざまな被験者の神経データを効率的に適応させて一貫した表現を作る能力は、脳-コンピュータインターフェースや他の応用での改善された介入やツールの道を切り拓く可能性があるんだよ。

今後の研究

今後の研究で探る方向性としては、モデル訓練の改善、被験者に依存しないRBMモデルの開発、および異なる種類の神経信号での応用テストが含まれるよ。これを広げていくことで、多様な集団や条件での脳機能の理解を深めていきたいと思ってるんだ。

オリジナルソース

タイトル: Cross-subject Mapping of Neural Activity with Restricted Boltzmann Machines

概要: Subject-to-subject variability is a common challenge in generalizing neural data models across subjects. While many methods exist that map one subject to another, it remains challenging to combine many subjects in a computationally efficient manner, especially with features that are highly non-linear such as when considering populations of spiking neurons or motor units. Our objective is to transfer data from one or more target subjects to the data space of one or more source subject(s) such that the neural decoder of the source subject can directly decode the target data when the source(s) is not available during test time. We propose to use the Gaussian-Bernoulli Restricted Boltzmann Machine (RBM); once trained over the entire set of subjects, the RBM allows the mapping of target features on source feature spaces using Gibbs sampling. We also consider a novel computationally efficient training technique for RBMs based on the minimization of the Fisher divergence, which allows the gradients of the RBM to be computed in closed form, in contrast to the more traditional contrastive divergence. We apply our methods to decode turning behaviors from a comprehensive spike-resolved motor program - neuromuscular recordings of spike trains from the ten muscles that control wing motion in an agile flying Manduca sexta. The dataset consists of the comprehensive motor program recorded from nine subjects driven by six discrete visual stimuli. The evaluations show that the target features can be decoded using the source classifier with an accuracy of up to 95% when mapped using an RBM trained by Fisher divergence. Significant StatementIn this study, we address the variability of neural data across subjects, which is a significant obstacle in developing models that can generalize across subjects. Our objective is to create a task-specific representation of the target subject signal in the feature space of the source subject. Our proposed RBM architectures achieve highly flexible and accurate cross-subject mapping with few assumptions. Our Fisher RBM improved the previous state of the art method by 300%. Our methods show promise in generalizing features of complex neural datasets across individuals, tuning neural interfaces to subject-specific features, and leveraging data across multiple subjects when experiments are limited in time or completeness.

著者: Suya Wu, H. Yang, M. Angjelichinoski, J. Putney, S. Sponberg, V. Tarokh

最終更新: 2024-12-06 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2023.04.14.536854

ソースPDF: https://www.biorxiv.org/content/10.1101/2023.04.14.536854.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

類似の記事