SHREDを使ったモーションデータ拡張の進展
新しいアルゴリズムSHREDが、健康とパフォーマンスモニタリングのための動きデータ分析を強化するよ。
― 1 分で読む
目次
人間の動きを理解することは、医療、リハビリ、スポーツ、役立つデバイスの設計など多くの分野で大事なんだ。動きをモニターすることで、病気の進行を追ったり、回復を助けたり、アスリートのパフォーマンスを評価したり、より良い補助ツールを作ったりできる。従来、専門家は人が歩いたり走ったりする時の特定の測定値を使って動きを測ってたんだ。その測定値はデジタルバイオマーカーとして知られていて、速度、角度、動きのタイミングなどの変数が含まれる。
特定の動作関連の要素は、怪我をしたときの膝の角度や高齢者が転倒するリスクのある人の足幅の変動など、深刻な結果と関連付けられてる。アメリカでは、かなりの割合の人が移動の問題を抱えていて、日常生活の中で動きをモニターすることが重要なんだ。コントロールされた環境外で人間の動きを効果的に観察するには、ポータブルで使いやすく、信頼性が高く、正確なセンサーが必要なんだ。
現在の動作検知技術
動作検知のためのさまざまな技術があって、それぞれ実用性や精度に関して利点と欠点がある。通常、最良の結果は、光学モーションキャプチャやフォースプレートのような複雑なセットアップを伴う方法から得られるけど、これらのシステムは専門のラボと訓練された人員が必要なんだ。これが多くの人にとってアクセスを制限することになる。
逆に、ウェアラブルデバイスやスマートフォンのようなシンプルでポータブルなデバイスは動きをモニターできるけど、あまり正確じゃない場合もある。たとえば、慣性計測ユニット(IMU)やカメラなんかは日常的なシチュエーションで使われるけど、センサーの配置や時間とともに増えるエラーのような問題から正確な読み取りを得るのは難しい。
機械学習の役割
最近の機械学習の進展は、人間の動作を分析する新しい扉を開いた。アルゴリズムはリハビリクリニックやウェアラブルセンサーなど、さまざまなソースから集めた膨大なデータを処理して、一見すると明らかではないパターンや関係を特定することができる。この機械学習の手法は活動の認識、マーカーなしでの動作のキャプチャ、転倒の検出、さまざまなセンサーからのデータの統合に特に役立ってる。
研究者たちはまた、限られた数のセンサーから人間の動きを合理的に推測する方法にも取り組んでいて、データ収集の負担を軽減することを目指してる。ただし、これらのアプローチはまだ特化したモーションキャプチャシステムの精度には達していない。
SHREDアルゴリズムの紹介
有望なアプローチの一つが、SHallow REcurrent Decoder(SHRED)だ。この技術は、過去のセンサー情報を使って、いくつかの測定から完全な動作データセットを再構築するのを助ける。SHREDのアーキテクチャは、時間とともにパターンを学ぶためのリカレントネットワークと、限られたデータに基づいて運動状態の全体像を再現するためのシンプルなデコーダを使用してる。
SHREDの特長は、ノイズや測定の不正確さを扱えることで、完璧なセンサー配置の必要性を減らせるところだ。従来のディープラーニングモデルに比べて、トレーニングに必要なデータが少なくて済むから、限られたモーションデータで作業する時に便利なんだ。
SHREDに対する私たちの目標
SHREDアルゴリズムが、シンプルな加速度計からの限られたセンサー測定値を使って、全人間の動きを示すより包括的なデータセットにマッピングできることができるんじゃないかと思ってる。過去の測定値を使うことで、他のモデリング方法に比べてより良い結果が得られるかもって興味津々なんだ。
さらに、作業の複雑さがSHREDモデルの動作データ拡張能力にどのように影響するかを研究したいと思ってる。複雑なタスクでモデルをトレーニングすれば、シンプルなタスクよりも良い結果が得られると思う。これをテストするために、さまざまな動きのパターンをキャプチャするいくつかのオープンソースデータセットを使用するつもり。
手法の概要
私たちの研究は、3つの主要なセクションに分かれてる:
パートA:モデリング技術
ここでは、限られたセンサー情報をより密度の高いデータセットに変換するためのさまざまなモデリング技術の数学を説明する。SHRED、他の浅いデコーダーネットワーク、線形回帰モデルが含まれる。
パートB:使用するデータセット
SHREDのデータ拡張性能を評価するために選んだオープンソースデータセットをレビューする。これらのデータセットには、トレッドミルでの歩行やダンスのようなよりダイナミックなアクションが含まれてる。
パートC:動作の複雑さ
このセクションでは、動きのタスクの複雑さがSHREDの推論能力にどのように影響するかを見ていく。
データ拡張の理解
データ拡張とは、限られたセンサー読み取り値をより詳細なデータセットに変換することを意味する。これを2つの方法で達成できる:
- 再構築:既知の情報に基づいて欠損データを埋めること。
- 推論:新しい状況や以前に遭遇したことのない被験者のデータを予測すること。
SHREDを人間の動作に適用する
私たちは、さまざまなデータセットを使用してSHREDが人間の動作データをどれだけ拡張できるかをテストし、他のモデルとそのパフォーマンスを比較した。まず、シンプルなトレッドミルでの歩行タスクを探求し、その後、より複雑な活動、例えばランニングやフリースタイルダンスに移った。
トレッドミル歩行タスク
トレッドミルでの歩行から始めて、SHREDが定期的なパターンを示すデータを再現できるか観察した。SHREDの出力と実際の測定データを比較することで、データ再構築の精度を測定した。個別マッピング(各個人のデータを使用)とグループマッピング(数人のデータを使って他の人のデータを予測)の2種類のマッピングで実験した。
モーションキャプチャデータの収集
特定のタスクを実行している成人グループから動作データを集めた。私たちの目標は、選択された測定値から完全なモーション状態を正確に再構築できるかを見ることだった。どのセンサー入力の組み合わせが最も効果的かをテストした。
慣性センサーのデータ
さまざまなアクションを実行している間に参加者からウェアラブルデバイスのデータも収集した。再び、限られたデータに基づいて正確な結果を生み出すSHREDの能力をテストし、他のモデルのパフォーマンスと比較した。
動作タスクの複雑さ
SHREDの能力をさらに調べるために、動きの複雑さがそのパフォーマンスにどう影響するかを探求した。これには、個人が歩き方を変えなければならないタスクが含まれた。動きにどれだけの変動があったかを見て、動作データ拡張に対する複雑さの影響を定量化することを目指した。
環境制約の探求
制御された環境からトレッドミルのようなものからよりダイナミックな設定に移行すると、データ拡張に影響を与えるかどうかを見た。たとえば、より自然な環境では、人々の動きにばらつきが増すことに気づいた。この変動は、私たちの結果の精度に大きな影響を与えた。
データ拡張の精度
すべてのテストを通じて、SHREDは動作データを正確に拡張することができ、個別のシナリオとグループベースのシナリオの両方で他のモデルを上回った。SHREDは、さまざまなデータセットやタスクでエラー率が低かった。トレッドミルの歩行試験では、競争モデルよりも平均エラーがかなり低かった。
SHREDと他のモデルの比較
SHREDの独特な過去のセンサーデータの利用は、時間のシーケンスを利用しなかったモデルと比較して、結果を大幅に改善することに繋がった。これは、データ拡張の精度における大きな進展を示している。
結論
全体的に、SHREDのような浅いリカレントデコーダーネットワークは、人間の動作データを拡張するための強力なツールなんだ。限られた数のセンサー測定をより包括的な情報セットにうまくマッピングできるから、モーションを再構築したり推測したりするのに役立つ。この発見は、日常的な設定で健康やパフォーマンスをモニターする方法を向上させるかもしれない。
私たちは、継続的で非侵襲的な人間の動きをトラッキングするために、SHREDの能力が個別の評価のための新しい道を開くと信じてる、特にリハビリのような設定で。この動作の複雑さが推論アルゴリズムの精度に与える影響を理解することは、より自然な環境でこれらの方法を適用できるようにするために重要なんだ。
ここで示したアプローチを利用することで、現在の制限を克服し、健康モニタリング、パフォーマンス評価、補助デバイスの設計などさまざまなアプリケーションの精度を向上させることができるんだ。
タイトル: Human motion data expansion from arbitrary sparsesensors with shallow recurrent decoders
概要: Advances in deep learning and sparse sensing have emerged as powerful tools for monitoring human motion in natural environments. We develop a deep learning architecture, constructed from a shallow recurrent decoder network, that expands human motion data by mapping a limited (sparse) number of sensors to a comprehensive (dense) configuration, thereby inferring the motion of unmonitored body segments. Even with a single sensor, we reconstruct the comprehensive set of time series measurements, which are important for tracking and informing movement-related health and performance outcomes. Notably, this mapping leverages sensor time histories to inform the transformation from sparse to dense sensor configurations. We apply this mapping architecture to a variety of datasets, including controlled movement tasks, gait pattern exploration, and free-moving environments. Additionally, this mapping can be subject-specific (based on an individuals unique data for deployment at home and in the community) or group-based (where data from a large group are used to learn a general movement model and predict outcomes for unknown subjects). By expanding our datasets to unmeasured or unavailable quantities, this work can impact clinical trials, robotic/device control, and human performance by improving the accuracy and availability of digital biomarker estimates.
著者: Megan R Ebers, M. Pitts, K. M. Steele, J. N. Kutz
最終更新: 2024-06-03 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.06.01.596487
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.06.01.596487.full.pdf
ライセンス: https://creativecommons.org/licenses/by-nc/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。