Simple Science

最先端の科学をわかりやすく解説

# 統計学# 方法論# アプリケーション

加速度計研究における欠損データへの対処

臨床試験における加速度計データの欠損を管理する方法。

― 1 分で読む


トライアルの欠損データを修トライアルの欠損データを修正する法。臨床研究で欠測加速度計データを対処する方
目次

最近、加速度計などのウェアラブルデバイスが臨床試験での身体活動の追跡に人気になってるね。これらのデバイスは、研究者が異なる治療が人々の歩数にどんな影響を与えるかを理解するのに役立つんだ。ただ、加速度計を使う上での課題の一つは、欠損データの扱いだよ。参加者がデバイスを着け忘れたり、何らかの理由で外したり、技術的な問題が起きたりすることがあるんだ。

欠損データの扱い方を理解することは重要で、研究の結果に影響を与える可能性があるんだ。この記事では、加速度計の研究における欠損データの対処法について、一般的なアプローチである多重代入(MI)の詳細に焦点を当てて話すね。MIには、パラメトリックとノンパラメトリックの2つの方法があるよ。

加速度計データの重要性

加速度計は、体に装着してリアルタイムで動きを測定するデバイスだ。身体活動レベルを客観的に収集する方法を提供してくれるから、研究にとって貴重なツールなんだ。これらのデバイスは通常、短い間隔でデータを記録していて、たいていは5秒ごとに記録されるよ。これによって、参加者が一日を通してどれだけ活動的かを詳細に見ることができるんだ。

臨床試験では、研究者が加速度計を使って歩数や他の活動レベルを測定することが多い。参加者は通常、毎日活動の包括的な様子を提供するために、デバイスを一週間着けているんだ。このデータは、身体活動を増やすことを目的としたさまざまな介入の効果を評価するために分析されるよ。

欠損データの課題

欠損データは、加速度計を使った研究でよくある問題だ。参加者が指示通りにデバイスを着けないことがあって、外したり、バッテリー切れなどの問題が起きたりするんだ。従来の欠損データ管理のアプローチでは、デバイスが一定時間以上着けられなかった日は「欠損」と見なすことが多い。たとえば、ある日540分未満しかデバイスを着けていなければ、その日のデータは無視されることがあるんだ。これにより、参加者が着けていない時間帯でも有用なデータを提供しているかもしれないのに、貴重な情報が失われてしまうことがあるんだ。

だから、欠損データを細かく扱うためには、もっと繊細なアプローチが必要だね。具体的には、エポックレベル(特定の時間区間)で見る必要があるんだ。こうすることで、研究者はより多くの情報を保持し、利用可能なデータをうまく使えるんだ。

欠損データの分類

多重代入の方法を適用する前に、研究者は欠損データを正確に特定して分類する必要があるよ。加速度計データの文脈では、欠損の形はさまざまなんだ。例えば、参加者が寝ている間にデバイスを外してしまうと、長い間動きが記録されないことがある。これは、研究プロトコルに沿っているので、欠損データとして扱うべきではないんだ。

これらの期間を効果的に分類するために、研究者は次のようなタイプに分けることができるよ:

  1. 非活動期間: 参加者がデバイスを着けている可能性があるけど、動いていない短い時間帯。これらは1〜3時間の間隔であることが多い。

  2. 非着用期間: デバイスが外された状態で、動きがない長い時間帯。これらは1〜5時間続くことがある。

  3. 睡眠期間: 睡眠のためにデバイスが着けられていない5〜15時間の長い時間帯。この期間は予想される。

  4. 睡眠エクストラ期間: デバイスを遅れて着けたり早めに外したりするような、15時間以上の非常に長い期間。これも欠損データに繋がる。

これらの欠損インターバルを効果的に分類することで、研究者はMI方法を適用する際の欠損データの取り扱いをより理解できるようになるんだ。

多重代入の概要

多重代入(MI)は、観察されたデータに基づいて欠損データを合理的な推測で埋める方法だ。MIの目的は、欠損エントリに対して信頼できる値の範囲を提供することなんだ。これによって、研究者は完全なデータがあるかのように分析を行うことができるんだ。

MIは、欠損エントリを予測値で置き換えることによって、いくつかの異なる完全なデータセットを作成することを含むよ。これらのデータセットは別々に分析されて、結果が平均されて最終的な推定を出すんだ。このアプローチは、欠損データに関する不確実性を考慮に入れるので、より信頼性の高い結果を得ることができるんだ。

MIには、パラメトリックとノンパラメトリックの2つの主要なアプローチがあるよ。

パラメトリック多重代入

MIのパラメトリックアプローチは、データが特定の統計的分布に従うと仮定するんだ。加速度計データの文脈では、研究者はトビット回帰のようなモデルを適用するかもしれない。これにより、制約のあるデータ(例えば、歩数がゼロ未満になることがないデータ)の問題に対処できるんだ。

パラメトリックアプローチを適用する際、研究者はまずデータを日単位に集約するんだ。これがバイアスを引き起こすことがあるけど、歩数の対数変換を行うことで、正規性の仮定がより妥当になるようにできるんだ。こうすることで、代入に必要なパラメータを定義することができるんだ。

パラメトリックアプローチの大きな利点の一つは、観察された値に基づいてデータの上限と下限を設定できることだよ。例えば、ある日が非着用期間のため部分的に観察されていると見なされた場合、代入は関連する歩数のための現実的な範囲を設定することでこれを考慮することができるんだ。

ノンパラメトリック多重代入

MIのノンパラメトリックアプローチは、特定の統計的分布に依存しないんだ。パラメトリックモデルを使う代わりに、この方法は似たような参加者からの観察データを使って欠損データを埋めるんだ。アイデアは、似た特性を持つ「寄付者」を見つけて、そのデータを使って欠損値を推定することだよ。

実際には、ノンパラメトリックアプローチはデータの分布について厳密な仮定を必要としないから、利点があるんだ。柔軟性が高く、複雑なデータパターンに適応できるから、加速度計のデータセットにぴったりなんだ。

ノンパラメトリックアプローチを実施する際、研究者はまず各参加者の欠損期間を特定するんだ。次に、同じ参加者の別の日や他の似た参加者から適用可能な寄付者データを探すんだ。年齢、性別、ベースラインの活動レベルといった要因に基づいてマッチングを行うことで、研究者は欠損データの信頼できる代入を作成できるんだ。

シミュレーション研究

MIの両方のアプローチの有効性を評価するために、研究者はシミュレーション研究を行うんだ。これらの研究は、各方法が欠損データを加えたデータセットから真の値をどれだけ正確に回復できるかを評価するんだ。

あるシミュレーションでは、研究者が加速度計のデータセットに欠損データパターンを追加して、非着用や睡眠エクストラの期間の事例をシミュレートするかもしれない。それから、パラメトリックとノンパラメトリックのアプローチの両方を適用して、参加者の平均歩数を推定するパフォーマンスを評価するんだ。

結果的に、ノンパラメトリックアプローチは一般的にバイアスが少なく、標準誤差も小さいことが示されたんだ。ただし、データの数週間が欠損している場合は、ノンパラメトリックアプローチが寄付者データ不足のために効果的でないこともあるんだ。

PACE-UP試験への適用

これらの方法の効果を示すために、研究者はそれを実際の臨床試験であるPACE-UP試験に適用するんだ。この試験は、45歳から75歳の参加者の身体活動を増やすことを目的とした介入を検証したんだ。

参加者は数週間にわたって異なる時間点で加速度計を着けてもらったんだ。予想通り、欠損データの事例が発生したよ。両方のMIアプローチを適用することで、研究者は各方法が介入が歩数に及ぼす推定効果にどのように影響するかを評価できたんだ。

どちらの方法も、異なるポイント推定と標準誤差をもたらし、欠損データの仮定が研究結果を大きく変える可能性があることを示したんだ。特に、ノンパラメトリックアプローチは、オリジナルの試験で報告されたものと比較可能な推定をもたらしたよ。

討論

MIのパラメトリックとノンパラメトリックの両方のアプローチには、強みと弱みがあるんだ。パラメトリックアプローチは欠損データを扱うための構造的な方法を提供するけど、現実のデータセットの複雑さには常に合わないかもしれない。一方、ノンパラメトリックアプローチは柔軟性が高いけど、適切な寄付者データの利用可能性に依存するんだ。

ウェアラブルデバイスの使用が続く中、欠損データに関連する課題はおそらく残り続けるだろうね。だから、細かいデータセットの欠損を扱うための改善された方法を開発することが、臨床研究で正確な結果を生み出す鍵になるよ。

将来的には、両方の方法の強みを組み合わせたハイブリッドアプローチを探ることができるかもしれない。そんな進展があれば、臨床試験のデータ分析の質がさらに向上し、参加者の身体活動レベルを改善するための介入に関するより良い洞察が得られるだろうね。

オリジナルソース

タイトル: Multiple Imputation Approaches for Epoch-level Accelerometer data in Trials

概要: Clinical trials that investigate interventions on physical activity often use accelerometers to measure step count at a very granular level, often in 5-second epochs. Participants typically wear the accelerometer for a week-long period at baseline, and for one or more week-long follow-up periods after the intervention. The data is usually aggregated to provide daily or weekly step counts for the primary analysis. Missing data are common as participants may not wear the device as per protocol. Approaches to handling missing data in the literature have largely defined missingness on the day level using a threshold on daily wear time, which leads to loss of information on the time of day when data are missing. We propose an approach to identifying and classifying missingness at the finer epoch-level, and then present two approaches to handling missingness. Firstly, we present a parametric approach which takes into account the number of missing epochs per day. Secondly, we describe a non-parametric approach to Multiple Imputation (MI) where missing periods during the day are replaced by donor data from the same person where possible, or data from a different person who is matched on demographic and physical activity-related variables. Our simulation studies comparing these approaches in a number of settings show that the non-parametric approach leads to estimates of the effect of treatment that are least biased while maintaining small standard errors. We illustrate the application of these different MI strategies to the analysis of the 2017 PACE-UP Trial. The proposed framework of classifying missingness and applying MI at the epoch-level is likely to be applicable to a number of different outcomes and data from other wearable devices.

著者: Mia S. Tackney, Elizabeth Williamson, Derek G. Cook, Elizabeth Limb, Tess Harris, James Carpenter

最終更新: 2023-03-30 00:00:00

言語: English

ソースURL: https://arxiv.org/abs/2303.17331

ソースPDF: https://arxiv.org/pdf/2303.17331

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。

類似の記事