データ収集を通じた妊娠に関する研究の進展
「All of Us」プログラムを使った妊娠研究の徹底的な見直し。
― 1 分で読む
目次
妊娠は人間の健康の重要な部分だけど、もっと研究されるべきだよね。いろんな理由があるんだけど、妊娠中の人を研究するのは大変だし、倫理の問題もある。だから、多くの妊婦が臨床試験や研究に参加できていないんだ。結果として、研究者は妊娠に関する健康問題や行動、結果を調べるために観察データに頼らざるを得なくなってる。でも、妊娠や出産後の研究は、利用できるデータや研究デザインの限界でまだ難しいんだよね。
妊娠研究の課題
妊娠に関する多くの研究は高額なグループ研究を利用していて、妊娠全体を追跡することができないことが多いんだ。たとえば、政府の出生データは一般的な情報を提供するけど、早期の妊娠の詳細や薬の使用に関する情報が欠けてることが多い。出生コホートは、最近の妊娠中または出産後の人に焦点を合わせた観察研究だけど、妊娠の終わり近くに参加者を募集することが多いから、大事な早期の情報が欠けてしまうんだ。
最近では、妊娠前の研究をデザインして、受胎、妊娠、出産後の健康結果に関するデータを最初から集めることが行われてる。こういうコホート研究は貴重な長期データを提供できるけど、かなりのリソースが必要だし、妊娠のタイミングや結果に関して自己報告に依存することが多い。一方で、電子健康記録(EHR)や保険請求などの実世界データは、診断、治療、コストに関する詳細な情報を含んでいるけど、重要な人口統計情報が欠けていて、妊娠を特定したり妊娠週数を正確に測ったりするのが難しいんだ。
All of Us研究プログラム
All of Us研究プログラムは、妊娠をもっと効果的に研究するチャンスを提供してる。EHR、調査、バイオサンプル、アクティビティトラッカーを通じてデータを集めてる。このアプローチは、健康に影響を与える社会的および医療的要因を調べる長期研究をサポートしてる。プログラムは、過去の研究であまり代表されてこなかった妊婦など、幅広い人々を含めることを目指してる。
All of Usプログラムの潜在的なメリットにもかかわらず、実世界データを使って妊娠を特定して分析するのにはまだ課題がある。異なるコーディングの仕方、患者が複数の医療提供者を利用すること、一貫性のない妊娠週数のコーディングなどが、妊娠のエピソードを特定するのを難しくしてる。これは、研究者が妊娠の確認に単一のコードに頼れないことを意味してて、妊娠、その結果、妊娠週数を正確に特定するには複雑なアルゴリズムが必要なんだ。
研究の目的
この研究の主要な目標は、All of Usデータの中で妊娠のエピソードを見つけ、妊娠週数や結果を推測し、調査データを使ってこれらのエピソードを検証し、特定された妊娠を特徴づけることだった。この研究は、All of Usプログラムが研究者や調査対象のコミュニティにとって重要な妊娠に関する質問に答えるための価値あるツールでありうることを示そうとしてた。
All of Usプログラムの仕組み
All of Us研究プログラムは2018年に成人参加者の登録を開始した。全国にわたる広範な募集戦略を持っていて、誰でもボランティアとして参加できる。参加者は調査を通じて人口統計情報を提供し、健康歴や社会的背景についての詳細を含むことができる。また、EHRデータをリンクしたり、バイオサンプルを共有したり、フィットネストラッカーからのデータを提供することもできる。
データは、異なる医療機関から集まり、それぞれの医療記録システムを共通のデータフォーマットに標準化して分析を容易にしてる。品質チェックとプライバシー保護が適用された後、特定のトレーニング要件を満たした研究者がこのデータにアクセスできる。
妊娠特定アルゴリズム
All of Usプログラムの参加者の中から妊娠を見つけるために、研究者たちは他の健康データを使って開発・検証された特定のアルゴリズムを使用した。この手法は、妊娠がどう終わったかを調べ、妊娠の進行に関連する一連のコードを使用し、妊娠の開始日を推定するという3つの部分にプロセスを分ける。
アルゴリズムは、出産、死産、異所性妊娠、流産、出産の結果を特定することから始まる。妊娠が通常どれくらい続くかに基づいて情報を整理し、妊娠週数に関する詳細を提供するコードを組み込む。これらの情報源を統合することで、研究者は妊娠の出来事をより明確に把握できる。
結果の検証
研究者たちは、調査データと照らし合わせたり、元のアルゴリズムに含まれていない妊娠関連の追加コードをチェックしたりして、特定された妊娠のエピソードを検証した。調査参加者の現在の妊娠状況に関する回答を見て、それらの回答と特定されたエピソードを比較して、間違った分類を特定した。
こうやってデータを評価した結果、調査の回答とアルゴリズムの結果との間に高い一致が見られた。これは、アルゴリズムが妊娠を特定するのに信頼できることを示唆してる。
妊娠エピソードの特徴付け
この研究では、多くの妊娠エピソードを特定し、その結果、期間、関与した個人の人口統計を調べることができた。さまざまな妊娠の結果に関連する要因を探索するために統計モデルを使用した。また、参加者がプログラムに貢献した追加データ、例えば調査の回答やトラッカーデータを理解することも目指してた。
参加者の人口統計
妊娠エピソードが特定された参加者の中には、少数民族グループに属する重要な割合がいた。40%以上がヒスパニックまたはラティーノと自己認識し、30%以上が白人だった。ほとんどの参加者は女性で、過半数が異性愛者と自己認識してた。
この研究では、複数の妊娠エピソードを持つこと、出産の可能性、早産の可能性に関連するさまざまな特性が示された。たとえば、収入が高い人は複数の妊娠エピソードが記録される可能性が高く、年齢が高い参加者は早産の可能性が高かった。
生児出産からの洞察
生児出産に関する発見では、平均妊娠週数は39週で、約5分の1の出生が早産だった。All of Usの人口統計データと全国統計を比較すると、いくつかの違いがあることが明らかになった。たとえば、プログラムを通じて出産した人々は、全国平均よりもやや高齢で、教育も受けている傾向があった。
All of Usデータの潜在能力と約束
母体の健康問題はますます深刻になってきていて、特に異なる人種・民族グループ間での合併症や不平等の増加を考慮するとそうだね。医療記録と健康行動や社会的要因に関する調査情報を組み合わせることで、All of Usプログラムは妊娠体験や出産後の健康についての新たな洞察を提供できる。これにより、研究者は健康格差の根本的な原因を理解して対処できるようになる。
さらに、このプログラムには、妊娠中に調査を完了した参加者が多く含まれているから、研究者は彼らの健康体験を出産後の期間にわたって追跡できる機会が豊富にある。これにより、社会的要因、差別の経験、妊娠やその後の健康結果との関連を探ることができる。
追加データ源の活用
プログラムは、遺伝情報やウェアラブルトラッカーからの身体活動データなど、他のタイプのデータも集めていて、妊娠に関する重要な質問に答えるのに役立つ。たとえば、早産の原因を理解するのは複雑な問題で、この多様なデータを統合することで新たな洞察が得られるかもしれない。
強みと限界
EHRからの実世界データは、多くの年にわたる妊娠と関連する健康特性の広い視野を提供するけど、限界もある。コーディングミスは患者記録にギャップや不正確さをもたらすかもしれないし、異なる医療システムからケアを受ける患者は重要な健康情報を隠す断片化された記録を生むことがある。
これらの課題にもかかわらず、この研究は、All of Usプログラムのデータと妊娠特定アルゴリズムが、従来のコーディング検索だけに頼るよりも研究のためのより強固な基盤を提供することを示してる。新しい方法を活用することで、今後の研究は妊娠体験をより深く理解することに集中できる。
今後の方向性
データ提供のタイミングを認識することは、妊娠に関する研究にとって重要だよ。All of Usデータセットで特定された多くの妊娠は、参加者がプログラムに参加する前に起こったから、妊娠中に集められたデータを必要とする研究の機会が制限されるかもしれない。でも、いくつかの調査回答はタイミングに関係なくEHRデータにリンクできる。
All of Usプログラムは多様な人口を含めるよう努めているけど、すべてのコミュニティを完全には代表していないかもしれない。研究者は、公平で正確な結果を確保するために研究での潜在的なバイアスを考慮する必要がある。
要するに、All of Usプログラムを通じて妊娠を研究するこの革新的なアプローチは、研究者が妊婦の健康や体験に関する包括的な洞察を集めることを可能にし、最終的には母子の健康の結果を改善することにつながるんだ。
タイトル: Pregnancy episodes in All of Us: Harnessing multi-source data for pregnancy-related research
概要: ObjectiveThe National Institutes of Healths All of Us Research Program addresses gaps in biomedical research by collecting health data from diverse populations. Pregnant individuals have historically been underrepresented in biomedical research, and pregnancy-related research is often limited by data availability, sample size, and inadequate representation of the diversity of pregnant people. We aimed to identify pregnancy episodes with high-quality electronic health record (EHR) data in All of Us Research Program data and evaluate the programs utility for pregnancy-related research. Materials and MethodsWe used an algorithm to identify pregnancy episodes in All of Us EHR data. We described these pregnancies, validated them with additional data, and compared them to national statistics. ResultsOur study identified 18,970 pregnancy episodes from 14,234 participants; other possible pregnancy episodes had low-quality or insufficient data. Validation against people who reported a current pregnancy on an All of Us survey found low false positive and negative rates. Demographics were similar in some respects to national data; however, Asian-Americans were underrepresented, and older, highly educated pregnant people were overrepresented. DiscussionOur approach demonstrates the capacity of All of Us to support pregnancy research and reveals the diversity of the pregnancy cohort. However, we noted an underrepresentation among some demographics. Other limitations include measurement error in gestational age and limited data on non-live births. ConclusionThe wide variety of data in the All of Us program, encompassing EHR, survey, genomic, and Fitbit data, offers a valuable resource for studying pregnancy, yet care must be taken to avoid biases.
著者: Louisa H Smith, W. Wang, B. Keefe-Oates
最終更新: 2024-04-12 00:00:00
言語: English
ソースURL: https://www.medrxiv.org/content/10.1101/2024.04.10.24305609
ソースPDF: https://www.medrxiv.org/content/10.1101/2024.04.10.24305609.full.pdf
ライセンス: https://creativecommons.org/licenses/by-nc/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。