shaPRSを用いた多因子リスクスコアの進展
新しい方法で遺伝子データを使った病気リスクの予測が改善される。
― 1 分で読む
目次
ゲノムワイド関連研究(GWAS)は、私たちの遺伝子が病気や特定の特性のリスクにどう影響するかを調べる方法だよ。研究者たちはたくさんの人を調査して、どの遺伝子のバリエーションがさまざまな健康問題に関連しているかを見ているんだ。この研究から出てきた面白いツールの一つが、多因子リスクスコア(PRS)って呼ばれるもの。これは、遺伝的な構成に基づいて、ある病気になったり特定の特性を持つ可能性を推定するのに役立つよ。
最近の研究では、一般的な病気に対して非常に高い多因子リスクスコアを持っている人たちは、その病気に関連するまれな遺伝子変異を持つ人たちと同じようなリスクを抱えていることがわかったんだ。この発見は、これらのスコアを標準的な医療検査と組み合わせて、病気をより早く、より正確に検出できる希望を与えているよ。でも、実際の臨床設定でのスコアの有用性を制限するいくつかの課題もまだ残ってるんだ。
現在のGWASの課題
多因子スコアの価値は、これを作るために使用されるGWASデータの質に大きく依存してる。研究対象者の数が増えると、これらのスコアの精度も向上するんだ。現在の研究では、病気に影響を与える遺伝的要因をしっかり理解するためには、数十万、いや数百万の症例が必要かもしれないと言われているよ。残念ながら、多くの複雑な病気には十分な症例がないから、さまざまな研究のデータを組み合わせても情報が不足していることがある。この情報不足が、多因子スコアの精度をいつも保証できない理由なんだ。
もう一つの大きな問題は、GWASの参加者の多様性が不足していることだよ。ほとんどのデータはヨーロッパ系の人々から得られているから、他の人々からの重要な遺伝情報が欠けているんだ。このデータのバイアスが、異なる系統の人々に対する多因子スコアの効果を制限しているよ。多くの病気には、非ヨーロッパ系の人々に一般的な遺伝的リスク要因があるけど、現在の研究では見落とされていることがある。
多様なデータの必要性
2024年初めの時点で、GWASに参加した人の約94.5%がヨーロッパ系だったよ。この代表性の偏りは問題を引き起こすんだ。なぜなら、多因子リスクスコアが他の系統の人々にはうまく働かない可能性があるからだよ。最近の研究結果は、多くのリスク変異が異なる集団の間で均等に共有されていないことを示している。このギャップは、病気リスクに大きな違いを生むことがあって、全ての人に対して正確な推定をするのが難しいんだ。
幸い、今は遺伝研究におけるより良い代表性を求める強い動きがあるよ。非ヨーロッパ系の人々を含む研究は、多様なデータを含めることで、ほとんどヨーロッパ系の研究で見逃された遺伝的関連についての新しい発見につながっている。多因子スコアが本当に役立つためには、さまざまな背景からの広範な遺伝データを使って開発される必要があるんだ。
疾患間での共通の遺伝的影響
集団ごとの遺伝的リスクには違いがあるけど、多くのリスク要因はさまざまな系統グループ間で共有されていると考えられているよ。科学者たちがより多くの病気を研究する中で、関連する病気の間で多くの遺伝的リスク要因が重複していることがわかってきたんだ。たとえば、クローン病や潰瘍性大腸炎といった炎症性腸疾患を持つ人々は、よく遺伝的リスク要因を共有している。これらの関連に関する研究は、遺伝学と病気の複雑さを明らかにする助けになっている。
研究者たちは、さまざまな特性や系統のデータを組み合わせて、PRSの精度を向上させようとしているよ。つまり、特定の遺伝的要因が一つの病気だけじゃなく、複数の状態にどう影響するかを見ているってこと。さまざまな情報源からのデータを使うことで、より完全な画像を作成できるんだ。
shaPRSの導入
既存の方法の課題に対処するために、shaPRSという新しいアプローチが開発されたよ。このツールは、特にデータが完全に一致しないときに、2つの異なるGWAS研究からの情報を組み合わせるのを助けるんだ。異なるゲノムのポイントで、その情報がどれだけ関連しているかを追跡しながら、追加のデータセットからの有用な情報を見つけることに重点を置いているよ。
shaPRSの方法は、2つのデータセットからの要約統計を使用するんだ。1つのデータセットは対象集団を表していて、もう1つは補足情報を提供する。詳細な分析を行うことで、shaPRSは各遺伝子変異における2つ目のデータセットの関連性を推定するんだ。これにより、メタ分析を行い、2つの研究からの発見を効果的に組み合わせることが可能になるよ。
shaPRSの仕組み
shaPRSは、まず各遺伝子変異に対して、2つのデータセット間での効果の一貫性が確認できる証拠を調べるところから始まるんだ。統計的方法を使って、遺伝的効果が似ているかどうかを判断するよ。共通性が高い場合、shaPRSは両方のデータセットからの平均効果を使うんだ。共通性が低い場合は、より慎重になって、プライマリデータセットの効果だけに依存するようにしているよ。
この方法は柔軟で、研究者が今後の分析のために完全な要約統計を作成するのを許可しているんだ。だから、shaPRSは既存の研究パイプラインに簡単に統合できて、さまざまな研究に対応できるようになっているよ。
shaPRSのパフォーマンス評価
shaPRSがどれだけ優れているかを示すために、研究者たちはUKバイオバンクのデータを含む大規模なデータセットでテストしたんだ。その結果、shaPRSは他の類似の方法よりもかなり優れていることがわかったよ。特に、実際のデータセットに適用したときに、さまざまな病気や集団にわたってPRSの精度を高めるのに効果的だったんだ。
shaPRSの方法は、複数のデータセットからの情報を適切に活用する重要性を示しているよ。この進展は、より正確な予測とリスク評価が多様な集団において期待できるということを意味しているんだ。
炎症性腸疾患への応用
炎症性腸疾患(IBD)は、クローン病や潰瘍性大腸炎などの疾患を含んでいるよ。これらの状態は消化器系に影響を与えて、遺伝的要因と環境因子の両方の影響を受けるんだ。研究者たちは、shaPRSを使ってこれら2つのタイプのIBDを研究したんだけど、何千もの症例を含むデータセットを利用したよ。分析の結果、2つの病気の間で遺伝的効果に顕著な違いがあることが分かり、shaPRSはそれを効果的に捉えることができたんだ。
shaPRSを使うことで、研究者たちは遺伝的要因に基づいてこれらの病気になる可能性の予測の精度が向上したことがわかったよ。この方法は、IBDの多因子リスクスコアを洗練するのに役立ち、早期発見や個別の治療戦略を通じて患者の転帰を改善するかもしれないんだ。
異なる系統間の予測
特定の病気における有用性に加えて、shaPRSは異なる系統間の予測にもメリットがあるんだ。異なる集団における遺伝的リスクがどう変わるかを理解することは、効果的な医療戦略を開発するのに重要だよ。shaPRSを使うことで、研究者たちは追加の遺伝型データなしで、さまざまな系統の情報を統合してより正確なPRSを構築することができたんだ。
このアプローチは、遺伝研究において過小評価されてきた集団にとって特に価値があるよ。これによって、より良い病気リスク評価が可能になるんだ。より多様なデータセットが利用可能になるにつれて、shaPRSのような方法は、医療と病気予防戦略における公平性を確保する上で重要な役割を果たすことができるよ。
PRSの未来
遺伝研究における多様性の重要性が増す中で、shaPRSのようなアプローチは、より包括的な研究への道を開いているんだ。遺伝科学の新たな進展がある中で、研究者たちは公衆衛生への影響を考慮する必要があるよ。効果的なリスク予測には、異なる集団や遺伝的構成に適応できるツールが必要なんだ。
shaPRSが進化し続ける間、多因子リスクスコアの生成方法において重要な改善を提供することが期待されているよ。多様な遺伝情報の統合は、より良い予測を可能にして、最終的にはより個別化された医療ソリューションに貢献することになるんだ。
結論
まとめると、多因子リスクスコアは病気の予測や予防戦略を変革する可能性を持っているよ。でも、現在の方法にはサンプルの多様性やデータの正確性に関する課題があるんだ。shaPRSの導入は、この分野における重要な進展を表していて、研究者たちが多様なデータセットをより効果的に活用し、リスク予測を改善できるようにしているよ。
今後は、科学コミュニティが多様な遺伝データの収集を優先して、多因子リスクスコアの正確性と有用性を高めることが重要だよ。そうすることで、すべての個人にとって、公平な健康結果を達成するために取り組むことができるんだ。
タイトル: ShaPRS: Leveraging shared genetic effects across traits or ancestries improves accuracy of polygenic scores
概要: We present shaPRS, a novel method that leverages widespread pleiotropy between traits, or shared genetic effects across ancestries, to improve the accuracy of polygenic scores. The method uses genome-wide summary statistics from two diseases or ancestries to improve the genetic effect estimate and standard error at SNPs where there is homogeneity of effect between the two datasets. When there is significant evidence of heterogeneity, the genetic effect from the disease or population closest to the target population is maintained. We show via simulation and a series of real-world examples that shaPRS substantially enhances the accuracy of PRS for complex diseases and greatly improves PRS performance across ancestries. shaPRS is a PRS pre-processing method that is agnostic to the actual PRS generation method and, as a result, it can be integrated into existing PRS generation pipelines and continue to be applied as more performant PRS methods are developed over time.
著者: Martin Kelemen, E. Vigorito, L. Fachal, C. A. Anderson, C. Wallace
最終更新: 2024-02-21 00:00:00
言語: English
ソースURL: https://www.medrxiv.org/content/10.1101/2021.12.10.21267272
ソースPDF: https://www.medrxiv.org/content/10.1101/2021.12.10.21267272.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。
参照リンク
- https://github.com/mkelcb/shaprs
- https://github.com/privefl/simus-PRS/tree/master/paper3-SCT/code_real
- https://github.com/mkelcb/shaprs-paper
- https://ega-archive.org/studies/EGAS00001000924
- https://ega-archive.org/studies/EGAS00000000084
- https://ega-archive.org/datasets/EGAD00000000005
- https://figshare.com/articles/dataset/European_LD_reference_with_blocks_/19213299
- https://personal.broadinstitute.org/hhuang//public//PRS-CSx/Reference/