Simple Science

最先端の科学をわかりやすく解説

# 生物学# 生物情報学

新しい方法DendroPRSが遺伝的リスク予測を向上させる

DendroPRSは、さまざまな遺伝的背景にわたって健康リスク評価を改善するよ。

― 1 分で読む


DendroPRS:DendroPRS:一歩前進スク予測を強化する。DendroPRSは多様な人々の遺伝的リ
目次

遺伝学の分野が急速に進歩していて、大きな遺伝情報のデータベースが一般的になってきてるんだ。これらのデータベースはバイオバンクと呼ばれていて、多様な人たちのDNAデータを含んでる。ここでの主な目標の一つは、遺伝的な特徴に基づいて健康リスクを予測できる方法を作ることなんだけど、現在の方法はすべてのグループに均等に機能しているわけじゃない、特にヨーロッパ系や東アジア系以外の人たちにはうまく働かないことが多い。これが異なる人口間で不公平な健康結果につながる可能性があるんだ。

現在の方法の問題

ほとんどの遺伝的リスクスコアを予測するための既存の方法は、主にヨーロッパ系と東アジア系のデータを使って訓練されているんだ。このアプローチは他のグループに適用すると苦労することが多い。代表的じゃない人口に対しては訓練データが少ないから、モデルの精度も低いんだよ。これが健康の不平等についての懸念を生む。

予測精度に影響を与える要因

多様な人口に対する現在の予測方法のパフォーマンスが悪い理由は何個かある。一つは、異なる人口に共通する遺伝的変異、つまりSNPの違いだ。さらに、大規模な研究の際に選ばれるSNPは、訓練データが多いグループで一般的なものを好む傾向があるんだ。こうした違いが、遺伝的変異の影響の強さが人口ごとにどう変わるかに影響を与える。

遺伝的変異がどのように一緒に遺伝するかのリンク不均衡のパターンの変化も、正確な予測を妨げる要因なんだ。これらの課題は、人口間の遺伝的多様性をもっと考慮できる新しい方法の必要性を強調してる。

DendroPRSの紹介

これらの問題に対処するために、DendroPRSという新しい方法が開発されたんだ。DendroPRSは、さまざまな祖先グループからの遺伝データによりフィットするように設計されてる。各グループを完全に独立したものとして扱うんじゃなくて、異なる人口の歴史的な関係を考慮してるんだ。異なる人口がどれくらい密接に関連しているかを認識することで、DendroPRSはグループ間の遺伝的効果のサイズをより正確に予測できるんだ。

DendroPRSは、系統樹の中での位置に基づいてSNPの効果サイズを変えられるようにしてる。これが、予測をより信頼性のあるものにして、このグループの共有された歴史を尊重するのに役立つ。

DendroPRSの検証

DendroPRSの効果は、まずシミュレーションを通じてテストされた。この方法は、さまざまな人口の間で変わる遺伝的効果にどれくらいフィットできるかをテストするためにいくつかの試験を受けた。結果として、DendroPRSは人口間の関係があまり直接的でなくても精度を維持できることが示された。

その後、遺伝子発現の研究から得られたデータを使って現実のテストが行われた。この研究では、遺伝的変異が異なる人口における遺伝子発現にどう影響するかを調べた。DendroPRSは、規制効果の変動が大きく異なる遺伝子を特定することで期待できる結果を示した。

複雑な特徴への応用

DendroPRSは、UKバイオバンクのデータを使って複雑な特徴にも適用された。このバイオバンクは多くの個々の遺伝的および健康データを含んでいて、さまざまな祖先グループを包含しているから、研究者たちはDendroPRSが身長、BMI、コレステロール値などの健康特徴をどれくらい予測できるかを評価できた。

分析の中で、DendroPRSはすべての人口に対して単一のモデルをフィットさせるか、各人口ごとに別々にモデルを調整する従来の方法と比較された。結果は、DendroPRSが特に人口間での違いが知られている特徴に対して優れていることを示した。この方法は、代表的でないグループにとって特に有益で、予測精度の向上が見られた。

発見と観察

研究を通じて、いくつかの重要な観察が浮かび上がった。DendroPRSは、遺伝的変異が人の祖先によって健康の特徴に異なる影響を持つ場合を区別できた。例えば、特定のSNPがあるグループではBMIに強い影響を与えた一方、他のグループではほとんど影響がなかった。このような詳細な分析は、遺伝データを解釈する際に祖先を考慮することがどれほど重要かを際立たせてる。

さらに、DendroPRSは遺伝データだけじゃなく、年齢や性別などの追加情報を活用して予測精度を上げるのにも効果的だった。これは、さまざまなデータタイプに適応し、組み込む柔軟性を示していて、より正確な健康評価につながる可能性がある。

今後の研究への影響

DendroPRSが多様な人口間で遺伝的効果を正確にモデル化できる能力は、新しい研究の道を開く。将来の研究では、さらに複雑な特徴やより大きなSNPセットを含めることができるかもしれない。モデルがもっと多くの遺伝データを扱う能力を高めることで、研究者は遺伝が異なる人々の健康にどう影響するかについて貴重な洞察を得られるだろう。

さらに、過学習を防ぐためのより洗練された正則化技術の応用も改善の余地がある。また、混合集団をサポートする方法を探ることが、このモデルの適用可能性をさらに高めるかもしれない。

結論

さまざまな祖先背景で遺伝的リスクを正確に予測する際の課題は、新しい方法論の緊急の必要性を浮き彫りにしてる。DendroPRSは、人間の遺伝的多様性を尊重するより強固なアプローチを提供することで、この分野での重要な一歩を示してる。

系統関係の革新的な利用や、人口特有の効果を捉える能力によって、DendroPRSは研究の進展と健康結果の改善の両方に期待が持てる。科学者たちはこの方法を使うことで、遺伝と健康の間の複雑な関係をよりよく理解し、最終的には祖先に関係なくすべての人に公平で効果的な医療ソリューションを提供できるようになるんだ。

オリジナルソース

タイトル: Multi-ancestry polygenic risk scores using phylogenetic regularization

概要: Accurately predicting phenotype using genotype across diverse ancestry groups remains a significant challenge in human genetics. Many state-of-the-art polygenic risk score models are known to have difficulty generalizing to genetic ancestries that are not well represented in their training set. To address this issue, we present a novel machine learning method for fitting genetic effect sizes across multiple ancestry groups simultaneously, while leveraging prior knowledge of the evolutionary relationships among them. We introduce DendroPRS, a machine learning model where SNP effect sizes are allowed to evolve along the branches of the phylogenetic tree capturing the relationship among populations. DendroPRS outperforms existing approaches at two important genotype-to-phenotype prediction tasks: expression QTL analysis and polygenic risk scores. We also demonstrate that our method can be useful for multiancestry modelling, both by fitting population-specific effect sizes and by more accurately accounting for covariate effects across groups. We additionally find a subset of genes where there is strong evidence that an ancestry-specific approach improves eQTL modelling.

著者: Mathieu Blanchette, E. Layne, S. Zabad, Y. Li

最終更新: 2024-02-17 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.02.14.580313

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.02.14.580313.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

著者たちからもっと読む

類似の記事