新しい技術が特性に対する遺伝的つながりを明らかにする
研究者たちが最新の手法を使って、身長や病気に関する新しい遺伝的つながりを発見したよ。
― 1 分で読む
目次
全ゲノム関連研究(GWAS)は、特定の特徴に関連する遺伝的な違いを見つけるために使われてるんだ。これらの特徴は、例えば身長や心臓病の有無みたいなもの。それに、特定のDNAの部分がどう動くかとか、どれくらい遺伝子が活発かといったもっと複雑な生物学的変化も含まれる。でも、多くのGWAS研究には課題がある。例えば、病気が稀な場合、研究するための十分な人を見つけるのが難しいことがある。
遺伝子研究の新しい方法
最近、研究者たちはグラフ畳み込みニューラルネットワークって呼ばれる高度なコンピュータープログラムをいろんな分野で使い始めてる。一般的な使い方の一つは、過去に買ったものに基づいて商品を提案する推薦システムなんだ。例えば、料理に関する本をよく買う人には、他の料理本を勧めるような仕組み。これらのシステムは、多くのユーザーの行動に基づいてアイテムの詳細な表現を作ることで機能する。
この記事では、同じような技術を遺伝学に応用できる方法について話してる。過去のGWASから得たデータを使って、研究者たちは既存の知識に基づいて病気との新しい遺伝的な関連を特定できるんだ。
アプローチ
研究者たちは、もし二つの遺伝的位置が同じ生物学的特徴に関連しているなら、他の特徴にも関連している可能性があると考えた。特別なプログラムを使って、生物学的特徴に関連する遺伝的変化に関する既存の情報を、病気に関する情報と組み合わせた。
プロセスの検証ステップ
まず、研究者たちは彼らの方法が遺伝的変化と生物学的特徴の関係を効果的に予測できることを示した。これを三つのステップで行った:
- モデルが特定の遺伝的変化がDNAの動きに関連しているかを予測できることを証明した。
- これがRNAの生成方法にも適用できることを確認した。RNAはタンパク質を作るのに重要なんだ。
- 遺伝情報のネットワーク内で特定の遺伝的変化がどれくらい重要かを分析し、病気との関連を見つけた。
身長に関連する新しい遺伝的リンクの発見
彼らのアプローチの信頼性を確立した後、身長に関連する新しい遺伝的位置を見つけることに取り組んだ。発見した26の新しい位置のうち、88%がさらにテストで確認された。比較として、身長に関する既知のゲノム全体において重要なリンクの91%も他の研究で確認されている。
自己報告された病気の調査
研究者たちは、大規模な健康データベースで64種類の自己報告された病気を含めて分析を拡張した。調査した病気の約3分の2に関連する新しい遺伝的位置を少なくともひとつ見つけた。全体として、以前は特定されていなかった新しい遺伝的関連をかなりの数見つけたので、彼らの方法が病気への遺伝的つながりの発見を促進する可能性を示唆している。
遺伝的つながりの重要性
研究者たちは、遺伝的な位置が病気に関連してどれくらい重要かを調べるためにモデルを使った。この重要性を測るために、遺伝的変化が広い遺伝ネットワーク内でどれだけ接続されているかを見る方法を使った。病気に関連する遺伝的変化を似たような遺伝的変化のグループと比較して、重要な違いを見つけた。
これは、いくつかの遺伝的変化が病気に関連して他よりも影響力が強い可能性を示してる。これは病気への遺伝的リンクを理解するために重要で、治療法や予防法を見つける手助けになるかもしれない。
既存の研究の強化
彼らのモデルが意味のある結果をもたらせることを確認した後、研究者たちは身長やさまざまな病気に関連する新しい遺伝的関連を探すのにそれを使った。遺伝的変化がどのように相互作用するかのマップを作って、その知識を利用して各特徴に関連する追加の遺伝的位置を特定した。
身長の研究結果
身長に関する研究で、107の新しい遺伝的な位置を特定した。次に、これらの位置が以前の研究で支持されているかを確認するため、結果を再現することにした。ほぼすべての新しい遺伝的位置の発見が再現できたので、彼らのアプローチが信頼できることを示してる。
病気の分析結果
64の自己報告された病気を評価する際に、研究者たちは以前の研究では見られなかった143の新しい関連を発見した。これは遺伝データのランダムサンプリングに比べて大幅な改善を示していて、彼らのモデルが病気への新しい遺伝的リンクを特定するのに効果的であることを示している。
補強証拠
新しい遺伝的関連を特定した後、研究者たちは別の大規模な健康データセットを見て、彼らの発見を検証しようとした。彼らは、新しい関連のいくつかがこの外部データセットでも重要であることを見つけた。これは、彼らのアプローチが病気への遺伝的リンクに関する貴重な情報を明らかにできるという考えを支持している。
結論
病気への遺伝的リンクを探す研究が増えるにつれて、それに伴う課題も増えていく。この文章で議論された方法は、研究にとって有望な新しい方向を提供する。高度な計算技術と既存の遺伝データを組み合わせることで、研究者たちは病気への遺伝的つながりをより良く発見できるかもしれない。これが、治療の改善や遺伝が健康に果たす役割の理解を深めることに繋がる可能性がある。
要するに、この新しい方法は遺伝学の分野を強化する大きな可能性を示していて、将来の研究に重要な役割を果たすかもしれない。この発見の重要性は、複雑な特徴や病気の遺伝的基盤をより良く理解することへ道を開く手助けをすることにあり、医療科学や公衆衛生におけるブレークスルーに繋がる可能性がある。
タイトル: Leveraging molecular-QTL co-association to predict novel disease-associated genetic loci using a graph convolutional neural network
概要: Genome-wide association studies (GWAS) have successfully uncovered numerous associations between genetic variants and disease traits to date. Yet, identifying significantly associated loci remains a considerable challenge due to the concomitant multiple-testing burden of performing such analyses genome-wide. Here, we leverage the genetic associations of molecular traits - DNA CpG-site methylation status and RNA expression - to mitigate this problem. We encode their co-association across the genome using PinSage, a graph convolutional neural network-based recommender system previously deployed at Pinterest. We demonstrate, using this framework, that a model trained only on methylation quantitative trait locus (QTL) data could recapitulate over half (554,209/1,021,052) of possible SNP-RNA associations identified in a large expression QTL meta-analysis. Taking advantage of a recent saturated map of height associations, we then show that height-associated loci predicted by a model trained on molecular-QTL data replicated comparably, following Bonferroni correction, to those that were genome-wide significant in UK Biobank (88% compared to 91%). On a set of 64 disease outcomes in UK Biobank, the same model identified 143 independent novel disease associations, with at least one additional association for 64% (41/64) of the disease outcomes examined. Excluding associations involving the MHC region, we achieve a total uplift of over 8% (128/1,548). We successfully replicated 38% (39/103) of the novel disease associations in an independent sample, with suggestive evidence for six additional associations from GWAS Catalog. Replicated associations included for instance that between rs10774625 (nearest gene: SH2B3/ATXN2) and coeliac disease, and that between rs12350420 (nearest gene: MVB12B) and glaucoma. For many GWAS, attaining such an enhancement by simply increasing sample size may be prohibitively expensive, or impossible depending on disease prevalence.
著者: Andrew David Bretherick, J. Ng-Kee-Kwong
最終更新: 2024-03-05 00:00:00
言語: English
ソースURL: https://www.medrxiv.org/content/10.1101/2024.03.04.24303678
ソースPDF: https://www.medrxiv.org/content/10.1101/2024.03.04.24303678.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。