ポリジェニックスコア研究の進展
新しいツールやリソースが遺伝的リスク評価や研究を強化してるよ。
― 1 分で読む
大規模な人々の遺伝情報の開発によって、研究者たちは遺伝的な違いと多くの病気や特性を結びつけることができるようになったんだ。この知識は、たくさんの人の遺伝データを一度に見る「全ゲノム関連解析(GWAS)」から得られたものだ。この情報を使って、研究者たちは「多遺伝子リスクスコア(PGS)」っていうスコアを作成できて、これは特定の健康問題に対する個人の遺伝的リスクを推定するものなんだ。このスコアは、誰かが持っている遺伝的変異の数と種類に基づいて計算されるよ。
科学者たちがこれらのスコアを作るためのいろんなツールがあるんだ。有名なものにはPruning+Thresholding、LDpred、PRSC-CSがあるよ。これらのツールは、研究者がどの遺伝的変異を含めるか、そしてその重みをどうするかを選ぶのを助けるんだ。多くの研究者がPGSを使って健康に関する問題を調べたり、臨床現場で健康リスクや治療への反応を予測したりしてるんだ。
PGSカタログは、これらのスコアに関する情報を収集して共有するためのリソースなんだ。研究者が研究を再現したり、スコアを効率的に再利用したりできるようにするんだ。オープンデータベースだから、誰でもアクセスできるよ。カタログには、スコアがどうやって作られたか、異なるグループでの効果、そして新しいサンプルのスコアを計算するために必要なファイルの詳細が含まれてるよ。
PGSカタログは使いやすくて、オンラインで利用できるんだ。去年1年間で、140カ国以上から約27,000人の訪問者が利用したよ。カタログはPGS研究にとって重要で、人口全体の予測を改善するスコアを提供して、研究者が臨床試験で個人にPGSの結果を返すことを可能にしているんだ。
PGSカタログが始まって以来、そのデータは大幅に増加したよ。2024年5月の時点で、618の研究から4,735のPGSスコアが収集されてて、利用可能なデータが急増してるんだ。研究者たちは、機械学習技術を使って適格な研究を系統的に見つけてるよ。多様な祖先背景を含む研究や新しい健康特性を報告している研究を優先しているんだ。
研究者たちは、研究の著者が自分たちの発見をカタログに提供することを強く勧めているよ。彼らは、スコア方法や関連データを含むファイルを提出できて、作業が公開されるまでデータをプライベートに保つオプションもあるんだ。最近、約23%の研究が直接カタログにデータを提出していて、データ共有の改善が進んでいることを示しているよ。
PGSカタログは、さまざまな健康状態を反映するスコアを含めることを目指していて、現在は650以上の異なる健康用語に関連する特性を含んでいるよ。研究者たちは、主にヨーロッパの参加者で作られたスコアは他の背景の人にはうまく働かない可能性があることを理解しているんだ。これに対処するために、カタログは多様な祖先データから作成されたスコアに焦点を当てて拡大してるんだ。
より良いアクセスと利用のための新機能
PGSをデータから計算するプロセスは複雑なことがあるよ。遺伝データをフォーマットしたり、変異を一致させたり、スコアを計算したりするためにいろんなソフトウェアツールを使うから、多くの研究者にとって障壁になることもあるんだ。今のところ、確立されたワークフロー内で簡単に計算できるユーザーフレンドリーなツールは少ないんだ。これを簡単にするために、PGSカタログ計算機っていう新しいツールが開発されたよ。
PGSカタログ計算機は、祖先の違いを考慮しながらPGSを計算するプロセスを簡素化するんだ。ユーザーは大学のサーバーやクラウドプラットフォームなど、さまざまな計算環境で大規模なデータセットを扱えるようになってる。研究者は既存のスコアを選んだり、自分のスコアファイルを入力したりできるよ。結果には要約レポートも含まれてるんだ。
このツールは、効率的にバイオインフォマティクス分析を実行するための人気のあるシステム「Nextflow」に基づいてるよ。Nextflowは複数のプラットフォームを管理できて、標準のソフトウェアコンテナを使用することで再現性を確保するんだ。PGS計算機のチームはこのツールを維持していて、他の開発者からの入力を歓迎するオープンソースのコードベースに貢献しているよ。
計算機は一般的なゲノムフォーマットの入力ファイルを扱えるし、データを迅速に処理できるんだ。スコアファイルの変異を入力データのものと自動的に一致させて、発生する可能性のある一般的な問題にも対処するよ。ツールは計算がどのように導き出されたかを要約した明確なレポートも提供しているんだ。
PGSに関する大きな課題の1つは、スコアが大きく異なることがあって、解釈が難しいことだよ。これに対処する一般的な方法は、母集団の平均に基づいてスコアを標準化することだけど、このアプローチは研究している特定の個人グループに敏感なことがあるんだ。PGSの分布も遺伝的祖先に基づいて異なることがあるよ。
PGSカタログ計算機は、遺伝的祖先に応じてスコアを調整するための確立された方法を使用して、解釈可能性を向上させるんだ。これには、スコアを基準グループと比較したり、祖先の違いに応じて調整するための高度な技術を使ったりすることが含まれるよ。主要な基準グループとして、多様な背景を持つ人々が含まれた大規模なデータセットが使用されているんだ。
PGSを調整する方法は、変異とターゲットデータの重なりを特定することから始まるよ。その後、主成分分析(PCA)が実施されて、個々の遺伝的祖先空間へのマッピングが行われるんだ。このプロセスで、人々が祖先のラベルに基づいて不正確にカテゴライズされることがないようにするんだ。
祖先がはっきりと表現されていない個人の場合、ツールは固定グループのラベルに頼らずに相対的なPGSを計算できるよ。継続的な調整方法は、異なる祖先間のスコアの平均や分散の違いに対処することで、PGS計算の正確性を向上させるんだ。これらの調整は、より正確に遺伝リスクを報告するために臨床試験で既に使用されているよ。
未来を見据えて
ポリジェニックスコアの研究と臨床利用が増えるにつれて、PGSカタログも成長していくよ。さまざまな祖先グループからのPGSスコアと評価の拡大によって、ユーザーがデータをより効果的にナビゲートできる新しい機能や能力が開かれてきたんだ。祖先の多様性を効果的に表現することにコミットしていて、遺伝情報の公平な分析を達成するための作業を進めているよ。
PGSカタログのチームは、データの提出をさらに簡単にするための作業もしているんだ。ユーザーが自分の成果をアップロードできるように自動化されたシステムを開発中で、検証や共有プロセスを簡素化する予定だよ。文書の改善やユーザーへのトレーニングも続けて、PGSへのオープンアクセスの影響を高めるんだ。
PGSカタログ計算機は、PGSの計算が安全で公平であることを確保するのを助けるよ。このツールは、遺伝的祖先に基づいてスコアを調整するための一貫した方法をユーザーに提供するように設計されていて、研究や医療での公正な利用にとって重要なんだ。ソフトウェアは、他の研究と統合しやすい形式でスコアを出力するから、遺伝的素因が健康にどう関連しているかの理解を広げるのを可能にするよ。
現在のPGSカタログ計算機のバージョンは特定の種類のデータに最適化されているけど、将来的には全ゲノムシーケンシングデータへの対応を含める能力を拡大する計画があるんだ。これによって、ユーザーがあらゆるタイプの遺伝データにPGSを効果的に適用できるようになるんだ。
全体として、PGSカタログは研究者や臨床医にとって貴重なリソースで、さまざまな研究や医療研究分野でポリジェニックスコアの利用を支えるための必要なツールを提供しているよ。継続的な改善とコミュニティの貢献を通じて、カタログは適応し成長し続けて、遺伝的リスクの理解を進め、多様な人々の健康成果を改善するのを助けていくんだ。
タイトル: The Polygenic Score Catalog: new functionality and tools to enable FAIR research
概要: Polygenic scores (PGS) have transformed human genetic research and have multiple potential clinical applications, including risk stratification for disease prevention and prediction of treatment response. Here, we present a series of recent enhancements to the PGS Catalog (www.PGSCatalog.org), the largest findable, accessible, interoperable, and reusable (FAIR) repository of PGS. These include expansions in data content and ancestral diversity as well as the addition of new features. We further present the PGS Catalog Calculator (pgsc_calc, https://github.com/PGScatalog/pgsc_calc), an open-source, scalable and portable pipeline to reproducibly calculate PGS that securely democratizes equitable PGS applications by implementing genetic ancestry estimation and score normalization using reference data. With the PGS Catalog & calculator users can now quantify an individuals genetic predisposition for hundreds of common diseases and clinically relevant traits. Taken together, these updates and tools facilitate the next generation of PGS, thus lowering barriers to the clinical studies necessary to identify where PGS may be integrated into clinical practice.
著者: Samuel A Lambert, B. Wingfield, J. T. Gibson, L. Gil, S. Ramachandran, F. Yvon, S. Saverimuttu, E. Tinsley, E. Lewis, S. C. Ritchie, J. Wu, R. Canovas, A. McMahon, L. W. Harris, H. Parkinson, M. Inouye
最終更新: 2024-05-31 00:00:00
言語: English
ソースURL: https://www.medrxiv.org/content/10.1101/2024.05.29.24307783
ソースPDF: https://www.medrxiv.org/content/10.1101/2024.05.29.24307783.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。