Simple Science

最先端の科学をわかりやすく解説

# 生物学# 遺伝学

PSAP-ゲノム領域を使った希少疾患の診断の進展

新しい方法が希少疾患の遺伝子変異の特定を改善する。

― 1 分で読む


希少疾患診断の新しい方法希少疾患診断の新しい方法のための変異同定を強化する。PSAP-ゲノム領域は、まれな遺伝的状態
目次

希少疾患は少数の人々に影響を与える状態だよ。でも、その珍しさにもかかわらず、これらの病気は世界中で約3億5千万の人に影響を及ぼしているんだ。これらの希少疾患の多く、約80%は遺伝的原因があって、つまり親から受け継いだ遺伝子の変化によって引き起こされるんだ。多くの希少疾患は、メンデル遺伝のパターンに従っていて、単一の遺伝子変化が特定の病気につながることがあるんだ。

診断の課題

希少疾患の診断での最大の課題の一つは、半数以上のケースで基礎となる分子原因が不明なままってことだ。これは主に、希少疾患の多くが複雑な遺伝的構成を持っていて、影響を受けた人それぞれがユニークな遺伝子変化を持っているからなんだ。この状況は「n-of-one」問題と呼ばれているよ。

科学と技術が進む中、全エクソームシーケンシング(WES)や全ゲノムシーケンシング(WGS)などの方法がクリニックで一般的なツールになってきたんだ。これらの方法は、研究者や医療専門家が個人の全ての遺伝物質を調べて希少疾患の潜在的な原因を見つけることを可能にする。しかし、このプロセスは、各人のDNAに見つかる希少な遺伝子変化の数の多さによって複雑になることがある。病気の原因は、多くの希少な変化の中に埋もれていて、どの変異がその状態に責任があるのかを特定するのが難しいんだ。課題は、これらの変異の中から有害なものと無害なものを区別することにあるよ。

人口サンプリング法(PSAP

個人の有害な遺伝子変異を特定する問題に対処するために、人口サンプリング法(PSAP)という方法が作られたんだ。PSAPは、一般集団において病気に寄与する可能性のある変化を見つける確率に基づいて、各遺伝子の統計的な指標を計算することで機能する。この方法は、どの変異をさらに調査するかを優先する方法を提供するよ。

PSAPの最初のバージョンであるPSAP-genesは、不妊症や妊娠喪失など、さまざまな状態の変異を特定するのに役立ってきた。しかし、この方法は遺伝子のコーディング領域だけを見ているから、全ゲノムのほんの一部に過ぎないんだ。特に希少疾患に関わる重要な遺伝子変化は、遺伝子を直接コードしていない非コーディング領域で発生するんだけど、これらは遺伝子機能に影響を与えることがあるんだ。

遺伝子を超えた拡大:非コーディング領域の重要性

研究によると、非コーディング変異は希少疾患の発生に重要な役割を果たす可能性があるんだ。これには、これらの非コーディング領域において遺伝的関連が見つかった多くの研究が裏付けている。また、非コーディング領域は遺伝子発現を調整する上で重要で、遺伝子がオンまたはオフになるタイミングや方法を制御するのに役立つんだ。

それにもかかわらず、既存の多くの方法は非コーディング領域の変異を有効に評価する能力が不足しているんだ。これらのツールのほとんどは、病気についての広範な先行知識を必要とし、通常は候補遺伝子にのみ焦点を当てるため、多くの関連性のある変異を見逃すことがあるよ。

PSAP-ゲノム領域の導入

PSAP-genesの限界に対処するために、PSAP-ゲノム領域と呼ばれる新しいアプローチが開発された。これは、コーディングおよび非コーディング領域の両方を含めるようにPSAPメソッドを拡張したものなんだ。機能的な重要性に基づいた事前定義されたゲノム領域を使用することで、この方法はより広範な変異を分析できるようになっているよ。

この新しい戦略は、CADD領域と呼ばれる事前定義された領域を利用する。これらは、高機能かつ高病原性の変異が欠如している特性を持つゲノムの領域なんだ。これらの領域を使うことで、研究者は個々のゲノム内の変異を優先順位付けするために、より情報量が多く関連性のある統計的指標を作成できるようになるんだ。

Easy-PSAPの役割

Easy-PSAPは、PSAP-ゲノム領域法を取り入れたツールだよ。このツールは、研究者にヌル分布を生成する手段を提供する。これって、どの遺伝子変異が重要で病気に寄与する可能性があるかを特定するのに重要なんだ。このツールは、更新された遺伝データを使って、変異の頻度や既知の病原性スコアに基づいて潜在的な有害性を評価するんだ。

PSAP-ゲノム領域の評価

PSAP-ゲノム領域の有効性は、実際の遺伝的シナリオを模倣した人工疾患モデルを使って評価されたよ。この評価では、一般集団のゲノムデータに既知の病原性変異を導入して、PSAP-ゲノム領域がどれだけそれを特定できるかを見たんだ。

非コーディング病原性変異を評価した際の結果は、PSAP-ゲノム領域を使うことで、伝統的な病原性スコアのみに基づく方法よりも大幅に優れた結果を示した。この新しい方法は、さまざまなモデル条件で有害な変異を特定する際の精度が高いことを示したんだ。

非コーディング変異の優先順位付け

非コーディング変異を評価したある研究では、PSAP-ゲノム領域が病原性変異を常に最上位候補の中にランク付けしていて、病原性スコアのみを使用するよりもはるかに効果的だったことがわかったよ。特に、上位にランクされた変異を見たときの改善は顕著で、非コーディング領域を分析する能力が重要な遺伝子変化を特定する範囲を広げることを示しているんだ。

スプライシング変異:重要な焦点

非コーディング変異の中でも、スプライシングに関連するものは特に注目に値するんだ。スプライシング変異は、遺伝子産物の作成方法に影響を与える可能性があり、健康に大きな影響を及ぼすことがある。評価の結果、スプライシング変異はPSAP-ゲノム領域-ACSスコアリングシステムの下でうまく機能することがわかり、この方法の強みに焦点を当てた重要な遺伝子変化を特定する能力を強調したんだ。

PSAP-ゲノム領域の実データへの影響

PSAP-ゲノム領域の有用性をさらに示すために、研究者たちは既知の遺伝性疾患を持つ患者からの実データにこの方法を適用したんだ。あるシナリオでは、脳小血管病(CSVD)に関与するすべての病因変異が、PSAP-ゲノム領域を使用してトップ100にランク付けされた。この優先順位の付け方は、診断や治療のために調査すべき変異を絞り込むために医療従事者にとって重要なんだ。

男性不妊に関する別の研究でも、特定された変異がPSAP-ゲノム領域によっても大幅に優先されていた。これにより、医療従事者にとって調査すべき重要な候補者のリストが得られ、さまざまな条件やタイプの遺伝子変異に対するアプローチの適応性を示したんだ。

従来の方法に対する利点

PSAP-ゲノム領域の大きな利点は、コーディング領域に制限されずに全ゲノムを評価できることなんだ。この柔軟性により、病気の発生に寄与する可能性のある変異のより包括的な分析が可能になる。特定の条件に関与する遺伝子についての先行知識を必要としないから、さまざまな遺伝性疾患に広く適用できるんだ。

比較分析では、全ゲノムシーケンシングで特定されたコーディング変異に対しても、PSAP-ゲノム領域が貴重な洞察を提供できることがわかった。コーディング変異に対して元のPSAP-genesアプローチを上回ることはなかったけど、患者の遺伝的背景の文脈に基づいて候補を優先するのに役立つ有用な情報をもたらしたんだ。

PSAP-ゲノム領域の将来の方向性

PSAP-ゲノム領域のさらなる発展には多くの機会があるよ。今後の改善には、挿入や欠失などの追加の遺伝子変化を取り入れたり、大規模なゲノム変異の影響を調べたりすることが含まれるかもしれない。また、プロテオミクスやメタボロミクスなどのオミクス解析の結果が、関連性のある変異のスコアリングや特定をどう向上させるかを研究者たちは考えているんだ。

現行の方法の一つの限界は、遺伝子変異を評価するために使用されるスコアリングシステムにあるよ。病原性変異をランク付けする際のCADDスコアの有効性は変異によって異なることがある、特に非コーディング変化についてはね。規制アノテーションの進展を含めて、スコアリングシステムの継続的な更新は、PSAP-ゲノム領域の今後のバージョンを向上させることを約束しているんだ。

結論

要するに、PSAP-ゲノム領域は遺伝子変異優先付けの分野での重要な進展を示しているよ。コーディング領域の制約を超えて、ゲノム全体の機能的に関連する領域を利用することで、この方法は希少疾患における病原性変異を効果的に特定する能力を強化しているんだ。このアプローチの継続的な検証と洗練は、希少疾患の診断や遺伝的基盤の理解を改善し、影響を受ける人々に対する治療オプションや結果を向上させる道を開いているんだ。

オリジナルソース

タイトル: PSAP-genomic-regions: a method leveraging population data to prioritize coding and non-coding variants in whole genome sequencing for rare disease diagnosis

概要: The introduction of next generation sequencing technologies in the clinics has improved rare disease diagnosis. Nonetheless, for very heterogeneous or very rare diseases, more than half of cases still lack molecular diagnosis. Novel strategies are needed to prioritize variants within a single individual. The PSAP (Population Sampling Probability) method was developed to meet this aim but only for coding variants in exome data. To address the challenge of the analysis of non-coding variants in whole genome sequencing data, we propose an extension of the PSAP method to the non-coding genome called PSAP-genomic-regions. In this extension, instead of considering genes as testing units (PSAP-genes strategy), we use genomic regions defined over the whole genome that pinpoint potential functional constraints. We conceived an evaluation protocol for our method using artificially-generated disease exomes and genomes, by inserting coding and non-coding pathogenic ClinVar variants in large datasets of exomes and genomes from the general population. We found that PSAP-genomic-regions significantly improves the ranking of these variants compared to using a pathogenicity score alone. Using PSAP-genomic-regions, more than fifty percent of non-coding ClinVar variants, especially those involved in splicing, were among the top 10 variants of the genome. In addition, our approach gave similar results compared to PSAP-genes regarding the scoring of coding variants. On real sequencing data from 6 patients with Cerebral Small Vessel Disease and 9 patients with male infertility, all causal variants were ranked in the top 100 variants with PSAP-genomic-regions. By revisiting the testing units used in the PSAP method to include non-coding variants, we have developed PSAP-genomic-regions, an efficient whole-genome prioritization tool which offers promising results for the diagnosis of unresolved rare diseases. PSAP-genomic-regions is implemented as a user-friendly Snakemake workflow, accessible to both researchers and clinicians which can easily integrate up-to-date annotation from large databases. Author summaryIn recent years, improvement in DNA sequencing technologies has allowed the identification of many genes involved in rare diseases. Nonetheless, the molecular diagnosis is still unknown for more than half of rare diseases cases. This is in part due to the large heterogeneity of molecular causes in rare diseases. This also highlights the need for the development of new methods to prioritize pathogenic variants from DNA sequencing data at the scale of the whole genome and not only coding regions. With PSAP-genomic-regions, we offer a strategy to prioritize coding and non-coding variants in whole-genome data from a single individual in need of a diagnosis. The PSAP-genomic-regions combines information on the predicted pathogenicity and frequency of variants in the context of functional regions of the genome. In this work, we compare the PSAP-genomic-regions strategy to other variant prioritization strategies on simulated and real data. We show the better performance of PSAP-genomic-regions over a classical approach based on variant pathogenicity scores alone. PSAP-genomic-regions provides a straightforward approach to prioritize causal pathogenic variants, especially non-coding ones, that are often missed with other strategies and could explain the cause of undiagnosed rare diseases.

著者: Marie-Sophie Ogloblinsky, O. Bocher, C. Aloui, A.-L. Leutenegger, O. Ozisik, A. Baudot, E. Tournier-Lasserve, H. Castillo-Madeen, D. Lewinsohn, D. F. Conrad, E. Genin, G. Marenne

最終更新: 2024-02-13 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.02.13.580050

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.02.13.580050.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

著者たちからもっと読む

類似の記事