Simple Science

最先端の科学をわかりやすく解説

# 健康科学# 遺伝学・ゲノム医学

希少疾患におけるトランスクリプトミクスへのリファレンスゲノム選択の影響

研究は、遺伝子発現分析における参照ゲノムの選択の重要性を強調している。

― 1 分で読む


ゲノムの選択が希少疾患の研ゲノムの選択が希少疾患の研究に影響を与えるてめっちゃ重要。参照ゲノムの選択は、正確な病気診断にとっ
目次

トランスクリプトミクスは、異なる条件、特に病気における遺伝子の発現を研究するための方法なんだ。このアプローチは、研究者が特定の病気がどう発生するか、またどう診断できるかを理解するのに役立つ。でも、この研究の重要な部分にはリファレンスゲノムを使うことが含まれていて、これは人間のゲノムの「地図」として機能するもので、比較の基準になるんだ。hg19、hg38、CHM13など、異なるバージョンのリファレンスゲノムが存在して、それぞれがトランスクリプトミック研究の結果に影響を与えて、遺伝子発現の解釈にもばらつきが出るんだ。

リファレンスゲノム選択の重要性

正しいリファレンスゲノムを選ぶのは、正確なデータ分析にとって超大事。ゲノムアノテーション、つまり遺伝子のラベルや説明の違いについてはよく文書化されてるけど、異なるリファレンスゲノムを使うことから生じる変動についてはあんまり理解されてないんだ。多くの研究室は古いバージョン(たとえばhg19)に頼ってることが多くて、新しいバージョンに切り替えるのは時間とリソースがかかっちゃうからなんだ。この依存は特に、診断に正確な情報が必要な稀な病気の分析をする上で課題になるんだ。

研究の概要

異なるリファレンスゲノムが遺伝子発現の結果にどう影響するかを知るために、包括的な研究が行われた。研究者たちは、稀な病気の患者とその家族のサンプルからトランスクリプトームデータを集めて、hg19、hg38、CHM13の選択が結果にどう影響を与えたのかを調べた。特に、稀で未診断の病気を診断する際に、ゲノム選択がどれだけ重要かを強調することを目指してたんだ。

コホートとサンプル

この研究では、稀な病気の患者とその影響を受けていない家族メンバーを含む316人から386サンプルを分析した。サンプルは血液、皮膚細胞、筋肉など、さまざまなソースから得られた。各サンプルは同様に処理されて、異なるゲノムビルドにアラインされて、一貫性が確保されたんだ。

方法論

研究者たちは、異なるビルドでの遺伝子の発現を調べた。これには、異なる方法で定量化された遺伝子や特定のゲノムバージョンにしか見られない遺伝子をチェックすることが含まれてた。彼らは幅広いサンプルを調べ、異なるリファレンスゲノムを使った分析への影響を文書化したんだ。

遺伝子発現変化に関する主要な発見

研究者たちは、使用するリファレンスゲノムによって多くの遺伝子が異なる発現を示すことを見つけた。彼らは、これらの変化によって差次的発現を持つ何千もの遺伝子を特定した。特に、ある遺伝子は一つのビルドでしか検出できなかったり、別のビルドでは著しく異なる発現レベルを示したりしてた。この変動は、トランスクリプトームデータを解釈する際にリファレンスゲノム選択がいかに重要かを強調しているんだ。

ビルド間のアノテーションの一貫性

遺伝子アノテーションは、遺伝子の構造と機能を説明するものなんだけど、この研究ではhg19、hg38、CHM13ビルド間でのアノテーションの一貫性を比較した。多くの遺伝子が異なるビルド間で同じアノテーションを持っていることがわかったけど、一部には発現解釈に影響を与える可能性のある変動が見られた。

マルチマッピングリードの影響

サンプルを分析したところ、リード、つまりRNAの配列が異なってゲノムにマッピングされたことがわかった。CHM13アライメントは、hg19やhg38に比べて未マッピングのリードが多く出た。この不一致は、特に複雑な遺伝子領域で遺伝子発現を正確に定量化する能力に影響を与える可能性があるんだ。

差次的定量化分析

研究者たちは統計的方法を使って、異なるゲノムビルドを比較する際に発現推定に顕著な違いを示した遺伝子を特定した。彼らは、何百もの遺伝子の差次的定量化を見つけて、これらの変化を各リファレンスゲノムにおける既知のゲノム問題に関連づけたんだ。

稀な病気の診断への影響

この研究は、間違ったリファレンスゲノムを使用することで、特に稀な病気の場合に誤診が起こる可能性があることを示唆している。特定の状態を理解するために重要な遺伝子が検出されないか、選ばれたゲノムビルドによって異常な発現に見えることがある。たとえば、特定の遺伝子は知られている障害に関連していて、特定のリファレンスゲノムを使用することでしか識別できなかった。

アノテーション特異的遺伝子の要約

研究者たちは、ゲノムビルド間でアノテーションが異なる相当数の遺伝子を特定した。これは、特定の遺伝子があるゲノムでは発現しているが別のゲノムでは発現していないことを意味していて、結果を解釈する際には注意が必要ということを示している。一部のアノテーション特異的遺伝子は知られている病気と関連しているけど、多くは問題のあるゲノム領域と重なっていて、さらに複雑な結果を引き起こす可能性があるんだ。

ビルド排他的発現

特定の遺伝子は、一つのゲノムだけで発現が検出された。このビルド排他的な遺伝子の多くは、正確なシーケンシングとマッピングが難しいことが知られているゲノム領域に関連していた。だから、研究者はこれらの遺伝子から得られる結果を解釈する際には慎重にすべきだってアドバイスしてるんだ。

アウトライヤー検出と臨床的関連性

異なるビルド間で異常に高いまたは低い発現を持つ遺伝子、つまりアウトライヤーを検出する能力が探られた。アウトライヤーの検出は、病気に寄与するかもしれない候補遺伝子を特定するのに重要なんだ。研究では、アウトライヤーのステータスはビルド間で比較的一貫していることがわかったけど、いくつかの遺伝子には違いがあって、それが稀な病気の文脈でのさらなる研究に影響を与えるんだ。

結論:課題と推奨事項

この研究は、特に臨床の場でのトランスクリプトミクス研究において正しいリファレンスゲノムを選ぶことの重要性を強調している。結果は、異なるゲノムビルドを使うことで遺伝子発現結果に大きな変化が生じることを示している。研究者は、特に稀で未診断の病気にとって、どのゲノムビルドが特定の研究目標に最も適しているかを徹底的に評価することを推奨している。ゲノム選択がデータ解釈にどう影響するかを理解することは、診断精度を向上させ、病気のメカニズムに関する知識を進めるために重要なんだ。

結局、トランスクリプトミクスは稀な病気の診断に大きな影響を与える可能性がある。でも、研究者は自分たちのリファレンスゲノムの選択が遺伝子発現や病気の関連性について最も正確な結論を導くために、その影響を慎重に考慮する必要があるんだ。

オリジナルソース

タイトル: Impact of genome build on RNA-seq interpretation and diagnostics

概要: Transcriptomics is a powerful tool for unraveling the molecular effects of genetic variants and disease diagnosis. Prior studies have demonstrated that choice of genome build impacts variant interpretation and diagnostic yield for genomic analyses. To identify the extent genome build also impacts transcriptomics analyses, we studied the effect of the hg19, hg38, and CHM13 genome builds on expression quantification and outlier detection in 386 rare disease and familial control samples from both the Undiagnosed Diseases Network (UDN) and Genomics Research to Elucidate the Genetics of Rare Disease (GREGoR) Consortium. We identified 2,800 genes with build-dependent quantification across six routinely-collected biospecimens, including 1,391 protein-coding genes and 341 known rare disease genes. We further observed multiple genes that only have detectable expression in a subset of genome builds. Finally, we characterized how genome build impacts the detection of outlier transcriptomic events. Combined, we provide a database of genes impacted by build choice, and recommend that transcriptomics-guided analyses and diagnoses are cross-referenced with these data for robustness.

著者: Stephen B Montgomery, R. A. Ungar, P. C. Goddard, T. D. Jensen, F. Degalez, K. S. Smith, C. A. Jin, Undiagnosed Diseases Network, D. E. Bonner, J. A. Bernstein, M. T. Wheeler

最終更新: 2024-01-12 00:00:00

言語: English

ソースURL: https://www.medrxiv.org/content/10.1101/2024.01.11.24301165

ソースPDF: https://www.medrxiv.org/content/10.1101/2024.01.11.24301165.full.pdf

ライセンス: https://creativecommons.org/licenses/by-nc/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。

著者たちからもっと読む

類似の記事