がんにおける遺伝子融合の検出技術の進展
新しい技術ががんに関連する遺伝子融合の検出と分析を改善してるよ。
― 1 分で読む
目次
がん細胞は、遺伝子の再配置と呼ばれる変化を持っていることが多く、これが融合遺伝子の形成につながることがあります。これは、2つの異なる遺伝子の部分が結合して新しい遺伝子ができることを指します。時々、これらの変化はがんを成長させる腫瘍促進遺伝子を活性化させたり、がんを防ぐ役割を持つ腫瘍抑制遺伝子を無効にしたりします。
さまざまながんの中で、特定の融合遺伝子が主要な役割を果たすことが知られています。たとえば、BCR::ABL1融合遺伝子は慢性骨髄性白血病(CML)で一般的に見られます。他にも、滑膜肉腫のSS18::SSXや前立腺がんのTMPRSS2::ERGなどの注目すべき例があります。これらの融合遺伝子を理解することは、特に子供において特定のがんを診断するために重要で、特定の融合がマーカーとして機能します。
遺伝子融合ががんにつながる仕組み
遺伝子融合ががんに寄与する方法はいろいろです。一般的なメカニズムの一つは、融合した遺伝子の新しい位置が遺伝子の調節に影響を与え、不適切に発現させることです。また、融合によって機能が変わった新しいタンパク質が生成されることもあります。こうした変化は、正常な細胞の挙動を乱し、がんの特徴である制御されない細胞成長につながることがあります。
これらの遺伝子融合を特定することは、がん研究の重要な部分になってきました。これにより、診断のためのバイオマーカーの発見や、CMLの治療に使われるチロシンキナーゼ阻害剤のようなターゲット治療の開発が進んでいます。
融合遺伝子検出の進展
最近、RNAシーケンシング(RNA-seq)という技術が、遺伝子融合の検出で人気を得ています。RNA-seqは一般的に安価で、遺伝子融合から得られる実際のRNA産物を測定できるため、好まれています。RNA-seqのIlluminaプラットフォームは、がん研究で一般的になりました。
Illumina RNA-seqからのデータを分析するために、多くの計算手法が開発され、がんおよび正常組織における融合遺伝子に関する重要な発見につながっています。がんにおける融合は通常、ゲノムの再配置によるもので、正常組織に見られるものはスプライシングや自然な遺伝的変異などのプロセスによるものであることが多いです。
短いリード検出の限界
RNA-seqの進展にもかかわらず、RNAリードの短さはその有効性を制限することがあります。短いリードは融合トランスクリプトの完全な構造を捉えられないことがあり、完全な配列を再構築するために追加の方法が必要になります。
さらに、RNA分子の特定の部分に焦点を当てた標準のRNA-seq手法は、融合ブレイクポイントに関する重要な情報を見逃す可能性があります。ここで、新しい技術であるロングリードシーケンシングが登場します。
ロングリードシーケンシング技術
PacBioやOxford Nanoporeが提供するロングリードシーケンシング技術の最近の進展により、RNA分子全体のシーケンシングが可能になりました。これにより、融合遺伝子やそのトランスクリプトの完全なシーケンスを取得する新しい可能性が広がります。
当初、これらのロングリード技術はいくつかの課題に直面し、スループットが低かったりエラー率が高かったりしました。しかし、技術の向上により、より正確な結果が得られるようになり、がん研究での遺伝子融合の詳細な調査に適したものとなりました。
CTAT-LR-Fusion: 融合検出のための新しいツール
ロングリードからの融合検出を改善する必要性に応じて、CTAT-LR-fusionというツールが開発されました。このツールは、がんトランスクリプトームを分析するための大きなフレームワークの一部です。CTAT-LR-fusionは、ロングリードRNA-seqのために特に設計され、キメラリードの検出、融合トランスクリプトの特定、発現の定量、結果の視覚化などのさまざまな機能を提供します。
効果的に機能することを確保するために、研究者たちはさまざまなシーケンシング技術やエラー率を模倣した包括的なデータセットを作成しました。また、ツールの正確性を検証するためにがん細胞株を使用した実験も行いました。
CTAT-LR-Fusionの性能評価
CTAT-LR-fusionの性能は、シミュレーションデータと実データを使用して既存のツールと比較されました。その結果、融合トランスクリプトを正確に特定する強力な結果を示し、融合遺伝子の正しい順序や方向性を報告する点で他の方法を上回りました。
実際のがん細胞株に適用したところ、CTAT-LR-fusionは従来の短リードRNA-seq手法よりも多くの融合トランスクリプトを検出できました。この結果は、ロングリードががんに存在する融合の複雑さや多様性をより深く理解できることを示しています。
単一細胞トランスクリプトミクスにおける応用
遺伝子融合が単一細胞レベルでどのように振る舞うかを研究するのは重要な分野です。個々の細胞を分析する能力は、腫瘍の異質性や融合の生物学的影響についての洞察を提供します。CTAT-LR-fusionを使用して、研究者は腫瘍サンプルを分析し、さまざまな融合遺伝子を特定しました。
T細胞が浸潤したメラノーマのサンプルでは、ツールが癌細胞の高い割合で存在する特定の融合遺伝子を特定するのを助けました。これは、ロングリードシーケンシングとCTAT-LR-fusionががんに関連する重要な遺伝情報を明らかにする可能性を示しています。
課題と今後の方向性
研究が進むにつれて、いくつかの課題が残っています。多様ながんタイプでの融合検出のさらなる検証や、ロングリードと短リードのシーケンシングプラットフォームからのデータ統合が重要です。
シーケンシング技術の急速な進展に伴い、遺伝子融合の検出と分析方法の最適化が今後の焦点となるでしょう。これには、検出ツールの感度や特異度の向上、さまざまながんにおける融合の生物学的影響の全範囲を探求することが含まれます。
結論
がんにおける融合遺伝子の研究は、常に進化しているダイナミックな分野です。CTAT-LR-fusionのような新しい技術やツールは、これらの重要な遺伝的変化を特定して分析する能力を高めます。遺伝子融合ががんにおいて果たす役割についてさらに学ぶことで、患者の予後を改善するためのパーソナライズド医療アプローチに近づいています。
ロングリードシーケンシングをがん研究に統合することの可能性は、新しいバイオマーカーの発見や、より効果的な治療法の開発に大きな可能性を秘めています。これらの進展を探求し続けることで、がんの診断と治療の未来が変わるかもしれません。
タイトル: CTAT-LR-fusion: accurate fusion transcript identification from long and short read isoform sequencing at bulk or single cell resolution
概要: Gene fusions are found as cancer drivers in diverse adult and pediatric cancers. Accurate detection of fusion transcripts is essential in cancer clinical diagnostics, prognostics, and for guiding therapeutic development. Most currently available methods for fusion transcript detection are compatible with Illumina RNA-seq involving highly accurate short read sequences. Recent advances in long read isoform sequencing enable the detection of fusion transcripts at unprecedented resolution in bulk and single cell samples. Here we developed a new computational tool CTAT-LR-fusion to detect fusion transcripts from long read RNA-seq with or without companion short reads, with applications to bulk or single cell transcriptomes. We demonstrate that CTAT-LR-fusion exceeds fusion detection accuracy of alternative methods as benchmarked with simulated and real long read RNA-seq. Using short and long read RNA-seq, we further apply CTAT-LR-fusion to bulk transcriptomes of nine tumor cell lines, and to tumor single cells derived from a melanoma sample and three metastatic high grade serous ovarian carcinoma samples. In both bulk and in single cell RNA-seq, long isoform reads yielded higher sensitivity for fusion detection than short reads with notable exceptions. By combining short and long reads in CTAT-LR-fusion, we are able to further maximize detection of fusion splicing isoforms and fusion-expressing tumor cells. CTAT-LR-fusion is available at https://github.com/TrinityCTAT/CTAT-LR-fusion/wiki.
著者: Brian J. Haas, Q. Qin, V. Popic, H. Yu, E. White, A. Khorgade, A. Shin, K. Wienand, A. Dondi, N. Beerenwinkel, F. Vazquez, A. M. AlKhafaji
最終更新: 2024-02-28 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.02.24.581862
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.02.24.581862.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。
参照リンク
- https://github.com/TrinityCTAT/CTAT-LR-fusion/wiki
- https://github.com/TrinityCTAT/ctat-minimap2
- https://github.com/TrinityCTAT/CTAT-LR-fusion
- https://github.com/Oshlack/JAFFA
- https://github.com/PacificBiosciences/pbfusion/releases
- https://github.com/Maggi-Chen/FusionSeeker
- https://github.com/WGLab/LongGF
- https://github.com/broadinstitute/CTAT-LRF-Paper/tree/main/0.Workflows_and_Dockers
- https://data.broadinstitute.org/Trinity/CTAT_FUSIONTRANS_BENCHMARKING/on_simulated_data/simulated_fusion_transcript_sequences/
- https://ndownloader.figshare.com/files/27676470
- https://github.com/PacificBiosciences/ccs
- https://github.com/yukiteruono/pbsim3/issues/12
- https://github.com/MethodsDev/pbsim3
- https://github.com/fusiontranscripts/LR-FusionBenchmarking
- https://github.com/broadinstitute/CTAT-LRF-Paper
- https://zenodo.org/records/10650516