WarpDemuXによるRNAシーケンシングの進展
新しい方法がRNAシーケンシングの精度と効率を向上させる。
Max von Kleist, W. van der Toorn, P. Bohn, W. Liu-Wei, M. Olguin-Nava, R. P. Smyth
― 1 分で読む
目次
ナノポア直接RNAシーケンシング(dRNA-seq)は、RNAを研究するための進んだ方法だよ。従来のRNAシーケンシングはRNAをcDNAに変換してからやるけど、dRNA-seqはRNAを直接測定するんだ。この方法だと、研究者たちは異なるRNAの形や特徴、たとえばポリアデニル化尾の長さを特定できる。RNAを自然な状態で保つことで、RNAに起こる複雑な修飾、エピトランスクリプトームについて新しい洞察が得られるんだ。
マルチプレックスとは?
マルチプレックスは、複数のサンプルを一緒にまとめて同時にシーケンスする一般的な技術だよ。これにより、コストを下げたり、実験の変動を減らしたりできる。マルチプレックスでは、各サンプルに特有の「バーコード」が付けられて、解析段階で識別できるようにされるんだ。DNAシーケンシングには確立されたマルチプレックスのプロトコルがあるけど、dRNA-seq専用の商業的な方法はまだないんだ。
dRNA-seqのマルチプレックスにおける課題
ナノポアシーケンシングのマルチプレックスは、技術の特性から複雑なんだ。個々のRNA分子は、膜内の小さな開口部(ナノポア)を通り抜けさせられる。分子が通過すると、その特徴を反映した電流の流れを妨げる。これは、初期準備中にサンプルに結びつけられたモータータンパク質によって制御されるんだ。この独特のプロセスやRNAの移動速度の変動のために、電気信号を正確なRNA配列に戻すのが難しいんだ。
DNAシーケンシングでは、バーコードがDNAアダプターに組み込まれていて、シーケンサーが簡単に読み取れるようになってるけど、dRNA-seqではアダプターにDNAとRNAの成分が含まれていて、各サンプルを特定するバーコードの読み取りが難しくなってる。RNA自体にRNAバーコードを付けるという解決策も考えられるけど、準備中に複雑さや潜在的なエラーが増えるんだ。
また、研究者はDNAアダプターの一部としてバーコード配列を設計できる。この方法だと、原始的な電気信号を使ってどのサンプルがどれかを識別できるんだ。「DeePlexiCon」という手法がこれらのバーコードを分類するために開発されたけど、たくさんの計算能力が必要で、効率が悪くなるんだ。
WarpDemuXの紹介
これらの課題に対処するために、WarpDemuXという新しい方法が開発された。これは、dRNA-seqのバーコードを特定して検出するプロセスを簡素化するツールなんだ。WarpDemuXは電気信号に直接働きかけて、基盤呼び出し(生の信号をヌクレオチド配列に変換するプロセス)を回避してるんだ。
WarpDemuXは、バーコードを分類するために迅速な機械学習システムを利用してる。デザインは、信号パターンに明確な違いがある12のユニークなバーコードセットを作ることに焦点を当てていて、正確な特定が可能なんだ。さらに、WarpDemuXはdRNA-seqデータのリアルタイム処理とサンプル固有の適応サンプリングを可能にして、シーケンシング中のサンプルの扱い方を管理するのを助けるんだ。
精度とスピードの重要性
バーコードを高い精度とスピードで分類できる能力は、dRNA-seqには欠かせないんだ。目標は、データの整合性を保ちながら、効率的でコスト効果の高いマルチプレックス方法を作ることなんだ。バーコードをDNAアダプター内に配置することで、WarpDemuXはライブラリ準備プロセスを簡素化してるんだ。
この方法は、動的時間ワーピング(DTW)というアルゴリズムを採用していて、変動する可能性のある時間ベースの信号を比較するのを助けるんだ。これにより、WarpDemuXはナノポア信号に固有の変動を管理するのに適してるんだ。この新しいシステムは、DTWを使って類似性を評価し、サポートベクターマシン(SVM)を使ってバーコードを分類する。
バーコード分類器のトレーニングは、特別に設計されたRNA分子を使って行ったんだ。これらの分子は、既知のバーコードで慎重に構築されて、さまざまな信号パターンを反映したトレーニングデータセットを作成するんだ。これらの信号を分析することで、WarpDemuXは新しいサンプルをより正確に分類する方法を学ぶんだ。
WarpDemuXのパフォーマンス
テストでは、WarpDemuXは既存の方法と比べて優れたパフォーマンスを示したんだ。サンプルを特定する精度が高く、必要なトレーニングデータも少なかった。大きな利点は、リードを早く処理できることだから、サンプルを大きな遅延なく分析できるんだ。この機能は、迅速な結果が必要な環境で特に役立つんだ。
さらに、このシステムはサンプルの扱いにバランスを持たせることができる。シーケンシング中、あるサンプルが他よりもかなり豊富に存在する場合、WarpDemuXはそのサンプルからのリーディングを拒否して、全てのサンプルのカバレッジをより均等に保つことができる。この適応サンプリングアプローチは、効率を高めるだけでなく、データの質を最大化するんだ。
実際のアプリケーション:SARS-CoV-2の分析
その効果を示すために、WarpDemuXはCOVID-19の原因であるSARS-CoV-2の研究に使われたんだ。研究者たちは、感染細胞からRNAを収集して、非感染のコントロールと比較したんだ。RNAはWarpDemuXバーコードでタグ付けされ、単一のプラットフォームでシーケンシングされて、複数のサンプルを同時に分析できるようになったんだ。
このアプローチにより、各ウイルス変異体から生成されるRNAに時間経過による有意な違いが見られたんだ。適応サンプリング機能は、分析中に豊富でないサンプルにも適切な注意を払うのを助け、ウイルスの挙動についてより包括的な理解を可能にしたんだ。
RNAの特徴に関する観察
ウイルスサンプルを特定して分類するだけでなく、この方法は、感染細胞内でのウイルスの挙動についての洞察も提供したんだ。研究者たちは、特定の時間間隔での異なるRNAタイプの豊富さを測定することで、ウイルスの成長と複製のダイナミクスを追跡できたんだ。
さらに、WarpDemuXはRNAのポリアデニル化尾の長さの分析も可能にした。この長さは、RNA分子がどのように機能し、ウイルス感染中にどのように調節されるかに影響を与えるから重要なんだ。結果は、感染細胞からのRNAとウイルス自身に見られるRNAのポリアデニル化尾の長さに違いがあることを示したんだ。
バーコードカバレッジのバランス
WarpDemuXの重要な機能の一つは、データ内の異なるバーコードの表現をバランスさせる能力なんだ。これは、システムが分類に基づいてどのリードを保持するかをリアルタイムで判断する「適応サンプリング」と呼ばれる方法で達成されてる。
シーケンシング中に豊富でないサンプルに焦点を当てることで、WarpDemuXは使用可能なリードの数を最大化し、全体のデータセットの質を向上させるんだ。このリアルタイムの調整は、時間を節約するだけでなく、得られた結果の科学的価値を高めるんだ。
RNAシーケンシングの今後
dRNA-seqは可能性を示しているけど、現在のマルチプレックス技術の複雑さから広く使われていないんだ。WarpDemuXの導入で、研究者たちは効率的な分析を促進し、RNAやその修飾の研究に新しい可能性を切り開く強力なツールを手に入れたんだ。
WarpDemuXの精度、スピード、適応性は、RNA研究をより一層信頼性の高いものにするんだ。RNAシーケンシング技術が進化し続ける中で、WarpDemuXのようなツールは、トランスクリプトミクスや関連分野の研究を進展させる上で重要な役割を果たすと思うよ。
結論
ナノポア直接RNAシーケンシングは、RNAをその自然な状態で調べる有望なアプローチだよ。マルチプレックスを通じて、研究者たちは一度の実行で複数のサンプルを分析できて、時間とリソースを節約してるんだ。WarpDemuXのような方法の開発は、この分野において重要なステップを示していて、効率的なバーコード分類と適応サンプリングを可能にしてる。
複雑なデータセットを処理し、迅速に信頼できる結果を出す能力を持つWarpDemuXは、RNA研究の未来のイノベーションの基盤を築くんだ。これらの技術を引き続き改善することで、科学者たちはRNAの複雑さやその生物学的プロセスへの影響をより深く調査できるようになるんだ。
タイトル: Demultiplexing and barcode-specific adaptive sampling for nanopore direct RNA sequencing
概要: Nanopore direct RNA sequencing (dRNA-seq) enables unique insights into (epi-)transcriptomics. However, applications are currently limited by the lack of accurate and cost-effective sample multiplexing. We introduce WarpDemuX, an ultra-fast and highly accurate adapter-barcoding and demultiplexing approach. WarpDemuX enhances speed and accuracy by fast processing of the raw nanopore signal, use of a lightweight machine-learning algorithm and design of optimized barcode sets. We demonstrate its utility by performing a rapid phenotypic profiling of different SARS-CoV-2 viruses, crucial for pandemic prevention and response, through multiplexed sequencing of longitudinal samples on a single flowcell. This identifies systematic differences in transcript abundance and poly(A) tail lengths during infection. Additionally, integrating WarpDemuX into sequencing control software enables real-time enrichment of target molecules through barcode-specific adaptive sampling, which we demonstrate by enriching low abundance viral RNA. In summary, WarpDemuX is a broadly applicable, high-performance, and economical multiplexing solution for nanopore dRNA-seq, facilitating advanced (epi-)transcriptomic research.
著者: Max von Kleist, W. van der Toorn, P. Bohn, W. Liu-Wei, M. Olguin-Nava, R. P. Smyth
最終更新: 2024-10-23 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.07.22.604276
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.07.22.604276.full.pdf
ライセンス: https://creativecommons.org/licenses/by-nc/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。