次世代シーケンシング:病原体検出の新しい視点
多様な生物試料から病原体を特定するための現代的アプローチ。
― 1 分で読む
次世代シーケンシング(NGS)は、科学者がいろんなサンプルに含まれるDNAを見られる最新の方法だよ。このアプローチは、サンプル内の病原体や有害なバイ菌を見つけるのに特に役立つんだ。事前にそれらが何かを知らなくても調べられるから便利なんだよ。血液、便、その他の体液など、幅広いサンプルを分析できて、どんな微生物がいるかの貴重な情報を提供するんだ。
どうやって動いてるか
まずはサンプルを取って、そのDNAやRNAを抽出するところから始まるよ。遺伝子素材が手に入ったら、シーケンシングの準備をするんだ。シーケンシングは遺伝子コードを読み取るプロセスだよ。シーケンシングの後、得られた生データを既知の遺伝子データベースと比較して、サンプル内の生物を特定するんだ。これは、特定の病原体に焦点を当てて、事前にそのバイ菌を知っておくことが必要なターゲットシーケンシングとは違うんだ。
サンプルの多様性と課題
いろんな種類のサンプルには、微生物の量や種類が全然違うことがあるよ。例えば、人間の標本は複雑さやバイ菌の数が異なるんだ。血液や脳脊髄液(CSF)みたいなサンプルは、一般的に微生物がいないはずなんだ。だから、これらの体液に潜在的な病原体のDNAが少しでも見つかると、問題があるってことを示すんだよ。尿や膣スワブみたいな場合は、特定の有害株がいるかどうかだけが行動を必要とすることもあるね。
高い複雑さを持つサンプル、例えば便は、何百、何千もの異なる種が含まれてることがあるから、分析が難しいんだ。そういうときは、特定の有害株を数量化することが重要で、同時にサンプル内の微生物の全体のバランスも考慮する必要があるよ。パフォーマンスを正確に評価するために、ラボはよくいろんなツールやデータベースを使ってデータを再評価しなきゃならないんだ。
分析パフォーマンスの重要性
リファレンス素材を使うことで、ラボはメタゲノミクスでの手法を評価できるから、より信頼性のある結果が得られるんだ。このリファレンス素材は、分析が正確で効果的であることを確認するためのコントロールとして機能するんだよ。例えば、科学者は既知のDNA量を含む模擬サンプルを使って、自分たちのワークフローがどれだけうまく異なる生物を検出・特定できるかをテストすることができる。
検出限界(LOD)を設定することが重要なんだ。これは、サンプル内で信頼できるほど特定できる病原体の最小量を指すよ。CSFみたいな低複雑性のサンプルでは、バックグラウンドノイズ(他のDNAがあること)が少ないから、低いLODを持つことが必要なんだ。一方、便サンプルはバックグラウンドDNAが多くて、特定の病原体を検出するのが難しくなるんだ。
リファレンス素材とワークフロー
リファレンス素材を使うことで、ラボのパフォーマンス評価能力が大きく向上するよ。既知の量の特定の病原体をサンプルに含めることで、ラボは自分たちのシーケンシングや分析プロセスがどれだけうまく機能しているか確認できるんだ。この素材は、ワークフローにバイアスや不正確さがどこにあるかを特定するのに役立つよ。
メタゲノミクスのワークフローのパフォーマンスは、サンプルの種類やテストする特定の病原体によって異なることがあるから、各ユニークなワークフローとサンプルの種類ごとにパフォーマンス指標を設定するのが必要なんだ。ラボは、サンプルを集めるところからDNAを処理するまで、各ステップが最終結果にどう影響するかを理解するためにいろんな側面を調べる必要があるよ。
臨床応用と規制の課題
ラボが臨床目的のためにメタゲノミクスのワークフローを開発する場合、これらの方法が規制基準を満たすことを確保しなきゃならないんだ。これは、診断使用の承認を得るために厳密なテストとバリデーションが必要ってことだよ。成功するワークフローは、異なる種類のサンプルで病原体を正確に検出できる能力を示さなきゃならない。
この移行で重要なのは、特定の生物を既知のレベルで使うことだね。これによって、ワークフローのパフォーマンスを理解するだけでなく、臨床応用の前に潜在的な弱点を特定するのにも役立つよ。
実験的知見
研究者たちは、低複雑性(CSF)と高複雑性(便)のサンプルでいろんな病原体の株をテストして、彼らのワークフローのパフォーマンスをよりよく理解しようとしているんだ。例えば、CSFサンプルでは、使った両方の分類器でパフォーマンスが一貫していて、ワークフローの種類が大きな要因ではなかったんだ。しかし、便サンプルでは、ある分類器が特定の病原体を検出するのにかなり良い結果を出したよ。
面白いことに、異なるサンプルが異なるLODを生成する一方で、ワークフローはサンプルのタイプに対して比較的無関心に見えたので、いろんな種類のサンプルでうまく機能できる可能性があるんだ。これからの使用において、同じ分析アプローチがもっと広く適用されるかもしれないってことを示唆しているね。
病原体検出の特異性
メタゲノミクスシーケンシングの重要なテストの一つは、関連する細菌株(例えば、E. coli)の区別ができるかどうかなんだ。これは、治療の決定に影響を与える可能性があるから、臨床の現場では重要なんだよ。分析に使われるデータベースによって結果が異なることもある。いくつかのワークフローは病原体株を特定して区別するのに成功したけど、他のはそうできなかったんだ。
これらの発見の影響は大きいよ。さまざまなワークフローがどのように機能するのかを理解することで、ラボはテストを最適化して、メタゲノミクス診断の信頼性を高めることができるんだ。
結論
病原体を検出するための次世代シーケンシングの開発と評価は、いくつものステップを含む複雑なプロセスなんだ。多様なサンプルを分析して、幅広い病原体を特定する能力は、臨床診断や公衆衛生監視を改善する大きな可能性があるよ。研究が進んでワークフローが洗練されていくにつれて、メタゲノミクスの可能性がより実現されて、患者の有害微生物の迅速で正確な検出につながるんだ。
要するに、次世代シーケンシングは病原体の検出に革命をもたらして、科学者や医療専門家がさまざまなサンプルに潜む多くの潜在的な脅威を特定できるようにしたんだ。この技術を医療に最大限に活かすためには、方法やプラクティスの継続的な改善、効果的なコントロールやリファレンス素材の統合が重要になるよ。
タイトル: Analytical Assessment of Metagenomic Workflows for Pathogen Detection with NIST RM 8376 and Two Sample Matrices
概要: We assessed the analytical performance of metagenomic workflows using NIST Reference Material 8376 DNA from bacterial pathogens spiked into two simulated clinical samples: cerebral spinal fluid (CSF) and stool. Sequencing and taxonomic classification were used to generate signals for each sample and taxa of interest, and to estimate the limit of detection (LOD), the response function, and linear dynamic range. We found that the LODs for taxa spiked into CSF ranged from approximately (0.1 to 0.3) copy/L, with a linearity of 0.96 to 0.99. For stool, the LODs ranged from (10 to 221) copy/L, with a linearity of 0.99 to 1.01. Further, discriminating different E. coli strains proved to be workflow-dependent, as only one classifier:database combination of the three tested showed the ability to differentiate the two pathogenic and commensal strains. Surprisingly, when we compared the response functions of the same taxa in the two different sample types, we found those functions to be the same, despite large differences in LODs. This suggests that the "agnostic diagnostic" theory for metagenomics may apply to different target organisms and different sample types. Using RMs, we were able to generate quantitative analytical performance metrics for each workflow and sample set, enabling relatively rapid workflow screening before employing clinical samples. This makes these RMs a useful tool that will generate data needed to support translation of metagenomics into regulated use. ImportanceAssessing the analytical performance of metagenomic workflows, especially when developing clinical diagnostics, is foundational for ensuring that the measurements underlying a diagnosis are supported by rigorous characterization. To facilitate the translation of metagenomics into clinical practice, workflows must be tested using control samples designed to probe the analytical limitations (e.g. limit of detection). Spike-ins allow developers to generate fit-for-purpose control samples for initial workflow assessments and inform decisions about further development. However, clinical sample types include a wide range of compositions and concentrations, each presenting different detection challenges. In this work, we demonstrate how spike-ins elucidate workflow performance in two highly dissimilar sample types (stool and CSF); and we provide evidence that detection of individual organisms is unaffected by background sample composition, making detection sample agnostic within a workflow. These demonstrations and performance insights will facilitate translation of the technology to the clinic.
著者: Jason G. Kralj, S. L. Servetas, S. P. Forry, M. E. Hunter, J. N. Dootz, S. A. Jackson
最終更新: 2024-09-26 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.09.24.614717
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.09.24.614717.full.pdf
ライセンス: https://creativecommons.org/publicdomain/zero/1.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。