細菌ゲノムのためのオックスフォード・ナノポア技術の評価
研究は、バイオロジカルゲノムを分析するためのONTと従来の方法を比較してるよ。
― 1 分で読む
目次
全ゲノムシーケンシングは、細菌の完全な遺伝物質を調べる方法なんだ。この技術は、有害な細菌を特定したり、病気のアウトブレイクを追跡したりするのにすごく重要だよ。過去20年ほど、短いリードのシーケンシング技術がよく使われていて、速くてエラー率が低いからね。科学者たちは、この方法を使ってさまざまな細菌株を区別するために貴重なデータを得ているんだ。これは公衆衛生の監視に必要不可欠なんだよ。
今は、特定の細菌を調べるとき、科学者たちはしばしば一塩基多型(SNP)分析やコアゲノム多重座標シーケンスタイピング(cgMLST)って呼ばれる方法を使ってる。BIGSdb-Pasteur、PubMLST、EnteroBaseみたいなデータベースを使うことで、科学者たちは標準化されたゲノム情報にアクセスできるんだ。これによって、リステリア・モノサイトゲネスやサルモネラ・エンテリカといった重要な病原体を研究するのに役立ってる。
でも、短いリードデータを使って完全な細菌ゲノムを作成するのは、しばしば不可能なんだ。これは、細菌の遺伝物質にある複雑な繰り返しの部分が原因なんだ。また、短いリードは、抗生物質耐性のような重要な特性を運ぶプラスミドを分析するのが難しいんだ。さらに、第二世代シーケンシング技術の高コストも、その使用を制限しているんだよ。特に小さなラボやリソースが少ない国ではね。
オックスフォード・ナノポア技術:解決策
オックスフォード・ナノポア技術(ONT)は、短いリード技術が直面しているいくつかの問題を解決する代替手段を提供しているんだ。ONTシーケンシングはポータブルで、複数のサンプルを一度に見るときにコストが効果的で、長いリードを扱えるからね。これにより、遺伝物質の組み立てがより良くなり、プラスミドや染色体みたいな環状構造も含められるんだ。ONTはリアルタイムシーケンシングもできるから、アウトブレイクの時に便利なんだよ。
でも、ONTはエラー率が高いっていう欠点があって、細菌を正確に分類するのが難しいことがあるんだ。エラーが誤解を招く結果を生むことがあって、株の間の真の違いを特定するのが難しくなるんだ。だから、ほとんどの公的な細菌データベースは、ONTシーケンシングからだけ生成されたデータを受け入れていないんだ。
最近の研究では、細菌のタイピングにおけるONTの有効性を評価しようとしているんだ。結果はさまざまだったけど、特定の条件や研究される細菌の種類によっては、その使用に期待が持てるんだ。最新のONT技術はエラー率を減少させるかもしれなくて、細菌のタイピングにより信頼性を持たせることができるんだよ。
研究概要
この研究は、ONTシーケンシングの性能を広く受け入れられている短いリードシーケンシング技術と比較評価することを目的としていて、特に3つの重要な呼吸器病原体:クレブシエラ・ニューモニエ(Klebsiella pneumoniae)、コリネバクテリウム・ジフテリアエ(Corynebacterium diphtheriae)、ボルデテラ・パートゥシス(Bordetella pertussis)に焦点を当ててるんだ。研究者たちは、実験中に最新のONT化学を使ったんだ。
使用した細菌分離株
この研究には、12種の細菌からの24の分離株が含まれてた。この分離株は、さまざまなクレブシエラ、コリネバクテリウム、ボルデテラの細菌の種類を表しているんだ。これらの細菌は、ラボの確立されたコレクションから抽出されて、代表的な株を含むようにしたんだ。
細菌の培養とDNA抽出
これらの細菌をさらに研究するために、研究者たちは適切な培地を使って制御されたラボの条件で細菌を育てたんだ。十分に成長した後、特別なキットと設備を使ってDNAを抽出して、遺伝物質を効果的に分析できるようにしたんだよ。
DNAのシーケンシング
短いリードシーケンシングのために、彼らはよく知られたキットを使ってライブラリを準備し、高度な機械でシーケンスしたんだ。一方、長いリードのシーケンシングには、Rapid Barcoding Kitを使ったONTを使って、長期間にわたってデータを生成できるようにしたんだ。両方の方法が完全なゲノムを生成するのにどれだけうまく機能するかを見たかったんだ。
データの処理
研究者たちは、シーケンシングデータを分析するためにいろいろなプログラムをテストしたんだ。さまざまなモデルやフィルタリング方法を使って、長いリードデータを処理するのに最適な方法を探したんだ。生のリードの質を評価することは、結果が信頼できるものであることを確認するために重要だったんだよ。
ゲノムの組み立て
短いリードデータは、確立された方法を使って完全なゲノムに組み立てられた。一方、長いリードデータには異なる組み立て技術が必要だったんだ。ONTの性能は特に注目すべきもので、しばしば少ないけど大きなコンティグが得られることが多くて、全体的により良い質の組み立てができたんだ。
研究の結果
生のリードの質
両方の方法から生成された生のリードの質が評価されたんだ。その結果、最新のONTバージョンは高品質のリードを生成していて、しばしば選択された質の閾値を超えてた。これらの高品質リードは、正確なゲノム組み立てにとって重要だったんだよ。
ゲノムの完全性
両方の方法で作成されたゲノムを比較すると、短いリードの組み立ては通常多数のピースやコンティグがあったのに対して、ONTの組み立てはしばしばコンティグが少なく、時には環状のゲノムになることさえあったんだ。これは、細菌のゲノムをより正確に表す指標になるから重要なんだ。
ゲノムタイピングの精度
研究者たちは、両方の方法で作成された組み立てに基づいてゲノムタイピングがどれだけうまく機能したかを分析したんだ。ONTの組み立ては短いリードの組み立てと比較してミスマッチの数が少なかったことが分かって、ONTが細菌の分類に信頼できる結果を提供できることを示してるんだ。
アウトブレイクの調査
公衆衛生のアプリケーションにおいて、正確な細菌タイピングはアウトブレイクを追跡するために必要なんだ。この研究は、ONTデータが調査中に異なる株を区別するのにうまく機能する可能性があることを示したんだ。これは、類似した株に関して短いリードデータと密接に一致してたからなんだよ。
結論
この研究の結果は、特に最新バージョンを使用したONTシーケンシングが細菌性病原体の研究に貴重なツールになり得ることを示唆しているんだ。正確で包括的なゲノムデータを生成する能力を持っていて、公衆衛生の分野での使用に期待が持てるんだ、特に伝統的な方法が限られている地域ではね。
技術が進歩すれば、ONTは病原体のグローバルな監視やアウトブレイクへの対応において重要な役割を果たすことになるかもしれない。リソースが少ない環境でも、迅速な結果を提供できるコスト効率の良さで多くのラボにとって魅力的な選択肢になるんだ。
タイトル: Accurate genotyping of three major respiratory bacterial pathogens with ONT R10.4.1 long-read sequencing
概要: High-throughput massive parallel sequencing has significantly improved bacterial pathogen genomics, diagnostics, and epidemiology. Despite its high accuracy, short-read sequencing struggles with complete genome reconstruction and assembly of extrachromosomal elements such as plasmids. Long-read sequencing with Oxford Nanopore Technologies (ONT) presents an alternative that offers benefits like real-time sequencing and cost-efficiency, particularly useful in resource-limited settings. However, the higher error rates of ONT have so far limited its application in high-precision genomic typing. The recent release of ONTs R10.4.1 chemistry, with significantly improved raw read accuracy (Q20+), offers a potential solution to this problem. The aim of this study was to evaluate the performance of ONTs latest chemistry for bacterial genomic typing against the gold standard Illumina technology, focusing on three respiratory pathogens of public health importance, Klebsiella pneumoniae, Bordetella pertussis, and Corynebacterium diphtheriae, and their related species. Using the Rapid Barcoding Kit V14, we generated and analyzed genome assemblies with different basecalling tools and models, at different simulated depths of coverage. ONT assemblies were compared to the Illumina reference for completeness and core genome multilocus sequence typing (cgMLST) accuracy (number of allelic mismatches). Our results show that genomes obtained from raw data basecalled with Dorado (with both simplex and duplex reads) SUP v0.7.1, assembled with Flye, and with a minimum coverage depth of 30x, optimized the accuracy for all bacterial species tested. The error rates were consistently below 1% of each cgMLST scheme, indicating that ONT R10.4.1 data is suitable for high-resolution genomic typing applied to outbreak investigations and public health surveillance.
著者: Chiara Crestani, N. Zidane, C. Rodrigues, V. Bouchez, M. Rethoret-Pasty, V. Passet, S. Brisse
最終更新: 2024-10-03 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.10.03.616467
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.10.03.616467.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。