Simple Science

最先端の科学をわかりやすく解説

# 生物学# 微生物学

SingleMを使った微生物コミュニティプロファイリングの進展

SingleMは、完全なゲノムがなくても種を特定することで微生物分析を強化するよ。

― 1 分で読む


SingleM:SingleM:微生物分析の新時代究方法を革新する。SingleMは、微生物コミュニティの研
目次

微生物群は、私たちの体から海や土壌まで、いろんな環境で重要な役割を果たしてるんだ。これらのコミュニティを研究するために、研究者たちはよく2つの重要な質問をするんだ:どんな微生物がいるの?どれくらいの量がいるの?

これらの質問に正確に答えるために、科学者たちはショットガンメタゲノムシーケンシングっていう方法を使うんだ。このアプローチでは、サンプル内のすべての微生物のDNAに関する情報を集めることができる。方法は、得られたDNA配列に基づいて、異なるタイプの微生物とその相対的な量のデータを提供するよ。

税onomicプロファイリング

DNAがシーケンスされたら、次のステップは税onomicプロファイリングソフトウェアを使って分析すること。これらのソフトウェアは、集めたシーケンスを既存の知られているゲノムのデータベースと照合するんだ。新しいシーケンスを十分に研究された参考ゲノムと比較することで、サンプルに存在する微生物をカテゴライズできるんだ。

税onomicプロファイリングにはいくつかの方法があるよ:

  • マーカー遺伝子マッチング:特定の微生物グループに関連する特定の遺伝子を探す方法。
  • Kmerマッチング:短いDNA配列(kmers)を探して生物を特定する技術。
  • リードマッピング:シーケンスを全ゲノムと整列させて類似性を見つけるアプローチ。

最近のソフトウェア、MetaPhlAnは、より大きなゲノムデータベースを含めて改善されたんだけど、この方法の制限の一つは、データベースにまだ追加されていない新たに発見された種を見逃すことが多いってこと。

現在のツールの限界

さまざまなツールがあるにもかかわらず、コミュニティの構成を正確に推定するのは難しいまま。多くの既存の税onomicプロファイリング方法は参考ゲノムに依存してるから、新しい種を見落としがち。これが微生物生態学の研究に影響して、科学者たちはさまざまな環境に存在する多様性を完全には理解できないんだ。

SingleMの紹介

この問題に対処するために、SingleMっていう新しいツールが開発されたんだ。このソフトウェアは、完全なゲノムやドラフトゲノムがない場合でも、種レベルで微生物群をプロファイリングするのに特化してるよ。SingleMは、ほとんどの生物に存在するマーカー遺伝子の特定の安定した領域に注目して動作する。これらの領域を分析することで、コミュニティ構造の簡略化されたビューを作るんだ。

SingleMは以下のステップを踏むよ:

  1. 保存された領域へのリードのマッチング:集めたシーケンスを細菌と古細菌に特有の59個のマーカー遺伝子の保存された領域と比較することから始める。

  2. 操作的分類単位(OTUs)へのクラスタリング:リードをマッチングした後、ソフトウェアはそれらをOTUsにグループ化する。OTUsは異なる分類群を表すよ。

  3. 分類の割り当て:各OTUは、よく維持されたデータベース内の最も近い既知の親戚に基づいて分類される。

  4. 要約プロファイルの作成:最後に、SingleMはサンプル内のさまざまな微生物の相対的な豊富さを表示する包括的な分類プロファイルを生成するよ。

SingleMの結果と利点

SingleMは、既知の種を含むシミュレーションされたコミュニティに対してベンチマークを通じて、その効果を示してるんだ。微生物の存在を正確に特定し、定量化するのに既存のツールよりも優れてたんだ。

特に、SingleMは他の方法に比べて動作が早く、メモリ要件も少ないんだ。この効率は、リードの不必要な処理を最小限に抑え、研究者が1分あたり100万以上のリードを分析できるから来てるよ。

新しい系統を検出する能力を比較したテストでは、SingleMが他のツールを上回った。アミノ酸配列を使う独自の方法によって、参考データベースに存在しない生物も特定できたんだ。

公開メタゲノムの分析

SingleMは検証された後、公開されているメタゲノムの膨大なデータセットを分析するために適用されたんだ。この分析では、25万以上のメタゲノムをレビューし、多くの新しい微生物群を発見した。

この広範な分析により、研究者たちは人間や動物のサンプルのような特定の環境が、土壌や海洋などの環境サンプルに比べて既知の種の表現度が高いことを発見したんだ。多くの生態データセットでは、対応する参考ゲノムがないため、微生物の多様性の大部分が未分類のままだった。

継続的なリソース:Sandpiper

SingleMの結果は、Sandpiperっていうプラットフォームを通じてアクセスできるようになってる。このウェブサイトでは、研究者たちが最新の結果に基づいて分類プロファイルをブラウズしたり分析したりできるようになってる。Sandpiperは定期的に更新されるように設計されていて、新しいデータが利用可能になると反映されるよ。

このデータベースは、科学者たちが世界中の微生物多様性の範囲を理解するのに役立つ。さらに、まだ発見されていない膨大な数の微生物を完全に特徴づけるためには、より良い参考ゲノムが必要だってことを強調してる。

特定のゲノムの回収

Sandpiperデータセットの一つの応用は、特定のゲノムの回収を支援することだ。シーケンスからゲノムを再構築するのは計算集約的なため、研究者たちはSingleMを使って、元のデータ内での存在の推定に基づいて新しいゲノムを含む可能性のあるサンプルを指摘できるんだ。

代表的でない細菌の系統でこのアプローチをテストすることで、研究者たちは多数の新しいゲノムを回収できて、利用可能なデータベースに表現される多様性を向上させたんだ。

今後の方向性

SingleMは、以前は知られていなかった系統を検出可能にすることで、微生物生態学の研究に新しい可能性を開いているんだ。SingleMやSandpiperが提供するメタゲノムシーケンシング技術と分析のさらなる進展は、微生物生命についてのより包括的な理解を提供するだろう。

新しいゲノムを参考データベースに統合することで、研究者たちは微生物群とその環境との関係をさらに探求できるようになるよ。

分類プロファイリングの方法を改善することで、科学者たちは微生物生態系の複雑さや地球上の生命の広い文脈での役割をより理解できるようになるんだ。

オリジナルソース

タイトル: SingleM and Sandpiper: Robust microbial taxonomic profiles from metagenomic data

概要: Determining the taxonomy and relative abundance of microorganisms in metagenomic data is a foundational problem in microbial ecology. To address the limitations of existing approaches, we developed SingleM, which estimates community composition using conserved regions within universal marker genes. SingleM accurately profiles complex communities of known microbial species, and is the only tool that detects species without genomic representation, even those representing novel phyla. Given SingleMs computational efficiency, we applied it to 248,559 publicly available metagenomes and show that the vast majority of samples from marine, freshwater, sediment and soil environments are dominated by novel species lacking genomic representation (median relative abundance 75.0%). SingleM also provides a way to identify metagenomes for the recovery of novel metagenome-assembled genomes from lineages of interest, and can incorporate user-recovered genomes into its reference database to improve profiling resolution. Quantifying the full diversity of Bacteria and Archaea in metagenomic data shows that microbial genome databases are far from saturated.

著者: Ben J Woodcroft, S. T. N. Aroney, R. Zhao, M. Cunningham, J. A. M. Mitchell, L. Blackall, G. W. Tyson

最終更新: 2024-01-31 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.01.30.578060

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.01.30.578060.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

著者たちからもっと読む

類似の記事