Simple Science

最先端の科学をわかりやすく解説

# 生物学# 進化生物学

原核ウイルス分類の進展

新しいツールが遺伝子分析を使って原核ウイルスの分類を強化してるよ。

― 1 分で読む


原核ウイルスをうまく分類す原核ウイルスをうまく分類すサクッと理解できるようにしてくれる。vClassifierはウイルスの分類を
目次

原核ウイルスはバクテリアや古細菌を感染させる小さなエージェントだよ。地球上で最も一般的な生物で、生態系に大きな影響を与えてる。これらのウイルスは微生物の個体数を調整したり、遺伝的多様性をサポートしたり、生命の進化に重要な役割を果たしてる。宿主細胞を攻撃して壊すことで、有機物を解放して栄養サイクルを栄養してる。このプロセスは生態的バランスを保つのに欠かせない。

でも、重要なのに原核ウイルスの種類がたくさんあって分類が難しいんだ。古い分類方法は信頼できる遺伝的マーカーが足りなくて、ウイルスグループ間の遺伝的多様性が高いせいで苦労してた。最近では、これらのウイルスをどうやって分類するかを解明するための新しいコンピューター基盤の方法が、バクテリオファージ(バクテリアを感染させるウイルス)や古細菌ウイルスの多様性を示してる。

これらの技術は主に遺伝子の内容、ウイルス同士のつながり、ゲノムの関係、一致したウイルスゲノム間の距離を見てる。geNomadやvConTACTのようなツールは、原核ウイルスをファミリー単位で分類するのに役立ってる。もっと詳しい分類のために、vConTACT、GRAViTy、VICTOR、ViPTree、VirClustのようなツールが作られた。vConTACTはウイルスのタンパク質のクラスターを構築して遺伝子の共有を分析し、GRAViTyは分析用のゲノムの特徴を見てる。VICTORは異なるアプローチを組み合わせてウイルスを分類し、ゲノム間の距離を計算する。ViPTreeはウイルスの関連を示すツリーを作成し、VirClustはリファレンスなしで働き、タンパク質に基づいてツリーを作るんだ。

これらの方法は原核ウイルスの研究に効果的だけど、いくつかの課題も残ってる。例えば、VICTORはよく遅くなるし、分析できるゲノムの数に制限があって、グループ間の関係を完全には反映しないことがある。また、vConTACTやGRAViTyはウイルスの進化的歴史を考慮してないから、正しい分類には重要なんだ。ViPTreeとVirClustも大きなデータセットを分析するのに限界がある。

ウイルスの具体的な役割を知るのに必要な種レベルの割り当てを改善するためには、もっと良いソフトウェアが必要なんだ。今のところ、ヒトや環境サンプルから見つかるウイルスゲノムを特に分類するプログラムはないから、ウイルスの分類学や生態を理解するのが難しくなってる。

ゲノムベースの研究の重要性

ゲノムを研究することは進化的なつながりを理解するためには重要だよ。特定の遺伝子、いわゆる単一コピー遺伝子は保存されていて、分類には大きな役割を果たしてる。dsDNA原核ウイルスの場合、これらの単一コピー遺伝子は特定の分類群、例えばファミリーやサブファミリーの中で一貫してる。この一貫性は、ファミリーやサブファミリー内のメンバーが似たような単一コピー遺伝子を持ってることを示してて、低い分類群で普遍的なパターンがあることを示唆してる。

私たちは、さまざまなウイルスの分類群から単一コピーのマーカーを特定した。これらのマーカーに基づいてツリーを作成したら、その形が国際ウイルス分類委員会(ICTV)が設定したサブファミリーや属レベルの分類とよく一致してることがわかった。

このアプローチを使用して、私たちはvClassifierを作った。これは参照ツリーに基づいてウイルスゲノムを自動的に分類するツールだ。vClassifierは参照ツリー内での親戚に従ってウイルスをグループ分けし、平均ヌクレオチド同一性を使って種レベルの分類を割り当ててる。他のプログラムと比較したとき、vClassifierは同じかそれ以上のパフォーマンスを示した。

分類群とマーカーの選択

データセットを構築するために、ICTVの分類の特定のバージョンを使用して、ICTVによって分類された完全なゲノムを選んだ。私たちは、212種類の異なる分類群にわたって、バクテリアや古細菌ウイルスから5,128のウイルスゲノムを集めて、8つの分類ランクに整理した。強い結果を得るために、少なくとも10のゲノムが利用可能な分類群に焦点を絞った。

その後、ウイルス遺伝子ファミリーのデータベースを使って各分類群で適切なマーカーを探した。スクリーニングの結果、203の分類群で1から276のマーカーが見つかった。マーカーを選ぶ基準には、分類群のゲノムの少なくとも50%に存在すること、ゲノムごとの平均出現率が低いこと、十分なタンパク質の長さが含まれた。

配列整列と系統解析

各分類群で単一コピーの遺伝子マーカーを特定した。最高得点の遺伝子配列を選び、複数のヒットがあったマーカーについては、分析のために最高得点を選んだ。整列を改善し、それらを1つの配列整列にまとめた。その後、堅牢な系統解析を確保するために、整列の重要な部分を代表するゲノムに焦点を当てた。

最終的な参照ツリーは、精製されたデータから構築され、ブートストラップの複製を使ってツリーの枝のサポートを確認した。このプロセスを通じて、各分類群内の進化的関係を表す203の系統樹を生成した。

ICTVとのベンチマーキングと比較

次に、私たちの系統的方法をICTVの分類と比較した。各分類群に何人の代表がいるかに基づいて系統群を定義し、ブートストラップ値を評価して単系統性を測定した。私たちの方法の精度は、各分類群内の単系統群の数をその分類群の総グループと比較することで計算した。

サブファミリーや属レベルでの徹底的な分析のために、vClassifierを他のウイルスゲノムを分類するツールと比較した。各ツールはデフォルト条件で実行され、ICTVの分類とどのように一致するかを評価することができた。

vClassifierのワークフロー

vClassifierは特定のフォーマットのゲノムアセンブリを処理できる。遺伝子を予測してクエリゲノムから単一コピーのマーカーを特定する。配列が整列され、欠落したマーカーのためにギャップが追加される。最後のステップは、特別なプログラムを使ってゲノムを参照ツリーに配置することだ。

分類を割り当てるために、vClassifierはクエリゲノムが参照ツリーのどこに位置するかをチェックする。クラスター内のすべてのゲノムが同じサブファミリーや属に属する場合、クエリゲノムもそこに配置される。種レベルの分類は、整列のカバレッジとヌクレオチド同一性に依存する。

vClassifierは強力なサーバーでうまく動作するように設計されていて、多くのゲノムを効率的に分類できる。高品質のゲノムで最も良いパフォーマンスを発揮し、分類の精度が向上する。

異なる環境でのパフォーマンス

私たちは、海洋、堆積物、土壌環境からのさまざまなウイルスサンプルに対してvClassifierの効果をテストした。このツールは、特に属レベルで高い割り当て率を示し、vConTACT3のような他のツールよりも良いパフォーマンスを発揮した。この効率は、vClassifierがさまざまな環境の文脈でより正確な分類を提供できることを示してる。

マーカー遺伝子分布の変動性

原核ウイルスは多様な進化的パターンを示し、遺伝子マーカーの保存に影響を与えてる。ほとんどの単一遺伝子マーカーはウイルス間で広く共有されてないから、系統的な有用性が制限される。私たちの発見は、高い分類群では単一コピーのマーカーが少ない一方で、低い分類群には特定のマーカーセットが存在することを示してる。

すべてのウイルスにおいて普遍的な単一コピー遺伝子が存在しないにもかかわらず、私たちの研究は分類学研究のための特定のマーカーの重要性を強調してる。低い分類群に多くのマーカーが存在することで、より詳しい分類と進化的関係の洞察が可能になる。

ICTV分類との高い一致

ウイルスのファミリーやサブファミリーの分類に強い支持を見つけて、ICTV基準と高い一致を示した。私たちの結果は、dsDNAウイルスの中で多くの分類群が単系統であることを示した。ただし、いくつかのファミリーは一致率が低く、分類アプローチのさらなる洗練が必要だと示してる。

種レベルでは、他の分類群と比較して一致率が低いことがわかった。これは、ICTVの枠組みで分類されたウイルスゲノムに関する情報が限られていることを示してる。種の分類を改善するために、私は系統解析と平均ヌクレオチド同一性を組み合わせた。これが成功したアプローチだった。

結論

私たちは、進化的関係と遺伝的比較に基づいてウイルスを分類するための強力なツール、vClassifierを開発した。vClassifierはICTVやNCBIの分類と高い整合性を示し、ウイルス分類学にとって価値がある。高いレベルでの分類には限界があるけど、継続的な更新で最新の情報を保つようにする。

全体的に、この研究はウイルス分類学の理解を深めて、進化する科学的知識に追いつくための分類方法の継続的な改善の必要性を示してる。最終的には、さまざまな環境でウイルスを正確に特定し分類するのを助けることになる。

オリジナルソース

タイトル: vClassifier: a toolkit for species-level classification of prokaryotic viruses

概要: As the most abundant and diverse biological entities, prokaryotic viruses play pivotal roles in ecological systems. Their taxonomic classification has been instrumental in elucidating their diversity and ecological functions. However, determination of viral taxonomy remains a considerable challenge. Recently developed approaches succeed in assignment of viral taxonomy at higher ranks, such as at the family level and above, but struggle at the subfamily level and below to the genus and species resolutions. Here, we describe the vClassifier toolkit, a phylogeny-informed methodology to provide species-level taxonomic assignments of viruses. We used single-copy marker genes relevant to specific taxa and reference phylogenetic trees for these groups which facilitates direct comparisons with the taxonomic framework of the International Committee on Taxonomy of Viruses (ICTV). Our method demonstrated significant congruence with the ICTV taxonomy, showing 84-91% alignment at the subfamily and genus levels. For species-level classification, our strategy was integrated with average nucleotide identity, yielding a high congruence rate of over 92% with the taxonomic data from the NCBI Virus database. Benchmarking comparisons revealed that vClassifier matches or surpasses other available tools regarding precision and classification success rates. By achieving objectivity and high levels of consistency, vClassifier streamlines the taxonomic categorization of prokaryotic viral genomes. Accurate assignments at the subfamily, genus, and species levels will significantly refine the taxonomic resolution of viruses, fostering a deeper understanding of viral diversity in microbiomes and ecosystems.

著者: Karthik Anantharaman, K. Zhou, J. C. Kosmopoulos

最終更新: 2024-06-02 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.05.28.596318

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.05.28.596318.full.pdf

ライセンス: https://creativecommons.org/licenses/by-nc/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

著者たちからもっと読む

類似の記事