iLund4uを使った微生物ゲノムの変異マッピング
新しいツールが微生物のゲノムを分析して、遺伝的ホットスポットを見つけて分類するよ。
― 1 分で読む
目次
微生物のゲノムは多様性にあふれてるよね。遺伝子の変化はいろんなプロセスによって起こるんだ。たとえば、水平遺伝子移動(HGT)っていう重要なプロセスがあって、これは遺伝子が親から子へではなく、別の生物間で移動することを指すんだ。この移動によって、ゲノムアイランドって呼ばれる遺伝子の断片ができて、近縁な生物の間であったりなかったりすることがあるんだ。これらのアイランドは均等に散らばってるわけじゃなくて、ホットスポットと呼ばれる特定のエリアに多く見られるんだ。ホットスポットは遺伝子の急速な変化が起こる地域で、より安定したセクションに囲まれてる。
プラスミドやウイルスを含む移動性遺伝要素も、遺伝子の入れ替えみたいなメカニズムによって変化が起きるホットスポットを持ってる。一部のホットスポットには、「モロン」領域っていう、独立に機能できる余分な遺伝子が含まれてることがあるんだ。もう一つの変化の要因として、他の生物から遺伝子を移すことなく変化をもたらす多様性生成レトロエレメントがあるね。全体的に見て、これらのプロセスは変動のある微生物ゲノムの領域を作り出し、その近くにより安定したコア遺伝子があるんだ。
この文脈で、たくさんの変動があるゲノムの場所を「可変アイランド」と呼ぶことができるよ。そして、安定した遺伝子の近隣を共有するこれらの可変アイランドの集まりは「ホットスポット」と呼ばれる。
iLund4uのワークフローと機能
iLund4uは微生物のゲノムを分析して、ホットスポットを見つけるためのツールなんだ。主な機能は3つあって、ホットスポットアノテーション、タンパク質検索、プロテオームアノテーションっていうんだ。ホットスポットアノテーションモードはゲノムの変動があるエリアを見つけるために使いやすくて、タンパク質検索とプロテオームアノテーションモードはこれらのホットスポットでのタンパク質機能の探求と分析を可能にするんだ。
異なるアイランドは、病気に関連する遺伝子や抗生物質への耐性、遺伝要素に対する防御など、持っている遺伝子の種類に基づいてカテゴライズできるよ。このカテゴライズによって新しい生物学的機能の発見につながることがあるんだ。たとえば、ウイルスに対抗する防御システムは特定の場所に集まることが多く、研究者はその場所のパターンを通じて新しい防御機構を見つけられるんだ。
ホットスポットを特定するプロセスは一般的に、知られた保存遺伝子の領域を認識すること、知られたカゴと関連付けること、そして複数のゲノム全体の遺伝子プールを分析することの3つのアプローチを含むよ。たとえば、研究者は知られたホットスポット周辺の保存遺伝子を探して新しい防御システムを見つけることができるんだ。
でも、既存の方法には限界があって、大規模なデータセットを効果的に分析するのが難しかったり、プラスミドのような他の遺伝要素に対応できなかったりすることがあるんだ。そこで、iLund4uが開発されて、何百万ものゲノム配列にわたってホットスポットを特定してアノテーションするためのスケーラブルな方法になってる。
iLund4uは異なるゲノムのタンパク質の内容の類似性に基づいてネットワークを構築するんだ。これによって、異なる種やプラスミド、ウイルスからの配列を分析できるようになるよ。類似した配列のグループを見つけたら、それに基づいて可変アイランドやホットスポットを特定するんだ。
ホットスポットの特定と分析
iLund4uアルゴリズムは、何十万ものファージやプラスミドの配列に適用されてるよ。これらの分析によって、研究者たちは多種多様なタンパク質機能を持つ多くのホットスポットを見つけたんだけど、その多くはまだ特定されてないんだ。平均して、ファージゲノムの約9パーセントがこれらのホットスポットアイランドで構成されるんだ。ホットスポットのタンパク質が多機能であればあるほど、可変アイランドのサイズが大きくなる傾向があるんだ。
iLund4uを使うと、ユーザーはホットスポット内のタンパク質を検索できて、既存のデータベースに基づいてアノテーションを提供するんだ。これによって、異なる遺伝子がどのように機能するかに関する理解が広がるよ。タンパク質検索モードでは、ユーザーはホットスポット内で似たタンパク質を特定でき、プロテオームアノテーションモードではコミュニティの類似性に基づいてホットスポットをタグ付けできるよ。
ファージとプラスミドにおけるホットスポットの特定
iLund4uを使って、特定のデータベースから多くのファージ配列を分析したんだ。チームはファージ配列を再アノテーションして、類似したタンパク質のコミュニティを特定したんだ。結果として、これらのコミュニティ内のほとんどのタンパク質は保存されているか可変で、少しの割合が中間的だったんだ。
たくさんの可変アイランドを見つけて、それらをつないで多くのホットスポットを作成したよ。各ホットスポットには一般的に多くのタンパク質グループが含まれていて、中には100以上のものもあったよ。全体的に見て、多くのタンパク質にはまだ知られていない機能があるの。
プラスミドは、バクテリアに追加の特性を与えることができる小さなDNA分子なんだけど、プラスミドにもそれぞれのホットスポットがあるんだ。研究者がプラスミドのホットスポットを探したとき、プラスミドの構成はファージとは異なるけど、多くの類似点があることがわかったんだ。これって、どちらのタイプの遺伝要素も重要な付随遺伝子を持ち得ることを示唆してるね。
ホットスポットにおける機能的多様性
可変アイランドに関連する機能がどんなものかを理解するために、研究者たちはこれらのホットスポットに見られるタンパク質を詳しく調べたんだ。ほとんどのホットスポットでコードされたタンパク質は未アノテートで、多くの未知の機能があることを示してる。特定の機能的分類のルールを使って、ウイルスに対する防御やその他の要因に関連するいくつかのホットスポットを特定したよ。
ファージとプラスミドのホットスポットを比較する中で、存在する遺伝子の種類に違いが見られたんだ。これが、プラスミドとファージが異なる進化の道筋や機能を持っていることを示唆してる。特に、接合に関与するようなプラスミド特有の遺伝子は異なるホットスポットパターンを示したんだ。
面白い発見として、プラスミドがバクテリアの防御に対抗できる遺伝子を持つ能力と、抗生物質に対する耐性をコードするホットスポットを同時に持っていることが挙げられるね。
ファージにおける可変アイランドの構造
研究者たちは可変アイランドの全体的な構造や内容を理解しようとしたんだ。ファージゲノムのどれくらいが保存遺伝子と可変遺伝子で構成されているかを計算したよ。平均して、可変アイランドはファージゲノムの約9パーセントを占めていて、中央値はこれらの多様な領域に一定のゲノムスペースが割り当てられていることを示してる。
これらのアイランド内の多様な機能を分析したときに、ホットスポットのサイズとその中の機能の多様性との相関が見つかったよ。大きなアイランドは一般的に小さいアイランドよりも機能的多様性が多かったんだ。さらに、これらのアイランド内の遺伝子がどのように整列して相互作用しているかを探求して、これらの遺伝子が効率のためにどのように整理されているかの洞察を得たんだ。
P2様ファージのホットスポットと既知の防御システム
よく研究されているファージ、特にP2様ファージには、確立されたホットスポットがあるんだ。研究チームはiLund4uを使って、既知のP2様ファージゲノム内のこれらのホットスポットを特定してアノテーションしたよ。以前に特定された防御機構を再発見できて、iLund4uがこれらの重要な領域を見つけるのに効果的だって確認できたんだ。
見つかったホットスポットには、さまざまな機能に関連する遺伝子のミックスがあって、既知の防御システムや病原性因子が含まれてた。今回の分析では、遺伝子の位置において一貫性と変動性が見られて、一部の機能が保存されている一方で、まだ多様性や進化の余地があったんだ。
腸内ファージにおける多様なホットスポットの発見
研究者たちは、iLund4uを使って人間の腸に見られるファージを調査したんだ。抗生物質耐性や病原性に関連する多様な遺伝子が豊富な複雑なホットスポットを特定したよ。このホットスポットは多くのタンパク質グループを持っていて、これらのファージがバクテリアの宿主とどのように相互作用するかに重要な役割を果たしている可能性があるんだ。
詳しい分析の中で、受容体結合に関連する遺伝子が存在することがわかって、これによりファージが宿主との相互作用を良くするための戦略を進化させた可能性が示唆されたよ。さらに、特定の遺伝子は他の遺伝子の存在や不在によって機能を切り替えることができることが明らかになって、これらのファージゲノムがどのように機能するかに複雑さが加わったんだ。
iLund4uの重要性
iLund4uは、微生物ゲノム内のホットスポットや可変アイランドを体系的に特定するための画期的な方法として機能するんだ。この発見は、特に新しい免疫システムや重要な遺伝的特性を発見する上で、微生物の世界におけるこれらの領域の重要性を強調してるよ。
さまざまな分析アプローチを組み合わせることによって、研究者たちは遺伝子の機能を位置や関係に基づいて予測する力を高められるんだ。iLund4uを使うことで、異なる遺伝子間の関係を探求でき、新しい機能や微生物集団における相互作用の発見を進める手助けになるんだ。
研究者たちは、iLund4uから構築されたツールやデータベースが微生物ゲノムの研究、特に機能的アノテーションや新しい防御機構の発見に大いに役立つと信じているよ。
結論
さまざまなメカニズムによって形作られる微生物ゲノムの多様性は、これらの生物がどのように進化し、相互作用するかを理解するための可能性を広げるんだ。iLund4uのようなツールを使うことで、科学者たちは重要な遺伝情報を持つホットスポットや可変アイランドを特定できて、今後の微生物学研究に向けた道を切り開いてるんだ。これまでの発見は、新しい機能を特定し、微生物の生活に対する理解を深める可能性の広がりを強調してるよ。
タイトル: Systematic annotation of hyper-variability hotspots in phage genomes and plasmids
概要: Bacterial and bacteriophage genomes contain genomic regions of hyper-variability (diversity hotspots) caused by insertions of mobile genetic elements (MGEs), non-homologous recombination events and non-horizontal hypermutation. Accessory genes encoded in the diversity hotspots are involved in anti-MGE defence and counter-defence, virulence and antimicrobial resistance (AMR), thus playing key roles in interactions amongst phages, MGEs, bacteria and eukaryotic hosts. To date the majority of research has been focused on either individual hotspots or on relatively limited sets of hotspots in a small set of genomes, typically from a single species. A global understanding of hotspot diversity and dynamics still lacking. To address this gap, we developed iLund4u, an algorithm for the systematic annotation of hotspots across millions of sequences. Using a proteome composition approach, iLund4u detects proteome communities, annotates accessory proteins and identifies hotspots. By analysing 873K phage genomes and 696K plasmid sequences we identified 13.7K hotspots and 171K diverse protein families encoded there as cargo. Furthermore, iLund4u allows for protein search and proteome annotation functions versus a precomputed iLund4u database. In the protein search mode iLund4u identifies all hotspots that encode homologues of a query protein. In the proteome annotation mode iLund4u annotates hotspots by searching for communities of similar proteomes. Detailed documentation, user guide and the source code are available at the iLund4u home page: art-egorov.github.io/ilund4u.
著者: Artyom A. Egorov, V. Hauryliuk, G. C. Atkinson
最終更新: 2024-10-16 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.10.15.618418
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.10.15.618418.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。