Simple Science

最先端の科学をわかりやすく解説

# 生物学# 生物情報学

ゴールドファインダーの紹介:遺伝子関係を分析する新しいツール

Goldfinderは、細菌集団の遺伝子の組み合わせの研究を簡素化する。

― 1 分で読む


ゴールドファインダー:遺伝ゴールドファインダー:遺伝子関係が明らかにされた新しいツール。細菌の遺伝子の組み合わせを研究するための
目次

パングロームって、細菌や古細菌の集団に見られる遺伝子の完全なセットのことを指すんだ。集団内の各個体は、その遺伝子の一部しか持ってないけど、みんな合わさることで大きな遺伝子プールになる。つまり、多くの生物に共通する遺伝子もあれば、ほんの数種類の生物にしか見られない遺伝子もあるってこと。さらに、遺伝子はうまく連携して働かないと、生物がうまく成長できないんだ。

遺伝子の組み合わせの役割

研究によると、遺伝子が生物の適応度に与える影響は、他の遺伝子によって変わることがあるみたい。これは、いくつかの遺伝子がポジティブに相互作用して一緒に働くことで利益をもたらすこともあれば、他の遺伝子が競い合ったり干渉したりしてマイナスの影響をもたらすこともあるってこと。たとえば、ウイルスや他の有害な遺伝子要素から守るための細菌の防御システムは、いくつかの遺伝子が協力して成り立っていることが多いよ。他にも、必須な物質を作るための特定の遺伝子群があって、これらの遺伝子は一緒に存在しないと、全体の生産プロセスがうまく機能しないんだ。

遺伝子の組み合わせに対する選択圧

これらの遺伝子の組み合わせを研究する目的は、どれが自然選択の影響を受けているかを特定することなんだ。異なる菌株の中で、遺伝子がどのように一緒に現れるかを調べることで、特定の遺伝子が共存する傾向があるのか、それとも避け合うのかを推測できる。ただし、共に現れる遺伝子は、機能的に関連しているのではなく、共通の祖先から継承されたものである可能性も考慮する必要がある。

もし二つの遺伝子が同じ祖先から受け継がれて、頻繁に一緒に見られる場合、その現象は「子孫による連結」と呼ばれる。一方で、系統の中で何度も得られたり失われたりした場合、それは一緒に働く必要がある可能性が高いってこと。だから、科学者たちは異なる菌株の間の進化的関係を分析して、真の共出現や回避を単なる共有された系統から分ける必要があるんだ。

遺伝子の組み合わせを研究するための既存のアプローチ

遺伝子がどのように一緒に現れるかを分析し、進化的関係を考慮するために多くのツールが作られてるけど、これらのツールは複雑な数学モデルに頼っていることが多くて、時間がかかるし、同時に考えられる遺伝子の数も少ないことがある。他のあまり複雑でないモデルは速いけど、分析で完全な遺伝子セットを使用していない可能性がある。

関連のある研究分野には、ゲノムワイド関連研究があって、遺伝的変異と特定の特性の関連を調べている。この文脈では、細菌間の全体的な遺伝的関係を理解することが重要で、特に遺伝子の組み合わせを評価する際にはそうだね。

ゴールドファインダーの紹介

ここで登場するのがゴールドファインダー。これは、共有された系統を考慮しながら遺伝子の関係を研究するためのツールなんだ。ゴールドファインダーは効率的で、提供された遺伝子ツリーを使ったシミュレーションに基づいたノンパラメトリックな方法に基づいている。

ゴールドファインダーは、頻繁に一緒に現れる遺伝子のペアや避け合う傾向にある遺伝子のペアを特定することを目指している。遺伝子が似たパターンを示すのは、直接的な関係からではなく、祖先からの継承や集団の構造による可能性がある。 一緒にいることで大きな利益をもたらす遺伝子は、集団内でより頻繁に一緒に現れる可能性が高い。

ゴールドファインダーは、共通の系統によって共に現れるペアと自然選択によって共に現れるペアを区別している。そのために、ツールは系統間の関係に基づいて期待されるパターンを生成し、偶然の結果よりも多く現れる組み合わせを特定している。

ゴールドファインダーの仕組み

ゴールドファインダーには主に二つの情報が必要で、一つは異なる系統がどのように関係しているかを示す根付き系統樹で、もう一つは各系統の遺伝子の存在・不在パターンだ。もし系統樹が根付きでない場合、ゴールドファインダーは中点法を使って根を決定するよ。

このデータを取得すると、ゴールドファインダーは遺伝子の共出現や回避の可能性を反映したスコアを計算する。これらのスコアは、偶然の出現ではなく真の関係をどれだけ効果的に特定できるかによって異なる。ゴールドファインダーは、端末スコア、コインファインダースコア、同時スコアの三つの異なるスコアリング方法を使用している。

端末スコアは、両方の遺伝子が存在または不在の系統がいくつあるかを評価し、コインファインダースコアは、一方の遺伝子が存在する場合の他方の遺伝子の不在を重視している。同時スコアは、系統樹の枝を見て、遺伝子が時間とともに状態がどう変わったかを見ている。

ニル分布のシミュレーション

遺伝子間の共出現が異常なレベルであるかどうかを理解するために、ゴールドファインダーはシミュレーションを使って、遺伝子間に真の関係がない場合に期待されるスコアの分布を作成する。これは、遺伝子が独立に進化するシミュレーションを実行することを意味するよ。実データとこのシミュレーションされた分布を比較することで、ゴールドファインダーは遺伝子ペアのp値を導出し、共出現や回避が統計的に有意かどうかを示すことができる。

このツールは、これらの関係を視覚化するネットワークも作成できて、どの遺伝子が一緒に集まる傾向があるのか、どの遺伝子が避け合うのかを示すことができるよ。これにより、遺伝子プール内のつながりがより明確になるんだ。

遺伝子クラスタの特定

多くの遺伝子ペアが関連していることが見つかると、ゴールドファインダーはそれらを結びつけて、共出現する遺伝子の大きなネットワークを形成することができる。このネットワーク内では、頻繁に一緒に現れる遺伝子の濃密なクラスタを特定するのに設計されたアルゴリズムを使うことができる。

さらに、ゴールドファインダーはこれらの遺伝子クラスタ間の解離を分析して、異なる遺伝子群がどのように相互作用したり避け合ったりするのかを明らかにすることができるんだ。

視覚化と実用的な応用

ゴールドファインダーは、ユーザーが遺伝子の共出現ネットワークを探索できるいくつかの視覚化を出力する。この視覚化は、グラフィカルな表現用のソフトウェアを使ってさらに検討することができて、遺伝子間の関係を理解するのが簡単になるよ。

研究者たちは、さまざまな細菌集団にゴールドファインダーを適用することで、進化のダイナミクスを解明する手助けができる。ゴールドファインダーの発見を既存のツールの結果と比較することで、ゴールドファインダーは少ない遺伝子ペアを特定するかもしれないけど、共選択に関与する広範な遺伝子を認識することが多いことが明らかになる。

このツールは、細菌集団における遺伝的多様性を形成する力を明らかにし、微生物コミュニティ内の複雑さを解き明かすための将来の研究に向けた方法を提供しているんだ。

オリジナルソース

タイトル: Goldfinder: Unraveling Networks of Gene Co-occurrence and Avoidance in Bacterial Pangenomes

概要: The pangenome is the set of all genes present in a prokaryotic species. Most pangenomes contain many accessory genes that are present in only some of the species members. Genes need to function together, and it has been suggested that selection for certain gene combinations affects the structure of prokaryotic pangenomes. Nevertheless, genes might also co-occur simply due to being linked on the genome, and efficient tools are needed to distinguish linkage from co-selection. Here we present Goldfinder, an approach to infer co-occurrence and co-avoidance between gene pairs by taking the phylogenetic relationships of the species into account. The approach is implemented in an efficient Python script available at https://github.com/fbaumdicker/goldfinder. We also provide scripts for clustering co-occurring genes and for visualizing the resulting co-occurrence and co-avoidance networks in Cytoscape. In comparison to the co-occurrence inference tool Coinfinder, Goldfinder finds fewer co-occurring pairs in a real species pangenome, suggesting that fewer spurious associations due to phylogenetic dependencies are detected. We conclude that Goldfinder is a fast and accurate tool to infer gene co-occurrence and co-avoidance, which will enable large-scale analyses to infer co-selected genes across bacterial pangenomes.

著者: Franz Baumdicker, A. Gavriilidou, E. Paulitz, C. Resl, N. Ziemert, A. Kupczok

最終更新: 2024-05-02 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.04.29.591652

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.04.29.591652.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

著者たちからもっと読む

類似の記事

ソフトウェア工学LLMを使って自動ソフトウェアトレーサビリティを改善する

この記事では、大規模言語モデルを使ってソフトウェアのトレーサビリティを向上させるためのプロンプトの使い方について話してるよ。

― 1 分で読む