新しい方法が遺伝子ネットワークの理解を深める
遺伝子共発現を研究する新しいアプローチが複雑な関係を明らかにしている。
― 1 分で読む
目次
遺伝子共発現ネットワークは、科学者が細胞や生物の中で遺伝子がどのように協力して働くかを研究するのに役立つツールだよ。いろんな遺伝子の発現レベルを見ることで、同時に活発な遺伝子がどれかを確認できる。これによって、似たような役割や機能を持っている可能性が示唆されるんだ。発現に基づいてつながっている遺伝子のネットワークは、生物内のいろんなプロセスを制御する重要な遺伝子を特定するのに役立つんだ。
遺伝子をクラスタリングする重要性
何千もの遺伝子発現レベルが含まれている大規模なデータセットを扱うとき、すべてを一度に分析するのは難しいよね。役立つ戦略の一つは、行動が似ている遺伝子を小さなグループにクラスタリングすることだ。このプロセスは、何千もの個々の遺伝子ではなく、いくつかのグループに焦点を当てることで分析を簡略化するんだ。そして、他の多くの遺伝子とつながっている重要な遺伝子、いわゆるハブ遺伝子を強調するのにも役立つよ。
遺伝子をクラスタリングする方法
遺伝子共発現ネットワークを扱うときの主な質問は、どのように遺伝子を効果的にクラスタリングするかということだ。多くの方法は、似た遺伝子を探して、似た遺伝子が同じ生物学的機能に関与するという前提に基づいている。最も単純な類似性の一つは、遺伝子の発現レベルがどれだけ相関しているかに基づいている。遺伝子が高度に相関している場合は同じグループにまとめられ、相関がない場合は異なるグループに分けられる。
アソート性と遺伝子モジュール
これらの分析でよく見られるパターンはアソート性と呼ばれる。これは、同じグループの遺伝子が他のグループの遺伝子よりもお互いにより多くつながっていることを意味する。この方法で形成されるグループはアソートモジュールと呼ばれる。類似性を定義する方法はいくつかあって、どれも異なるクラスタリング結果をもたらすんだ。
人気のある方法の一つは、加重遺伝子共発現ネットワーク分析(WGCNA)と呼ばれる。この技術は相関値をより有用な形式に変換して、ネットワーク内で最も重要なつながりを強調するんだ。WGCNAの目的は、グループ内でどれだけつながっているかを分析してハブ遺伝子を特定することだ。もう一つの方法であるモジュレーテッドモジュラリティクラスタリング(MMC)は、遺伝子グループ内外のつながりを最大化することに焦点を当てているけど、アソート的でない他の遺伝子のグループを見落とすことがあるんだ。
代替ネットワーク構造
アソート性に基づいて遺伝子をクラスタリングするのは直感的だけど、それが遺伝子発現ネットワークの理解を制限する可能性があるんだ。一部の研究者は、これらのネットワークにはアソート的でない構造もあることを見つけた。アソート的でないネットワークでは、遺伝子がグループの中に閉じ込められずに、グループ間を越えてつながることが多いんだ。他にもコア・ペリフェリーのネットワークなども存在する。コア・ペリフェリーネットワークでは、中央に密に接続された遺伝子のグループがあり、外側のグループは互いにあまり接続されていないことがある。
現在、アソート性にのみ焦点を当てた多くの方法は、これらの代替構造を捕らえるのを見逃すかもしれない。これが、実際の遺伝子共発現データにどのくらいこれらのパターンが現れるのかという疑問を引き起こすんだ。他の生物学的ネットワーク、例えば神経細胞に見られるネットワークもこれらの代替構造を示している。そして、科学者たちは遺伝子発現システムにも多様な組織パターンがあるかもしれないと考えるようになったんだ。
新しいクラスタリングアプローチ
遺伝子共発現ネットワークのこれらの代替構造を調べるために、研究者たちは加重ネスト度補正確率ブロックモデル(SBM)という新しい方法を開発した。このモデルは、従来のアソートモジュールというアイデアに頼ることなく、意味のある遺伝子のグループを探すんだ。代わりに、遺伝子がどのようにお互いに接続しているかの全ての情報を利用するんだ。
SBMでは、強く相関しているものだけじゃなく、さまざまな種類の接続を反映したクラスタを許可するよ。これはアソート的な組織パターンとアソート的でない組織パターンの両方を明らかにすることができるから、実際の生物学的関係を特定するのに役立つんだ。
SBMの実装
研究者たちは、SBMを適用するために果物バエのデータセットを利用して、遺伝子クラスタを分析したよ。彼らは頭部と体の二つの種類の組織に焦点を当てて、遺伝子発現レベルを測定する特定のRNAシーケンシング法を使用したんだ。SBMを使うことで、他の方法と比べてより多くの遺伝子クラスタを見つけることを目指した。そして、これらのクラスタが遺伝子オントロジーの濃厚な関連性を調べることで、生物学的に関連があることを示したかったんだ。
ネットワークの複雑さを減らす
遺伝子共発現ネットワークを構築するために、研究者たちはまずネットワークの複雑さを減らして、分析しやすくする必要があったんだ。弱いつながりを持つエッジを削除することで、真の生物学的関係を表す可能性が低くなるからだ。厳格な偽発見率(FDR)のカットオフを設定することで、最も強い接続だけを残したよ。
このプロセスの結果、密度は低いけど、遺伝子間の相互作用で重要な役割を果たす遺伝子のほとんどを保持するネットワークが得られたんだ。最終的なネットワークは、SBMの適合をより効率的に行うことを可能にし、遺伝子発現データの組織に関する洞察を得られたよ。
クラスタリング手法の比較
研究者たちはSBMを伝統的な遺伝子クラスタリング手法であるWGCNAと比較したよ。WGCNAは通常、完全に接続されたネットワークを扱い、特定の閾値とパラメータに基づいてグループを特定するけど、この方法は時々、多くの遺伝子を見逃してしまうことがあるんだ。
それに対して、SBMはすべての遺伝子をうまくクラスタリングして、より広範で意味のあるネストされた階層を特定したよ。SBMはWGCNAによって作成された少数の広いグループとは対照的に、複数のレベルにわたって遺伝子クラスタの詳細な内訳を示したんだ。
ネットワークのアソート性とモジュラリティ
SBMはモジュラリティを最大化することを目指していないけど、それでも識別したクラスタのモジュラリティを測定することができたよ。研究者たちは、全体のモジュラリティとアソート性が頭部組織に比べて体組織で低いことを見つけた。一部の遺伝子グループは、異なるグループの遺伝子とより多く接続していて、より複雑なネットワーク構造を示しているんだ。
さらに、SBMは多くのブロックが遺伝子オントロジーの濃厚な関連性を通じて重要な生物学的意味を示していることを明らかにした。これは、遺伝子ネットワークのモジュラー構造が均一ではなく、異なる組織タイプによって大きく異なる可能性があることを示唆しているんだ。
クラスタリング結果からの生物学的洞察
これらの発見の生物学的な意味は深いよ。SBMは、遺伝子発現ネットワークは厳密にモジュラーでなく、同じくらい重要な非モジュラーコンポーネントを含むことができることを示したんだ。これは、すべての遺伝子グループがモジュラーな振る舞いを示す必要があるという伝統的な見解に挑戦するもので、遺伝子ネットワーク内の代替的な配置を考慮する必要があることを強調しているよ。
例えば、翻訳に関連する特定の遺伝子グループが、他のよりアソート的なグループとは別に特定された。このことは、異なる遺伝子機能が複雑なパターンでどのように相互接続されるかを強調するのに役立つよ。
発見の重要性
この発見は、アソート性の仮定にのみ基づいたクラスタリングアルゴリズムを使用する重要性を強調しているんだ。SBMのような柔軟な方法を利用することで、研究者は遺伝子発現ネットワークの構造をより包括的かつ偏見なしに探求できるようになる。これにより、遺伝子間の多様な関係を明らかにして、遺伝子機能や調節に対する理解が深まるんだ。
結論
遺伝子共発現ネットワークを調査することは、遺伝子が生物学的システム内でどのように相互作用し、機能しているかを理解するために重要だよ。SBMのような多様なクラスタリング手法を利用することで、研究者は遺伝子ネットワークの複雑な組織を明らかにするのにより適しているんだ。結果は、これらのネットワークがモジュラー特性と非モジュラー特性の両方を示すことができることを示していて、遺伝子相互作用の生物学的意義の理解をより豊かにしているよ。
遺伝子共発現ネットワークの探求は進化し続けていて、各新しい方法が遺伝子関係の異なる側面を明らかにしている。この継続的な研究は、最終的に遺伝学とその健康、病気、進化への影響の理解に貢献するんだ。
タイトル: Reassessing the modularity of gene co-expression networks using the Stochastic Block Model
概要: Finding communities in gene co-expression networks is a common first step toward extracting biological insight from these complex datasets. Most community detection algorithms expect genes to be organized into assortative modules, that is, groups of genes that are more associated with each other than with genes in other groups. While it is reasonable to expect that these modules exist, using methods that assume they exist a priori is risky, as it guarantees that alternative organizations of gene interactions will be ignored. Here, we ask: can we find meaningful communities without imposing a modular organization on gene co-expression networks, and how modular are these communities? For this, we use a recently developed community detection method, the weighted degree corrected stochastic block model (SBM), that does not assume that assortative modules exist. Instead, the SBM attempts to efficiently use all information contained in the co-expression network to separate the genes into hierarchically organized blocks of genes. Using RNA-seq gene expression data measured in two tissues derived from an outbred population of Drosophila melanogaster, we show that (a) the SBM is able to find ten times as many groups as competing methods, that (b) several of those gene groups are not modular, and that (c) the functional enrichment for non-modular groups is as strong as for modular communities. These results show that the transcriptome is structured in more complex ways than traditionally thought and that we should revisit the long-standing assumption that modularity is the main driver of the structuring of gene co-expression networks.
著者: Julien F. Ayroles, D. Melo, L. F. Pallares
最終更新: 2024-04-10 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2023.05.31.542906
ソースPDF: https://www.biorxiv.org/content/10.1101/2023.05.31.542906.full.pdf
ライセンス: https://creativecommons.org/licenses/by-nc/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。