大腸菌の転写因子に関する新しい洞察
研究がE. coliの転写因子の新しい結合部位を明らかにした。
― 1 分で読む
目次
大腸菌、つまりE. coliは、科学者たちがよく研究する細菌の一種なんだ。生物学やバイオテクノロジーで重要で、基本的な生命プロセスを理解したり、新しい技術を開発したりするのに役立つんだよ。でも、E. coliについての研究はたくさんあるけど、特に転写因子(TF)と呼ばれる特定のタンパク質がどう機能するかについてはまだわからないことが多いんだ。
転写因子は遺伝子の活性を制御するのを助けるタンパク質なんだ。彼らはDNAの特定の部分に結合して、どの遺伝子がオンになったりオフになったりするかに影響を与えるんだ。E. coliには約300種類のTFが知られているけど、そのうち詳細な情報がわかっているのはほんの一部なんだ。最近の推定では、これらのTFがDNAとどのように相互作用するかについては30%しか完全に理解していないらしい。
多くの転写因子については、結合するDNA配列に関する情報が不足していて、行動を示す科学的モデルもほとんどないんだ。細胞がどう働くかを理解し、新しい生物システムを開発するには、これらのタンパク質をもっと理解することが重要なんだ。
転写因子の研究方法
科学者たちがTFの結合を研究するために使う一つの方法は、クロマチン免疫沈降後のシーケンシング(ChIP-seq)っていう技術なんだ。この技術を使うと、研究者は生きた細胞全体のゲノムにわたる転写因子の全ての結合部位を調べることができる。でも、実験条件によってTFがDNAにどれだけうまく結合するかが変わるから、結果はバラつくことがあるんだ。
ChIP-Seqは強い結合部位と弱い結合部位の両方を見つけられるけど、研究者たちは弱い結合部位を無視することが多いんだ。でも、実際には弱い結合部位も遺伝子の調節に重要な役割を果たすことがあるんだ。ほとんどの研究が強い結合部位の特定に焦点を当てるけど、TFの行動を完全に理解するには、すべての可能なDNA配列に対する予測が必要なんだ。
ニューラルネットワークを使ったデータ分析の進展
最近、研究者たちは畳み込みニューラルネットワーク(CNN)を使ってChIP-Seqデータを分析するツールを開発したんだ。これらのモデルは、特に真核生物の研究で良い結果を出していて、複雑な相互作用がTFの結合を支配しているんだ。でも、これらの複雑なモデルがE. coliのようなシンプルな細菌システムにどれだけ適用できるのかは不明なんだ。
これらの高度なモデルは、一部の結合特性をうまく捉えられるけど、複雑になりすぎて結果の解釈が難しくなることもあるんだ。これらのモデルが生成するスコアは、物理的な生物学とは直接関係しないことが多くて、検証が難しいんだ。
熱力学モデルは、TFの行動を説明するもっと簡単な方法を提供しているんだ。これらのモデルは、TFの結合を実験室でテスト可能な測定可能な物理量に結びつけているんだ。研究者はTFがDNAに結合する際のエネルギーの変化を計算できて、特定の配列にどれだけ結合しやすいかを予測することができるんだ。
E. coliにおけるTFの結合マッピング
この研究では、科学者たちは139のE. coliの転写因子がDNAにどう結合するかを、標準化されたChIP-Seqアプローチを使って特定することを目指したんだ。彼らは、このデータをもっと正確に分析するために「BoltzNet」っていう新しいニューラルネットワークを開発したんだ。BoltzNetは、TFがどこに結合するかだけじゃなくて、そのDNA配列に基づいてどれだけ強く結合するかも予測することができるんだ。
研究者たちはTFをタグ付けして研究しやすくして、制御された条件でテストしたんだ。十分な量のTFを分析のために得られるように、2つの発現システムを使ったんだ。結果は複数の実験から生成されて、発見が一貫しているか確認されたんだ。
この研究では、これらの転写因子の新しい結合部位が多く見つかったんだ。データはTFの発現レベルと実験条件が結合結果に大きく影響することを示していたんだ。
BoltzNetからの洞察
BoltzNetは、TFの結合について解釈可能な予測を提供するユニークなモデルなんだ。熱力学モデルと一緒に機能するように設計されていて、DNA配列を使ってあるTFが特定のDNA部位に結合する可能性を予測するんだ。このモデルは、配列データだけで非常に正確な結果を出すことができるんだ。
ニューラルネットワークのデザインにより、研究者たちは大量のデータを迅速かつ効率的に分析できるんだ。BoltzNetはヌクレオチドレベルで予測を提供できるから、DNA配列の個々の塩基が結合強度にどのように寄与するかについて詳細な情報を提供できるんだ。
BoltzNetの性能を評価する中で、研究者たちはそれが結合部位の場所やモチーフ、ChIP-Seq実験におけるカバレッジのレベルを成功裏に予測できることを発見したんだ。これらの予測は実際の観測結果とよく一致していて、モデルの精度を示しているんだ。
結合部位の特徴の重要性
結合パターンの分析では、多くの転写因子が複数の結合部位を集中的に持っていることがわかったんだ。これらのクラスターは結合強度を高めて、遺伝子調節を維持するのに役立つんだ。コア結合モチーフに含まれないアクセサリーベースの存在も、結合強度に影響を与えることがあるんだ。これらのアクセサリーベースは保存が少ないけど、TFとDNAの相互作用を安定させるのに重要な役割を果たすんだ。
BoltzNetの予測力を試すために、科学者たちはモデルの予測に基づいて新しい合成結合部位をデザインしたんだ。彼らは既存の結合配列のバリエーションを作って、変化が結合強度にどのように影響するかを調べたんだ。結果は、モデルがどの配列がより効果的に結合するかを正確に予測できることを確認したんだ。
結合エネルギー予測の検証
結合部位の場所をテストするだけじゃなくて、研究者たちはBoltzNetの予測が実際の結合エネルギーと一致するかどうかも確認したかったんだ。彼らはBioLayer Interferometry(BLI)っていう方法を使って、制御された条件下でタンパク質がDNAとどう相互作用するかを測定したんだ。この技術により、TFが自然なDNA配列と合成DNA配列に対する結合強度を評価できたんだ。
BLIからの結果は、BoltzNetの結合エネルギー予測が測定値とよく一致することを確認したんだ。この検証は、BoltzNetがTFの結合行動を予測するのに役立ち、異なるTF-DNA相互作用の相対的な強さを理解する手助けができることを示唆しているんだ。
遺伝子調節理解への影響
転写因子の結合行動に関する発見は、遺伝子調節を理解する上でより広い影響を持っているんだ。結果は、ほとんどの転写因子がゲノムに非特異的に結合する可能性が高く、溶液中で自由にしているよりも、細胞内でどう遺伝子が調節されるかに影響を及ぼすことを示唆しているんだ。
BoltzNetが結合親和性を予測するためのより正確なモデルを提供することで、E. coliのような原核生物システムにおける遺伝子調節の仕組みをより明確に描き出すのを助けているんだ。この研究は、強い結合部位だけが重要だという従来の見方に挑戦して、TFの活動の全体像を理解するのにおける弱い結合部位の重要性を強調しているんだ。
結論
要するに、この研究はChIP-Seqデータの統合とBoltzNetの開発を通じて、E. coliにおける転写因子の結合についてより包括的な理解を提供しているんだ。結合部位を全体的にマッピングして、熱力学的アプローチを使ってデータを分析することで、科学者たちは転写因子が遺伝子発現をどう調節するのかをよりよく把握できるようになるんだ。
この研究から得られた洞察は、他の生物に同様の方法を適用して細胞機能を支配する複雑な相互作用のネットワークを理解するための将来の研究への道を開くんだ。BoltzNetは、タンパク質-DNA相互作用の複雑なダイナミクスを探求しようとする研究者にとって重要なツールになるんだ。
タイトル: Predictive Biophysical Neural Network Modeling of a Compendium of in vivo Transcription Factor DNA Binding Profiles for Escherichia coli
概要: The DNA binding of most Escherichia coli Transcription Factors (TFs) has not been comprehensively mapped, and few have models that can quantitatively predict binding affinity. We report the global mapping of in vivo DNA binding for 139 E. coli TFs using ChIP-Seq. We used these data to train BoltzNet, a novel neural network that predicts TF binding energy from DNA sequence. BoltzNet mirrors a quantitative biophysical model and provides directly interpretable predictions genome-wide at nucleotide resolution. We used BoltzNet to quantitatively design novel binding sites, which we validated with biophysical experiments on purified protein. We have generated models for 125 TFs that provide insight into global features of TF binding, including clustering of sites, the role of accessory bases, the relevance of weak sites, and the background affinity of the genome. Our paper provides new paradigms for studying TF-DNA binding and for the development of biophysically motivated neural networks.
著者: James E Galagan, P. Lally, L. Gomez-Romero, V. H. Tierrafria, P. Aquino, C. Rioualen, X. Zhang, S. Kim, G. Baniulyte, J. Plitnick, C. Smith, M. Babu, J. Collado-Vides, J. Wade
最終更新: 2024-05-24 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.05.23.594371
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.05.23.594371.full.pdf
ライセンス: https://creativecommons.org/licenses/by-nc/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。