新しいツールが細菌のRNA転写物を予測する
研究者たちが細菌のRNA転写物を予測するツールを開発して、遺伝子調節の理解が深まったよ。
― 1 分で読む
科学者たちはバクテリアや古細菌の遺伝子とゲノムを研究してきたけど、ほとんどの研究はタンパク質に焦点を当ててきたんだ。これは人間のゲノム研究とは違ってて、最初にRNAのトランスクリプトを調べてから全ゲノムをシーケンスしてるんだ。最近、研究者たちは特定のシーケンシングデータからバクテリアと古細菌のRNAトランスクリプトを迅速かつ安価に予測する新しいツールを作ったんだ。この予測は、これらの生物が遺伝子をどう調節しているか、特に有害な特性に関連して理解するのに重要で、新しいRNAベースの治療法や診断ツールを開発するのにも役立つんだ。
今、科学者たちは全てのタイプの生物を研究するためにゲノミクスと計算生物学を使ってる。全ゲノムシーケンシングやタンパク質の分析みたいな方法は、バクテリアや古細菌にとってスタンダードで手頃になってきた。でも、ほとんどの分析は主にタンパク質コーディング領域や、リボソームRNAみたいなよく知られたノンコーディングRNAに焦点を当ててきたんだ。だけど、病原体が生成するRNAトランスクリプト、特にノンコーディングRNAは、新しい薬や診断のターゲットになるかもしれない。
トランスクリプトは、さまざまな生物学的プロセスを通じて作られるRNAの一部分で、始まりと終わりのポイントによって特定できるんだ。これらのトランスクリプトはオペロンと呼ばれるより大きなグループの一部なんだけど、遺伝子発現を調整する領域も含まれてる。オペロンはバクテリアや古細菌に共通してて、多くのツールがそれを予測するために開発されてきた。たとえば、Rockhopperっていう注目すべきツールは、発現パターンや遺伝子間の距離に基づいてこれらの予測をするための統計的方法を使ってるんだ。歴史的には、オペロンの定義はDNAに基づいてたから、RNAベースのトランスクリプトを理解するのに制約があったんだ。
研究者たちが直面している一つの課題は、現在のツールがRNAに関する重要な詳細を見逃すことが多くて、遺伝子発現の全体像が不完全になることなんだ。たとえば、よく研究されているバクテリアのE. coliでは、そのRNAに関する予測があったけど、多くの参照ファイルにはトランスクリプト構造についての重要な情報がまだ欠けているんだ。これが、様々な微生物における遺伝子発現の研究に障害を生じさせてるんだ、バクテリアには多様性があるのに。
この問題を解決するために、科学者たちは異なる種にわたって機能するバクテリアのトランスクリプトを特定するための高速で簡単で信頼性のある方法を作ることを目指して、最近のRNAシーケンシング技術の進展を活用したんだ。トランスクリプトを正確に予測することで、研究者たちは遺伝子発現をより徹底的に探求できるし、ノンコーディングRNAの役割を含めて新しい分析ツールを適用できるんだ。
実験的アプローチ
研究では、科学者たちはONTダイレクトRNAシーケンシングっていうシーケンシング方法を使ってE. coli株を分析したんだ。彼らは、病原性因子を引き起こすことが知られている特定の条件下で成長させたこれらのバクテリアからシーケンシングデータを取得したんだ。他のバクテリア株からの既存の公的データも比較のために集めたよ。
この技術を使って、彼らは大量のシーケンシングデータを生成し、それを利用してRNAトランスクリプトを予測したんだ。E. coli K12株では、数千のRNA領域を特定したけど、多くは重複していたり、DNAの異なる鎖に見られたりしたんだ。彼らはこれらのトランスクリプトを、タンパク質をコードするもの(mRNA)とそうでないもの(ncRNA)の二つの主なカテゴリーに分類したんだ。
さらに、研究者たちはこれらのトランスクリプトの非翻訳領域(UTR)を特定するための方法も作ったんだ。これは、遺伝子がどのように調節されるかを理解するのに重要なんだ。多くの予測されたトランスクリプトが既知の遺伝子に対応していたけど、相当数は既存のデータベースでは見つからない新しい発見だったんだ。
バクテリアの転写に関する洞察
この研究は、バクテリアのRNAトランスクリプトの複雑な景観を明らかにして、多くの以前の予測を確認すると同時に新しいものも明らかにしたんだ。たとえば、E. coliのthrオペロン内で、いくつかのトランスクリプトが特定され、よく知られたリーダーペプチドトランスクリプトも含まれていたよ。他の領域はさらに複雑で、互いに影響を与え合う可能性のある複数のRNAトランスクリプトの証拠を示していたんだ。
研究者たちは、彼らの予測がトランスクリプトの正確な始まりと終わりのポイントを特定する上での不正確さをしばしば明らかにすることを発見したんだ。この変動は、バクテリアの転写が柔軟なプロセスで、環境条件に基づいて幅広いRNA分子を生成できることを示しているんだ。
同じ方法を他のバクテリア株に適用したら、似たようなパターンが見られたよ。シーケンシングデータの量は異なってたけど、それでもなお相当数のRNAトランスクリプトを特定できたから、彼らの方法は堅牢で、さまざまな種に広く適用できることが分かったんだ。
ノンコーディングRNAの分析
ノンコーディングRNAは特に重要で、遺伝子発現や細胞機能を調節するのに重要な役割を果たすことがあるんだ。この研究では、以前に文書化されていなかった多くの予測ノンコーディングRNAが特定されて、バクテリアの生命におけるその重要性が明らかになったんだ。
研究者たちは、これらのノンコーディングRNAの存在が、特に現在の抗生物質に対して耐性を示す株に対する治療法の開発に新しい道を提供するかもしれないと指摘しているよ。これらのRNA分子に焦点を当てることで、科学者たちは有害なバクテリアの機能を妨害する新しい戦略を見つけるかもしれないんだ。
正確なRNA予測の重要性
RNAトランスクリプトの正確な予測は、バクテリアの生物学を徹底的に理解するために必要なんだ。この研究は、バクテリアのゲノムの複雑さとその転写プロファイルが、特化したツールと方法の開発を必要とすることを強調しているよ。多くの既存のアルゴリズムは、人間のゲノムを分析するように設計されているけど、バクテリアのRNAデータに含まれる重複トランスクリプトや異なるDNA鎖由来のものなどのニュアンスを捉えられていないんだ。
研究者たちがこれらの予測ツールを改良し続けることで、バクテリアの遺伝子調節や病原性との関係についてより良い洞察を得ることができるんだ。この知識は、新しい治療法のターゲットを特定することや、診断を改善することにつながるかもしれない。
RNAシーケンシング技術の進展
新しいRNAシーケンシング技術の導入により、研究者たちはバクテリアのトランスクリプトームを前例のない詳細で探求できるようになったんだ。ONTダイレクトRNAシーケンシングのような方法は、逆転写を必要とせずにRNA分子を直接分析することを可能にするから、エラーやバイアスを導入することがないんだ。
これらの先進的な技術を使うことで、科学者たちはRNAトランスクリプトをより信頼性高く予測できるだけでなく、RNAの機能に影響を与えるかもしれない転写後修飾についての洞察も得られるんだ。これらの修飾を検出する能力は、RNA生物学やバクテリアの行動および治療戦略におけるその影響をより深く理解するのに役立つんだ。
課題と今後の方向性
バクテリアのRNA研究において進展があったとはいえ、課題は残ってるんだ。たとえば、フルレングスのRNAリードを取得するのは難しいままだし、特に長いトランスクリプトに関してはね。シーケンシング技術と方法論の改善が、これらの制限を克服するためには必要不可欠なんだ。
研究者たちは、バクテリアのトランスクリプトシーケンシングの進展が、真核生物向けのものと同じようなより良いツールや方法につながることを願っているんだ。フィールドが進化するにつれて、これらの分子の複雑さや多様性を反映した新しいバクテリアRNAのアノテーション基準を確立することが重要になるだろうね。最終的には、バクテリアの生物学を理解するのに役立つんだ。
結論
バクテリアや古細菌のRNAトランスクリプトの研究は、遺伝子調節や宿主-病原体相互作用、新しい治療アプローチの開発を理解する上で不可欠な分野なんだ。包括的なRNA予測に焦点を当てて、高度なシーケンシング技術を利用することで、科学者たちはバクテリアの生命の豊かな複雑さを明らかにし、新しい薬の開発のためのターゲットを特定できるんだ。この分野が進化し続ける限り、微生物RNAの複雑な世界やそれが人間の健康に及ぼす影響についてもさらに多くのことが明らかになるだろうね。
タイトル: Deciphering Bacterial and Archaeal Transcriptional Dark Matter and Its Architectural Complexity
概要: Transcripts are potential therapeutic targets, yet bacterial transcripts remain biological dark matter with uncharacterized biodiversity. We developed and applied an algorithm to predict transcripts for Escherichia coli K12 and E2348/69 strains (Bacteria:gamma-Proteobacteria) with newly generated ONT direct RNA sequencing data while predicting transcripts for Listeria monocytogenes strains Scott A and RO15 (Bacteria:Firmicute), Pseudomonas aeruginosa strains SG17M and NN2 strains (Bacteria:gamma-Proteobacteria), and Haloferax volcanii (Archaea:Halobacteria) using publicly available data. From >5 million E. coli K12 ONT direct RNA sequencing reads, 2,484 mRNAs are predicted and contain more than half of the predicted E. coli proteins. While the number of predicted transcripts varied by strain based on the amount of sequence data used for the predictions, across all strains examined, the average size of the predicted mRNAs is 1.6-1.7 kbp while the median size of the predicted bacterial 5-and 3-UTRs are 30-90 bp. Given the lack of bacterial and archaeal transcript annotation, most predictions are of novel transcripts, but we also predicted many previously characterized mRNAs and ncRNAs, including post-transcriptionally generated transcripts and small RNAs associated with pathogenesis in the E. coli E2348/69 LEE pathogenicity islands. We predicted small transcripts in the 100-200 bp range as well as >10 kbp transcripts for all strains, with the longest transcript for two of the seven strains being the nuo operon transcript, and for another two strains it was a phage/prophage transcript. This quick, easy, inexpensive, and reproducible method will facilitate the presentation of operons, transcripts, and UTR predictions alongside CDS and protein predictions in bacterial genome annotation as important resources for the research community.
著者: Julie C. Dunning Hotopp, J. S. A. Mattick, R. E. Bromley, K. J. Watson, R. S. Adkins, C. I. Holt, J. F. Lebov, B. C. Sparklin, T. S. Tyson, D. A. Rasko
最終更新: 2024-04-03 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.04.02.587803
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.04.02.587803.full.pdf
ライセンス: https://creativecommons.org/licenses/by-nc/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。