環状RNAの構造予測の進展
新しいモデルが円形RNA構造の予測を強化して、精度と効率を向上させたよ。
― 1 分で読む
目次
円形RNA(circRNA)は、直鎖ではなくループを形成する特別なタイプのRNAだよ。従来の直線RNAとは違って、円形RNAは一方の端にキャップも、もう一方の端にテールもないんだ。このユニークな形はバックスプライシングと呼ばれるプロセスを通じて作られて、RNAの断片が結合して円を形成する。結合が起こる端はバックスプライシングジャンクションって呼ばれるんだ。
最初の円形RNAは、40年以上前に特定の植物ウイルスで発見された。それ以来、RNAシーケンシングやバイオインフォマティクスの進展により、真菌、植物、ワーム、魚、昆虫、哺乳類などのさまざまな生物で何千もの円形RNAが特定されてきた。これらの円形RNAの多くは、タンパク質をコーディングする遺伝子からも派生していて、生物学的プロセスにおいて重要な役割を果たすかもしれないことを示唆しているんだ。
円形RNAの主な機能の一つは、他のRNA分子を調整する小さな分子であるマイクロRNAのスポンジとして機能することだよ。マイクロRNAに結合することによって、円形RNAは特定のRNAメッセージに干渉するのを防ぐんだ。他の知られている円形RNAの機能には、タンパク質の生産を助けたり、RNAに結合するタンパク質と相互作用したり、タンパク質を細胞内の特定の場所に誘導したり、ユニークな小さなタンパク質を生成したりすることが含まれている。
さまざまな機能を持っているから、円形RNAは特定の形を持たなきゃならない。でも、その柔軟性と長さのために3D構造を理解するのは難しいんだ。今のところ、円形RNAの完全な3D構造は一つしか文書化されていなくて、これらの構造を予測するためのより良い方法を開発することが急務だよ。
円形RNA構造予測の重要性
現在のRNAの3D構造を予測する方法は、一般的にテンプレートベースの方法とアブイニシオ法の2つに分けられる。テンプレートベースの方法は既存のRNA構造に依存して新しいRNA配列の形を予測する一方で、アブイニシオ法は既知のテンプレートを必要とせず、シミュレーションを使用して多くの可能な形を探るんだ。どちらにも長所と短所があるよ。
テンプレートベースの方法は早くできるけど、良いテンプレートがないと失敗しがち。一方で、アブイニシオ法はどんなRNA構造でも予測できるけど、計算リソースと時間がもっと必要かもね。最近、人工知能もRNAの形を予測するのに潜在能力を見せていて、特に直線RNAに対して効果的なんだ。
円形RNAについては、円形RNAに対応させたテンプレートベースのモデルの拡張である唯一の計算方法が存在しているよ。でも、限られたテンプレートしかないから、円形RNAの形をもっと効果的に予測できる代替手段が強く求められているんだ。
IsRNAcircの開発
この課題に取り組むために、線形RNA用に設計された以前のモデルに基づいて、IsRNAcircという新しいモデルが開発されたんだ。このモデルはRNAの簡略化された表現を使って、円形RNAの3D形状を予測するためのシミュレーションを適用するよ。
予測プロセスは、RNA配列、予測された2D構造、およびその直線対称の初期3D構造を含む入力データを準備することから始まる。入力準備の後、特有の「エンドクローズ」ステップがあって、二つの端を結合して円形を形成する。これに続いて構造予測と改良が行われるんだ。
予測段階では、モデルが無数の可能な形をサンプリングして、最も可能性の高い候補を見つけるよ。最後のステップでは、予測された構造の不規則性が修正されて、クリーンで正確なモデルが作られるんだ。
IsRNAcircの性能テスト
IsRNAcircの効果は、長さや構造タイプが異なる34の円形RNAのデータセットを使ってテストされたよ。これらのRNAサンプルは、ヘリックス、ヘアピン、内部ループ、ジャンクションを含むかどうかによって、構造的特徴に基づいて分類されたんだ。
各タイプの円形RNAは、その予測された構造が直線対称と比較して異なる特性を示し、モデルの予測能力を確認するのに役立ったよ。結果は、IsRNAcircによって予測された3D構造が直線バージョンとは大きく異なることを示していた。データは、長い円形RNAが直線形よりもよりユニークな形を採用する傾向があることを示しているんだ。
従来の方法を使って生成された初期構造の多くには、形に欠陥があったんだ。たとえば、存在すべきではないループや、不適切に絡み合ったセグメントが見つかったりしたよ。IsRNAcircはこれらの問題を修正できて、最終モデルに存在する悪い構造の数を劇的に減らしたんだ。
円形RNA構造の詳細な予測
具体的な例を挙げるために、各円形RNAタイプの代表的なケースが分析されたよ。
ヘリックス-円形RNA
ヘリックス-円形RNAの場合、336ヌクレオチドからなるPOLR2Aという分子が選ばれた。予測された構造は、円形形成が二本鎖領域内に位置していることを示していた。この分子の構造は、初期の直線形と予測された円形の形の間に大きな違いがあり、不合理なループ構造を修正するために著しい修正が加えられたんだ。
ヘアピン-円形RNA
次のケースは、259ヌクレオチドの長さを持つFKBP8というヘアピン-円形RNAに関するものだ。分析によると、このRNAはヘアピンループ構造を含んでいて、IsRNAcircモデルを使った後に大幅に改善されたんだ。予測された構造は欠陥が少なく、最適化が成功したことを示しているよ。
内部-円形RNA
内部-円形RNAの場合、224ヌクレオチドからなるMBOTA2円形RNAが調べられた。このRNAは、予測されたモデルに不合理なトポロジーが見られず、モデルが欠陥のない正確な構造を生成する能力を示しているんだ。
ジャンクション-円形RNA
最後に、259ヌクレオチドからなるSLC22A23というジャンクション-円形RNAが研究された。予測された構造は、その直線形とは大きな乖離を示していて、複雑な円形ジャンクションの形状を効果的に扱うモデルの能力を強調しているんだ。
既存の方法との比較
IsRNAcircモデルの効果を評価するために、既存の方法である3dRNAとの比較が行われたよ。円形RNAの実験的構造が直接の検証のために利用できないため、スコアリング関数を使用した間接的な評価が行われたんだ。
これらのスコアリング関数は、予測された構造がネイティブ状態にどれだけ近いかを測定していて、スコアが低いほど良い予測を意味するよ。結果は、IsRNAcircがさまざまなRNAタイプにおいて常に3dRNAよりも低エネルギースコアを生成していることを示していて、より強力なパフォーマンスを意味しているんだ。
計算効率と実行時間
IsRNAcircは印象的な予測能力を示しているけど、分子動力学シミュレーションの性質上、かなりの計算リソースが必要なんだ。平均して、IsRNAcircを使って円形RNAの構造を予測するには数時間かかることがあり、RNAの長さが増すと時間も増えるんだ。
将来的にIsRNAcircの効率を改善するために、コードの最適化、並列計算の使用、ハードウェアアクセラレーションオプションの検討などの戦略が考えられているよ。
結論
結論として、IsRNAcircモデルは円形RNAの3D構造を予測するための有望なツールとして際立っているよ。高度なシミュレーション技術と堅牢なフレームワークを利用することで、IsRNAcircは円形RNAのユニークな特徴を効果的にキャッチして、初期モデルに一般的に見られる構造エラーを修正するんだ。この能力は、円形RNAを理解するだけでなく、生物学におけるさまざまな役割を探るためにも重要なんだ。今後の開発と評価を進めることで、IsRNAcircモデルは円形RNAの構造と機能についての理解を大いに深めることができるかもしれないよ。
タイトル: IsRNAcirc: 3D structure prediction of circular RNAs based on coarse-grained molecular dynamics simulation
概要: As an emerging class of RNA molecules, circular RNAs play pivotal roles in various biological processes, thereby determining their three-dimensional (3D) structure is crucial for a deep understanding of their biological significances. Similar to linear RNAs, the development of computational methods for circular RNA 3D structure prediction is challenging, especially considering the inherent flexibility and potentially long length of circular RNAs. Here, we introduce an extension of our previous IsRNA2 model, named IsRNAcirc, to enable circular RNA 3D structure predictions through coarse-grained molecular dynamics simulations. The workflow of IsRNAcirc consists of four main steps, including input preparation, end closure, structure prediction, and model refinement. Our results demonstrate that IsRNAcirc can provide reasonable 3D structure predictions for circular RNAs, which significantly reduce the locally irrational elements contained in the initial input. Moreover, for a validation test set comprising 34 circular RNAs, our IsRNAcirc can generate 3D models with better scores than the template-based 3dRNA method. These findings demonstrate that our IsRNAcirc method is a promising tool to explore the structural details along with intricate interactions of circular RNAs. Author SummaryKnowledge of the 3D structure of circular RNA molecules can help us better understand their roles in eukaryotic cells. However, experimental determination of circular RNA 3D structure remains challenging, with currently only one complete circular RNA 3D structure available in the Protein Data Bank. Thus, extending from their linear counterparts, computational methods that can predict circular RNA 3D structure are urgently needed. In particular, physics-based de novo 3D structure prediction methods are promising due to their powerful sampling capability in the conformational space, which avoid the problem of limited available templates in template-based approaches. We have developed IsRNAcirc, a new physics-based method that employs an accurate coarse-grained force field and replica-exchange molecular dynamics simulations to predict the 3D structure of circular RNAs. IsRNAcirc is shown to significantly reduce the number of locally irrational structures in the input trials, which are caused by the lack of suitable templates and the improper assembly of fragments. Furthermore, in the absence of experimental reference structures, the predicted 3D models were validated using the popular scoring functions, such as DFIRE-RNA and rsRNASP, demonstrating that IsRNAcirc outperforms the template-based 3dRNA method in generating low-energy conformations.
著者: Dong Zhang, H. Jiang, Y. Xu, Y. Tong, R. Zhou
最終更新: 2024-07-05 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.07.03.601849
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.07.03.601849.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。