Sci Simple

New Science Research Articles Everyday

# 生物学 # 生物情報学

RNA構造予測技術の進展

RNA-TorsionBERTを紹介するよ。RNAの角度予測と質の評価がもっと良くなるんだ。

Fariza Tahi, C. Bernard, G. Postic, S. Ghannay

― 1 分で読む


RNA構造予測の強化 RNA構造予測の強化 向上させる。 新しい技術がRNAの角度予測と質の評価を
目次

RNA、つまりリボ核酸は、すべての生物に見られる重要な分子だよ。たんぱく質と同じように、さまざまな生物学的機能を助けてる。RNAが体の中でやる仕事は、その3次元(3D)形状にしっかり依存してるんだよ。RNAをもっと理解して研究するためには、3D構造を知ることが大事なんだ。

RNA構造を決定する方法

RNAの3D構造を知る方法はいくつかあるよ。一つは実験的な方法で、NMR(核磁気共鳴)、X線結晶構造解析、またはクライオ電子顕微鏡(cryo-EM)などの技術を使うんだ。でも、これらの方法はけっこう時間がかかってお金もかかる。

もう一つの方法は計算的方法で、RNAの配列に基づいて3D構造を予測しようとするんだ。主に3つのアプローチがあって、最初から始める(ab initio)、テンプレートを使う(template-based)、そして深層学習技術を使う。今のところ、たんぱく質の構造を予測するにはAlphaFoldが一番の成績を残してるけど、RNAの予測に関する最近の競技では、RNAの予測もAlphaFoldのレベルに達するのは難しいことが分かったんだ。その理由の一つは、RNAに特化したデータが不足してるからだよ。

RNA構造予測の課題

RNA構造を予測する上での課題の一つは、ヌクレオチドと呼ばれるRNAの構成要素にあるんだ。それぞれのヌクレオチドは、糖、リン酸、そして窒素塩基の3つの部分から成り立ってる。これらの成分には、RNAの構造を定義する特定の角度があるんだ。たんぱく質に比べて、RNAは考慮すべき角度が多くて、もっと複雑なんだよ。

今あるRNA構造予測の方法は、しばしばRNAの配列、二次構造情報、または多重配列アライメント(MSA)を使ってる。最近の深層学習の方法では、距離マップや幾何学的特徴の予測も含まれることがあるけど、これらの角度予測が全体の構造予測の改善にどれだけ効果的かはまだはっきりしてない。

言語モデルの導入

最近、研究者たちはテキストデータを扱うのに成功した言語モデルを使って、生物学的配列を解析し始めたよ。たとえば、DNABERTはDNAの配列用に設計されて、似たようなモデルのRNABERTがRNA用に作られたんだ。これらのモデルはRNAとDNAの配列の類似点を活かして、RNA構造の理解を深めてるんだよ。

でも、これらの進展にもかかわらず、まだ多くのRNA予測法は多重配列アライメントを必要としてるから、応用が制限されることもある。一部のRNAファミリーはあまり理解されてなくて、これらの現在の方法を効果的に使うのが難しいんだ。

唯一、配列だけを使ってRNAの角度を予測する方法がSPOT-RNA-1Dだけど、これは言語モデルとは違った技術を使ってる。

RNA構造の質の評価

RNA構造の質を判断するために、研究者たちはよくスコアリング関数を使うんだ。これらの関数は、トーション角を考慮して構造の質を評価する。いくつかのスコアリング方法があるけど、参考構造にアクセスが必要で、それが常に得られるわけじゃないんだ。

この問題を解決するために、私たちはRNA-Torsion-Aという新しいスコアリング関数を提案するよ。これは、私たちのモデルからの予測された角度を使って質の評価を行うんだ。この方法は、トーション特徴に基づいてRNA構造をランク付けするのに役立つよ。参考構造がなくてもRNA構造を評価できる方法を提供するんだ。

私たちの提案する方法:RNA-TorsionBERT

私たちは、RAW配列からRNAの角度を予測するための新しい方法、RNA-TorsionBERTを作ったんだ。事前に訓練された言語モデルを活用することで、RNAの理解を深めて、角度予測を向上させることができる。

RNA-TorsionBERTのアーキテクチャはDNABERTに基づいてて、RNAに合わせて特定の調整が加えられてるよ。RNAの配列を与えると、モデルはその配列をトークンに変換して、ネットワークに送信して予測角度を得るんだ。出力は角度を表す値を提供して、トーション角に基づいてRNA構造を評価する方法を提供するよ。

角度予測性能の評価

RNA-TorsionBERTの方法の性能を評価するために、既存の方法とその結果を比較したんだ。トレーニングは、ネイティブRNA構造を含むいくつかのデータセットを使ったよ。データセットは多様性があり、重複が少ないようにして、より正確な評価ができるようにしたんだ。

実験では、RNA-TorsionBERTがSPOT-RNA-1Dを上回る結果を示して、トーション角の予測が良くなってることが分かった。つまり、私たちの方法は、以前のツールに比べてRNA構造内の角度をより正確に予測できるってことだよ。

RNA構造の質評価

RNA-TorsionBERTから予測された角度を使って、RNA構造の質を評価できるんだ。予測された角度とRNA構造からの推定角度を比較することで、予測構造の質を示すスコアを生成できる。これによって、実際の生物学的構造に近い構造を特定するのに役立つんだ。

私たちの新しいスコアリング関数、RNA-Torsion-Aは、RNA構造質を評価するための確立されたメトリクスとの高い相関を示してる。このスコアリング関数は、角度の偏差に基づいて特にRNA構造についての洞察を提供するよ。

結果と議論

私たちは、トーション角を予測する上でのRNA-TorsionBERTのパフォーマンスを検証するためにさまざまな実験を行ったよ。結果は、この方法が既存の技術を常に上回ることを示してる。モデルは角度予測の平均誤差が低くて、RNA構造の予測における効果的な結果を確認したんだ。

予測に加えて、RNA-Torsion-Aスコアリング関数はRNA構造の質評価にも期待が持てるよ。平均誤差の概念を使って、他の確立されたメトリクスとよく相関する有効なスコアリング手法を作ることができるんだ。

結論

私たちの研究は、RNAのトーション角を予測し、構造の質を評価するための新しい方法、RNA-TorsionBERTとスコアリング関数、RNA-Torsion-Aを提案してるんだ。言語モデルと革新的なアプローチを活用することで、RNA構造の予測を向上させるとともに、その質を効果的に評価するためのツールを提供できるんだ。

RNA-TorsionBERTからの予測は、RNAの3D構造を再構築するための出発点として役立つかもしれないよ。今後の研究は、これらの方法をさらに洗練させて、さまざまなRNA研究における精度や適用性を向上させるかもしれない。これによって、研究者たちはRNA構造やその機能についてより良い洞察を得られるようになって、最終的には分子生物学の分野を進展させることができるんだ。

オリジナルソース

タイトル: RNA-TorsionBERT: leveraging language models for RNA 3D torsion angles prediction

概要: Predicting the 3D structure of RNA is an ongoing challenge that has yet to be completely addressed despite continuous advancements. RNA 3D structures rely on distances between residues and base interactions but also backbone torsional angles. Knowing the torsional angles for each residue could help reconstruct its global folding, which is what we tackle in this work. This paper presents a novel approach for directly predicting RNA torsional angles from raw sequence data. Our method draws inspiration from the successful application of language models in various domains and adapts them to RNA. We have developed a language-based model, RNA-TorsionBERT, incorporating better sequential interactions for predicting RNA torsional and pseudo-torsional angles from the sequence only. Through extensive benchmarking, we demonstrate that our method improves the prediction of torsional angles compared to state-of-the-art methods. In addition, by using our predictive model, we have inferred a torsion angle-dependent scoring function, called TB-MCQ, that replaces the true reference angles by our model prediction. We show that it accurately evaluates the quality of near-native predicted structures, in terms of RNA back-bone torsion angle values. Our work demonstrates promising results, suggesting the potential utility of language models in advancing RNA 3D structure prediction. Source code is freely available on the EvryRNA platform: https://evryrna.ibisc.univevry.fr/evryrna/RNA-TorsionBERT.

著者: Fariza Tahi, C. Bernard, G. Postic, S. Ghannay

最終更新: 2024-12-16 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.06.06.597803

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.06.06.597803.full.pdf

ライセンス: https://creativecommons.org/licenses/by-nc/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

類似の記事

遺伝学・ゲノム医学 デジタルツールで遺伝カウンセリングを改善する

研究が遺伝カウンセリングにおけるデジタルソリューションへの態度を明らかにした。

Marlies N. van Lingen, Sietske A. L. van Till, Noor A.A. Giesbertz

― 1 分で読む

神経学 テロメアとアルツハイマー:長さが示すもの

テロメアの長さがアルツハイマーのリスクや脳の健康にどんな関係があるかを探る。

Blanca Rodríguez-Fernández, Armand González-Escalante, Patricia Genius

― 1 分で読む