Simple Science

最先端の科学をわかりやすく解説

# 生物学# 生物情報学

AF_unmaskedを使ったタンパク質構造予測の進展

AF_unmaskedは、テンプレートと実験データを統合することで、タンパク質構造の予測を向上させる。

― 1 分で読む


AF_unmasked:AF_unmasked:次世代のタンパク質予測質構造の予測を改善する。AF_unmaskedは、複雑なタンパク
目次

2020年にAlphaFoldが登場して以来、生物学の研究者たちはこのツールを使ってタンパク質の構造を予測するための改善に取り組んでる。AlphaFoldは、アミノ酸配列に基づいてタンパク質が三次元の形に折りたたまれる方法を予測するために、先進的なコンピュータシステム、特に深層学習を利用してる。最近、科学者たちはAlphaFoldをより良く、複雑なタンパク質や構造に役立てる新たな方法を見つけてる。

一つの大きな焦点は、AlphaFoldが異なるソースからの構造情報を解釈し生成する方法だ。これは、タンパク質が折りたたまれる方法を予測するのが非常に難しいからで、結果が予測不可能なこともあるんだ。研究者たちは、AlphaFoldが最適な構造予測を見つけるために学習したエネルギーランドスケープを通じてサンプリング手法を使っていると考えてる。

AlphaFoldはこれを二つの主要なステップで行う。最初の部分が適切なスタート地点を特定し、二番目の部分が予測を洗練させて最終的な原子構造を生成する。最近、科学者たちはこの二番目のステップを改善して、予測をより正確で信頼性のあるものにしようとしてる。

AlphaFoldを改善する方法

最近行われたタンパク質構造予測手法の評価に関するイベントで、研究者たちは異なるチームがAlphaFoldの性能をどのように向上させたかを調べた。トップパフォーマンスのチームは、結果を改善するために二つの主な戦略を使った:

  1. 予測プロセスの間にランダムな要素を追加して、モデルの多様性を増やした。
  2. AlphaFoldが構造を予測するために使う配列アラインメントを洗練させて、より良い入力データを作り出した。

最初の方法は、AlphaFoldがエネルギー関数をさらに徹底的に探るのを助け、二番目は予測をより好ましいエネルギー領域で始めることを目的としていた。どちらの戦略もAlphaFoldがより高品質なモデルを提供するのを助けるためのものだった。

でも、これらの改善があっても、研究者たちは既存のタンパク質構造からの入力データの最適化が大きな利益をもたらしていないことに気づいた。実際、いくつかのチームはこれらの構造入力テンプレートを完全にオフにする実験も行っていた。

全体的に、生物学コミュニティではAlphaFoldがタンパク質構造を理解するための強力なツールである一方、まだ従来の実験技術に取って代わることはできないという合意がある。これは、予測とともに実験データを統合するためのより良いツールの必要性を強調している。

実験データとの統合

AlphaFoldの能力を向上させるために、科学者たちは既存のタンパク質構造決定手法と統合することに取り組んでいる。例えば、PhenixはAlphaFoldと伝統的な分子置換技術を組み合わせたツールで、これによりX線結晶構造解析から得られた実験データに対して予測された構造をより良く洗練できる。

加えて、研究者たちは、AlphaFoldをクライオ電子顕微鏡(cryo-EM)データと組み合わせることで、さらに正確な予測を生むことができることを示した。実験的な結果に基づいてAlphaFoldモデルを調整し、それらを予測プロセスに戻すことで、全体の予測の質と正確さを向上させることができる。

これらの進展にもかかわらず、AlphaFoldは元々単一のタンパク質予測のために設計されていて、複数のタンパク質が相互作用する様子を予測するのには限界がある。研究者たちは、実験データを考慮に入れられる再訓練可能なAlphaFoldのバージョンを作ろうとしているが、こんな大きなシステムの再訓練にはかなりのリソースが必要で、必ずしもうまくいくわけではない。

AF_unmaskedの導入

既存の多タンパク質構造テンプレートからの情報を活用しつつ、システムを再訓練する必要がないように、研究者たちはAF_unmaskedという新しいAlphaFoldのバージョンを開発した。このバージョンは、予測問題を簡素化して予測時間を短縮し、特に大きなタンパク質複合体に対してより正確なモデルを提供することを目指している。

AF_unmaskedはAlphaFoldのニューラルネットワークを、テンプレートをより情報を持って利用できるように修正している。これにより、AF_unmaskedは進化的データに依存せずに、タンパク質複合体の高品質なモデルを生成できる。新しい方法では、研究者がタンパク質鎖の配置を相対的にガイドするために、予測プロセス中に多タンパク質テンプレートを提供することができる。

予測プロセスの変更

AF_unmaskedは、予測プロセスにおけるテンプレートの使用に関する新しい戦略を導入している。これには、実験からの構造データを適切な形式に変換し、ターゲット配列と整列させるステップが含まれる。これにより、異なるタンパク質ファミリーからのテンプレートであっても、テンプレートモデルの座標をターゲットアミノ酸に正確に適用できるようになる。

研究者たちはまた、分析に使用する配列の数を制限することで、入力データを簡素化することができる。これには二つの利点がある:計算に必要な時間とメモリが減ること、そして予測結果におけるテンプレートの影響力が増すことだ。

AF_unmaskedのもう一つの重要な特徴は、タンパク質構造の欠けた部分を埋める能力だ。進化的データとテンプレートの両方の情報を利用することで、AF_unmaskedは実験データに欠けている部分や不完全な部分を再構成することができる。

AF_unmaskedの応用

AF_unmaskedの効果を評価するために、研究者たちはクライオ-EMから派生したさまざまなタンパク質構造に適用し、希望の結果が得られた。AF_unmaskedは、従来のAlphaFoldが苦戦した大きな複合体の構造を予測するのに役立った。

例えば、植物における重要な酵素であるRubiscoは複数のサブユニットから構成されている。AF_unmaskedはクライオ-EMデータと比較してRubiscoのキメラ版をより正確に予測し、標準的なAlphaFoldで生成された構造よりも実験的観察により合致した。

AF_unmaskedはClpBのような柔軟なタンパク質に対してもその能力を示し、その機能中に大きな変化が生じる。クライオ-EMデータから得たテンプレートを利用することで、AF_unmaskedは複数のコンフォメーションを生成し、タンパク質の動的な性質をより効果的に捉えた。

がんに関連するタンパク質であるニューロファイブロミンに関する研究では、AF_unmaskedは全体の配置を維持しながら構造の欠けた部分を予測することができた。欠けた領域を埋めるこの能力は特に価値があり、実験データでは明確でないタンパク質の形を視覚化することを可能にする。

現実世界への影響

AF_unmaskedによってもたらされた改善は、基本研究だけでなく、ドラッグデザインや病気の理解などの実用的な応用にも重要だ。AF_unmaskedは、大きくて複雑なタンパク質の正確なモデルを一度に生成できるため、科学者たちは新たなドラッグターゲットをより効率的に特定したり、変異がタンパク質の機能にどのように影響を与えるかを予測したりすることができるかもしれない。

例えば、タンパク質の変異は病気を引き起こすことがあり、これらの変異がタンパク質の形や機能をどのように変えるかを理解することが重要だ。AF_unmaskedの構造テンプレートに基づく異なるコンフォメーションを予測する能力は、研究者たちがこれらの変異の影響をよりよく理解するのに役立つかもしれない。

さらに、AF_unmaskedはより大きなタンパク質構造を扱えるので、複雑な生物学的システムを研究する新たな可能性を開き、タンパク質が細胞内でどのように相互作用し機能するのかをより深く理解する手助けになる。

結論

全体として、AF_unmaskedは、特に複雑なタンパク質の構造を予測する能力において大きな進歩を示している。既存の構造テンプレートを効果的に活用し、広範な進化的データへの依存を減らすことで、AF_unmaskedは構造決定へのより合理的なアプローチを提供する。

研究者たちがAF_unmaskedの可能性を引き続き探求する中で、これは構造生物学の分野で貴重なツールになる可能性が高い。これは、タンパク質の機能を理解するだけでなく、この知識を利用して治療介入やバイオテクノロジーの進展を促進する突破口につながるかもしれない。

AF_unmaskedの開発は、実験データと計算予測を統合することで、生命の分子的な複雑さをモデル化する能力を向上させることを示している。さらなる改良や応用が進めば、AF_unmaskedは分子レベルで生命の基盤を研究する科学者たちにとって、不可欠なツールの一部になるかもしれない。

オリジナルソース

タイトル: Unmasking AlphaFold: integration of experiments and predictions in multimeric complexes

概要: Since the release of AlphaFold, researchers have actively refined its predictions and attempted to integrate it into existing pipelines for determining protein structures. These efforts have introduced a number of functionalities and results at the latest Critical Assessment of protein Structure Prediction edition (CASP15), resulting in a marked improvement in the prediction of multimeric protein structures. However, AlphaFolds capability of predicting large protein complexes is still limited and integrating experimental data in the prediction pipeline is not straightforward. In this study, we introduce AF_unmasked to overcome these limitations. Our results demonstrate that AF_unmasked can integrate experimental information to build larger or hard to predict protein assemblies with high confidence. The resulting predictions can help interpret and augment experimental data. This new approach generates near-perfect structures even when little to no evolutionary information is available and imperfect experimental structures are used as a starting point. AF_unmasked fills incomplete structures by a procedure called"structural inpainting", which may provide insights into protein dynamics. In summary, AF_unmasked provides an easy-to-use method that efficiently integrates experiments to predict large protein complexes more confidently. Codegithub.com/clami66/AF_unmasked

著者: Claudio Mirabello, B. Wallner, B. Nystedt, S. Azinas, M. Carroni

最終更新: 2024-05-13 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2023.09.20.558579

ソースPDF: https://www.biorxiv.org/content/10.1101/2023.09.20.558579.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

類似の記事

ゲノミクス植物におけるスプライス部位予測に影響を与える要因

研究によると、イントロンの長さと量がアラビドプシスのスプライスサイト予測にどのように影響するかが明らかになった。

― 1 分で読む