タンパク質設計の進展:新しいアプローチ
最近のタンパク質設計の進展は、ヘルスケアやバイオテクノロジーにとってワクワクする可能性を示してるよ。
― 1 分で読む
目次
タンパク質デザインは、新しいタンパク質を作ったり、既存のものを編集して特定の機能を達成することにフォーカスした魅力的な科学の分野だよ。タンパク質は生物にとって不可欠な分子で、反応を触媒したり、構造を提供したり、細胞内外のコミュニケーションを助けたりする重要な役割を果たしてる。タンパク質をデザインできる能力は、ワクチンや標的療法の開発など、医学におけるブレークスルーにつながるかもしれないね。
タンパク質デザインの進展
最近数年で、タンパク質デザインは大きく進歩したよ。コンピュータモデリングや機械学習の発展がこの進展をサポートしてる。研究者たちは、原子レベルでのタンパク質の挙動をシミュレーションする高度なソフトウェアを使って、ユニークな形や機能を持つタンパク質を作れるようになったんだ。例えば、Rosettaソフトウェアみたいなツールを使うことで、タンパク質がどう折りたたまれるか、そしてその構造が機能にどう関係するかを予測できるんだ。
機械学習もこの分野を強化していて、より正確にタンパク質の構造や相互作用を予測できるモデルを提供してる。この機械学習の統合は、より効果的で効率的なタンパク質作成の方法を切り開いてるよ。
包括的なフレームワークの必要性
タンパク質デザインのツールやモデルが進化するにつれて、デザインプロセスの複雑さも増してる。複数のモデルや目的を統合できるフレームワークの必要性が高まってるんだ。この統合によって、研究者たちはさまざまなモデリングアプローチの強みを活かしながら、デザインしたタンパク質が安定性や機能性といった特定の基準を満たすようにできる。
これを達成する一つの方法は、タンパク質デザインの系統的なスクリーニング方法を使うことだよ。このアプローチでは、生成モデルが潜在的なデザインを提案し、それを評価するために異なるモデルを使って適合性を判断するんだ。でも、提案されたデザインがフィルターで設定された基準とあまり合わないと、多くのデザインが却下される可能性があって、このアプローチの効果を制限しちゃうかもしれない。
タンパク質デザインの課題
タンパク質デザインの一般的な課題は、異なるモデルや目的の間の対立だよ。例えば、あるタンパク質は機能を果たすために形を変えなきゃいけないことがある。この柔軟性は、タンパク質の一部が異なる形で異なる性質を持たなきゃならない状況を生み出すことがあって、すべての側面を同時に最適化するのが難しくなる。
こういう課題に対処するためには、研究者たちは異なる目的の間のトレードオフを考慮し、この競合するニーズをバランスさせる解決策を見つける必要があるよ。これは、タンパク質の構造と機能の関係を明確に理解することを要するんだ。
最適化アルゴリズムの役割
進化的多目的最適化アルゴリズムが、この文脈で貴重なツールとして登場してる。これらのアルゴリズムは、多目的空間で理想的な解に明示的に近づくことができ、研究者たちはさまざまなデザインの可能性をより効果的に探れるようになったんだ。
こういうアルゴリズムを使うことで、研究者たちは複数の基準を同時に満たすタンパク質を作ることができて、機能的なタンパク質をデザインする成功率が上がるんだ。これらのアルゴリズムはデザインプロセスを導く手助けをして、タンパク質の風景をより系統的に探ることを促進してるよ。
ケーススタディ:フォールドスイッチングタンパク質RfaH
進化的多目的最適化の効果を示すために、RfaHという特定のタンパク質を見てみよう。RfaHはフォールドスイッチングタンパク質で、異なる形に移行できることが機能にとって重要なんだ。RfaHの新しいバージョンをデザインするのは面白い課題で、異なる形が異なる最適化を必要とするからなんだ。
RfaHのデザインプロセスは、複数のモデリングアプローチを含んでるよ。研究者たちは、RfaHの折りたたみや異なる状態での安定性など、さまざまな側面を表す異なるモデルを使ったんだ。これらのモデルを組み合わせることで、効果的なタンパク質をデザインするためのより包括的な理解を得られるんだ。
RfaHのデザイン問題を探る
RfaHの研究では、研究者たちがNon-dominated Sorting Genetic Algorithm II(NSGA-II)という特定の最適化フレームワークを使って、新しい配列を設計することに集中したんだ。このアルゴリズムは、複数の目的を同時に考慮しながら、最適なデザインソリューションを見つける手助けをしてくれるんだ。
デザインプロセスを進める中で、研究者たちは新しいタンパク質候補を提案した。これらの候補を、どれだけうまく折りたたまれるかや、元のRfaHタンパク質の性質にどれだけ似ているかで評価したんだ。いくつかの繰り返しを通して、デザインをどんどん洗練させていったよ。
機械学習モデルの重要性
RfaHのケースでは、機械学習モデルがデザインプロセスを導くのに非常に重要だった。ProteinMPNN、AlphaFold2、ESM-1vのようなモデルを使うことで、研究者たちはデザインの性能をより正確に評価できたんだ。これらのモデルは、さまざまなデザイン目的をワークフローに直接統合するのを可能にしたんだ。
機械学習は、どの配列の修正が成功するデザインにつながるかを予測するのを助けて、デザインプロセスをスピードアップしたんだ。機械学習モデルが遺伝的アルゴリズムのフレームワークにうまく統合されたとき、研究者たちはデザインの結果が改善されるのを観察したよ。
遺伝的アルゴリズムの設定
遺伝的アルゴリズムにはいくつかの重要な要素があったよ。まず、研究者たちはどのデザインを突然変異させて改善するかを選ぶための選択メソッドを使ったんだ。各デザインが目的に対してどれだけ良く機能するかを評価するために、さまざまなスコアリング関数に頼ったんだ。各デザインのパフォーマンスは、望ましい特性にどれだけ近いかで評価されたんだ。
各繰り返しで、遺伝的アルゴリズムは前の世代の強みを基にした新しいデザインの世代を生成したんだ。この反復改善は、プロセスが進むにつれて最良のデザインを絞り込むのを助けたよ。
RfaHデザインプロセスの結果
RfaHデザインプロセスの結果は期待が持てたよ。進化的多目的最適化フレームワークを使うことで、研究者たちは機能的なRfaHタンパク質の特性により良く合致したデザインを作り出すことができたんだ。彼らは、自然な配列の回復やデザインしたタンパク質の全体的な性能において大きな改善を見たんだ。
遺伝的アルゴリズムによって生成されたデザインは、配列の変動が減少したんだ。つまり、デザインされた配列はより一貫して安定していて、これはタンパク質の機能にとって重要なんだ。さらに、これらの配列は自然に存在するフォールドスイッチングタンパク質により強い類似性を示していて、デザインプロセスが効果的だったことを示すんだ。
複数のモデルを統合する利点
デザインプロセスに複数のモデルを統合することで、いくつかの利点が得られたよ。異なるモデリングアプローチからのインサイトを組み合わせることで、研究者たちはタンパク質の重要な生物物理的特性や動的挙動をよりよく捉えたデザインを作れるようになったんだ。この統合戦略は、機能要件を満たさない問題のあるデザインを生み出す可能性を最小化することにもつながったよ。
さらに、情報を持った突然変異オペレーターの使用により、デザインプロセスが配列空間の特定のエリアに集中することができたんだ。このターゲットを絞ったアプローチは、成功するデザインを生み出す確率を最大化し、一方であまり有望でない候補に無駄な努力をかけるのを減らしたよ。
配列トレードオフの理解
デザインプロセス中に生成された配列を分析していると、研究者たちはデザインされたタンパク質の特性に基づくトレードオフのパターンを観察したんだ。一部の配列は、他の特性を犠牲にして特定の特性を優先していることがわかったんだ。これが、タンパク質デザインの複雑さを示してるんだ。
例えば、RfaHタンパク質の特定の位置は、タンパク質のフォールドに応じて特定のタイプの残基を好む傾向があったんだ。これらのトレードオフを理解することで、望ましい機能のためにタンパク質を最適化する方法に関する貴重なインサイトが得られたよ。
将来の研究への影響
RfaHタンパク質のデザインに進化的多目的最適化を使った成功は、将来の研究に新しい道を開くことになるよ。より洗練されたモデルが開発されるにつれて、追加のデザイン目的を統合する可能性が増えていくんだ。これが、標的療法や改良ワクチンなど、医学的応用向けのタンパク質デザインのブレークスルーにつながるかもしれないね。
研究者たちは、この最適化フレームワークを単一のタンパク質以外のさまざまなデザインタスク、例えば、全体の代謝経路やバイオ分子のネットワークの作成にも適用できるようになるんだ。応用の可能性は広がっていて、タンパク質デザインの分野に明るい未来を示してるよ。
結論
タンパク質デザインは、コンピュータモデリングや機械学習の進展のおかげで急速に進化してる。進化的多目的最適化フレームワークを使うことで、研究者たちは特定の機能に合わせたタンパク質を効果的に作れるようになったんだ。この統合的アプローチは、デザインプロセスを向上させるだけでなく、結果のバイアスや変動を減らすのにも役立つんだ。
RfaHタンパク質のケーススタディは、成功したデザインを達成するために複数のモデルや技術を組み合わせる効果を示してる。研究者たちがこの分野を探求し続けることで、タンパク質デザインが医療やバイオテクノロジーに大きな影響を与える革新をもたらす可能性が高いと思うよ。
タイトル: An integrative approach to protein sequence design through multiobjective optimization
概要: With recent methodological advances in the field of computational protein design, in particular those based on deep learning, there is an increasing need for frameworks that allow for coherent, direct integration of different models and objective functions into the generative design process. Here we demonstrate how evolutionary multiobjective optimization techniques can be adapted to provide such an approach. With the established Non-dominated Sorting Genetic Algorithm II (NSGA-II) as the optimization framework, we use AlphaFold2 and ProteinMPNN confidence metrics to define the objective space, and a mutation operator composed of ESM-1v and ProteinMPNN to rank and then redesign the least favorable positions. Using the multistate design problem of the foldswitching protein RfaH as an in-depth case study, we show that the evolutionary multiobjective optimization approach leads to significant reduction in the bias and variance in RfaH native sequence recovery, compared to a direct application of ProteinMPNN. We suggest that this improvement is due to three factors: (i) the use of an informative mutation operator that accelerates the sequence space exploration, (ii) the parallel, iterative design process inherent to the genetic algorithm that improves upon the ProteinMPNN autoregressive sequence decoding scheme, and (iii) the explicit approximation of the Pareto front that leads to optimal design candidates representing diverse tradeoff conditions. We anticipate this approach to be readily adaptable to different models and broadly relevant for protein design tasks with complex specifications. Author summaryProteins are the fundamental building blocks of life, and engineering them has broad applications in medicine and biotechnology. Computational methods that seek to model and predict the protein sequence-structure-function relationship have seen significant advancement from the recent development in deep learning. As more models become available, it remains an open question how to effectively combine them into a coherent computational design approach. One approach is to perform computational design with one model, and filter the design candidates with the others. In this work, we demonstrate how an optimization algorithm inspired by evolution can be adapted to provide an alternative framework that outperforms the post hoc filtering approach, especially for problems with multiple competing design specifications. Such a framework may enable researchers to more effectively integrate the strengths of different modeling approaches to tackle more complex design problems.
著者: Tanja Kortemme, L. Hong
最終更新: 2024-03-04 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.03.01.582670
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.03.01.582670.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。