高温プロテイン設計の新しい方法
NOMELTは、暖かい環境でのタンパク質の安定性に対する新しいアプローチを提供してるよ。
― 1 分で読む
目次
タンパク質は私たちの体にとって重要な分子で、社会でもいろんな役割を果たしてるんだ。医学や食べ物、服、さらにはごみの片付けにも使われる。タンパク質をリサイクルプラスチックに使うような革新的な方法にも可能性があるんだ。でも、高温に耐えるタンパク質を作るのは研究者たちにとっての課題なんだよね。これが重要なのは、たくさんの用途ではタンパク質が暖かい環境で効果的に機能する必要があるから。
長年、科学者たちは高温で安定なタンパク質を作る方法を模索してきたけど、結果はまちまちで、全てのタンパク質に当てはまる一つの解決策はないってことが分かってきた。それぞれのタンパク質は異なる振る舞いをするから、研究者たちには独自の挑戦があるんだ。
タンパク質研究における現代技術の役割
最近、ディープラーニングの進歩がタンパク質を扱う科学者たちにわくわくするツールを提供してる。ディープラーニングは大量のデータと複雑なモデルを使ってパターンを見つけたり予測をしたりするんだ。研究者たちは、特に高温での安定性を含むタンパク質の特性を予測するための様々なモデルを開発してきた。
既存の戦略のいくつかは、特定の安定性ターゲットに基づいて異なるタンパク質のバージョンを比較するのに役立つけど、こうした手法はしばしば詳細なデータがたくさん必要で、集めるのに時間がかかってお金もかかる。ラベル付きデータなしでタンパク質の特性を予測できるモデルもあるけど、限界がある。高温安定性について正確にランク付けできないこともあるんだ。
別のアプローチは、通常の温度で特定の三次元形状に折りたためる新しいタンパク質の配列を設計することなんだけど、残念ながら、これらのデザインは必ずしも高温でも機能することを保証するわけじゃない。
高温に耐えるタンパク質設計の新しい手法
この研究は、高温に耐えるタンパク質を設計する新しい手法、NOMELTを紹介してる。この手法は、ニューラルマシントランスレーションというコンピュータープログラムを使ってる。目標は、普通の温度でうまく機能するタンパク質の配列を、高温でも機能するバージョンに変換することなんだ。
NOMELTは、400万以上のタンパク質ペアを含む大きなデータセットを使ってトレーニングされた。各ペアの一方は低温環境から、もう一方は高温環境から来てる。これらのタンパク質の違いを理解することで、モデルは高温でより安定な新しい配列を生成できるという考えなんだ。
モデルのトレーニング:その仕組み
NOMELTモデルは、メソフィリック(低温)タンパク質配列を調べて、サーモフィリック(高温)バージョンを生成することで新しいタンパク質配列を生成することを学んでる。各モデルは、元の配列とは少し異なる配列を生成することがある。これは、タンパク質が同じような性質を持ちながらも、必ずしも同じではないから正常なんだ。
モデルのパフォーマンスを評価するために、研究者たちはタンパク質クラスターのテストセットを作った。モデル生成された配列と実際のサーモフィリック配列がどれだけ一致するかを確認した結果、モデルは自然界に存在するタンパク質にかなり似た配列を生成できることが分かった。
タンパク質の特性の理解
研究者たちは、何がタンパク質を高温で安定にするのかを解明しようとしてる。普遍的なルールはないけど、特定のパターンが浮かび上がってきてる。例えば、高温環境のタンパク質は、涼しい環境のものとは異なるアミノ酸の分布を持つことが多い。
新しいモデルは、これらの特性を正確に捉えてることを示してる。モデルによって生成されたアミノ酸配列を調べたところ、サーモフィリックタンパク質に一般的に見られるアミノ酸の分布に非常に近いことが分かった。つまり、モデルは新しい配列を作るだけでなく、それらの配列の特性が安定性にどう関連しているかも理解してるんだ。
もう一つの重要な要素は、システインアミノ酸の間の結合、つまり二硫化結合の存在だ。モデルは、システインを二硫化結合が形成できる位置に配置する傾向が高く、これがこれらの結合の重要性を理解していることを示唆してる。
ケーススタディ:特定のタンパク質の改善
NOMELTモデルの効果を示すために、研究者たちは果物バエに見られるEngrailed Homeodomain(En-HD)という特定のタンパク質に適用した。モデルは複数の提案された変異を持つ新しい配列を生成したけど、元のものと比べて安定性が大きく改善されることはなかった。
でも、研究者たちはNOMELTを一回限りの解決策ではなく、変異の生成器と見なしてた。潜在的な変異のライブラリを作成して、最適化ラウンドをいくつか行った。プロセス中に、En-HDタンパク質の安定性は大きく改善された。
研究者たちは分子動力学シミュレーションを使って、新しいバリアントが高温でどのように振る舞うかを評価するテストも行った。シミュレーションの結果、元のタンパク質は溶融温度で構造を失い始めたのに対し、NOMELTバリアントは高温でも安定性を維持してたんだ。
ケーススタディ:タンパク質バリアントのランク付け
別のテストでは、研究者たちはNOMELTがさまざまなタンパク質バリアントの安定性をどれだけうまく予測できるかを探った。モデルを使って既存のバリアントを評価し、溶融温度を測定した。モデルは強力な予測能力を示し、実際の実験データと良い相関を持ってた。
他の予測手法と比べて、NOMELTは高温に対する安定性についてタンパク質バリアントを正確にランク付けすることができた。これは、特定の例に関するトレーニングなしでも、モデルが価値ある洞察を提供できることを示してる。
この研究で使用されたデータと技術
NOMELTモデルをトレーニングするために使われたデータセットは、異なる温度環境のタンパク質ホモログのペアで構成されてた。研究者たちは、このデータを慎重にフィルタリングして、高品質なタンパク質ペアが使用されるようにし、最適な成長温度に大きな差があるものに制限したんだ。
NOMELTモデル自体は、高度なニューラルネットワーク技術に基づいてて、既存のタンパク質言語モデルを利用してタンパク質配列内のパターンを見つけるんだ。これを微調整して、メソフィリックタンパク質のサーモフィリックバージョンを生成するようにしたんだ。
評価のために、生成された配列と実際の高温タンパク質との類似性を分析するためにさまざまな計算手法が実装された。これには構造的特性の確認や、タンパク質配列のアライメントを調べることが含まれてた。
タンパク質工学の未来
NOMELTの開発は、タンパク質工学の新しい道を開く有望な手法を提供してる。この手法は、高温に耐える新しいタンパク質を設計して評価するプロセスを簡素化する。これにより、科学者がタンパク質の安定性と設計にアプローチする方法が革命的に変わる可能性があるんだ。
この手法を継続的に改善し、タンパク質研究の他の分野も探求することで、科学者たちはさまざまな業界に適した特性を持つタンパク質を作り出せるかもしれない。技術が進歩するにつれて、医学や環境清掃、材料科学での応用の可能性は大きい。
結論
全体的に、NOMELTはタンパク質工学の分野での大きな前進を示してる。最先端の機械学習技術を使うことで、研究者は高温環境で生き残れる安定したタンパク質を作り出すための新しい道を開いてる。この進展は、タンパク質の構造や機能の理解を深めるだけでなく、さまざまな現実の応用にも大きな可能性を秘めてるんだ。
タイトル: A learnable transition from low temperature to high temperature proteins with neural machine translation
概要: This work presents Neural Optimization for Melting-temperature Enabled by Leveraging Translation (NOMELT), a novel approach for designing and ranking high-temperature stable proteins using neural machine translation. The model, trained on over 4 million protein homologous pairs from organisms adapted to different temperatures, demonstrates promising capability in targeting thermal stability. A designed variant of the Drosophila melanogaster Engrailed Homeodomain shows increased stability at high temperatures, as validated by estimators and molecular dynamics simulations. Furthermore, NOMELT achieves zero-shot predictive capabilities in ranking experimental melting and half-activation temperatures across two protein families. It achieves this without requiring extensive homology data or massive training datasets as do existing zero-shot predictors by specifically learning thermophilicity, as opposed to all natural variation. These findings underscore the potential of leveraging organismal growth temperatures in context-dependent design of proteins for enhanced thermal stability.
著者: David A. C. Beck, E. Komp, C. Phillips, H. N. Alanzi, M. Zorman
最終更新: 2024-02-08 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.02.06.579188
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.02.06.579188.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。