Simple Science

最先端の科学をわかりやすく解説

# 生物学# 生物工学

EVOLVEproを使ったタンパク質工学の進展

新しい方法がAIを使ってタンパク質の設計と最適化を効率化する。

― 1 分で読む


EVOLVEproがタンパEVOLVEproがタンパク質デザインを革命化する革する。AI駆動の方法がタンパク質工学の効率を変
目次

タンパク質工学は、タンパク質をデザインしたり改良したりして、その機能を向上させることに重点を置く分野だよ。これらのタンパク質は、私たちの体や医薬品から遺伝子編集ツールまで、さまざまな技術で重要な役割を果たしてるんだ。タンパク質工学の目的は、より効果的に役割を果たしたり、異なる用途で使える新しい能力を持ったタンパク質を作り出すことだね。

タンパク質の理解とその多様性

タンパク質はアミノ酸の長い鎖でできてて、特定の形に折りたたまれることで機能を果たすんだ。アミノ酸の組み合わせは無限にあって、多様な活動を持つタンパク質がたくさん存在してる。この多様性は、何十億年もの進化の過程で発展してきたもので、役割をうまく果たすタンパク質が生き残り、複製される傾向があるんだ。

タンパク質言語モデルの役割

最近、科学者たちはタンパク質を研究するために、タンパク質言語モデル(PLM)っていう進んだコンピュータアルゴリズムを使い始めてるんだ。これらのモデルは、膨大なタンパク質配列のデータベースから学んで、新しいタンパク質のデザインを生成できる。タンパク質の「文法」を分析することで、研究者が配列の変化がタンパク質の機能にどう影響するかを理解する手助けをしてるよ。

タンパク質工学の課題

PLMは新しいデザインを提案できるけど、これらのデザインの効果を実験室で広くテストする必要があるんだ。改善されたタンパク質を作ろうとした多くの試みは、期待通りにいかなかったりする。これはPLMが、これらの新しいデザインが実際の状況でどう振る舞うかを予測するのに苦労することがあるからなんだ。

EVOLVEproの紹介:新しいアプローチ

この課題を解決するために、EVOLVEproっていう新しい方法が開発されたんだ。従来の方法は実験テストがたくさん必要だけど、EVOLVEproはPLMと回帰モデルを組み合わせて使うんだ。これによって、少ないテストでどのタンパク質のバリアントが最もうまくいくかを予測できるんだ。

EVOLVEproの仕組み

EVOLVEproは一連のステップで動作するよ:

  1. タンパク質配列の入力:タンパク質はアミノ酸の配列で表される。
  2. 予測の作成:PLMがこれらの配列を分析して、活動の改善の可能性を予測する。
  3. 候補の選定:これらの予測に基づいて、実験テストのために少数のタンパク質のバリアントが選ばれる。
  4. 実験的検証:これらのバリアントが元のものよりも性能が良いかテストされ、その結果がモデルにフィードバックされて将来の予測を改善する。

EVOLVEproの利点

このアプローチにはいくつかの利点があるよ:

  1. 必要な実験が少ない:従来の方法は何百、何千のバリアントをテストする必要があるけど、EVOLVEproは数十回のテストで良い結果を出せる。
  2. 成功率が高い:EVOLVEproはどのタンパク質がそのタスクで成功するかを予測する能力が強い。
  3. 多機能最適化:同時に複数の機能のためにタンパク質を最適化できるから、複雑なアプリケーションに役立つ。
  4. 特別な知識が不要:ユーザーはタンパク質科学の専門家である必要がないから、いろんな分野の人に使いやすい。

実世界での応用

EVOLVEproは、病気の治療や遺伝子編集の強化、ワクチン用のRNA製造に使われるさまざまなタンパク質でテストされてるよ。初期の結果は、タンパク質の機能に大きな改善を示してる。

抗体の最適化

EVOLVEproの一つの応用は、COVID-19に立ち向かうために使われる抗体の改善だった。元の抗体は複数のバリアントと一緒にテストされたんだ。EVOLVEproはすぐに改善を特定して、ウイルスを中和するのにかなり効果的なバリアントを生み出したよ。

小型CRISPRヌクレアーゼの開発

もう一つの面白い応用は、遺伝子を編集するためのツールであるCRISPRのコンパクト版を設計することだった。このバージョンは、既存のモデルよりも良い性能を発揮するように強化されて、より小さなツールが必要な治療応用で価値を示したよ。

RNA生産の改善

EVOLVEproは、RNAを生成するのに重要な酵素であるT7 RNAポリメラーゼの最適化にも使われた。改善によって、RNA生産の効率と純度が向上したんだ。これってワクチンや治療用RNAを作るためには重要なことだよね。

EVOLVEproと従来の方法の比較

従来のタンパク質工学の方法は、いろんなバリアントをデザインしてテストする試行錯誤が伴うから、時間がかかり、費用がかかることが多いんだ。それに対して、EVOLVEproはデータに基づく予測を使って、プロセスを簡素化し、成功率を高めるよ。この方法は時間とリソースを節約して、より早いイノベーションにつながるんだ。

タンパク質工学の未来

研究者たちがEVOLVEproの能力を探求していく中で、その潜在能力に対する楽観的な見方が広がってるんだ。人工知能とタンパク質工学の統合は、バイオテクノロジーの急速な進展への道を開いている。もっと多くのタンパク質が研究されるにつれて得られる知識が、EVOLVEproを洗練させる手助けをして、さらに強力なツールになるんだ。

結論

タンパク質工学は科学の革新の最前線で、医療、農業、環境科学などの分野に影響を与えてる。EVOLVEproのようなツールのおかげで、研究者はこれまで以上に効率よくより良いタンパク質をデザインできるんだ。技術が進化するにつれて、複雑な課題に対処し、私たちの生活の質を向上させるソリューションを開発する可能性を秘めているよ。

オリジナルソース

タイトル: Rapid protein evolution by few-shot learning with a protein language model

概要: Directed evolution of proteins is critical for applications in basic biological research, therapeutics, diagnostics, and sustainability. However, directed evolution methods are labor intensive, cannot efficiently optimize over multiple protein properties, and are often trapped by local maxima. In silico-directed evolution methods incorporating protein language models (PLMs) have the potential to accelerate this engineering process, but current approaches fail to generalize across diverse protein families. We introduce EVOLVEpro, a few-shot active learning framework to rapidly improve protein activity using a combination of PLMs and protein activity predictors, achieving improved activity with as few as four rounds of evolution. EVOLVEpro substantially enhances the efficiency and effectiveness of in silico protein evolution, surpassing current state-of-the-art methods and yielding proteins with up to 100-fold improvement of desired properties. We showcase EVOLVEpro for five proteins across three applications: T7 RNA polymerase for RNA production, a miniature CRISPR nuclease, a prime editor, and an integrase for genome editing, and a monoclonal antibody for epitope binding. These results demonstrate the advantages of few-shot active learning with small amounts of experimental data over zero-shot predictions. EVOLVEpro paves the way for broader applications of AI-guided protein engineering in biology and medicine.

著者: Omar O. Abudayyeh, K. Jiang, Z. Yan, M. D. Bernardo, S. R. Sgrizzi, L. Villiger, A. Kayabolen, B. Kim, J. K. Carscadden, M. Hiraizumi, H. Nishimasu, J. S. Gootenberg

最終更新: 2024-07-18 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.07.17.604015

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.07.17.604015.full.pdf

ライセンス: https://creativecommons.org/licenses/by-nc/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

著者たちからもっと読む

類似の記事