タンパク質進化の道筋
タンパク質がちっちゃな変化やつながりを通じて進化する様子を発見しよう。
Pranav Kantroo, Günter P. Wagner, Benjamin B. Machta
― 1 分で読む
目次
タンパク質は私たちの細胞の働き者だよ。食べ物を分解したり、信号を送ったり、細胞の形を与えたりと、色々な重要な仕事をしてる。アミノ酸の鎖からできていて、タンパク質は特有の形を持っていて、それができることを決めるんだ。複雑な機械みたいなもので、1つの部分を変えると、結果が変わるかもしれないよ。
タンパク質の進化のミステリー
進化を長くてクネクネした道に例えてみて。時間が経つにつれて、タンパク質は小さな突然変異を通じて配列を変えることができて、これはまるで小さな速度バンプみたい。多くの迂回を経たタンパク質は、見た目も動きも全然違うものになることがあるけど、長いルートを通ってもまだかなり似た感じのままのものもある。
でも、問題はこれだ: 科学者たちは、これらのタンパク質がどうやって関連しているかをどうやって見つけるのか、特に見た目や動きが遠い親戚みたいな時に?そこが難しいところなんだよね!
タンパク質配列の言語
どの言語にも文法があるように、タンパク質には配列を通じて「話す」方法があるんだ。科学者たちはこの言語を理解するためのツールを開発しているよ。人気のあるツールの1つがタンパク質言語モデルで、アミノ酸の配列に基づいて、タンパク質がどう折りたたまれて機能するかを予測するのを助けてくれる。
このモデルは基本的に翻訳者の役割を果たしていて、異なる配列がどう関連しているかを理解しようとしているの。だから、見た目が全然違う2つのタンパク質があったら、このモデルは一見明らかでないつながりを探しに行くんだ。
タンパク質間の道を作る
面白いアイデアがあるよ: タンパク質の間に道を作れたら、まるで2つの点を結ぶドットをつなぐみたいな感じ!まさに科学者たちがやろうとしていることなんだ!アミノ酸を1つ別のものに入れ替えるような小さな変更をすることで、理論的にタンパク質が1つの形から別の形に進化するのを見られるかもしれない。
想像してみて、言葉の中の1つの文字を変えて別の言葉を作るゲームをするみたいに – でもタンパク質のことなんだ!言葉の代わりにアミノ酸の配列があって、目的は、希望のタンパク質に達するまで実行可能な突然変異を作り続けることなんだ。
タンパク質のロードトリップ
ロードトリップの例えを使ってみよう。もし1つのタンパク質(これをタンパク質Aと呼ぼう)からスタートしてタンパク質Bに到達したいなら、道すがら小さな調整(または突然変異)しかできないんだ。スイッチをするたびに、新しいタンパク質がまだ機能することを確認したいよね、まるでロードトリップの途中で車が壊れないようにするみたいに。
このロードトリップを面白くするために、科学者たちは「ビームサーチ」というものを考案したんだ。これは、最短ルートを示すだけじゃなくて、すべての停留所で車(またはタンパク質)がスムーズに動けるかどうかも確認するGPSみたいなものだよ。タンパク質の風景の中で最適な経路を見つけるのに役立つんだ。
完全同系統: 近い親戚
まずは完全同系統のタンパク質から始めよう。これは、かなりの特徴を共有している兄弟みたいなもので、同じ親を持つ感じだね。例えば、抗生物質に対抗するのを手助けする酵素は、その配列に多くの類似点を持っているよ。
科学者たちがこれらの兄弟タンパク質をいくつかの経路でつなげようとしたとき、突然変異が小さくて一貫していれば、経路は機能していることがわかったんだ。まるで家族の再会から別の家族の再会へ、慣れ親しんだ近所を通って運転するみたいだね。
遠い同系統: 複雑な家系図
次は遠い同系統でスパイスを加えよう。これらのタンパク質は、時が経つにつれてかなり変わった第二子や第三子のようなもので、でもまだいくつかの家族の特徴を共有しているんだ。
例えば、環境の変化に応じるのを手助けするタンパク質の家系があるよ。ちょっと多様性があるけど、研究者たちはこれらの遠い親戚の間にもつながりを見つけることができることがあるんだ。経路はおかしな状態や不安定な状態を通るかもしれないけど、まるで不慣れなエリアを迂回するみたいだね。
仮説的同系統: 謎のいとこ
次は仮説的同系統のタンパク質。これらのタンパク質は、あまり似ていない遠い親戚のようなもので、異なる目的を持っているけど、共通の祖先を示唆するようないくつかの奇妙な類似点があるんだ。
例えば、乳酸脱水素酵素とNADH過酸化水素酵素は、全然違う仕事をする2つの異なるタンパク質なんだけど、構造のいくつかの部分は幽霊のような類似性を持っているんだ。科学者たちは、これらのタンパク質の間に意外なひねりや回り道がある経路を見つけて、それが不安定な状態を通ることが多くて、道を失った気分になることがあるんだ。
経路を見つける課題
タンパク質の間の経路を見つけるのは、見た目ほど簡単じゃないんだ。これは、時間が経つにつれて崩れてしまった古い橋をつなごうとしているように考えることができるよ。似たようなタンパク質(兄弟のような)間の経路を見つけるのは簡単だけど、遠い親戚や謎のいとこたちの場合は、より不確実な空間をナビゲートする必要があることが多いんだ。
時には、これらの経路をたどると、タンパク質が安定した構造や機能を失うことがあるよ。それは、ガタガタの道を走れない車が壊れるみたいな感じ。科学者たちは、これらの経路を探すとき、多くのデータを集めて、正しい方向に進んでいることを確認するんだ。
経路に沿った適応度の測定
科学者たちがタンパク質の経路を作るとき、各変異の「適応度」を測る方法も必要だよ。このための一般的な方法がESM2言語モデルを使って、特定のタンパク質が効果的に機能する可能性を予測することなんだ。
想像してみて、ロードトリップの途中で自分の調子を教えてくれるフィットネストラッカーがある感じ。ガタガタ道に入ったら、トラッカーがビープ音を鳴らして、「ルートを変える時間だよ!」って警告するかもしれない。さもないと、車(またはタンパク質)が諦めちゃうかも!
さまざまな経路の比較
役に立つ経路を確保するために、科学者たちはしばしばそれらを比較するよ。ビームサーチ法で作成された経路は、ランダムな経路よりも持続する傾向があるんだ。
ちょっと面白いことに、ランダムな経路を使うと驚くべき発見に繋がることもあるけど、往々にして行き止まりや、もっと悪いことに、故障に繋がることが多いんだ!タンパク質が旅の間に「適応度」を保っているかを追跡することで、科学者たちはより良い経路を作成するための技術を洗練していくことができるんだ。
学んだ教訓
タンパク質配列間で実行可能な経路を作成する中で、科学者たちは進化がどう働くかについてかなりのことを発見したんだ。完全同系統をすんなりつなげるのはできるけど、遠い同系統や仮説的同系統はもうちょっと繊細な手法が必要みたいだね。
この研究の美しさは、進化のランダムな性質を理解することにあるんだ。時には、すべてを変える隠れたつながりを偶然発見することがあるからね。
結論: 進むべき道
科学者たちがタンパク質の旅を地図化し続ける中で、彼らは単に経路を見つけるだけじゃなく、生命がどのように適応するかについての秘密を解き明かしているんだ。この知識は、タンパク質が今後どのように進化するかを予測するのに役立ち、医療やバイオテクノロジーの新しい革新につながるかもしれないよ。
だから、次に進化について考えるときは、思い出してね: それは予想外のひねり、曲がり角、そして美しい新しい目的地に導く時々の迂回があるクネクネした道のりなんだ!
タイトル: High fitness paths can connect proteins with low sequence overlap
概要: The structure and function of a protein are determined by its amino acid sequence. While random mutations change a protein's sequence, evolutionary forces shape its structural fold and biological activity. Studies have shown that neutral networks can connect a local region of sequence space by single residue mutations that preserve viability. However, the larger-scale connectedness of protein morphospace remains poorly understood. Recent advances in artificial intelligence have enabled us to computationally predict a protein's structure and quantify its functional plausibility. Here we build on these tools to develop an algorithm that generates viable paths between distantly related extant protein pairs. The intermediate sequences in these paths differ by single residue changes over subsequent steps - substitutions, insertions and deletions are admissible moves. Their fitness is evaluated using the protein language model ESM2, and maintained as high as possible subject to the constraints of the traversal. We document the qualitative variation across paths generated between progressively divergent protein pairs, some of which do not even acquire the same structural fold. The ease of interpolating between two sequences could be used as a proxy for the likelihood of homology between them.
著者: Pranav Kantroo, Günter P. Wagner, Benjamin B. Machta
最終更新: 2024-11-13 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2411.09054
ソースPDF: https://arxiv.org/pdf/2411.09054
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。