Simple Science

最先端の科学をわかりやすく解説

# 生物学# 生物物理学

クライオ電子顕微鏡技術の進展

新しい方法がクライオ電子顕微鏡を使ってタンパク質の形状再構築を改善する。

― 1 分で読む


CryoSPHERE:CryoSPHERE:次世代のタンパク質分析を革新中。高度な技術によってタンパク質の形状再構築
目次

クライオ電子顕微鏡法、通称クライオEMは、たんぱく質のような大きな生物構造の3D形状を観察する特別な方法なんだ。この技術では、同じたんぱく質を薄い氷の層で凍らせて、電子顕微鏡で見るんだ。これによって、たんぱく質の2D画像がたくさんできて、これを粒子って呼ぶんだ。主な目的は、撮影された画像に基づいてこれらのたんぱく質の可能な形を見つけることだよ。

たんぱく質は色々な形をとることができて、凍ったコピーはそれぞれ違う形を表しているかもしれない。従来、科学者たちはこのバリエーションを無視して、すべてのたんぱく質が同じ形だと仮定してたんだ。でも、異種再構成って言われる方法で、すべての異なる形を見たいというニーズがあるんだ。

クライオEMの課題

クライオEMの画像から構造を再構築するのは簡単じゃないんだ。いくつかの課題があって、プロセスを難しくしてる。まず、各画像はあらかじめ知られていない角度からたんぱく質を見せてる。次に、電子がたんぱく質と相互作用する方法が画像を不明瞭にして、情報が変わっちゃうんだ。この効果はカメラのレンズが写真をぼかすのに似てる。最後に、これらの画像は通常多くのノイズを含んでいて、はっきりした詳細が見えにくいんだ。

これらの課題のせいで、多くの標準的な方法は平均化された画像を作り、異なる形の詳細を失っちゃうんだ。一部の新しい方法は、画像で見つかる異なる形にフィットするように変化する、想定された基本構造に基づいた制約を使って詳細を保とうとしているよ。

現在の方法

AlphaFoldやRosettaFoldは、アミノ酸配列に基づいてたんぱく質の形を予測できるツールなんだ。初期の形を与えるのが得意だけど、ノイズのせいで形の意味のあるバリエーションを回復するのが難しいんだ。2D画像しか見えないから、形の回復がさらに難しくなるんだ。

これに対処するために、新しい方法は、異なる形がたんぱく質の部分の大きな動きで説明できることが多いという考えに基づいてる。この新しい方法は、変分オートエンコーダVAE)という機械学習の一種を使ってる。この方法は、たんぱく質を部分に分ける方法を学び、クライオEMから集めた画像に基づいて異なる形を見つけられるんだ。

新しい方法の仕組み

この方法の主な焦点は、たんぱく質のセグメントを特定し、これらのセグメントが画像に応じてどう動くかを理解することなんだ。まず、たんぱく質をセグメントに分ける。次に、特定の画像ごとにそれらのセグメントを変換する方法を学ぶ。この二つのステップは同時に行われて、新しいデータを処理する際に学んで調整できるモデルが出来上がるんだ。

この方法で学習されたセグメントは、たんぱく質の機能的に重要な部分、ドメインと必ずしも同じではないけど、学習プロセスで実際のドメインを特定することが多くて、結果の精度を向上させるのに役立つんだ。

表記と問題の定式化

簡単に言うと、たんぱく質を研究する時、残基と呼ばれる小さな単位で作られていると考えられるんだ。各残基には原子が含まれてる。目標は、これらの残基を基に2D画像から3D形状を再構築するために点をつなぐことなんだ。各残基が空間でどう配置されているかを見つけることは、画像のバリエーションや存在するノイズを考えると難しい仕事なんだ。

通常、古い方法は、画像ごとにたんぱく質の密度マップを取得しようとしてた。でも、新しい方法は、画像ごとにたんぱく質の実際の構造を回復することを目指して、たんぱく質の形のバリエーションをより詳しく理解できるようにしてるんだ。

関連研究

クライオEMの再構築に使える方法はいくつかあるんだ。RELIONやcryoSPARCは、深層学習に基づかない最も一般的に使われている方法の二つなんだ。これらは一般的に、キャプチャされた画像に基づいて密度マップを作成することに焦点を当てている。しかし、これらはたいてい、画像がわずか数個の構成にしか構成されていないかのように扱っちゃうから、多くの形の詳細を見逃しちゃうんだ。

他の方法は、たんぱく質の形をよりよく理解するために深層学習を利用してる。例えば、いくつかの方法は変分オートエンコーダを使用し、他の方法は直接再構築に焦点を当ててる。また、各残基を別々に追跡しようとする方法もあって、これらはノイズのレベルのためにしばしば局所的な最小値に捕まってしまうことが多いんだ。

既存の方法で進展があったものの、すべての方法はノイズや画像を正確にモデル化するという制限に直面してるんだ。

方法:クライオSPHERE

新しい方法、クライオSPHEREは、たんぱく質の構造の再構築に焦点を当てているんだ。主な利点は、たんぱく質の部分を動かす仕方にある。たんぱく質の小さな部分を独立して調整するのではなく、より大きなセグメントをより剛性に動かすことに集中してるんだ。

この方法は、典型的な変分オートエンコーダの構造を使用するんだ。システムは各画像を取り込み、潜在変数にマッピングする。この変数は、その後、それぞれのたんぱく質のセグメントに必要な変換を決定するデコーダに渡される。基本構造はそれに応じて調整されて、たんぱく質の新しいポーズに基づいて2D画像が生成されるんだ。

画像形成モデル

たんぱく質の3D構造から2D画像を作成するには、まず密度マップを推定するんだ。この密度マップは、たんぱく質内で電子が最も見つかりやすい場所を表すんだ。密度マップが作成されると、それが2D画像フォーマットに投影されるんだ。

このステップは重要で、たんぱく質の実際の構造をクライオEMでキャプチャされた画像に直接結びつけるんだ。このプロセスに関わる正確な計算は、従来の方法と比べて計算時間を大幅に短縮するのに役立つんだ。

最大尤度と変分推論

形状をよりよく理解するために、この新しい方法は、画像に基づいてたんぱく質の形のバリエーションを表現することを学ぶんだ。変分推論という技術を使って、特定のたんぱく質構造に画像がフィットする尤度を最大化するんだ。これによって、処理するデータについてより正確な理解が得られるんだ。

セグメント分解

このアプローチは、たんぱく質をいくつかのセグメントに分けることで、モデルが残基ごとにではなく、少数の部分に集中できるようにしてる。セグメントは柔軟に定義されていて、単一の残基が複数のセグメントに所属することができる。これによって、動きをモデル化するのをうまく行えて、たんぱく質の動きの複雑さを捉えられるんだ。

この方法は、セグメントをフィットさせるための特定の数学モデルを使用していて、セグメントと全体のアミノ酸鎖構造との間に繋がりがあることを保証してる。このように、学習や調整がスムーズに行われ、過剰な計算を避けることができるんだ。

デコーダーアーキテクチャ

モデルのデコーダーは、画像が学習された潜在変数とどう関係しているかを説明するんだ。各画像には、たんぱく質の形を調整するのを助けるユニークな変数があるんだ。デコーダーは、セグメントをそれぞれの動きと結びつけることで、行われる変換の明確な理解を提供するんだ。

デコーダーのステップは一緒に機能して、たんぱく質の各部分の変換を結合するんだ。つまり、残基の位置が調整される時、それは異なるセグメントへの所属を尊重する方法で行われるんだ。

エンコーダーと事前分布

エンコーダーは分布を追跡して、たんぱく質の形のマップを作るのを助けるんだ。これは、学習された変換が一貫していて合理的であることを保証するために、正規分布を使用して行われる。パラメータを最適化することで、モデルはたんぱく質の形についての理解を深め続けることができるんだ。

クライオSPHEREのテスト

クライオSPHEREは、たんぱく質の形を再構築する効果を示すために、異なるデータセットでテストされているんだ。最初に、連続的な動きを表すたんぱく質構造のシミュレーションデータセットでテストされた結果、クライオSPHEREがたんぱく質セグメント間の角度や距離を正確に予測できることがわかったんだ。

その後、SARS-CoV-2スパイクたんぱく質の二つの異なる形を含むデータセットに適用された。モデルは、ドメイン間の角度を高精度で回復できたので、実際のたんぱく質の形を扱う能力を確認できたんだ。

最後に、分子動力学シミュレーションから作成されたデータセットでクライオSPHEREがテストされ、たんぱく質セグメントの動きを正確に追跡できる能力を示したんだ。クライオSPHEREの性能は、画像から体積を再構築する際、競合する方法よりも一貫して優れていたんだ。

クライオSPHEREの利点

クライオSPHEREがたんぱく質の形を再構築する方法として際立つ理由はいくつかあるんだ:

  1. 効率的な変形: 基本構造を直接変換することで、クライオSPHEREは複雑な計算を避けて、より迅速な結果を提供するんだ。

  2. 複雑さの軽減: 大きなセグメントに焦点を当てることで、必要なニューラルネットワークのサイズが減り、プロセスがより早く効率的になるんだ。

  3. 透明性と明確さ: モデルは異なるたんぱく質部分がどのように動いているかについて明確な情報を提供するので、古い方法と比べて結果の解釈が簡単なんだ。

  4. 堅牢性: クライオSPHEREは、より少ない画像でも良いパフォーマンスを発揮するから、さまざまな状況でたんぱく質を研究するための柔軟なツールなんだ。

  5. 洞察に満ちた情報: この方法論によって、研究者はたんぱく質の動態やさまざまな形についての深い洞察を得られるので、今後の進展に繋がるんだ。

今後の方向性

クライオSPHEREは大きな可能性を示しているけど、将来的な改善の機会もあるんだ。例えば、この方法で学習したセグメントが大規模な研究から得られる発見とどれだけ相関するかを評価するのは有益かも。また、たんぱく質の動態を理解し、異なる構造を予測することが、バイオメディスンの進展に繋がるかもしれないんだ。

まとめると、クライオSPHEREはたんぱく質の形の分析において重要な進歩を表しているんだ。たんぱく質の構造とその動きの関係に焦点を当てることで、分子生物学の研究に新しい道を開いていて、分子レベルでの生命の複雑さを理解しようとしている科学者たちにとって貴重なツールになってるんだ。

オリジナルソース

タイトル: cryoSPHERE: Single-particle heterogeneous reconstruction from cryo EM

概要: The three-dimensional structure of a protein plays a key role in determining its function. Methods like AlphaFold have revolutionized protein structure prediction based only on the amino-acid sequence. However, proteins often appear in multiple different conformations, and it is highly relevant to resolve the full conformational distribution. Single-particle cryo-electron microscopy (cryo EM) is a powerful tool for capturing a large number of images of a given protein, frequently in different conformations (referred to as particles). The images are, however, very noisy projections of the protein, and traditional methods for cryo EM reconstruction are limited to recovering a single, or a few, conformations. In this paper, we introduce cryoSPHERE, a deep learning method that takes as input a nominal protein structure, e.g. from AlphaFold, learns how to divide it into segments, and how to move these as approximately rigid bodies to fit the different conformations present in the cryo EM dataset. This formulation is shown to provide enough constraints to recover meaningful reconstructions of single protein structures. This is illustrated in three examples where we show consistent improvements over the current state-of-the-art for heterogeneous reconstruction.

著者: Gabriel Ducrocq, L. Grunewald, S. Westenhoff, F. Lindsten

最終更新: 2024-06-24 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.06.19.599686

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.06.19.599686.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

著者たちからもっと読む

類似の記事