Simple Science

最先端の科学をわかりやすく解説

# 生物学# 生物情報学

DeepSLICEM: クライオEMパーティクルクラスタリングの進化

新ツールが複雑な混合物のクライオEM画像分析を改善。

― 1 分で読む


DeepSLICEMが粒子DeepSLICEMが粒子クラスタリングを強化するいツール。より良いクライオEM画像解析のための新し
目次

クライオ電子顕微鏡法、つまりクライオEMは、2017年にノーベル化学賞を受賞した強力な技術だ。この方法を使うと、研究者たちは急速に冷凍されたサンプルの写真を撮ることができる。このサンプルには大きな生物分子が含まれてることが多く、画像は電子ビームを使って取得されるんだ。今では、2024年初頭の時点で、クライオEMによって様々な生物分子の32,000以上の構造画像が作成されているよ。

クライオEM構造の成長

クライオEMを使って作成された構造の数は急増している。そのほとんどは単一粒子クライオEMというタイプの研究から来ていて、これは高純度のサンプルが必要なんだ。でも最近、研究者たちはクライオ電子トモグラフィー(クライオET)という別の方法を使って、もっと複雑な細胞環境の中での画像を取得している。

これらの分子の構造を特定することは重要で、実際の応用があるんだ。例えば、SARS-CoV-2のスパイクタンパク質の構造を理解したことで、COVID-19ワクチンの開発につながったよ。

細胞抽出物の分析における課題

最近、科学者たちはクライオEM技術を拡張して、純粋なサンプルだけじゃなく、細胞からの複雑な混合物の中にある粒子を特定することに成功した。これには追加の課題があるんだ:異なる粒子の画像を分類する必要があるんだ。

複雑さはあるけど、これらの混合物の中で異なる粒子を分離することで、より多くの構造を解決できる可能性があるよ。このプロセスでは、多くの異なる高分子を含むサンプルを取り、クライオ電子顕微鏡で撮影するんだ。結果の画像は粒子の2D投影を示していて、そこから類似性に基づいてグループ化して3D構造を再構成するんだ。

2D投影の分析

従来、これらの投影を分析する方法は、異なる粒子間の類似性に焦点を当てているけど、既存の多くの方法は同じ粒子の異なる構造の混合物を分離するのに向いているんだ。新しいアプローチ、SLICEMは、同じ3Dオブジェクトの投影を結びつける数学的特性を巧みに使ってる。

SLICEMは、これらの投影で見つかった類似性に基づいてグラフを作成し、その後、類似性に応じて投影をグループ化するんだ。関連する研究では、ニューラルネットワークを使ってこれらの投影を表現する方法を学習させ、粒子のクラスター化精度を向上させている。これらの表現とグラフ技術を組み合わせることで、混合物の中で異なる高分子を特定するのに進展が見込めるよ。

DeepSLICEMの紹介

この記事では、DeepSLICEMという新しいツールを紹介するよ。このツールは、異なる粒子の2D投影のクラスタリングプロセスを改善することを目的にしてる。画像表現のためのさまざまな深層ニューラルネットワークやグラフニューラルネットワーク技術を探って、パフォーマンスを向上させてきたんだ。

DeepSLICEMは、粒子の画像をクラスタリングする最適な方法を見つけるために、さまざまな方法の組み合わせをテストしている。多くの異なる画像表現技術、グラフノード表現技術、クラスタリング方法を使用してるよ。

テストに使用したデータセット

DeepSLICEMをテストするために、実験データセットと合成データセットの両方を使用したよ。実験データセットには4つの異なる高分子複合体の100枚の2D投影画像が含まれていて、合成データセットには30以上の異なるタンパク質からサンプリングされた204枚の画像があった。

さらに、ノイズが精度に与える影響を調べるために、画像にランダムノイズを追加してノイジーデータセットを作成した。加えて、データセットに利用可能な投影の数が多ければどう変わるのか、クラスタリング方法のパフォーマンスがどうなるのかも探っている。

画像の表現

2D投影を分析するために、画像埋め込み技術を使って画像のベクトル表現を作成した。これにより、画像を多次元空間の点として表現することができ、クラスタリングに役立てられるんだ。

使った重要な技術の一つが、サイアミーズニューラルネットワークで、これを使うことで画像を比較し、同じ複合体の投影がベクトル空間内で近くにあることを確認できるんだ。このネットワークを画像のペアでトレーニングすることで、類似した高分子と異なる高分子をよりよく区別できるようになるよ。

グラフの表現

異なる投影間の類似性を取り入れるために、グラフアプローチも使った。SLICEMアルゴリズムは、ノードが画像を表し、エッジがそれら間の類似性を表す類似性グラフを作成するのを助けるんだ。そして、これらのノードとそれらの関係を表現するためのさまざまな方法を探った。

画像表現とグラフノード表現を組み合わせることで、より良いクラスタリング結果が得られる。こうした組み合わせによって、データに存在する複雑な関係や類似性を捉えることができるんだ。

クラスタリング方法

結合表現を作成した後、画像を分類するためのさまざまなクラスタリング方法を探った。実験では、クラスタの数を事前に知る必要がない人気のクラスタリング技術を使用したよ。

さまざまなクラスタリング方法の組み合わせを評価することで、以前の方法より精度が高いものをいくつか特定した。結果は、複数の技術を組み合わせることが、クラスタリングのパフォーマンスを向上させる上で重要だってことを示しているよ。

DeepSLICEMを使用した結果

徹底的なテストを通じて、DeepSLICEMが2D投影のクラスタリング精度を大幅に向上させることがわかった。特にノイジーデータやもっと多くの投影を持つデータセットを扱うときに、以前の方法より優れていたよ。

実験は、より強固で微調整された画像表現がより良いクラスタリング結果につながることを示した。DeepSLICEMと以前の方法を比較すると、画像とグラフノード埋め込みを組み合わせることで最良の結果が得られたんだ。

クラスタリングパフォーマンスの評価

クラスタリングのパフォーマンスは、さまざまな指標を使用して評価され、アルゴリズムのパフォーマンスについての洞察が提供された。私たちは結果を既存の方法と比較し、異なるデータセットにわたって強い改善が見られた。

さらに、良い結果を達成するための方法の一貫性を詳しく調べ、さまざまなデータセットでどの技術の組み合わせが最も効果的かを特定した。

今後の方向性

今後、DeepSLICEMの機能を高める多くの可能性がある。一つの重要な改善点は、画像埋め込みの洗練だ。現在の方法は一般的な画像データセットでトレーニングされたCNNに基づいているから、クライオEM画像に最適化されていないかもしれない。

これらのネットワークを特定のクライオEMイメージングデータで再トレーニングすれば、クラスタリングにさらに良い画像特徴が得られる可能性がある。また、研究者たちは新しいモデル、例えばオートエンコーダーやトランスフォーマーネットワークを探ることで、埋め込みの質をさらに向上させることができるかもしれない。

DeepSLICEMがクライオEMデータの分析に成功したことで、このパイプラインは画像が混在している他の分野にも応用できるかもしれない。これにより、さまざまな研究分野での使用拡大のためのエキサイティングな機会が提供されるだろう。

結論

要するに、DeepSLICEMは異なる高分子の2D投影をクラスタリングするための強力で効率的なアプローチを提供している。深層学習技術と従来の方法を活用することで、このツールは複雑な生物サンプルの研究に新しい可能性を開いているよ。

この革新は生物構造の理解を深めるだけじゃなく、さまざまな科学分野でのさらなる応用の道を切り開くんだ。これらの技術の継続的な開発と洗練は、クライオEMと関連する研究の未来を明るくしているよ。

オリジナルソース

タイトル: DeepSLICEM: Clustering CryoEM particles using deep image and similarity graph representations

概要: Finding the 3D structure of proteins and their complexes has several applications, such as developing vaccines that target viral proteins effectively. Methods such as cryogenic electron microscopy (cryo-EM) have improved in their ability to capture high-resolution images, and when applied to a purified sample containing copies of a macromolecule, they can be used to produce a high-quality snapshot of different 2D orientations of the macromolecule, which can be combined to reconstruct its 3D structure. Instead of purifying a sample so that it contains only one macromolecule, a process that can be difficult, time-consuming, and expensive, a cell sample containing multiple particles can be photographed directly and separated into its constituent particles using computational methods. Previous work, SLICEM, has separated 2D projection images of different particles into their respective groups using 2 methods, clustering a graph with edges weighted by pairwise similarities of common lines of the 2D projections. In this work, we develop DeepSLICEM, a pipeline that clusters rich representations of 2D projections, obtained by combining graphical features from a similarity graph based on common lines, with additional image features extracted from a convolutional neural network. DeepSLICEM explores 6 pretrained convolutional neural networks and one supervised Siamese CNN for image representation, 10 pretrained deep graph neural networks for similarity graph node representations, and 4 methods for clustering, along with 8 methods for directly clustering the similarity graph. On 6 synthetic and experimental datasets, the DeepSLICEM pipeline finds 92 method combinations achieving better clustering accuracy than previous methods from SLICEM. Thus, in this paper, we demonstrate that deep neural networks have great potential for accurately separating mixtures of 2D projections of different macromolecules computationally.

著者: Meghana Venkata Palukuri, E. M. Marcotte

最終更新: 2024-02-08 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.02.04.578778

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.02.04.578778.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

類似の記事