Simple Science

最先端の科学をわかりやすく解説

# 計量生物学# 生体分子

タンパク質間相互作用の予測の進展

この研究は、物理的特徴に基づいてタンパク質相互作用を予測するためのスコアリング関数を評価してるよ。

― 1 分で読む


タンパク質相互作用予測のイタンパク質相互作用予測のインサイト探る。スコアリング関数とタンパク質結合の課題を
目次

タンパク質は生物学において重要な分子で、さまざまな方法で相互作用しているんだ。これらの相互作用は、多くの生物学的機能にとって重要で、酵素の働き方や細胞骨格の組織、免疫系が有害物質を検出する方法などに関わっている。これらの相互作用の重要な側面は、2つのタンパク質がどこでどのように結びつくかを理解することだ。この結合界面を特定することで、タンパク質複合体の機能をよりよく理解するのに役立つんだ。

実験的な方法、例えばX線結晶構造解析などが、タンパク質-タンパク質界面の構造を見つけるのに役立つ。ただ、これらの方法は高コストで時間がかかることがある。例えば、人間の体には無数のタンパク質-タンパク質相互作用があるけど、その構造が実験的に決定されているのはごく一部だけなんだ。

計算タンパク質設計の目標の一つは、2つのタンパク質が相互作用するかどうかを予測し、間の結合部位を見つけること。これをするために、研究者たちはさまざまな計算モデリング技術を使って、タンパク質がどのように相互作用するかのポテンシャルモデルを生成しているよ。

計算モデルとリジッドボディドッキング

タンパク質がどのように結びつくかを予測する最初のステップは、彼らがどうフィットするかを示すモデルを生成することなんだ。このプロセスは、2つのタンパク質をリジッドにドッキングさせることから始まる。つまり、既知のタンパク質の構造を使って、どのように再配置するかを試みるんだ。

これらのモデルを生成したら、その正確さを評価する方法が必要なんだ。これを目的としたスコアリング関数が使われる。これらの関数は、実際のタンパク質相互作用の構造をどれだけよく予測するかに基づいてモデルにスコアを付ける。一部のスコアリング関数は以前に評価されているけど、それらの方法は、使われるモデルの数や質に敏感だったりするんだ。

この研究では、計算モデルのタンパク質-タンパク質界面が実際の構造とどのくらい一致しているかを評価するために、7つの異なるスコアリング関数を考慮している。DockQというスコアを使って、構造的類似性を利用してモデルが実験的な構造にどれだけ近いかを計算するんだ。

ターゲット間の正確さの違い

私たちの発見の一つは、いくつかのモデルが高いスコアを返し、DockQとの近い一致を示す一方で、多くの他のモデルはあまり相関しないということ。このことは、スコアリング関数がドッキングモデルの質を正確に予測する能力に差があることを意味しているんだ。

タンパク質が密接に絡み合っていて、界面で多くの接触があるターゲットは、そのスコアとDockQの間に強い相関を示す傾向があることに気づいたよ。これらの発見は、特定の物理的特徴が予測を改善するのに役立つ可能性があることを示唆している。

また、私たちは3つの物理的特徴に基づいた新しいスコアリング関数も作成した。この新しいスコアのパフォーマンスは、既存のスコアリング関数と同等かそれ以上なんだ。これは、特定の物理的特性に焦点を当てることで、タンパク質相互作用の予測能力を大幅に向上させることができることを示しているよ。

研究の重要性

私たちの研究は、2つのタンパク質がどこで結びつくかを予測するという重要な課題に取り組んでいる。さまざまなスコアリング関数を標準的な類似性の測定基準(つまり、DockQ)と比較することによって、現在のスコアリング関数が高品質モデルと低品質モデルを区別するのに苦労していることを強調している。研究は、いくつかの物理的特性を特定し、それをより正確なスコアリング関数に組み合わせる方法を示しているんだ。

タンパク質相互作用の風景を理解する

タンパク質は複雑な環境で相互作用していて、これらの相互作用を予測するには、これらのタンパク質が存在するさまざまな風景やコンテキストを理解する必要がある。私たちは、リジッドボディドッキングに焦点をあてて、タンパク質構造の相互作用を詳しく見ていくよ。

リジッドボディドッキングは比較的単純なタスクのはずだけど、実際には結果として得られたモデルの正確なスコアリングが重要で、依然として課題を抱えている。私たちの研究は、今日使われている多くのスコアリング関数が、タンパク質相互作用のモデルを一貫して正確に評価するためには改善が必要だと見つけたんだ。

サンプリングとモデル生成

私たちの研究では、高品質なデータを確保するために特定の基準に基づいて選ばれた84のタンパク質ヘテロダイマーターゲットのセットをサンプリングしたよ。それぞれのターゲットの構造は高解像度で解決されていなきゃいけなくて、追加の非タンパク質材料を含んではいけない。

これらのターゲットのために計算モデルを作成するために、ZDOCKというプログラムを使った。このプログラムは、繰り返しシミュレーションを通じて、各ターゲットのために多くのモデル(最大540,000個)を生成するんだ。これらのモデルを生成した後、均一なサンプリングアプローチを導入して、高品質モデルを効果的にキャッチするようにしたよ。

スコアリング関数の評価

私たちの評価プロセスでは、さまざまなスコアリング関数からの結果を比較した。各スコアリング関数の効果は、予測されたスコアとグラウンドトゥルース、つまりDockQスコアと比較することで測定された。

使われるスコアリング関数が、予測された質に基づいてモデルを「ポジティブ」または「ネガティブ」と正確に分類できることが重要なんだ。でも、異なるスコアリング関数はさまざまなレベルの信頼性を示した。一部はDockQとの強い相関を示したけど、他はそうではなかったよ。

タンパク質界面の物理的特徴

スコアリングしやすいタンパク質相互作用とは何かをよりよく理解するために、タンパク質界面の物理的特徴も調査した。例えば、タンパク質間の接触点の数や、界面のサイズ、接触点での2つのタンパク質の絡み具合を見てみたんだ。

私たちの発見は、より絡み合ったインターフェースの方が正確にスコアリングしやすい傾向があり、逆に大きなインターフェースは困難をもたらす可能性があるということ。

ディープラーニングの役割

タンパク質予測におけるディープラーニング技術の台頭とともに、これらの方法を用いて設計された新しいスコアリング関数の可能性も探求したよ。しかし、私たちの研究では、特定のグラフニューラルネットワークなどの高度なディープラーニングモデルでさえ、物理的特徴に基づく単純なスコアリング関数を常に上回るわけではないことが示されたんだ。

将来の取り組みには、これらのスコアリング関数が、モデルの質のバランスの取れた表現を保証するデータセットで訓練される必要があることを強調している。より良い訓練データが、タンパク質相互作用の予測性能を向上させる可能性が高いんだ。

結論

要するに、この研究は、計算モデルを使ってタンパク質-タンパク質相互作用を予測する上での課題と成功についての洞察を提供している。さまざまなスコアリング関数を評価し、タンパク質界面の根本的な物理的特性を考慮することで、タンパク質ドッキングシナリオにおける予測の正確さを向上させることを目指しているんだ。

計算方法の継続的な改善と物理的特徴への考慮によって、研究者たちがタンパク質相互作用の魅力的な世界を解明し、それが生物学的機能において果たす重要な役割を明らかにするのを助けるだけの優れたツールを開発していけるんだ。

タンパク質がどのように結びつくか、そしてその相互作用の影響を理解する旅は続いていて、私たちの発見はこの分野におけるさらなる研究と開発への道を切り開いているよ。

オリジナルソース

タイトル: Assessment of scoring functions for computational models of protein-protein interfaces

概要: A goal of computational studies of protein-protein interfaces (PPIs) is to predict the binding site between two monomers that form a heterodimer. The simplest version of this problem is to rigidly re-dock the bound forms of the monomers, which involves generating computational models of the heterodimer and then scoring them to determine the most native-like models. Scoring functions have been assessed previously using rank- and classification-based metrics, however, these methods are sensitive to the number and quality of models in the scoring function training set. We assess the accuracy of seven PPI scoring functions by comparing their scores to a measure of structural similarity to the x-ray crystal structure (i.e. the DockQ score) for a non-redundant set of heterodimers from the Protein Data Bank. For each heterodimer, we generate re-docked models uniformly sampled over DockQ and calculate the Spearman correlation between the PPI scores and DockQ. For some targets, the scores and DockQ are highly correlated; however, for many targets, there are weak correlations. Several physical features can explain the difference between difficult- and easy-to-score targets. For example, strong correlations exist between the score and DockQ for targets with highly intertwined monomers and many interface contacts. We also develop a new score based on only three physical features that matches or exceeds the performance of current PPI scoring functions. These results emphasize that PPI prediction can be improved by focusing on correlations between the PPI score and DockQ and incorporating more discriminating physical features into PPI scoring functions.

著者: Jacob Sumner, Grace Meng, Naomi Brandt, Alex T. Grigas, Andrés Córdoba, Mark D. Shattuck, Corey S. O'Hern

最終更新: 2024-07-23 00:00:00

言語: English

ソースURL: https://arxiv.org/abs/2407.16580

ソースPDF: https://arxiv.org/pdf/2407.16580

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。

著者たちからもっと読む

類似の記事