Simple Science

最先端の科学をわかりやすく解説

# 計量生物学# 定量的手法# 化学物理学

薬ドッキング法におけるディープラーニングの評価

深層学習の分子ドッキングの精度と妥当性における効果を評価する。

― 1 分で読む


薬のドッキング法の評価薬のドッキング法の評価グ精度に課題があるんだ。ディープラーニングの手法は、薬のドッキン
目次

ドッキングは新しい薬を発見するのにめっちゃ大事な部分だよ。リガンドって呼ばれる小さい分子が、どれだけプロテインにくっつけるかを考えるんだ。科学者たちは、実験からの情報かプロテインとリガンドのコンピュータモデルを使って相互作用を予測する。目的はリガンドがプロテインにうまくフィットするかを見ることで、研究者が薬の候補を選びやすくするんだ。

ドッキングからの予測はバーチャルスクリーニングに使われて、大量の薬剤候補が試されて、どれが効果的な治療法になり得るのかを探る。医薬化学者たちもこれらの予測を使って小さい分子がプロテインにどう結合するかを理解して、薬として開発できるかを判断するのに役立てる。

ドッキングの方法は、結合はプロテインとリガンドの構造間の相互作用によって起こるという考え方に基づいてる。でも、この過程は複雑だから、方法はスピードと精度のバランスをとる必要があるんだ。

ドッキングにおけるディープラーニングの役割

ディープラーニング(DL)技術はドッキングのやり方を変えてる。ドッキングのプロセスを速く、正確にする可能性を示してるんだ。いくつかのDLベースのドッキング方法が提案されていて、それぞれリガンドがプロテインにどう結びつくかを予測するユニークな方法を持ってる。

従来のドッキング方法は計算に特定の特徴を含めて、化学的に意味があるかや物理的に妥当かを確認してる。たとえば、リガンドが動ける範囲を回転可能な部分だけに制限してたり、プロテインとリガンドが不可能な重なり方をしたらペナルティを課したりする。

でも、現在のDLベースのドッキング方法の中には、こういう重要なチェックを見落とすものもある。これが非現実的な結合ポーズを生むことがあっても、RMSD値に関しては良い精度を示すことがあるんだ。RMSDは、予測された結合モードが実際のものにどれだけ近いかを測る一般的な方法だよ。

ドッキング方法のパフォーマンスを真に評価するためには、予測されたポーズが化学的にや物理的に妥当かどうかを評価する独立したテストが必要なんだ。これが現在のDLベースのドッキング方法で何が不足しているかを特定し、より良い予測の開発を促進するのに役立つ。

物理的妥当性の重要性

ドッキングの予測の物理的妥当性を確認するのは、PDB(Protein Data Bank)での構造データの検証に似てる。構造検証は、リガンドの結合長や角度が既知の化学構造と一致するかをチェックする。また、原子が近づきすぎる場合の立体的衝突も探すんだ。

リガンドを検証するために最初に設計されたチェックは、ユーザーが正しい可能性のある構造を選べるように助ける。一方で、ドッキング方法はどれだけ結晶構造を再現できるかに基づいて判断されるから、その出力も同じ妥当性チェックを通過するべきなんだ。

リガンドのコンフォメーションを生成するためのいくつかのワークフローには、すでに物理的チェックが含まれている。たとえば、幾何学的チェックは、予測された結合長や角度が既知の最適値からどれくらい逸脱しているかを測定する。追加の化学チェックでは、不正確な結合パターンや欠如した官能基を特定することができる。

ここでの目標は、予測された結合コンフォメーションが化学的にも物理的にも妥当であることを確認することだ。

ドッキング方法の現状

ドッキング方法の比較のほとんどは、結合モードのRMSDに heavily focused していて、この傾向は新しい方法の導入にも引き継がれている。調査した5つのDLベースのドッキング方法は、標準的な方法に対してパフォーマンスが向上したと主張しているが、これらの主張は主にRMSD値に依存していて、物理的妥当性をチェックしていない。

これらのギャップに対処するために、私たちはPoseBustersテストスイートを提案する。このスイートは、予測されたリガンドポーズの非妥当なコンフォメーションをチェックするように設計されている。私たちはPoseBustersを使って、5つのDLベースのドッキング方法と2つの古典的なドッキング方法の出力を評価した。

結果は、RMSDだけを見たとき、いくつかのDLベースの方法が良いパフォーマンスを示すかもしれないことを明らかにしている。しかし、予測の物理的リアリズムを考慮すると、従来の方法がしばしばDL方式を上回ることが多い。

テストしたドッキング方法の概要

調査した5つのDLベースの方法は次の通り:

  1. DeepDock: この方法は、リガンドの原子間の距離に基づいて統計的なポテンシャルを学習する。
  2. DiffDock: グラフ技術を使用してブラインドドッキングを実行し、事前に定義された結合部位を必要としない。
  3. EquiBind: DiffDockに似ているが、特にドッキングのためにグラフニューラルネットワークを活用することに焦点を当てている。
  4. TankBind: この方法は、予測された結合ポケットでドッキングするために三角法を取り入れたユニークなアプローチを採用している。
  5. Uni-Mol: 分子の形や向きを扱うように設計されたトランスフォーマーを使用する。

研究に含まれる2つの古典的方法はAutoDock VinaとGoldで、これはこの分野で確固たる評価を築いている。

選ばれた各方法には、PDBBindデータセットのさまざまなサブセットから得た特定のトレーニングデータがあった。このデータセットには、プロテイン-リガンド複合体に関する情報が含まれていて、これらのドッキングモデルをトレーニングするために使用されている。

PoseBustersテストスイート

PoseBustersテストスイートは、主に3つのセクションから成り立っている:

  1. 化学的妥当性: この最初のグループは、予測されたリガンドが認識された化学基準や特性に従っているかを確認する。
  2. 分子内特性: 2つ目のセクションは、結合長や角度などの幾何学的要因をテストして、受け入れ可能な範囲内にあるかを確認する。
  3. 分子間相互作用: 最後のグループは、リガンドがプロテインや共因子とどう相互作用するかを調べ、衝突や重なりをチェックする。

PoseBustersのすべてのテストを通過した予測されたポーズは「PB-valid」とラベル付けされる。予測を評価するために、スイートはリドッキングされたリガンド、真のリガンド、プロテイン構造を含む入力ファイルを必要とする。

ドッキング方法の評価

PoseBustersテストスイートを使用して、DLベースおよび古典的なドッキング方法から生成された予測を評価した。リガンドをそれぞれのプロテインに再ドッキングすることで、各方法が同じ条件下でどれだけうまくいったかを評価できた。

Astex Diverse Setの結果

Astex Diverse Setには、ドッキング方法を評価するためのベンチマークとして使用されるさまざまな手作りのプロテイン-リガンド複合体が含まれている。結果は、RMSDだけを考慮すると、DLベースの方法の1つであるDiffDockが最も良いパフォーマンスを示すことを示している。しかし、物理的妥当性も考慮に入れると、GoldやAutoDock Vinaのような従来の方法が最良となる。

この文脈では、DiffDockはRMSDに基づいて多くの実際に正確に見える予測を生成できたが、これらの多くの予測は物理的に妥当ではなかったことを強調することが重要だ。

PoseBustersベンチマークセットの結果

PoseBustersベンチマークセットは、DL方法がトレーニング中に遭遇していないより挑戦的なプロテイン-リガンド複合体で構成されている。このテストセットでは、GoldやAutoDock Vinaが引き続き良好なパフォーマンスを発揮しているのに対し、DiffDockのようなDL方法は新しいデータに苦しんでいる。

ポストドッキングエネルギー最小化を実施しても、予測されたポーズをより適切にフィットさせる調整が行われたが、結果は従来の方法がパフォーマンスと妥当性の面でDL方法を上回っていることを示唆している。

ディープラーニング方法の限界

両方のセットからの発見は、DLベースの方法が現在一般化に課題を抱えていることを示している。彼らはトレーニングセットに似たデータではうまくいくことが多いが、見たことのない複合体には苦労する。これは、トレーニング中に提示された特定のプロテイン構造への過剰適合の可能性を示唆している。

さらに、エネルギー最小化はDL方法のいくつかの予測を改善するかもしれないが、GoldやAutoDock Vinaのような古典的方法の精度レベルには達していない。これは、古典的なドッキングモデルで表現される化学や物理の重要な側面が、現在のDL技術では完全に捉えられていないことを強調している。

まとめ

要するに、DLベースのドッキング方法は可能性を示しているけど、PoseBustersテストスイートを通じた私たちの分析は、物理的妥当性の維持と新しいデータへの一般化に特に重要な改善点があることを明らかにしている。これらの方法が発展するにつれて、化学的整合性と物理的リアリズムのチェックを取り入れることが、薬剤発見の分野を進めるためには不可欠になるだろう。

PoseBustersテストスイートは、開発者にとって価値のあるツールで、現在のモデルの弱点を特定し、より良いドッキング方法の開発を導くのに役立つ。この継続的な作業は、効果的な治療法の探求においてより信頼性の高い予測に向けた進展を促すことを目的としている。

オリジナルソース

タイトル: PoseBusters: AI-based docking methods fail to generate physically valid poses or generalise to novel sequences

概要: The last few years have seen the development of numerous deep learning-based protein-ligand docking methods. They offer huge promise in terms of speed and accuracy. However, despite claims of state-of-the-art performance in terms of crystallographic root-mean-square deviation (RMSD), upon closer inspection, it has become apparent that they often produce physically implausible molecular structures. It is therefore not sufficient to evaluate these methods solely by RMSD to a native binding mode. It is vital, particularly for deep learning-based methods, that they are also evaluated on steric and energetic criteria. We present PoseBusters, a Python package that performs a series of standard quality checks using the well-established cheminformatics toolkit RDKit. Only methods that both pass these checks and predict native-like binding modes should be classed as having "state-of-the-art" performance. We use PoseBusters to compare five deep learning-based docking methods (DeepDock, DiffDock, EquiBind, TankBind, and Uni-Mol) and two well-established standard docking methods (AutoDock Vina and CCDC Gold) with and without an additional post-prediction energy minimisation step using a molecular mechanics force field. We show that both in terms of physical plausibility and the ability to generalise to examples that are distinct from the training data, no deep learning-based method yet outperforms classical docking tools. In addition, we find that molecular mechanics force fields contain docking-relevant physics missing from deep-learning methods. PoseBusters allows practitioners to assess docking and molecular generation methods and may inspire new inductive biases still required to improve deep learning-based methods, which will help drive the development of more accurate and more realistic predictions.

著者: Martin Buttenschoen, Garrett M. Morris, Charlotte M. Deane

最終更新: 2023-11-28 00:00:00

言語: English

ソースURL: https://arxiv.org/abs/2308.05777

ソースPDF: https://arxiv.org/pdf/2308.05777

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。

著者たちからもっと読む

類似の記事