Simple Science

最先端の科学をわかりやすく解説

# 生物学# 生物情報学

iScoreを使って薬の発見を改善する

iScoreは、薬がタンパク質に結合するのを予測するためのより早い方法を提供してるよ。

― 1 分で読む


iScore:iScore:次世代薬物結合予測器を革新する。iScoreは、迅速な結合予測で薬の発見
目次

分子ドッキングは、薬の発見でよく使われる方法で、潜在的な薬みたいな小さな分子が体内のタンパク質にどう結合するかを調べるんだ。これらの小さな分子が特定のタンパク質にどれだけうまくくっつくかを予測することで、研究者はどの分子が治療に最適かを見つけ出せる。

分子ドッキングの効果は、サンプリングとスコアリングの二つの主な部分に依存してる。サンプリングは、これらの小さな分子の形や構成を探索して、タンパク質にどうフィットするかを調べるプロセスだ。スコアリングは、これらの分子がどれだけタンパク質に結合するかを測定して、どの候補が最も有望かを理解する手助けをする。

伝統的な分子ドッキングの課題

スコアリングの部分はすぐにできるけど、サンプリングはかなりの時間とリソースがかかる。これが原因で、ドッキングプロセス全体が高くついたり遅くなったりすることがある。特に大量の分子をテストする時にね。さらに、テスト用の化合物データベースが不足してて、多くの潜在的な薬のような分子がまだ探求されてない。

伝統的なスコアリング関数は、研究者が分子がタンパク質にどれだけ結合するかを評価するのに役立つけど、限界がある。年々改善はされてるけど、精度と速度でまだ苦戦している。フリーエネルギー摂動(FEP)みたいなもっと洗練された方法もあるけど、大きな計算能力が必要で小さいライブラリの分子にしか使えない。

スコアリング関数への機械学習の導入

最近の機械学習(ML)の進歩は、より良いスコアリング関数を作る可能性を示している。MLベースの関数は、テストでうまくいくことが多く、一般的に従来のものより速い。しかし、全てのスコアリング関数は、タンパク質と分子の相互作用を理解する必要があるから、ゆっくりしたサンプリング段階の課題にはまだ直面している。

iScoreの紹介:新しいスコアリング関数

この記事では、iScoreという新しいスコアリング関数を紹介する。iScoreは、分子がタンパク質にどれだけうまく結合するかを詳細な相互作用を分析せずに予測できるから、他と違う。代わりに、分子とタンパク質の結合部位の簡単な説明のセットを使ってる。

複雑なサンプリング段階をスキップすることで、iScoreは多くの時間とリソースを節約できる。さらに、研究者が新しい分子の大量コレクションを興味のあるタンパク質に対して評価できるから、以前は考慮されていなかった化合物を見つける手助けができる。

iScoreの仕組み

iScoreは、多くのタンパク質-リガンド複合体を含む特定のデータセットを使ってトレーニングされたから、結合親和性に影響を与える異なる特徴を学んでいる。iScoreを開発するのに、ディープニューラルネットワーク、ランダムフォレスト、極限勾配ブースティングの三つの機械学習アプローチが使われた。さらに、これら三つの方法の強みを組み合わせたハイブリッドモデルが作られて、パフォーマンスが向上した。

iScoreの評価

iScoreの効果は、さまざまなデータセットを使って伝統的なスコアリング方法と広範にテストされた。結果は、iScoreが結合親和性の予測精度(スコアリングパワー)、異なる候補の順位付け(ランキングパワー)、ランダムな選択の中から最良の候補を特定する能力(スクリーニングパワー)において、他のスコアリング関数を上回っていることを示した。

iScoreのスコアリングパワー

iScoreのスコアリングパワーは、予測が実際の実験結果にどれだけ近いかを見ることで測定される。他のスコアリング関数と比べて、iScoreは実験データとの強い相関を示したから、予測は信頼できて正確だった。

iScoreのランキングパワー

ランキングパワーは、iScoreが予測された効果に基づいて薬候補をどれだけうまく順位付けできるかを評価する。iScoreは、既存の多くのスコアリング関数よりもこれらの候補を順位付けするのが得意で、さらなるテストにどの分子を優先すべきかを探るための強力なツールになっている。

iScoreのスクリーニングパワー

スクリーニングパワーは、多くの選択肢の中から最良の結合分子を正しく特定できる能力を指す。iScoreは、トップ候補を特定するのに印象的な成功率を示して、他の方法を上回った。この最高の選択肢を見つける能力は、薬の発見の初期段階で重要だ。

iScoreの速度と効率

iScoreの際立った特徴の一つは、速度だ。iScoreは数千の化合物を迅速にスクリーニングできることが示されていて、大規模な分子ライブラリのテストにとても効率的だ。この速度は、新しい薬を開発する過程で、時間が非常に重要な要素になるから、かなり重要だ。

結論

まとめると、iScoreは薬の発見で使われるスコアリング関数の重要な進歩を表している。機械学習と分子とタンパク質の特性の簡単な説明を組み合わせることで、結合親和性を迅速かつ正確に予測できる。新しい分子を効果的に順位付けし、スクリーニングする能力は、新薬探しにおいてその有用性を高めている。薬の発見が進化し続ける中で、iScoreのようなツールはプロセスを加速させ、以前は時間がかかりすぎた化学空間を探る手助けをする重要な役割を果たすだろう。革新的な手法と効率的なスクリーニング能力を通じて、iScoreは新しい治療法を見つける可能性を提供しながら、薬の開発の未来を切り開いている。

オリジナルソース

タイトル: iScore: A ML-Based Scoring Function for de novo Drug Discovery

概要: In the quest for accelerating de novo drug discovery, the development of efficient and accurate scoring functions represents a fundamental challenge. This study introduces iScore, a novel machine learning (ML)-based scoring function designed to predict the binding affinity of protein-ligand complexes with remarkable speed and precision. Uniquely, iScore circumvents the conventional reliance on explicit knowledge of protein-ligand interactions and full picture of atomic contacts, instead leveraging a set of ligand and binding pocket descriptors to evaluate binding affinity. This approach avoids the inefficient and slow conformational sampling stage, thereby enabling the rapid screening of ultra-huge molecular libraries, a crucial advancement given the practically infinite dimensions of chemical space. iScore was rigorously trained and validated using the PDBbind 2020 refined set, CASF 2016, and CSAR NRC-HiQ Set1/2, employing three distinct ML methodologies: Deep Neural Network (iScore-DNN), Random Forest (iScore-RF), and eXtreme Gradient Boosting (iScore-XGB). A hybrid model, iScore-Hybrid, was subsequently developed to incorporate the strengths of these individual base learners. The hybrid model demonstrated a Pearson correlation coefficient (R) of 0.78 and a root mean square error (RMSE) of 1.23 in cross-validation, outperforming the individual base learners and establishing new benchmarks for scoring power (R = 0.814, RMSE=1.34), ranking power ({rho} = 0.705), and screening power (success rate at top 10% = 73.7%).

著者: Leif A. Eriksson, S. J. Mahdizadeh

最終更新: 2024-04-03 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.04.02.587723

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.04.02.587723.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

類似の記事