Simple Science

最先端の科学をわかりやすく解説

# 生物学# 薬理学と毒性学

薬の発見におけるバーチャルスクリーニングの課題

現在の分子フィンガープリントを使った方法は、薬の開発において大きな制約があるんだ。

― 1 分で読む


バーチャルスクリーニングのバーチャルスクリーニングの限界不十分だね。分子フィンガープリントは薬の活性予測には
目次

バーチャルスクリーニングは、特定の体内ターゲット、例えばタンパク質に結合可能な小分子を見つけるために使われる手法なんだ。テクノロジーの進歩のおかげで、研究者たちは今や数十億の候補分子の中から効果がありそうなものを探せるようになった。一般的な方法は、既知の活性分子の小さなグループから始めて、構造が似ている他のものを探すことだよ。

類似特性原則

このアプローチの背後にある重要な考え方が、類似特性原則(SPP)なんだ。SPPでは、構造が似ている小分子は、生物学的特性も似ていることが多いとされている。この原則は直感的で、分子が生物学的な環境でどう振る舞うか、アクティビティや毒性を予測するための基盤となっている。でも、この原則は客観的に測るのが難しいことがあるんだ。どんな類似性が重要かは、何を見ているかによって変わる。例えば、構造-活性関係は分子の特定の部分に焦点を当てることもあれば、全体の構造を考慮する場合もある。

分子フィンガープリント

小分子を比較する最初のステップは、分子フィンガープリントを作成することが多い。フィンガープリントは、分子の構造や化学的特徴を捉えたユニークなコードみたいなものだ。これを生成した後、研究者たちはフィンガープリントを比較して、どの分子が似ているかを調べる。もし二つの分子が似たフィンガープリントを持っていれば、似た生物学的機能を共有しているかもしれないと考えられている。この方法は、溶解度や分配などの特性を予測するのに成功することもあるけど、分子がターゲットとどう相互作用するかを予測するにはうまくいかないこともある。

コンテキストと結合領域

分子の生物学的なアクティビティは、特定のタンパク質との相互作用に大きく依存するってことも重要だよ。各タンパク質にはユニークな結合領域があって、これがあるから同じ分子でも異なるタンパク質と相互作用すると全然違う振る舞いをすることがあるんだ。だから、分子フィンガープリントだけに頼るのは、生物学的相互作用の多様性を捉えるには不十分かもしれない。この制約が、フィンガープリントを使ってどの分子が効果的に結合するのかを予測することの有効性に疑問を投げかけているんだ。

現在の手法の限界

SPPに基づく分子フィンガープリントの使用には知られている限界があるけど、この手法はまだ広くドラッグ開発に使われている。フィンガープリントベースのバーチャルスクリーニングはシンプルで速いから魅力的なんだけど、必ずしもドラッグアクティビティの予測に成功するわけではない。アクティブな小分子を大きなライブラリーから見分けるために、さまざまなタイプの分子フィンガープリントが開発されてきたけど、結果はまちまちで、「一サイズで全てに合う」アプローチはないんだ。

フィンガープリントの評価

フィンガープリントの種類は、線形特徴、円形特徴、予め定義されたサブストラクチャに基づいて分類できる。これらの方法はそれぞれ、分子のユニークな表現を計算する。これらのフィンガープリントが実際にどれだけうまく働くかを評価するために、研究者は既知のアクティブおよび非アクティブ化合物を含むベンチマーキングデータセットを使うんだ。各データセットには含まれる分子のタイプが異なるから、結果に影響を与えることがあるよ。

バーチャルスクリーニング評価指標

バーチャルスクリーニング手法のパフォーマンスを評価するために、研究者はアクティブな分子を正しく特定する能力を分析することが多い。これを行う一般的な方法の一つが、受信者動作特性(ROC)曲線を使うことだ。これは、真陽性(正しい特定)と偽陽性(誤った特定)のバランスを見ている。ランダムな手法はこの曲線上で約0.5のスコアを持つけど、完璧な手法は1.0になる。しかし実際には、研究者たちはしばしば、非アクティブなものの中から早くアクティブな分子を特定したいと思っているから、単純な指標だけではスクリーニング手法の有効性を完全に捉えられないことがあるんだ。

この問題に対処するために、アクティブ化合物の早期濃縮をよりよく評価するための代替指標がいくつか開発されている。その一つがデコイ保持因子(DRF)と呼ばれるもので、アクティブなものを保持しつつ、非アクティブな化合物をどれだけうまくフィルターできるかを示している。この指標は解釈が簡単で、異なるデータセット間でも一貫性があることが多いんだ。

フィンガープリント戦略のパフォーマンス

研究者たちは、異なるフィンガープリンティング手法がアクティブな分子をどれだけうまく特定できるかを調査した。彼らは様々な化合物の類似性を既知のアクティブ分子と比較し、複数のベンチマークデータセットで異なるフィンガープリントタイプのパフォーマンスを比較したんだ。結果は、ほとんどのフィンガープリントがパフォーマンスが良くなく、多くがROCやDRFの基準を下回っていた。これはフィンガープリント戦略が大規模なライブラリーの中でアクティブな分子をうまく濃縮できていないことを示唆しているんだ。

類似性分布

アクティブな分子と非アクティブな分子の類似性の分布をよりよく理解するために、研究者たちは分子のペアのタニモト係数を分析した。多くの場合、アクティブ-アクティブのペア間の類似性が、アクティブ-非アクティブのペア間の類似性と大きく重なっていることがわかった。これによって、分子フィンガープリントだけでこの二つのグループを区別するのは難しいことが多かったんだ。

一部のフィンガープリントでは、高い類似性を持つアクティブな分子の小さいグループが表示されて、アクティブな化合物だけを選ぶカットオフスコアを設定できるかのような誤った印象を与えることもあった。でも、高いカットオフを設けても、多くの非アクティブな化合物もその閾値を上回るスコアを持つことが予想されて、高い偽陽性のリスクをもたらすんだ。

検証された非アクティブな分子の評価

フィンガープリントの類似性がアクティビティを予測するのにどれほど有効かを洞察するために、別のデータセットが調査された。このデータセットには非アクティブであることが確認された化合物が多数含まれていた。この場合、研究者たちは、アクティブ化合物とこの非アクティブなものを比較しても、フィンガープリントからの予測力にほとんど証拠がないことを見つけた。

効力との相関

フィンガープリントがアクティブな化合物を特定する能力を評価するだけでなく、フィンガープリントの類似性がアクティブな分子の効力と相関があるかどうかも調べられた。特定のデータセットを分析した結果、フィンガープリントの類似性と化合物の効力との相関は一般的に弱かった。これは、高いフィンガープリントの類似性が必ずしも化合物がより効果的または強力であることを意味しないことを示している。

結論

結論として、計算手法は新しいドラッグ候補を発見するためのワクワクする機会を提供するけど、現在の分子フィンガープリントを使ったアプローチには大きな限界があるってことがわかった。これらの手法は、アクティブな化合物と非アクティブなものの区別を安定して行うのが難しくて、これはドラッグ開発において重要なんだ。将来的には、特定のターゲットとの相互作用のコンテキストを考慮した分子の表現を見つけることに焦点を当てるべきだね。分子表面の特性を強調し、単純なフィンガープリントの表現から脱却することが、ドラッグ発見におけるバーチャルスクリーニングの効果を改善する鍵になるかもしれないよ。

オリジナルソース

タイトル: Do molecular fingerprints identify diverse active drugs in large-scale virtual screening? (no)

概要: Computational approaches for small-molecule drug discovery now regularly scale to consideration of libraries containing billions of candidate small molecules. One promising approach to increased speed in evaluating billion-molecule libraries is to develop succinct representations of each molecule that enable rapid identification of molecules with similar properties. Molecular fingerprints are thought to provide a mechanism for producing such representations. Here, we explore the utility of commonly-used fingerprints in the context of predicting similar molecular activity. We show that fingerprint similarity provides little discriminative power between active and inactive molecules for a target protein based on a known active - while they may sometimes provide some enrichment for active molecules in a drug screen, a screened dataset will still be dominated by inactive molecules. We also demonstrate that high-similarity actives appear to share a scaffold with the query active, meaning that they could more easily be identified by structural enumeration. Furthermore, even when limited to only active molecules, fingerprint similarity values do not correlate with compound potency. In sum, these results highlight the need for a new wave of molecular representations that will improve the capacity to detect biologically active molecules based on similarity to other such molecules.

著者: Vishwesh Venkatraman, A. Roy, D. Demekas, J. Gaiser, R. Xiong, T. Wheeler

最終更新: 2024-06-08 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2022.09.20.508800

ソースPDF: https://www.biorxiv.org/content/10.1101/2022.09.20.508800.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

著者たちからもっと読む

類似の記事