Simple Science

最先端の科学をわかりやすく解説

# 生物学# 生物情報学

DrugCLIP:AIで薬の発見を加速させる

DrugCLIPはAIを使って新しい薬候補のバーチャルスクリーニングを早めるんだ。

― 1 分で読む


AIが薬の発見を加速させるAIが薬の発見を加速させるなるよ。新しいモデルで薬の候補を見つけるのが早く
目次

ヒトゲノムには約20,000の遺伝子があって、これがタンパク質を作ってるんだ。これらの遺伝子の多くはさまざまな病気と関連してる。でも、承認された薬によってターゲットにされてるのはそのうちの約10%だけ。つまり、新しい治療法を作るための未開拓な可能性がたくさんあるってこと。研究者たちはこれらの生物学的ターゲットを新薬にしたいと思ってるけど、効果的な研究のために必要なツールやリソースが不足してることが多いんだ。

ドラッグ発見の大きな問題の一つは、すべてのヒトタンパク質を直接研究するのが実用的じゃないってこと。そこで科学者たちはバーチャルスクリーニングに目を向けてて、これはコンピュータを使ってさまざまな分子が特定のタンパク質にどれだけ結合するかを予測する方法なんだ。ここでよく使われる方法の一つが分子ドッキングで、これは候補の薬分子をターゲットのタンパク質に当てはめようとするもの。技術は進歩してるけど、まだ時間がかかるんだよね。例えば、1億の分子を1つのタンパク質に対してテストするのに、強力なコンピュータを使っても数週間かかることもある。

人工知能(AI)を使えばこのプロセスを早めることができるかもしれないんだけど、ドラッグ発見におけるAI利用にも課題がある。一つは、AIモデルをトレーニングするためのデータが現実の条件をうまく反映してないこと。あと、いくつかのAIモデルは複雑で、多くの計算能力が必要だから、大規模な化合物ライブラリを扱うときには遅くなっちゃう。

新しい、より速いAIの方法が必要で、ドラッグ発見をもっと効率的にすることが求められてるんだ。

DrugCLIPの紹介

今日はDrugCLIPを紹介するよ。これはコントラスト学習っていうテクニックを使って、バーチャルスクリーニングを改善する新しいアプローチなんだ。コントラスト学習は、効果的に結合する分子とそうでないものを特徴を比較することで区別するのを手助けする。この方法は、不一致なデータや偏った化学ライブラリから来るエラーの影響を減らすことができる。

DrugCLIPの目立った特徴の一つはスピード。従来のドッキング法の約100,000倍、他の現在の機械学習アプローチよりも約100倍速いんだ。このスピードはドラッグ発見のペースを劇的に変える可能性がある。

DrugCLIPのパフォーマンスを評価するために、コンピュータベースのテストと実験室での実験が行われた。モデルは二つのよく知られたバーチャルスクリーニング評価で良好な結果を示し、従来の分子ドッキングや他の先進的なAIシステムを上回った。DrugCLIPは、気分障害に関連する特定の受容体や輸送体のような実世界のターゲットにもテストされて、さまざまな潜在的な薬候補を成功裏に特定したんだ。

その後、DrugCLIPは最先端のAIツールAlphaFold2によって予測されたすべてのヒトタンパク質のスクリーニングに適用された。この方法を使って、研究者たちは1日で500百万以上の分子を単一のコンピューティングセットアップでスクリーニングした。この大規模なスクリーニングの結果、200万以上の潜在的な薬候補のデータセットが得られた。

DrugCLIPの仕組み

DrugCLIPのトレーニングプロセスは、事前訓練とファインチューニングの二つの段階から成る。事前訓練の間に、システムはタンパク質と潜在的な薬分子の関係を理解することを学ぶ。この段階では、タンパク質と分子の合成データペアをたくさん作る方法を使用して、より良い学習を促進してる。

事前訓練の後、DrugCLIPは実際の実験データを使ってファインチューニングを行う。このステップでは、実際のタンパク質-リガンド相互作用を示してモデルの理解を洗練させる。方法には同じ分子の異なる配置を生成することも含まれてて、これがモデルがさまざまな条件を扱うのを助ける。

バーチャルスクリーニングを実行するとき、DrugCLIPは分子とタンパク質ポケットの表現をベクトルに素早く変換する。これらのベクトルを比較して最良のマッチを見つけ、迅速な候補の特定を可能にするんだ。

パフォーマンス評価

DrugCLIPは二つの確立されたバーチャルスクリーニングデータセットを使って評価された。従来の方法や他のAIモデルよりもはるかに優れた性能を示した。これらの結果は、DrugCLIPが潜在的な薬候補を特定する強力な能力を持っていることを確認するものだ。

さらに、システムはトレーニングに含まれてないタンパク質に対してもパフォーマンスを維持して、頑健さを示した。タンパク質構造のエラーに対しても耐性を示して、理想的でない条件でも信頼できる結果を出すことができることを証明した。

DrugCLIPの効率性は、大規模スクリーニングタスクにとって魅力的な選択肢にしてる。モデルは膨大な化学ライブラリを迅速に処理できるから、包括的なドラッグ発見に適してるんだ。

実世界でのテスト

コンピュータテストに加えて、DrugCLIPは実験室でもテストされた。研究者たちはメンタルヘルスに関連する二つの確立されたターゲットに焦点を当てた:うつ病に関連する受容体と注意障害に関連する輸送体。

うつ病関連の受容体に対して、DrugCLIPは大規模な化合物ライブラリをスクリーニングして、いくつかの有望な候補を特定した。実験室でのテストでは、これらの候補のうちのいくつかが受容体を効果的に活性化したことが確認されて、抗うつ薬としての潜在的な利用において重要なんだ。

注意障害に関連する輸送体についても、DrugCLIPは成功を示した。別の化合物のセットをスクリーニングした後、いくつかの分子が輸送体の活動を効果的に抑制することが見つかった。この発見は、DrugCLIPがさまざまな状態に対する潜在的な治療法を特定できることを示唆してる。

ゲノム全体への適用

初期のテストから得られた良好な結果を受けて、DrugCLIPはAlphaFold2を通じて予測されたすべてのヒトタンパク質をスクリーニングするためにより広い文脈で適用された。これらの予測の精度を向上させるために、タンパク質構造をさらに洗練させる戦略が策定された。

この洗練されたアプローチで、DrugCLIPは5億以上の薬のような分子のゲノム全体のスクリーニングを行った。この努力の結果、さまざまなヒトタンパク質をカバーする潜在的な薬候補の包括的なデータベースが得られた。

新しいデータベースは、既存のものよりも多くのタンパク質ターゲットを含んでるから、特に重要なんだ。これは研究者がさまざまな病気に対する新しい薬を見つける助けになるだろう。

結論

タンパク質構造予測の進歩やDrugCLIPのようなツールの登場により、効果的なドラッグ発見の可能性はこれまで以上に大きい。DrugCLIPはバーチャルスクリーニングプロセスを大幅にスピードアップすることで、新しい治療法を探すための強力なリソースとして自らの価値を証明した。

シリコでの有望な薬候補の成功した特定や実世界でのテストは、モデルの薬開発における実用的な価値を示してる。広範な発見を自由に利用できるようにすることで、DrugCLIPは研究を加速し、新しい治療法の探求における革新を促進することを目指してる。

ドラッグ発見の分野が進化し続ける中で、DrugCLIPはさまざまな健康上の課題に取り組む新しい方法を研究者に提供する最前線に立ってる。その広範な適用と高い効率性が、未解決の医療ニーズに対処する新たな薬の波につながる可能性があるんだ。

オリジナルソース

タイトル: Deep contrastive learning enables genome-wide virtual screening

概要: Numerous protein-coding genes are associated with human diseases, yet approximately 90% of them lack targeted therapeutic intervention. While conventional computational methods such as molecular docking have facilitated the discovery of potential hit compounds, the development of genome-wide virtual screening against the expansive chemical space remains a formidable challenge. Here we introduce DrugCLIP, a novel framework that combines contrastive learning and dense retrieval to achieve rapid and accurate virtual screening. Compared to traditional docking methods, DrugCLIP improves the speed of virtual screening by several orders of magnitude. In terms of performance, DrugCLIP not only surpasses docking and other deep learning-based methods across two standard benchmark datasets but also demonstrates high efficacy in wet-lab experiments. Specifically, DrugCLIP successfully identified agonists with < 100 nM affinities for 5HT2AR, a key target in psychiatric diseases. For another target NET, whose structure is newly solved and not included in the training set, our method achieved a hit rate of 15%, with 12 diverse molecules exhibiting affinities better than Bupropion. Additionally, two chemically novel inhibitors were validated by structure determination with Cryo-EM. Building on this foundation, we present the results of a pioneering trillion-scale genome-wide virtual screening, encompassing approximately 10,000 AlphaFold2 predicted proteins within the human genome and 500 million molecules from the ZINC and Enamine REAL database. This work provides an innovative perspective on drug discovery in the post-AlphaFold era, where comprehensive targeting of all disease-related proteins is within reach.

著者: Yanyan Lan, Y. Jia, B. Gao, J. Tan, X. Hong, W. Zhu, H. Tan, Y. Xiao, Y. Huang, Y. Jin, Y. Yuan, J. Tian, W. Ma, Y. Zhang, C. Yan, W. Zhang

最終更新: 2024-09-04 00:00:00

言語: English

ソースURL: https://www.biorxiv.org/content/10.1101/2024.09.02.610777

ソースPDF: https://www.biorxiv.org/content/10.1101/2024.09.02.610777.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。

著者たちからもっと読む

類似の記事