Simple Science

最先端の科学をわかりやすく解説

# 計量生物学# 機械学習# 生体分子# 定量的手法

AIが新しい薬の発見への道を切り開く

AI駆動のシステムががん治療の新しい薬候補を生成する。

― 1 分で読む


AIが薬の設計を変えるAIが薬の設計を変える成。革新的なAIシステムが有望な薬剤候補を生
目次

新しい薬を見つけるのは、さまざまな病気の効果的な治療法を作るためにはめっちゃ大事なんだ。プロセスは、私たちの体の特定のタンパク質とうまく相互作用できる化合物を発見することが含まれる。これらのタンパク質は、がんみたいな病気に関わることが多い。科学者たちは、これらのタンパク質に結びついて、病気につながる機能を停止させるための異なるタイプの小分子を考案する必要があるんだ。

従来の薬の発見の課題

従来の薬の発見法は、時間がかかるしお金もすごくかかることが多い。研究者たちは正しい化合物を見つけるために、何千もの化合物をスクリーニングするんだ。でも、可能な化学構造の数が膨大すぎて、全てをテストするのは無理なんだよね。多くの候補薬は、開発の後半で効果がないことが多くて、臨床試験の成功率が低いんだ。

多様な分子の必要性

今ある小分子薬の構造には多様性が欠けてるんだ。これが、さまざまなタンパク質、特にあまり研究されてないものとの効果的な相互作用を妨げてる。だから、研究者たちは、構造的に多様で、こういったあまり知られてないタンパク質をターゲットにできる新しい化合物を作る革新的な方法を探してる。

薬のデザインにおけるAIの導入

人工知能(AI)は、薬のデザインにおいて重要なツールになりつつある。AIは、スタートテンプレートなしで新しい分子を生成するのを手伝えるから、今ある薬が効率的に結びつけないターゲットのために特に化合物を作れるんだ。「生成モデル」っていう方法が特に注目されてて、既存データから学んだパターンに基づいて新しいサンプルを作ることができるんだ。

生成モデルの仕組み

生成モデルは、ディープラーニングみたいな技術を使って構築されてる。人気のアプローチの一つは、変分オートエンコーダーを使うことで、これには分子の簡略化されたバージョンを作るエンコーダーと、それを復元するデコーダーが含まれてる。もう一つの方法は、生成敵対ネットワーク(GAN)を使って、二つのネットワークが競い合うことで生成データの質を向上させる。ひとつが新しいサンプルを作って、もうひとつがそれを評価するんだ。

DrugGENの導入

薬のデザインを進めるために、DrugGENっていうシステムが作られた。このシステムは、GANにグラフ表現学習っていう方法を組み合わせてる。DrugGENは、特にがん治療に重要なAKT1タンパク質に対して特定のタンパク質と相互作用できる新しい薬候補分子をデザインすることを目指してるんだ。

DrugGENの構成

DrugGENは二つの主要なGANで構成されてて、それぞれ特定の役割を持ってる。最初のGANは、実際の分子の特徴を学んで、それに基づいて新しいものを生成する。二つ目のGANは、生成された分子にターゲットタンパク質の情報を取り入れて、それらを潜在的な薬候補に精練するんだ。

DrugGENのためのデータ収集

データはDrugGENのトレーニングにとってめっちゃ重要なんだ。チームは、トレーニングのために三種類のデータを集めた:

  1. 化合物データ:ChEMBLみたいなデータベースからの既存分子に関する情報。
  2. タンパク質データ:AKT1に特化したProtein Data Bank(PDB)からのタンパク質モデル。
  3. バイオアクティビティデータ:異なる化合物がAKT1タンパク質とどれだけ相互作用できるかに関する情報。

これらのデータセットを組み合わせることで、DrugGENは新しくて、ターゲットタンパク質に対して効果的な分子を生成する方法を学んでいくんだ。

DrugGENの技術的側面

DrugGENは、分子をグラフ表現を使って処理する。各分子は、ノード(原子)とエッジ(結合)で構成されたグラフとして表現される。この形式は、AIが分子の構造や性質を理解するのを助ける。システムは、分子とターゲットタンパク質の特徴が正確に表現されるように設計された特定のアーキテクチャを持ってて、効果的な薬候補を生成するのに不可欠なんだ。

DrugGENのトレーニング

DrugGENモデルのトレーニングは、データとモデルのパラメータの慎重な管理が必要なんだ。トレーニングはフェーズごとに行われて、最初の生成器が学んだ後に二つ目の生成器が作業を始める。この体系的なアプローチが、モデルが効果的な薬のような化合物の特性を理解するのを助けるんだ。

DrugGENの評価

トレーニングの後、DrugGENのパフォーマンスはさまざまな指標で評価される。これには、生成された分子がどれだけリアルか(妥当性)、生成された各分子がどれだけ異なるか(ユニーク性)、生成サンプルの多様性(内部多様性)が含まれる。チームは、生成された分子が既知の効果的な化合物とどれだけ似ているかも評価する。

分子ドッキング

生成された分子がAKT1タンパク質にどれだけ結びつくかを調べるために、チームは分子ドッキング研究を行う。このプロセスは、分子とタンパク質間の相互作用を予測するのに役立って、薬としてのポテンシャル効果を提供する洞察を与えるんだ。

DrugGENの結果

結果は、DrugGENが広範囲の新しい分子を生成できることを示してる。これらの分子の多くは、有望な特性を持っていて、AKT1タンパク質に対して効果的である可能性を示してる。このシステムは、何百ものユニークな候補を生成していて、いくつかは既存の阻害剤よりも強力な結合親和性を示してる。

研究の次のステップ

研究チームは、真の阻害剤を含むより大きくて多様なタンパク質のデータセットでDrugGENをさらに発展させる予定だ。これによって、モデルはさらに効果的な薬候補を生成する能力が向上するだろう。さらに、チームは生成された化合物を実験室でテストして、ターゲットタンパク質に対する効果を確認することを目指してる。

結論

AIやDrugGENのようなシステムの導入は、薬の発見の分野で大きな可能性を示してる。新しい薬候補の生成を自動化することで、研究者たちは現在効果的な治療法がない病気の新しい治療法を探求できるようになる。DrugGENの継続的な開発とテストは、さまざまな病気の新しい、効果的な薬を見つける可能性を大いに高めるかもしれない。

オリジナルソース

タイトル: Target Specific De Novo Design of Drug Candidate Molecules with Graph Transformer-based Generative Adversarial Networks

概要: Discovering novel drug candidate molecules is one of the most fundamental and critical steps in drug development. Generative deep learning models, which create synthetic data given a probability distribution, offer a high potential for designing de novo molecules. However, for them to be useful in real-life drug development pipelines, these models should be able to design drug-like and target-centric molecules. In this study, we propose an end-to-end generative system, DrugGEN, for the de novo design of drug candidate molecules that interact with intended target proteins. The proposed method represents molecules as graphs and processes them via a generative adversarial network comprising graph transformer layers. The system is trained using a large dataset of drug-like compounds and target-specific bioactive molecules to design effective inhibitory molecules against the AKT1 protein, which is critically important in developing treatments for various types of cancer. We conducted molecular docking and dynamics to assess the target-centric generation performance of the model, as well as attention score visualisation to examine model interpretability. Results indicate that our de novo molecules have a high potential for interacting with the AKT1 protein at the level of its native ligands. Using the open-access DrugGEN codebase, it is possible to easily train models for other druggable proteins, given a dataset of experimentally known bioactive molecules.

著者: Atabey Ünlü, Elif Çevrim, Ahmet Sarıgün, Melih Gökay Yiğit, Hayriye Çelikbilek, Osman Bayram, Heval Ataş Güvenilir, Altay Koyaş, Deniz Cansen Kahraman, Abdurrahman Olğaç, Ahmet Rifaioğlu, Erden Banoğlu, Tunca Doğan

最終更新: 2024-07-26 00:00:00

言語: English

ソースURL: https://arxiv.org/abs/2302.07868

ソースPDF: https://arxiv.org/pdf/2302.07868

ライセンス: https://creativecommons.org/licenses/by-nc-sa/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。

著者たちからもっと読む

類似の記事

細胞生物学カルシウムのタンパク質の機能における役割について、いろんな種で。

研究によると、カルシウムがさまざまな生物や細胞プロセスにおけるタンパク質に与える影響がわかってきた。

― 1 分で読む