AIとナレッジグラフを使って希少疾患のために薬を再利用する
希少疾患における既存薬の新しい使い方を見つけるためのAIの役割を探ってるよ。
Nuria Queralt-Rosinach, P. Perdomo-Quinteiro, K. Wolstencroft, M. Roos
― 1 分で読む
目次
新しい薬を作るのは難しいし、成功する商品につながることはあんまりないんだ。研究によると、新しい薬の約90%が承認を得られないみたい。これは時間とお金の大きな無駄で、製薬会社にとっては利益にならないんだ。特に希少疾患の場合、この問題はもっと大きい。会社は、少数の人にしか影響しない病気の薬に投資するのをためらうかもしれない。でも、約7,000の希少疾患が存在してて、有効な治療法はたったの5%くらいしかないんだ。ヨーロッパだけで、約3600万人が希少疾患にかかっている。
この課題に対処するために、薬の再利用戦略が出てきた。これは、すでに別の病気で承認された薬を使うことを含む。こうすることで、企業は臨床試験に必要な高額で長い手順をスキップできるんだ。最近では、コンピュータ技術や人工知能(AI)を使った新しい方法が薬の再利用に効果的だということが分かってきた。興味深いアプローチの一つは、異なる分子、遺伝子、タンパク質、病気がどうつながっているかを表すネットワークを使うこと。これにより、他では分からない関係が明らかになることがあるんだ。
AIの可能性にもかかわらず、多くの人がその決定を信頼することに不安を感じている。特に医療の分野では、選択が命に大きく影響することがあるからね。AIの決定に対して明確な理由を提供することで、研究者がテスト可能な研究アイデアを形成でき、実験室での知識を促進できるんだ。EUも、自動システムによって下された決定に対して説明を受ける権利を保証する規制を推進している。
この記事では、希少疾患の薬の再利用におけるAIの予測と説明の提供について調査するよ。私たちの主な目標は、希少疾患の症状を治療するのに役立つ既存の薬を特定するシステムを作ること。進んだAI手法に重点を置いて、彼らの予測に対する理解しやすい理由も提供するようにする。
関連研究
薬の再利用における知識グラフ
現在の薬の再利用アプローチは、潜在的な薬の候補を見つけるために、グラフベースの方法とAIに頼ることが多い。グラフを使う主な利点は、複数のソースからデータを組み合わせる能力。これは希少疾患にとって重要で、データが限られたり散らばったりしているから。最近の研究では、知識グラフを使ってCOVID-19のような病気の薬の候補を見つけることができることが示されている。
さまざまなAI技術がこれらの知識グラフを分析できる、データの関係を強化したり変換したりする方法もある。私たちの研究では、特定の機械学習技術を組み合わせて、モデルを再学習させずに更新できるようにした。この柔軟性は薬の再利用にとって重要だ、新しい情報が常に出てきてるからね。
説明可能なAI (XAI)
グラフベースのモデルで説明を提供するために使われる一つの方法は(Graph)LIMEで、入力の小さな変更が予測にどう影響するかを調べる。もう一つの説明方法はCRIAGEで、ルールの形で説明を提供する。でも、私たちの研究では、特定の予測の背後にある重要な特徴と関係を特定するGNNExplainerを使うことにした。この方法は適応可能だから、さまざまなタイプのグラフモデルでもうまく機能する。
方法の概要
rd-explainerパイプライン
私たちは、希少疾患の薬の再利用のために特に設計されたrd-explainerという方法を開発した。このプロセスは主に3つのパートから成る:
- 知識グラフの構築: この部分では、特定の希少疾患に関連する知識グラフを作成し、薬の再利用オプションを見つけることを目指す。
- 予測モジュール: この段階では、ニューラルネットワークモデルを使って、どの薬が希少疾患の症状を治療するのに役立つかを予測する。
- 説明モジュール: この最後の部分では、なぜ特定の薬が特定の症状に予測されたのかを説明する重要なつながりを特定して表示する。
知識グラフを作成するために、病気の情報や既存の薬に関する信頼できるさまざまなソースからデータを集める。次に、このデータをグラフ構造に整理する。グラフの各部分は、病気のさまざまな側面や潜在的な治療法を表す。
データソース
私たちは、病気、遺伝子、薬に関する詳細を提供するいくつかのデータベースから情報を引き出した。主要なソースの一つはMonarch知識ベースで、さまざまな生物学的要素に関するデータを集めている。さらに、薬の特性やターゲットに特化したデータベースも使用した。これらの異なるデータソースを統合することで、予測を効果的にサポートできる包括的な知識グラフを作成することを目指した。
機械学習と説明
ノード特徴とデータ分割
私たちの方法は、ニューラルネットワークアプローチに基づいており、グラフ内の各ノードの表現を作成する。各ノードを適切に特徴づけることは、薬と症状のリンクを正確に予測するために重要だ。データをトレーニング、検証、テストセットに分けて、モデルが効果的に学べるようにし、正確に評価できるようにする。
GNNモデル
私たちは、GraphSAGEという特定のタイプのニューラルネットワークを利用して、知識グラフ内のノードの埋め込みを作成した。これらの埋め込みを使用することで、薬と症状の間のつながりを予測できる。このアルゴリズムは、大きなグラフを効率的に扱えるので役立つ。
リンク予測
私たちのモデルは、特定の症状に効果的に対処できる薬の可能性を推定するためのスコアを生成する。このスコアリングによって、予測された効力に基づいて潜在的な薬候補をランク付けすることができる。
グラフベースの説明
モデルが行った予測を理解するために、GNNExplainerを適用して薬とそれに対応する症状の関係を概説した。説明を洗練させて、意味のあるつながりを強調し、研究者がこれらの予測を検証する際に明確さを提供するようにした。
評価とパフォーマンス指標
モデル評価
私たちのモデルのパフォーマンスをテストするために、いくつかの標準的なベンチマークと結果を比較した。精度、再現率、F1スコアなどの一般的な指標を使用して、薬と症状のリンクを予測する際のモデルのパフォーマンスを測定した。
説明評価
モデルが生成した説明も評価した。説明が完全か不完全かを確認した。完全な説明は薬と症状の明確なつながりを提供し、不完全なものは断片的な情報を示す。私たちはモデルが示したつながりが既存の科学研究に支持されているかどうかを判断するための文献検索も行った。
希少疾患の知識グラフ
グラフ構築
二つの異なる知識グラフを構築して、デュシェンヌ型筋ジストロフィー(DMD)に焦点を当てた。最初のグラフには、病気に直接関連する重要なノードが含まれていた。二番目のグラフには、様々な病気の症状に関する追加情報が含まれており、より豊かなデータが得られた。
グラフトポロジー
両方の知識グラフの特徴を調べ、ノードや接続の数などを確認した。各グラフは、クラスタリングの挙動や接続性など、モデルのパフォーマンスや説明の理解度に影響を与える異なる特性を示した。
結果と発見
パフォーマンス指標
両方の知識グラフは、薬と症状のリンクを予測する際に強力なパフォーマンスを示した。結果は、さまざまな指標で高いスコアを示し、私たちのアプローチの効果を示している。
予測の検証
私たちの予測を利用可能な文献と照らし合わせたところ、モデルが提案した薬候補の中には、特定の症状を治療するために以前から記録されているものがあることが分かった。この検証は、私たちのアプローチによって行われた予測の信頼性を強化する。
説明の分析
私たちの方法が生成した説明の有用性も評価した。多くの説明が包括的で、研究者が提案された薬-症状リンクを理解するのに役立つ明確で論理的なつながりを提供していることが分かった。
一般化可能性
私たちの方法が他の病気にも適用できることを確認するために、アルツハイマー病と特定のタイプの筋萎縮性側索硬化症(ALS)でテストした。結果は引き続き強力なパフォーマンスを示し、私たちのアプローチが希少疾患以外の他の条件にも拡張できることを示している。
議論
私たちの発見は、知識グラフとAIの統合が薬の再利用の取り組みを大きく向上させ、特に広範な研究が不足している希少疾患において効果的であることを示唆している。予測に対して明確な説明を提供できる能力は、AIによる決定への信頼を高め、研究者が自分の成果を検証するのを支援する。
制限事項
私たちのアプローチの成功にもかかわらず、まだ解決すべき課題がある。私たちは一つの説明可能性手法しか使用しておらず、これがデータのすべての側面を網羅しているわけではない。さらなる研究が説明を洗練させ、異なるシナリオに適応させるために必要だ。
将来の方向性
今後は、説明を提供するための追加手法を探り、結果の一貫性を改善する必要がある。知識グラフの構造が予測の質にどのように影響するかをよりよく理解することも、研究を強化する。計算の専門家と実践的な研究者の協力が、この研究の継続的な進化にとって重要だろう。
結論
結論として、私たちの研究は、知識グラフと最先端のAI技術を組み合わせることで、希少疾患の薬の再利用において意義ある進展をもたらすことができることを示している。予測に対して理解しやすい説明を生成する能力は重要で、研究者が実験室でテスト可能な仮説を形成するのに役立つ。この革新的なアプローチは、薬の研究を加速させ、希少疾患に影響を受けた人々の結果を改善することが期待できる。
タイトル: Knowledge Graphs and Explainable AI for Drug Repurposing on Rare Diseases
概要: Artificial Intelligence (AI)-based drug repurposing is an emerging strategy to identify drug candidates to treat rare diseases. However, cutting-edge algorithms based on Deep Learning (DL) typically dont provide a human understandable explanation supporting their predictions. This is a problem because it hampers the biologists ability to decide which predictions are the most plausible drug candidates to test in costly lab experiments. In this study, we propose rd-explainer a novel AI drug repurposing method for rare diseases which obtains possible drug candidates together with human understandable explanations. The method is based on Graph Neural Network (GNN) technology and explanations were generated as semantic graphs using state-of-the-art eXplainable AI (XAI). The model learns features from current background knowledge on the target rare disease structured as a Knowledge Graph (KG), which integrates curated facts and their evidence on different biomedical entities such as symptoms, drugs, genes and ortholog genes. Our experiments demonstrate that our method has excellent performance that is superior to state-of-the-art models. We investigated the application of XAI on drug repurposing for rare diseases and we prove our method is capable of discovering plausible drug candidates based on testable explanations. The data and code are publicly available at https://github.com/PPerdomoQ/rare-disease-explainer. HighlightsO_LIWe demonstrated the use of graph-based explainable AI for drug repurposing on rare diseases to accelerate sound discovery of new therapies for this underrepresented group. C_LIO_LIWe developed rd-explainer for rare disease specific drug research for faster translation. It predicts drugs to treat symptoms/phenotypes, it is highly performant and novel candidates are plausible according to evidence in the scientific literature and clinical trials. Key is that it learns a GNN model that is trained on a knowledge graph built specifically for a rare disease. We provide rd-explainer code freely available for the community. C_LIO_LIrd-explainer is researcher-centric interpretable ML for hypothesis generation and lab-in-the-loop drug research. Explanations of predictions are semantic graphs in line with human reasoning. C_LIO_LIWe detected an effect of knowledge graph topology on explainability. This highlights the importance of knowledge representation for the drug repurposing task. C_LI
著者: Nuria Queralt-Rosinach, P. Perdomo-Quinteiro, K. Wolstencroft, M. Roos
最終更新: 2024-10-17 00:00:00
言語: English
ソースURL: https://www.biorxiv.org/content/10.1101/2024.10.17.618804
ソースPDF: https://www.biorxiv.org/content/10.1101/2024.10.17.618804.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた biorxiv に感謝します。