Simple Science

La science de pointe expliquée simplement

# Biologie# Bioinformatique

Utiliser l'IA et les graphes de connaissances pour réutiliser des médicaments pour des maladies rares

Explorer le rôle de l'IA dans la recherche de nouvelles utilisations pour des médicaments existants dans les maladies rares.

― 10 min lire


IA dans leIA dans lerepositionnement demédicamentsmaladies rares avec des médocs déjà là.Exploiter la techno pour s'attaquer aux
Table des matières

Créer de nouveaux médicaments, c'est pas toujours facile et ça mène souvent pas à un produit réussi. Des études montrent que près de 90% des nouveaux médicaments échouent à obtenir une approbation lors des tests. C'est une énorme perte de temps et d'argent, donc pas de profits pour les entreprises pharmaceutiques. Le problème est encore plus grand pour les maladies rares. Les entreprises peuvent hésiter à investir dans des médicaments pour des maladies qui touchent seulement quelques personnes. Pourtant, il existe environ 7 000 maladies rares, avec des traitements efficaces disponibles pour seulement environ 5 %. Rien qu'en Europe, environ 36 millions de personnes sont concernées par des maladies rares.

Pour faire face à ces défis, des stratégies de repositionnement de médicaments ont émergé. Cela consiste à utiliser des médicaments qui ont déjà été approuvés pour d'autres conditions. En faisant ça, les entreprises peuvent sauter beaucoup d'étapes coûteuses et longues nécessaires pour les essais cliniques. Récemment, de nouvelles méthodes utilisant la technologie informatique et l'intelligence artificielle (IA) ont montré des promesses dans le repositionnement de médicaments. Une approche intéressante consiste à utiliser des réseaux qui représentent comment différentes molécules, gènes, protéines et maladies sont connectés. Cette méthode peut révéler des relations qui ne seraient pas évidentes autrement.

Malgré le potentiel de l'IA, beaucoup de gens ne sont toujours pas sûrs de lui faire confiance. C'est particulièrement vrai dans le domaine de la santé, où les choix peuvent grandement affecter des vies. Fournir des raisons claires pour les décisions de l'IA peut aider les chercheurs à former des idées de recherche testables et à promouvoir la connaissance en laboratoire. L'UE pousse aussi pour des régulations qui garantissent aux gens le droit d'obtenir des explications sur les décisions prises par des systèmes automatisés.

Dans cet article, on va enquêter sur comment l'IA peut offrir des Prédictions et des explications dans le cadre du repositionnement de médicaments pour des maladies rares. Notre principal objectif est de créer un système pour identifier les médicaments existants qui pourraient aider à traiter les symptômes des maladies rares. On va se concentrer sur des méthodes avancées d'IA et s'assurer qu'elles fournissent aussi des raisons compréhensibles pour leurs prédictions.

Travaux Connexes

Graphes de connaissances dans le Repositionnement de Médicaments

Les approches actuelles de repositionnement de médicaments s'appuient souvent sur des méthodes basées sur des graphes et sur l'IA pour trouver des candidats médicaments potentiels. Un des grands avantages des graphes est leur capacité à combiner des données provenant de plusieurs sources. C'est crucial pour les maladies rares, où les données peuvent être limitées et éparpillées. Des recherches récentes ont montré comment les graphes de connaissances peuvent être utilisés pour trouver des candidats médicaments pour des conditions comme le COVID-19.

Différentes techniques d'IA peuvent analyser ces graphes de connaissances, y compris des méthodes qui améliorent et transforment les relations de données. Dans notre travail, on a combiné certaines techniques d'apprentissage automatique pour permettre des mises à jour sans avoir besoin de réentraîner le modèle. Cette flexibilité est importante dans le repositionnement de médicaments, car de nouvelles informations émergent constamment sur les médicaments, les gènes et les maladies.

IA Explicable (XAI)

Une méthode utilisée pour fournir des explications dans les modèles basés sur des graphes est (Graph)LIME, qui examine comment de petits changements dans l'entrée affectent les prédictions. Une autre méthode d'Explicabilité est CRIAGE, qui offre des explications sous forme de règles. Cependant, pour notre travail, on a choisi d'utiliser GNNExplainer, qui identifie les caractéristiques clés et les connexions responsables de certaines prédictions. Cette méthode est adaptable, ce qui signifie qu'elle peut bien fonctionner avec différents types de modèles de graphes.

Aperçu de la Méthode

Pipeline rd-explainer

On a développé une méthode appelée rd-explainer spécifiquement pour le repositionnement de médicaments dans les maladies rares. Le processus se compose de trois parties principales :

  1. Construction du Graphe de Connaissances : Cette partie crée un graphe de connaissances lié à une maladie rare spécifique et à l'objectif de trouver des options de repositionnement de médicaments.
  2. Module de Prédiction : À ce stade, on utilise un modèle de réseau de neurones pour prédire quels médicaments pourraient aider à traiter les symptômes de la maladie rare.
  3. Module d'Explication : Cette dernière partie identifie et montre les connexions importantes qui expliquent pourquoi un certain médicament a été prédit pour un symptôme particulier.

Pour créer le graphe de connaissances, on collecte des données provenant de diverses sources fiables axées sur les informations sur les maladies et les médicaments existants. On organise ensuite ces données en une structure de graphe. Chaque partie du graphe représente différents aspects de la maladie et des traitements potentiels.

Sources de Données

On a tiré des informations de plusieurs bases de données qui fournissent des détails sur les maladies, les gènes et les médicaments. Une source clé est la base de connaissances Monarch, qui collecte des données sur divers éléments biologiques. On a également utilisé des bases de données spécifiquement axées sur les propriétés et les cibles des médicaments. En intégrant ces différentes sources de données, on visait à créer un graphe de connaissances complet qui pourrait soutenir nos prédictions de manière efficace.

Apprentissage Automatique et Explications

Caractéristiques des Nœuds et Séparation des Données

Notre méthode repose sur une approche de réseau de neurones, où on crée des représentations pour chaque nœud dans le graphe. Bien représenter chaque nœud est vital pour prédire correctement les liens entre les médicaments et les symptômes. On divise les données en ensembles d'entraînement, de validation et de test pour s'assurer que notre modèle peut apprendre efficacement et être évalué avec précision.

Modèle GNN

On a utilisé un type spécifique de réseau de neurones appelé GraphSAGE pour créer des embeddings pour les nœuds dans nos graphes de connaissances. En utilisant ces embeddings, on peut prédire les connexions entre les médicaments et les symptômes. Cet algorithme est bénéfique car il peut gérer efficacement des graphes plus grands.

Prédiction de Liens

Notre modèle génère des scores pour estimer la probabilité qu'un médicament puisse efficacement traiter certains symptômes. Ce scoring nous aide à classer les candidats médicaments potentiels en fonction de leur efficacité prédite.

Explications Basées sur des Graphes

Pour comprendre les prédictions faites par notre modèle, on a appliqué GNNExplainer pour décrire les relations entre les médicaments et leurs symptômes correspondants. On a affiné les explications pour s'assurer qu'elles mettent en évidence des connexions significatives, fournissant ainsi de la clarté pour les chercheurs lorsqu'ils cherchent à valider ces prédictions.

Évaluation et Métriques de Performance

Évaluation du Modèle

Pour tester la performance de notre modèle, on a comparé ses résultats avec plusieurs benchmarks standards dans le domaine. On a utilisé des métriques courantes comme la précision, le rappel et le score F1 pour mesurer combien notre modèle est efficace à prédire les liens entre les médicaments et les symptômes.

Évaluation des Explications

On a aussi évalué les explications produites par notre modèle en déterminant si elles étaient complètes ou incomplètes. Une explication complète fournit une connexion claire entre un médicament et un symptôme, tandis qu'une incomplète montre des informations disjointes. On a effectué des recherches dans la littérature pour déterminer si les connexions suggérées par notre modèle étaient soutenues par des recherches scientifiques existantes.

Graphes de Connaissances sur les Maladies Rares

Construction de Graphes

On a construit deux graphes de connaissances différents en se concentrant sur la dystrophie musculaire de Duchenne (DMD). Le premier graphe contenait des nœuds essentiels directement liés à la maladie. Le deuxième graphe incluait des informations supplémentaires sur divers symptômes de la maladie, ce qui a permis d'obtenir des données plus riches.

Topologie des Graphes

Les caractéristiques des deux graphes de connaissances ont été examinées, y compris le nombre de nœuds et de connexions. Chaque graphe a montré des caractéristiques différentes, telles que le comportement de clustering et la connectivité, ce qui peut influencer la performance du modèle et la clarté des explications.

Résultats et Conclusions

Métriques de Performance

Les deux graphes de connaissances ont montré de solides performances lors des tests de prédiction des liens entre les médicaments et les symptômes. Les résultats ont indiqué de hauts scores dans diverses métriques, montrant l'efficacité de notre approche.

Validation des Prédictions

En vérifiant nos prédictions par rapport à la littérature disponible, on a découvert que certains candidats médicaments proposés par notre modèle avaient déjà été documentés pour traiter des symptômes spécifiques. Cette validation renforce la crédibilité des prédictions faites par notre approche.

Analyse des Explications

Les explications générées par notre méthode ont été évaluées pour leur utilité. Beaucoup d'explications se sont révélées complètes, fournissant des connexions claires et logiques qui seraient bénéfiques pour les chercheurs cherchant à comprendre les liens proposés entre médicaments et symptômes.

Généralisation

Pour confirmer que notre méthode peut être appliquée à d'autres maladies, on l'a testée sur la maladie d'Alzheimer et un type spécifique de sclérose latérale amyotrophique (SLA). Les résultats ont continué à montrer de solides performances, indiquant que notre approche peut s'étendre au-delà des maladies rares pour d'autres conditions également.

Discussion

Nos résultats suggèrent que l'intégration de graphes de connaissances avec l'IA peut considérablement améliorer les efforts de repositionnement de médicaments, surtout pour les maladies rares qui manquent de recherche approfondie. La capacité de fournir des explications claires pour les prédictions renforce la confiance dans les décisions basées sur l'IA et soutient les chercheurs dans la validation de leurs découvertes.

Limitations

Malgré les succès de notre approche, il reste encore des défis à relever. On a seulement utilisé une méthode d'explicabilité, qui peut ne pas couvrir tous les aspects des données. Des recherches supplémentaires sont nécessaires pour affiner ces explications et les adapter à différents scénarios.

Directions Futures

À l'avenir, il y a un besoin d'explorer des méthodes supplémentaires pour fournir des explications et améliorer la cohérence des résultats. Mieux comprendre comment la structure des graphes de connaissances affecte la qualité des prédictions peut aussi renforcer la recherche. La collaboration entre experts en informatique et chercheurs pratiques sera essentielle pour l'évolution continue de ce travail.

Conclusion

En conclusion, notre étude a montré que combiner des graphes de connaissances avec des techniques d'IA à la pointe peut mener à des avancées significatives dans le repositionnement de médicaments pour les maladies rares. La capacité de générer des explications compréhensibles pour les prédictions est cruciale, car elle aide les chercheurs à formuler des hypothèses qui peuvent être testées en laboratoire. Cette approche innovante promet d'accélérer la recherche sur les médicaments et d'améliorer les résultats pour les personnes touchées par des conditions rares.

Source originale

Titre: Knowledge Graphs and Explainable AI for Drug Repurposing on Rare Diseases

Résumé: Artificial Intelligence (AI)-based drug repurposing is an emerging strategy to identify drug candidates to treat rare diseases. However, cutting-edge algorithms based on Deep Learning (DL) typically dont provide a human understandable explanation supporting their predictions. This is a problem because it hampers the biologists ability to decide which predictions are the most plausible drug candidates to test in costly lab experiments. In this study, we propose rd-explainer a novel AI drug repurposing method for rare diseases which obtains possible drug candidates together with human understandable explanations. The method is based on Graph Neural Network (GNN) technology and explanations were generated as semantic graphs using state-of-the-art eXplainable AI (XAI). The model learns features from current background knowledge on the target rare disease structured as a Knowledge Graph (KG), which integrates curated facts and their evidence on different biomedical entities such as symptoms, drugs, genes and ortholog genes. Our experiments demonstrate that our method has excellent performance that is superior to state-of-the-art models. We investigated the application of XAI on drug repurposing for rare diseases and we prove our method is capable of discovering plausible drug candidates based on testable explanations. The data and code are publicly available at https://github.com/PPerdomoQ/rare-disease-explainer. HighlightsO_LIWe demonstrated the use of graph-based explainable AI for drug repurposing on rare diseases to accelerate sound discovery of new therapies for this underrepresented group. C_LIO_LIWe developed rd-explainer for rare disease specific drug research for faster translation. It predicts drugs to treat symptoms/phenotypes, it is highly performant and novel candidates are plausible according to evidence in the scientific literature and clinical trials. Key is that it learns a GNN model that is trained on a knowledge graph built specifically for a rare disease. We provide rd-explainer code freely available for the community. C_LIO_LIrd-explainer is researcher-centric interpretable ML for hypothesis generation and lab-in-the-loop drug research. Explanations of predictions are semantic graphs in line with human reasoning. C_LIO_LIWe detected an effect of knowledge graph topology on explainability. This highlights the importance of knowledge representation for the drug repurposing task. C_LI

Auteurs: Nuria Queralt-Rosinach, P. Perdomo-Quinteiro, K. Wolstencroft, M. Roos

Dernière mise à jour: 2024-10-17 00:00:00

Langue: English

Source URL: https://www.biorxiv.org/content/10.1101/2024.10.17.618804

Source PDF: https://www.biorxiv.org/content/10.1101/2024.10.17.618804.full.pdf

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.

Articles similaires