Avancées dans la découverte de médicaments grâce à de meilleures méthodes de prédiction
De nouvelles stratégies améliorent la précision pour prédire l'efficacité des composés médicamenteux.
― 7 min lire
Table des matières
- L'Importance de Valider les Prédictions
- Méthodes de Test Traditionnelles
- Apprendre de la Science des Matériaux
- Nouvelles Stratégies pour la Découverte de Médicaments
- Optimisation des Composés
- Tester les Nouvelles Stratégies
- Défis d'Extrapolation
- Le Rôle du Rendement de Découverte et de l'Erreur de Nouveauté
- Directions Futures
- Conclusion
- Source originale
Récemment, y a eu plein d'améliorations dans l'utilisation des ordis pour prédire comment les matériaux vont se comporter. Ces avancées sont aussi regardées pour leur utilisation dans la Découverte de médicaments. La découverte de médicaments, c'est le processus de trouver de nouveaux traitements, et c'est important que les méthodes utilisées pour prédire comment les composés (les ingrédients des médicaments) fonctionnent soient bien testées.
L'Importance de Valider les Prédictions
Quand les scientifiques créent des modèles pour prédire l'efficacité d'un composé, ils doivent s'assurer que ces modèles fonctionnent bien dans des situations réelles. Ça veut dire que les modèles devraient pouvoir prédire avec précision les propriétés des composés qui n'ont pas encore été testés. Souvent, les prédictions peuvent foirer parce que les modèles n'ont été testés qu'avec des infos qu'ils connaissaient déjà, ce qui peut créer un fossé entre ce que les études montrent et ce qui marche vraiment en pratique.
Ce défi est particulièrement sérieux dans la découverte de médicaments parce qu'il y a des milliers de petites molécules-plus de 10^60-qui n'ont pas toutes été explorées. Du coup, c'est dur pour les chercheurs de faire des prédictions précises sur de nouveaux composés qui pourraient devenir des médicaments efficaces.
Méthodes de Test Traditionnelles
La plupart du temps, les chercheurs évaluent leurs modèles en divisant aléatoirement leurs données en groupes d'entraînement et de test. Mais cette méthode a ses limites parce que les composés dans le groupe de test peuvent être très similaires à ceux du groupe d'entraînement. Pour régler ça, les chercheurs ont proposé de nouvelles façons de diviser les données, en se concentrant sur la structure chimique des composés. Mais même ces nouvelles méthodes pourraient être améliorées.
Apprendre de la Science des Matériaux
Dans la science des matériaux, le processus de test des modèles est plus établi. Ils ont des moyens de valider leurs prédictions efficacement, et ça peut influencer notre approche de la découverte de médicaments. En science des matériaux, les chercheurs cherchent souvent des matériaux avec une propriété spécifique, comme une meilleure conductivité. De la même manière, dans la découverte de médicaments, les chercheurs veulent savoir quels composés seront des médicaments efficaces basés sur des données de composés déjà testés.
Nouvelles Stratégies pour la Découverte de Médicaments
Pour améliorer les prédictions dans la découverte de médicaments, il y a trois nouvelles méthodes qui valent le coup d'œil :
Validation Croisée Avancée Triée : Cette méthode trie les composés par leurs propriétés pendant les tests. Ça peut aider à évaluer combien un modèle performe avec des composés ayant des caractéristiques spécifiques.
Rendement de Découverte : Ça mesure combien des composés prédits pourraient réellement fonctionner comme médicaments efficaces. Ça aide à voir si le modèle identifie des composés avec les bonnes propriétés.
Erreur de Nouveauté : Cette métrique aide à comprendre si le modèle peut faire des prédictions précises pour des composés différents de ceux utilisés pour l'entraîner.
Optimisation des Composés
La découverte de médicaments implique souvent d'ajuster plusieurs propriétés d'un composé en même temps. Par exemple, une propriété clé est le logP, qui indique à quel point un composé peut se dissoudre dans les graisses par rapport à l'eau. Les composés avec des valeurs logP modérées fonctionnent généralement mieux dans le développement de médicaments parce qu'ils équilibrent les caractéristiques nécessaires pour être efficaces sans risquer des problèmes comme la toxicité.
Tester les Nouvelles Stratégies
Pour mettre ces nouvelles méthodes en pratique, les chercheurs ont appliqué l'approche de validation croisée avancée triée à des groupes de composés ciblant certains protéines liées à des maladies. Ils ont découvert qu'organiser les composés par leurs propriétés leur a permis de mieux prédire lesquels seraient efficaces et sûrs.
Dans leurs résultats, les chercheurs ont remarqué que des composés avec des propriétés idéales avaient tendance à être prédits plus précisément avec les nouvelles méthodes, surtout quand ces composés étaient structurellement différents de ceux utilisés pour l'entraînement.
Défis d'Extrapolation
En utilisant ces nouvelles méthodes, les chercheurs ont découvert que prédire comment des composés avec des niveaux d'activité très bas ou très élevés allaient performer était un vrai casse-tête. En fait, les nouvelles méthodes montraient parfois des taux d'erreur plus élevés pour ces composés extrêmes, indiquant un besoin de modèles qui peuvent mieux s'adapter à différentes conditions.
Le Rôle du Rendement de Découverte et de l'Erreur de Nouveauté
Le taux de rendement de découverte-qui indique combien de composés identifiés sont vraiment efficaces-était généralement élevé, suggérant que le modèle pouvait efficacement trouver des candidats prometteurs pour le développement. Cependant, certaines méthodes, comme la validation croisée aléatoire, avaient tendance à créer des jeux de données similaires aux données d'entraînement, rendant les prédictions plus faciles mais potentiellement trompeuses.
L'erreur de nouveauté-qui regarde à quel point les prédictions étaient précises pour des composés différents de ceux que le modèle avait vus-restait basse en utilisant la validation croisée avancée triée. Cette constance suggère que cette méthode est efficace pour réduire les erreurs quand il s'agit de prédire comment de nouveaux composés vont performer.
Directions Futures
En regardant vers l'avenir, les chercheurs suggèrent que la validation croisée avancée triée pourrait être étendue à d'autres types de données, comme différentes mesures de la façon dont les composés interagissent avec les protéines. Il y a encore plein de choses à explorer sur comment ces types de données peuvent informer les efforts de découverte de médicaments.
Conclusion
En gros, appliquer les leçons apprises de la science des matériaux à la découverte de médicaments montre du potentiel pour améliorer la façon dont les prédictions sont validées dans ce domaine. Les nouvelles méthodes de validation, en particulier la validation croisée avancée triée, offrent une représentation plus réaliste de comment les composés pourraient performer dans des scénarios réels. En s'éloignant des méthodes traditionnelles, les chercheurs peuvent mieux aligner leurs processus de test avec les véritables besoins du développement de médicaments, menant à des prédictions plus utiles et efficaces. Ces avancées pourraient finalement conduire à de meilleurs candidats médicaments et à des résultats de santé améliorés.
Titre: Step Forward Cross Validation for Bioactivity Prediction: Out of Distribution Validation in Drug Discovery
Résumé: Recent advances in machine learning methods for materials science have significantly enhanced accurate predictions of the properties of novel materials. Here, we explore whether these advances can be adapted to drug discovery by addressing the problem of prospective validation - the assessment of the performance of a method on out-of-distribution data. First, we tested whether k-fold n-step forward cross-validation could improve the accuracy of out-of-distribution small molecule bioactivity predictions. We found that it is more helpful than conventional random split cross-validation in describing the accuracy of a model in real-world drug discovery settings. We also analyzed discovery yield and novelty error, finding that these two metrics provide an understanding of the applicability domain of models and an assessment of their ability to predict molecules with desirable bioactivity compared to other small molecules. Based on these results, we recommend incorporating a k-fold n-step forward cross-validation and these metrics when building state-of-the-art models for bioactivity prediction in drug discovery.
Auteurs: Srijit Seal, U. S. Saha, M. Vendruscolo, A. E. Carpenter, S. Singh, A. Bender
Dernière mise à jour: 2024-07-04 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.07.02.601740
Source PDF: https://www.biorxiv.org/content/10.1101/2024.07.02.601740.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.