Simple Science

La science de pointe expliquée simplement

# Biologie# Pharmacologie et toxicologie

Défis dans le criblage virtuel pour la découverte de médicaments

Les méthodes actuelles utilisant des empreintes moléculaires ont des limites importantes dans le développement de médicaments.

― 7 min lire


Limites du criblageLimites du criblagevirtueldes médicaments.à la hauteur pour prédire l'activitéLes empreintes moléculaires ne sont pas
Table des matières

Le criblage virtuel, c'est une technique utilisée dans le développement de médicaments pour dénicher des petites molécules qui pourraient potentiellement se lier à une cible spécifique dans le corps, comme une protéine. Grâce aux avancées technologiques, les chercheurs peuvent désormais passer au crible des milliards de molécules candidates pour celles qui sont susceptibles d'être efficaces. Une méthode courante pour y arriver est de commencer avec un petit groupe de molécules actives connues et de chercher d'autres ayant des structures similaires.

Principe de propriété similaire

Une idée clé derrière cette approche est ce qu'on appelle le principe de propriété similaire (PPS). Le PPS suggère que les petites molécules ayant des structures similaires ont souvent des propriétés biologiques similaires. Ce principe est intuitif et a servi de base pour prédire comment une molécule pourrait se comporter dans des milieux biologiques, y compris son activité et sa toxicité. Cependant, ce principe peut être difficile à mesurer objectivement. Différents types de similarité peuvent être pertinents, selon ce qu'on examine. Par exemple, certains types de relations structure-activité peuvent se concentrer sur des parties spécifiques d'une molécule, tandis que d'autres pourraient considérer la structure dans son ensemble.

Empreintes Moléculaires

La première étape pour comparer des petites molécules consiste souvent à créer ce qu'on appelle une empreinte moléculaire. Cette empreinte est comme un code unique qui capture les caractéristiques structurelles et chimiques de la molécule. Après avoir généré ces empreintes, les chercheurs les comparent pour voir quelles molécules sont similaires. L'idée est que si deux molécules ont des empreintes similaires, elles pourraient aussi partager des fonctions biologiques similaires. Cette méthode a eu un certain succès pour prédire des propriétés comme la solubilité et la partition, même si elle ne fonctionne pas toujours bien pour prédire comment une molécule interagira avec une cible.

Contexte et régions de liaison

Il est important de noter que l'activité biologique d'une molécule dépend fortement de ses interactions avec des protéines spécifiques. Chaque protéine a des régions de liaison uniques, et ces différences signifient qu'une même molécule peut se comporter très différemment selon la protéine avec laquelle elle interagit. Donc, s'appuyer uniquement sur des empreintes moléculaires peut ne pas suffire pour capturer la diversité des interactions biologiques. Cette limitation a soulevé des questions sur l'efficacité de l'utilisation d'empreintes pour prédire quelles molécules se lieront efficacement.

Limitations des méthodes actuelles

Bien qu'il y ait des limitations connues à l'utilisation d'empreintes moléculaires basées sur le PPS, cette méthode est toujours largement utilisée dans le développement de médicaments. La simplicité et la rapidité du criblage virtuel basé sur les empreintes rendent cette approche attrayante, même si elle ne mène pas toujours à des prédictions efficaces de l'activité des médicaments. Différents types d'empreintes moléculaires ont été développés pour aider à identifier des petites molécules actives dans de grandes bibliothèques, mais les résultats varient et il n'y a pas de méthode universelle.

Évaluation des empreintes

Divers types d'empreintes peuvent être classés en fonction de la manière dont ils codent l'information moléculaire, y compris les caractéristiques linéaires, circulaires et les sous-structures prédéfinies. Chacune de ces méthodes calcule une représentation unique des molécules. Pour évaluer l'efficacité de ces empreintes en pratique, les chercheurs utilisent des ensembles de données de référence qui incluent des composés actifs et inactifs connus. Chaque ensemble de données peut différer dans les types de molécules qu'il inclut, ce qui peut influencer les résultats.

Métriques d'évaluation du criblage virtuel

Pour évaluer comment une méthode de criblage virtuel fonctionne, les chercheurs analysent souvent sa capacité à identifier correctement les molécules actives. Une façon courante de le faire est à travers la courbe de caractéristique de fonctionnement du récepteur (ROC), qui examine l'équilibre entre les vrais positifs (identifications correctes) et les faux positifs (identifications incorrectes). Une méthode aléatoire scorerait autour de 0,5 sur cette courbe, tandis qu'une méthode parfaite scorerait 1,0. Cependant, en réalité, les chercheurs veulent souvent que la méthode identifie rapidement les molécules actives dans un océan de molécules inactives, donc des métriques simples pourraient ne pas capturer pleinement l'efficacité d'une méthode de criblage.

Pour y remédier, certaines métriques alternatives ont été développées pour mieux évaluer l'enrichissement précoce de composés actifs. Une de ces mesures est appelée facteur de rétention des leurres (DRF), qui montre à quel point une méthode peut filtrer les composés inactifs tout en conservant les actifs. Cette mesure peut être plus facile à interpréter et plus cohérente à travers différents ensembles de données.

Performance des stratégies d'empreinte

Les chercheurs ont mené une étude pour voir à quel point différentes méthodes d'empreintes pouvaient identifier des molécules actives. Ils ont calculé les similarités de divers composés avec des molécules actives connues et ont comparé la performance des différents types d'empreintes à travers plusieurs ensembles de données de référence. Les résultats ont montré que la plupart des empreintes avaient de faibles performances, avec beaucoup de scores en dessous des niveaux acceptables pour les mesures ROC et DRF. Cela suggère que les stratégies d'empreinte n'enrichissent pas efficacement les molécules actives dans de grandes bibliothèques.

Distributions de similarité

Pour mieux comprendre les distributions de similarité entre molécules actives et inactives, les chercheurs ont analysé les coefficients de Tanimoto pour des paires de molécules. Ils ont trouvé que dans de nombreux cas, les similarités entre les paires actives-actives chevauchaient significativement celles entre les paires actives-inactives. Cela signifie qu'il était souvent difficile de distinguer ces deux groupes uniquement sur la base de leurs empreintes moléculaires.

Certaines empreintes ont affiché un petit groupe de molécules actives à forte similarité, donnant une fausse impression qu'il serait possible de fixer un score seuil pour sélectionner uniquement des composés actifs. Cependant, même avec un seuil élevé, un nombre significatif de composés inactifs était aussi censé scorer au-dessus de ce seuil, entraînant un risque élevé de faux positifs.

Évaluation sur des molécules inactives vérifiées

Un autre ensemble de données a été examiné pour voir s'il pouvait fournir un aperçu de l'efficacité de la similarité d'empreinte pour prédire l'activité. Il incluait un grand nombre de composés confirmés comme inactifs. Dans ce cas, les chercheurs ont trouvé que même en comparant des composés actifs à cet ensemble de molécules inactives, il y avait peu de preuves de pouvoir prédictif des empreintes.

Corrélation avec la puissance

En plus d'évaluer la capacité des empreintes à identifier des composés actifs, les chercheurs ont aussi examiné si la similarité d'empreinte corrélait avec la puissance des molécules actives. En analysant un ensemble de données spécifique, ils ont constaté que la corrélation entre la similarité d'empreinte et la puissance du composé était généralement faible. Cela indique que simplement avoir une forte similarité d'empreinte ne signifie pas qu'un composé sera plus efficace ou puissant.

Conclusion

En conclusion, bien que les méthodes computationnelles offrent des opportunités passionnantes pour découvrir de nouveaux candidats médicaments, les approches actuelles utilisant des empreintes moléculaires montrent des limitations significatives. Ces méthodes ont du mal à distinguer de manière fiable les composés actifs des inactifs, ce qui est crucial dans le développement de médicaments. Les efforts futurs devraient se concentrer sur la recherche de meilleures façons de représenter les molécules, notamment celles qui prennent en compte le contexte de leurs interactions avec des cibles spécifiques. Mettre l'accent sur les propriétés de surface des molécules et s'éloigner des représentations simplistes d'empreinte pourrait être la clé pour améliorer l'efficacité du criblage virtuel dans la découverte de médicaments.

Source originale

Titre: Do molecular fingerprints identify diverse active drugs in large-scale virtual screening? (no)

Résumé: Computational approaches for small-molecule drug discovery now regularly scale to consideration of libraries containing billions of candidate small molecules. One promising approach to increased speed in evaluating billion-molecule libraries is to develop succinct representations of each molecule that enable rapid identification of molecules with similar properties. Molecular fingerprints are thought to provide a mechanism for producing such representations. Here, we explore the utility of commonly-used fingerprints in the context of predicting similar molecular activity. We show that fingerprint similarity provides little discriminative power between active and inactive molecules for a target protein based on a known active - while they may sometimes provide some enrichment for active molecules in a drug screen, a screened dataset will still be dominated by inactive molecules. We also demonstrate that high-similarity actives appear to share a scaffold with the query active, meaning that they could more easily be identified by structural enumeration. Furthermore, even when limited to only active molecules, fingerprint similarity values do not correlate with compound potency. In sum, these results highlight the need for a new wave of molecular representations that will improve the capacity to detect biologically active molecules based on similarity to other such molecules.

Auteurs: Vishwesh Venkatraman, A. Roy, D. Demekas, J. Gaiser, R. Xiong, T. Wheeler

Dernière mise à jour: 2024-06-08 00:00:00

Langue: English

Source URL: https://www.biorxiv.org/content/10.1101/2022.09.20.508800

Source PDF: https://www.biorxiv.org/content/10.1101/2022.09.20.508800.full.pdf

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Instrumentation et détecteursAvancées dans les multiplicateurs de trous liquides pour la détection de la matière noire

Des chercheurs améliorent l'efficacité des détecteurs pour les études sur la matière noire et les événements rares en utilisant une nouvelle technologie.

― 7 min lire

Articles similaires