Nouvelles méthodes pour lutter contre la résistance aux antibiotiques
Des chercheurs développent des outils pour prédire l'efficacité des peptides antimicrobiens contre E. coli.
― 7 min lire
Table des matières
Dans les années 1940, les antibiotiques ont changé la médecine en aidant les gens à se remettre d'infections bactériennes et en réduisant les taux de mortalité. Mais rapidement, de nouveaux problèmes sont apparus, comme la résistance aux antibiotiques et les allergies à ces médicaments. Au début des années 2000, beaucoup d'antibiotiques ne fonctionnaient plus bien, entraînant environ 5 millions de décès chaque année. Ce chiffre pourrait grimper à 10 millions d'ici 2050. La résistance croissante des germes aux antibiotiques traditionnels est désormais un problème mondial sérieux, nécessitant de nouvelles façons de traiter les infections.
Pour résoudre ce problème, les chercheurs se penchent sur des traitements alternatifs, surtout des options basées sur des biologiques qui sont plus spécifiques et moins susceptibles de provoquer une résistance. Un domaine prometteur consiste à utiliser des peptides et des protéines, comme les Peptides Antimicrobiens (AMP) et les anticorps monoclonaux (mAbs). Les AMPs peuvent efficacement lutter contre divers germes, même ceux qui sont résistants à plusieurs médicaments. Ils agissent rapidement et utilisent des méthodes uniques pour réduire les chances de résistance des germes. Les AMPs perturbent les membranes bactériennes grâce à leur structure spéciale, ce qui leur permet de cibler les cellules à charge négative.
Le Rôle des Bases de Données
Avec l'intérêt croissant pour les AMPs, les chercheurs ont créé plusieurs bases de données pour stocker des informations précieuses sur ces peptides. La première grande base de données, appelée Antimicrobial Peptide Database (APD), a été lancée en 2004. Elle contient des informations détaillées sur les peptides avec de nombreuses propriétés différentes, y compris leurs capacités à lutter contre les tumeurs, les virus, les champignons et les bactéries. Au fil du temps, d'autres sources de données publiques sont apparues, comme CAMPR4, DBAASP v3, et d'autres, offrant des détails essentiels sur la structure et la fonctionnalité des peptides. Ces ressources sont cruciales pour développer de nouveaux médicaments et faire avancer la recherche sur les AMPs.
Ces dernières années, on a vu une montée en puissance d'outils qui aident à prédire et à concevoir des séquences d'AMP, comme AI4AMP, AMPDiscover, et plusieurs autres. Certains outils se concentrent même sur la prédiction de peptides capables de lutter spécifiquement contre la tuberculose. Cependant, ces méthodes ne mesurent souvent pas l'efficacité d'un peptide ou la quantité nécessaire pour stopper la croissance bactérienne. Des recherches récentes ont visé à mieux comprendre la quantité minimale de peptides requise pour affecter des bactéries comme E. Coli.
Nos Efforts de Recherche
Pour améliorer la prédiction de l'efficacité des AMPs, nous avons créé une méthode pour estimer la concentration minimale inhibitrice (CMI) des peptides contre E. coli. Un des principaux objectifs était d'aider les scientifiques à concevoir des peptides capables de cibler efficacement cette bactérie. Nous avons développé un logiciel autonome appelé EIPpred et une plateforme web pour aider dans cette tâche. Notre serveur recherche à grande échelle des peptides antibactériens dans des protéines, prédisant leur efficacité et identifiant les parties des peptides qui influencent leurs valeurs de CMI.
Collecte de Données
Nous avons d'abord rassemblé un ensemble de données contenant des informations sur 3 929 peptides et leurs valeurs de CMI contre E. coli. Cet ensemble de données provenait de recherches antérieures et était divisé en deux parties : un ensemble d'entraînement de 3 143 peptides et un plus petit ensemble de validation de 786. Nous avons gardé la longueur des peptides cohérente dans les deux ensembles pour éviter tout biais.
De plus, nous avons créé un ensemble de données indépendant séparé utilisant 498 peptides, en veillant à ce qu'aucun ne soit identique à ceux des ensembles d'entraînement et de validation. Ce nouvel ensemble de données était essentiel pour tester la performance de nos méthodes.
Approche de Recherche
Nous avons utilisé un processus appelé validation croisée à 5 volets pour garantir que nos prédictions étaient précises. Cette technique divise les données en cinq parties, utilisant quatre parties pour entraîner le modèle et une partie pour le tester. Cette méthode réduit les erreurs et nous donne une idée plus claire de la performance de notre modèle. Nous avons également utilisé un outil appelé BLAST pour trouver des peptides similaires en les comparant à des peptides antibactériens connus. Cette étape nous a aidés à prédire l'efficacité de nos peptides de validation.
Caractéristiques des Peptides
Pour créer nos modèles prédictifs, nous devions analyser les caractéristiques des peptides. Nous avons examiné différents types de caractéristiques des Séquences de peptides pour recueillir un large éventail d'informations. Plus de 9 000 caractéristiques ont été calculées, couvrant différents aspects des compositions des peptides.
Nous avons également créé des profils binaires, qui ont attribué des valeurs aux acides aminés en fonction de leurs motifs. Cette étape a aidé à comprendre l'influence des longueurs de peptides sur leur efficacité. Par exemple, nous avons organisé les peptides en quatre groupes en fonction de leur longueur, ce qui nous a permis d'analyser mieux leurs caractéristiques spécifiques.
Techniques d'Apprentissage Automatique
Nous avons mis en œuvre plusieurs modèles d'apprentissage automatique dans notre étude pour établir une relation entre les caractéristiques des peptides et leurs valeurs de CMI. Nous avons utilisé douze algorithmes de régression différents pour déterminer quel modèle fonctionnait le mieux pour nos prédictions. Le Random Forest Regressor (RFR) a montré la meilleure précision parmi tous les modèles, en particulier lorsqu'on utilisait toutes les caractéristiques compositionnelles.
Nous avons expérimenté différents ensembles de caractéristiques et découvert que ceux basés sur les compositions des peptides donnaient de meilleurs résultats. Les modèles qui reposaient sur des peptides d'une longueur comprise entre 5 et 20 acides aminés ont également produit de meilleures prédictions.
Résultats et Performance
Nos résultats ont révélé que l'utilisation des bonnes caractéristiques a un impact significatif sur la précision des prédictions de CMI. Le modèle RFR a obtenu des scores élevés en corrélation avec les valeurs réelles de CMI, surtout lorsque nous avons sélectionné les 1 000 meilleures caractéristiques. Cette méthode a réduit les informations non pertinentes, conduisant à des prédictions plus fiables.
Nous avons également examiné à quel point nos modèles pouvaient prédire l'efficacité des peptides par rapport aux méthodes existantes. Notre modèle RFR a surpassé d'autres modèles dans la prédiction des valeurs de CMI, montrant sa force et sa fiabilité même avec des méthodes de calcul basiques.
Développement du Serveur Web
Pour rendre nos prédictions accessibles, nous avons construit une plateforme web conviviale appelée EIPpred. Ce site permet aux utilisateurs de prédire l'activité inhibitrice des peptides contre E. coli et même de concevoir de nouveaux mutants de peptides. La plateforme permet aux chercheurs de scanner des séquences protéiques pour localiser des régions efficaces en fonction des valeurs de CMI prédites.
Conclusion
Les bactéries, en particulier E. coli, continuent d'évoluer, rendant essentiel de trouver de nouvelles façons de lutter contre la résistance aux antibiotiques. Notre étude s'est concentrée sur le développement d'un outil rapide et efficace pour prédire l'efficacité des peptides antimicrobiens contre E. coli. En tirant parti de diverses techniques d'apprentissage automatique et en rassemblant des données étendues, nous avons fourni un modèle qui peut aider les chercheurs à concevoir de meilleures options de traitement à une époque où les antibiotiques traditionnels perdent leur efficacité.
Cet outil peut être une ressource essentielle pour la communauté scientifique, permettant la conception et la prédiction de nouveaux peptides qui pourraient aider à lutter contre les infections bactériennes. L'avenir réside dans l'amélioration de ces modèles et l'extension de leur application à d'autres bactéries nuisibles, offrant plus de solutions au problème croissant de la résistance aux antibiotiques.
Titre: Prediction of inhibitory peptides against E. coli with desired MIC value
Résumé: In the past, several methods have been developed for predicting antibacterial and antimicrobial peptides, but only limited attempts have been made to predict their minimum inhibitory concentration (MIC) values. In this study, we trained our models on 3,143 peptides and validated them on 786 peptides whose MIC values have been determined experimentally against Escherichia coli (E. coli). The correlational analysis reveals that the Composition Enhanced Transition and Distribution (CeTD) attributes strongly correlate with MIC values. We initially employed the similarity search strategy utilizing BLAST to estimate MIC values of peptides but found it inadequate for prediction. Next, we developed machine learning techniques-based regression models using a wide range of features, including peptide composition, binary profile, and embeddings of large language models. We implemented feature selection techniques like minimum Redundancy Maximum Relevance (mRMR) to select the best relevant features for developing prediction models. Our Random forest-based regressor, based on selected features, achieved a correlation coefficient (R) of 0.78, R-squared (R{superscript 2}) of 0.59, and a root mean squared error (RMSE) of 0.53 on the validation dataset. Our best model outperforms the existing methods when benchmarked on an independent dataset of 498 inhibitory peptides of E. coli. One of the major features of the web-based platform EIPpred developed in this study is that it allows users to identify or design peptides that can inhibit E. coli with the desired MIC value (https://webs.iiitd.edu.in/raghava/eippred). HighlightsO_LIPrediction of MIC value of peptides against E.coli. C_LIO_LIAn independent dataset was generated for comparison. C_LIO_LIFeature selection using the mRMR method. C_LIO_LIA regressor method for designing novel inhibitory peptides. C_LIO_LIA web server and standalone package for predicting the inhibitory activity of peptides. C_LI
Auteurs: Gajendra P.S. Raghava, N. Bajiya, N. Kumar
Dernière mise à jour: 2024-07-22 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.07.18.604028
Source PDF: https://www.biorxiv.org/content/10.1101/2024.07.18.604028.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.