Avancées dans les tests de toxicité des peptides
De nouvelles méthodes améliorent la prédiction de la toxicité des peptides hémolytiques pour un développement de médicaments plus sûr.
― 10 min lire
Table des matières
- Importance des Tests de Toxicité
- Défis dans la Prédiction des Peptides Hémolytiques
- Collecte et Prétraitement des Données
- Approches de Classification et de Régression
- Analyse des Peptides Hémolytiques
- Composition en Acides Aminés
- Préférences Positionnelles
- Analyse des Motifs
- Analyse de Corrélation
- Modèles d'Apprentissage Machine
- Modèles Hybrides pour des Prédictions Améliorées
- Modèles de régression pour Prédire les Valeurs HC50
- Évaluation des Performances
- Conclusion
- Source originale
- Liens de référence
Développer et tester de nouveaux médicaments, c'est souvent un vrai casse-tête et ça coûte cher. Ça prend souvent beaucoup de temps et il y a plein de risques. Créer un médicament, ça passe par plusieurs étapes, de la compréhension de la maladie aux essais cliniques. Dernièrement, on s'intéresse de plus en plus aux médicaments à base de peptides car ils offrent plusieurs avantages par rapport aux médicaments traditionnels. Ces avantages incluent une meilleure efficacité, un ciblage plus précis, moins de risques de réactions immunitaires et un risque réduit d'interactions avec d'autres médicaments. De plus, le coût de développement de ces médicaments est aussi plus bas par rapport aux autres.
Entre 2016 et 2023, 31 médicaments à base de peptides ont été approuvés par la Food and Drug Administration (FDA), ce qui représente plus de 8% de tous les médicaments approuvés pendant cette période. En plus de ça, plus de 200 peptides sont actuellement testés dans des essais cliniques, et environ 600 autres sont encore en phase de recherche préliminaire. Malgré leur potentiel, beaucoup de médicaments à base de peptides échouent pendant les tests, surtout parce qu'ils ne respectent pas les normes de sécurité et d'efficacité. Une grande raison pour cela, c'est comment le corps absorbe et traite ces médicaments. Donc, il est crucial de pouvoir tester et améliorer les propriétés de ces médicaments dès le début.
Toxicité
Importance des Tests deQuand on développe des médicaments à base de peptides, un gros défi, c'est la toxicité, qui peut être classée en trois types principaux : la cytotoxicité, qui affecte la santé des cellules ; l'hémotoxicité, qui peut endommager les globules rouges ; et l'immunotoxicité, qui peut provoquer des réactions allergiques. La concentration hémolytique (HC50) est une mesure courante utilisée pour évaluer à quel point un peptide est toxique. Ça indique la quantité d'un peptide qui cause 50% de destruction des globules rouges humains dans des conditions normales. Les peptides avec beaucoup d'acides aminés positivement chargés tendent à endommager les globules rouges à cause de leur interaction avec la surface négativement chargée de ces cellules.
Ces dernières années, plusieurs méthodes informatiques ont été créées pour prédire quels peptides pourraient être hémolytiques. La plupart de ces outils s'appuient sur des données provenant d'une base de données spécifique de peptides hémolytiques. Quelques approches d'apprentissage machine notables ont été développées pour améliorer la prédiction des peptides hémolytiques. Ces outils visent à améliorer la précision des prédictions tout en garantissant efficacité et rentabilité.
Défis dans la Prédiction des Peptides Hémolytiques
Bien qu'il y ait eu des progrès dans la prédiction des peptides hémolytiques, il reste encore beaucoup à faire. Beaucoup de méthodes existantes utilisent des données qui s'appliquent largement à tous les vertébrés, ce qui peut ne pas être assez spécifique pour des applications humaines. En plus, ces méthodes ne fournissent souvent pas de moyen pour prédire la valeur HC50 des peptides, ce qui est crucial dans le développement de médicaments.
Pour relever ces défis, une nouvelle méthode nommée HemoPI2 a été proposée. Cette méthode est formée sur un ensemble de données bien validé de peptides hémolytiques et combine apprentissage machine avec des algorithmes prédictifs à la pointe pour fournir des prédictions plus précises.
Collecte et Prétraitement des Données
Les données pour HemoPI2 ont été recueillies à partir de bases de données complètes contenant des informations expérimentales sur les peptides hémolytiques. Un total de 3147 peptides a été collecté d'une base de données et 560 d'une autre, en se concentrant sur ceux avec des valeurs HC50 connues. Les peptides avec des acides aminés non naturels ou ceux contenant moins de six acides aminés ont été exclus de l'ensemble de données. Lorsque un peptide avait plusieurs valeurs HC50, la moyenne a été calculée pour représenter son comportement hémolytique global.
L'ensemble de données final pour HemoPI2 se compose de 1926 peptides uniques, chacun associé à sa concentration hémolytique, ce qui permet aux chercheurs de classer les peptides selon leurs valeurs HC50. En utilisant un critère spécifique, les peptides avec une HC50 de ≤ 100 μM ont été étiquetés comme hémolytiques, tandis que ceux avec des valeurs plus élevées ont été classés comme non-hémolytiques.
Approches de Classification et de Régression
L'objectif principal de l'analyse de régression dans cette étude était le logarithme négatif de la HC50 (pHC50), ce qui facilite l'analyse de la large gamme de valeurs HC50. C'est une méthode courante utilisée pour traiter les données biologiques et améliore la performance des modèles de prédiction.
Pour les modèles prédictifs, les données ont été divisées aléatoirement en un ensemble d'entraînement et un ensemble de test indépendant. L'ensemble d'entraînement a été utilisé pour développer et valider les modèles à l'aide d'une approche de validation croisée en cinq parties, où les données sont divisées en cinq parties pour garantir des tests robustes des performances des modèles.
Pour décrire les peptides avec précision, l'extraction de caractéristiques est critique. Divers descripteurs tels que la composition en acides aminés, la composition en dipeptides et les propriétés physico-chimiques ont été dérivés des séquences de peptides. Un total de 1092 caractéristiques a été extrait, formant la base pour générer des modèles prédictifs.
Analyse des Peptides Hémolytiques
Composition en Acides Aminés
Une examination de la composition en acides aminés des peptides hémolytiques et non-hémolytiques a révélé des différences distinctes. Des résidus hydrophobes comme la cystéine, la phénylalanine, la glycine et la leucine étaient présents en plus grande proportion dans les peptides hémolytiques par rapport aux non-hémolytiques. Cela souligne l'importance de certains acides aminés dans la contribution à l'activité hémolytique.
Préférences Positionnelles
En regardant comment différents acides aminés sont positionnés dans les séquences de peptides, on a obtenu de nouveaux aperçus. Des résidus hydrophobes spécifiques étaient plus abondants au début des peptides hémolytiques, tandis que les peptides non-hémolytiques montraient une plus grande présence de résidus chargés positivement. Cette information pourrait aider à affiner les modèles prédictifs qui différencient les peptides hémolytiques et non-hémolytiques.
Analyse des Motifs
Une analyse des motifs a été réalisée pour identifier les modèles de séquence clés au sein des peptides hémolytiques et non-hémolytiques. Plusieurs motifs uniques ont été trouvés, exclusifs aux peptides hémolytiques, ce qui pourrait aider à développer des outils de prédiction plus précis. Identifier ces motifs non seulement aide à la précision des prédictions, mais renforce aussi la compréhension des mécanismes sous-jacents responsables de l'activité hémolytique.
Analyse de Corrélation
Une analyse de corrélation a été appliquée pour identifier les relations entre les caractéristiques extraites des peptides et leurs concentrations HC50. Cela a mis en évidence quelles propriétés particulières sont influentes dans la détermination de l'activité hémolytique. Connaître ces corrélations peut guider les chercheurs dans la conception de peptides plus sûrs pour un usage thérapeutique.
Modèles d'Apprentissage Machine
Une diversité de classificateurs d'apprentissage machine a été utilisée pour classer les peptides hémolytiques et non-hémolytiques. Des modèles comme Extra Trees, Support Vector Machines, et Random Forests ont été utilisés, montrant différents niveaux de performance. Le modèle Random Forest, en particulier, a montré de fortes capacités prédictives basées sur la complexité et la richesse des caractéristiques qu'il pouvait traiter.
En plus des modèles d'apprentissage machine traditionnels, des modèles avancés de langage protéique ont été utilisés pour capturer des informations contextuelles à partir des séquences de peptides. Ces modèles, formés sur de vastes ensembles de données de séquences protéiques, ont produit des embeddings de haute dimension qui ont considérablement amélioré la prédiction de l'activité hémolytique.
Modèles Hybrides pour des Prédictions Améliorées
Pour maximiser la précision prédictive, une approche hybride a été adoptée qui combinait des informations sur les motifs avec des modèles d'apprentissage machine. En appliquant une technique de scoring pondéré, les prédictions de la méthode basée sur les motifs ont été intégrées avec les sorties des modèles d'apprentissage machine pour affiner les classifications. Cette méthode a permis d'obtenir des prédictions plus éclairées tout en équilibrant les vrais positifs et les faux positifs.
Modèles de régression pour Prédire les Valeurs HC50
Des modèles de régression ont également été développés pour prédire directement les valeurs HC50. Diverses techniques, y compris les régresseurs Random Forest et Extra Trees, ont été utilisées, montrant des résultats prometteurs. L'utilisation d'embeddings issus de modèles de langage a encore amélioré la précision des prédictions, les rendant plus applicables au développement de peptides thérapeutiques.
Évaluation des Performances
Évaluer les performances des modèles prédictifs est crucial pour établir leur fiabilité. Pour la classification, des métriques comme la sensibilité, la spécificité et la précision ont été appliquées, tandis que l'analyse de régression a utilisé le coefficient de corrélation de Pearson et l'erreur absolue moyenne pour évaluer la précision des prédictions.
La méthode HemoPI2 a été comparée aux outils existants qui prédisent l'activité hémolytique, mettant en avant sa performance supérieure. HemoPI2 a atteint une grande aire sous la courbe (AUC), ce qui indique son efficacité à différencier les peptides hémolytiques et non-hémolytiques.
Conclusion
HemoPI2 représente un avancement significatif dans la capacité à classer et quantifier les peptides hémolytiques uniquement basés sur leurs séquences principales. Avec son focus sur des applications pratiques dans le développement de peptides thérapeutiques, cet outil peut potentiellement simplifier le processus de découverte de médicaments et améliorer la conception de médicaments à base de peptides plus sûrs. L'association d'apprentissage machine, d'analyse structurelle et d'identification de motifs positionne HemoPI2 comme une ressource précieuse pour les chercheurs dans ce domaine.
Le travail entrepris a le potentiel d'impacter significativement la compréhension de la toxicité des peptides et de l'indice thérapeutique, ouvrant la voie à de futurs développements qui priorisent la sécurité des patients dans la conception des médicaments. En rendant HemoPI2 disponible gratuitement en ligne, la communauté scientifique peut tirer parti de cet outil pour diverses applications, contribuant ainsi à l'avancement des thérapies par peptides.
Les détails concernant la composition en acides aminés, les préférences positionnelles, les motifs uniques et les découvertes de corrélation fournissent une base riche pour la recherche continue visant à améliorer la conception des médicaments à base de peptides.
Titre: Prediction of Hemolytic Peptides and their Hemolytic Concentration (HC50)
Résumé: Several peptide-based drugs fail in clinical trials due to their toxicity or hemolytic activity against red blood cells (RBCs). Existing methods predict hemolytic peptides but not the concentration (HC50) required to lyse 50% of RBCs. In this study, we developed a classification model and regression model to identify and quantify the hemolytic activity of peptides. Our models were trained and validated on 1924 peptides with experimentally determined HC50 against mammalian RBCs. Analysis indicates that hydrophobic and positively charged residues were associated with higher hemolytic activity. Our classification models achieved a maximum AUC of 0.909 using a hybrid model of ESM-2 and a motif-based approach. Regression models using compositional features achieved R of 0.739 with R{superscript 2} of 0.543. Our models outperform existing methods and are implemented in the web-based platform HemoPI2 and standalone software for designing hemolytic peptides with desired HC50 values (http://webs.iiitd.edu.in/raghava/hemopi2/). HighlightsO_LIDeveloped classification and regression models to predict hemolytic activity and HC50 values of peptides. C_LIO_LIA hybrid model combining machine learning and motif prediction excels in accuracy. C_LIO_LIBenchmarking of the existing classification methods on independent datasets. C_LIO_LIWeb server, standalone software, and pip package for hemolytic activity prediction of peptides/proteins. C_LI
Auteurs: Gajendra P.S. Raghava, A. S. Rathore, N. Kumar, S. Choudhury, N. K. Mehta
Dernière mise à jour: 2024-07-24 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.07.23.604887
Source PDF: https://www.biorxiv.org/content/10.1101/2024.07.23.604887.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.