Simple Science

Ciência de ponta explicada de forma simples

# Biologia# Bioinformática

Avanços na Testagem de Toxicidade de Peptídeos

Novos métodos melhoram a previsão da toxicidade de peptídeos hemolíticos para um desenvolvimento de medicamentos mais seguro.

― 9 min ler


Teste de Toxicidade deTeste de Toxicidade dePeptídeos Melhoradosegurança de medicamentos peptídicos.Novos métodos melhoram as previsões de
Índice

Desenvolver e testar novos medicamentos pode ser um processo complicado e caro. Geralmente leva tempo e vem com muitos riscos. A jornada de criar um remédio envolve várias etapas, desde entender a doença até os testes clínicos. Recentemente, a galera tá mais interessada em usar medicamentos à base de peptídeos porque eles têm várias vantagens em relação aos remédios tradicionais. Essas vantagens incluem maior eficácia, direcionamento mais preciso, menores chances de causar reações imunológicas e risco reduzido de interações com outros medicamentos. O custo de desenvolver esses remédios também é mais baixo em comparação com outros.

Entre 2016 e 2023, 31 medicamentos peptídicos foram aprovados pela FDA, que representa mais de 8% de todos os medicamentos aprovados nesse período. Além disso, mais de 200 peptídeos estão sendo testados em ensaios clínicos e cerca de 600 ainda estão nas fases iniciais de pesquisa. Apesar do potencial, muitos medicamentos peptídicos falham durante os testes, principalmente porque não atendem aos padrões de segurança e eficácia. Um grande motivo para isso é como o corpo absorve e processa esses medicamentos. Portanto, poder testar e melhorar as propriedades desses remédios desde o início é crucial.

Importância do Teste de Toxicidade

Quando se trata de desenvolver medicamentos à base de peptídeos, um grande desafio é a toxicidade, que pode ser categorizada em três tipos principais: citotoxicidade, que afeta a saúde das células; hemotoxicidade, que pode danificar os glóbulos vermelhos; e imunotoxicidade, que pode causar reações alérgicas. A concentração hemolítica (HC50) é uma medida comum usada para avaliar quão tóxico um peptídeo é. Ela indica a quantidade de peptídeo que causa 50% de destruição dos glóbulos vermelhos humanos em condições normais. Peptídeos que têm muitos aminoácidos carregados positivamente tendem a danificar os glóbulos vermelhos devido à interação com a superfície carregada negativamente dessas células.

Nos últimos anos, vários métodos baseados em computador foram criados para prever quais peptídeos podem ser hemolíticos. A maioria dessas ferramentas se baseia em dados de um banco de dados específico de peptídeos hemolíticos. Algumas abordagens notáveis de Aprendizado de Máquina foram desenvolvidas para melhorar a previsão de peptídeos hemolíticos. Essas ferramentas visam aumentar a precisão das previsões enquanto garantem eficiência e custo-benefício.

Desafios na Previsão de Peptídeos Hemolíticos

Embora tenha havido progresso na previsão de peptídeos hemolíticos, ainda há espaço para melhorias. Muitos métodos existentes usam dados que se aplicam amplamente a todos os vertebrados, o que pode não ser específico o suficiente para aplicações em humanos. Além disso, esses métodos geralmente não oferecem uma maneira de prever o valor HC50 dos peptídeos, um fator crítico no desenvolvimento de medicamentos.

Para enfrentar esses desafios, um novo método chamado HemoPI2 foi proposto. Esse método é treinado em um conjunto de dados bem validado de peptídeos hemolíticos e combina aprendizado de máquina com algoritmos preditivos de ponta para fornecer previsões mais precisas.

Coleta e Pré-processamento de Dados

Os dados para o HemoPI2 foram coletados de bancos de dados abrangentes que contêm informações experimentais sobre peptídeos hemolíticos. Um total de 3147 peptídeos foram coletados de um banco de dados e 560 de outro, focando em peptídeos com valores de HC50 conhecidos. Qualquer peptídeo com aminoácidos não naturais ou aqueles com menos de seis aminoácidos foram excluídos do conjunto de dados. Quando um peptídeo tinha múltiplos valores de HC50, a média foi calculada para representar seu comportamento hemolítico geral.

O conjunto de dados final do HemoPI2 consiste em 1926 peptídeos únicos, cada um emparelhado com sua concentração hemolítica, o que permite que os pesquisadores classifiquem os peptídeos com base em seus valores HC50. Usando um critério específico, peptídeos com HC50 de ≤ 100 μM foram rotulados como hemolíticos, enquanto aqueles com valores mais altos foram classificados como não-hemolíticos.

Abordagens de Classificação e Regressão

O principal alvo para a análise de regressão neste estudo foi o logaritmo negativo de HC50 (pHC50), o que facilita a análise da ampla gama de valores de HC50. Esse é um método comum usado para lidar com dados biológicos e melhora o desempenho dos modelos de previsão.

Para os modelos preditivos, os dados foram divididos aleatoriamente em um conjunto de treinamento e um conjunto de teste independente. O conjunto de treinamento foi utilizado para desenvolver e validar modelos usando uma abordagem de validação cruzada em cinco partes, onde os dados são divididos em cinco partes para garantir um teste robusto do desempenho do modelo.

Para descrever os peptídeos com precisão, a extração de características é crítica. Vários descritores, como composição de aminoácidos, composição de dipeptídeos e propriedades físico-químicas, foram derivadas das sequências de peptídeos. Um total de 1092 características foram extraídas, formando a base para gerar modelos preditivos.

Análise de Peptídeos Hemolíticos

Composição de Aminoácidos

Uma análise da composição de aminoácidos de peptídeos hemolíticos e não-hemolíticos revelou diferenças distintas. Resíduos hidrofóbicos como cisteína, fenilalanina, glicina e leucina foram encontrados em proporções mais altas em peptídeos hemolíticos em comparação com os não-hemolíticos. Isso destaca a importância de certos aminoácidos na contribuição para a atividade hemolítica.

Preferências Posicionais

Examinar como diferentes aminoácidos estão posicionados dentro das sequências de peptídeos forneceu mais insights. Resíduos hidrofóbicos específicos eram mais abundantes no início dos peptídeos hemolíticos, enquanto os peptídeos não-hemolíticos mostraram uma maior presença de resíduos carregados positivamente. Essas informações podem ajudar a refinar modelos preditivos que diferenciam peptídeos hemolíticos e não-hemolíticos.

Análise de Motivos

Uma análise de motivos foi conduzida para identificar padrões de sequência-chave dentro de peptídeos hemolíticos e não-hemolíticos. Vários motivos exclusivos foram encontrados que eram exclusivos para peptídeos hemolíticos, o que pode ajudar no desenvolvimento de ferramentas preditivas mais precisas. Identificar esses motivos não só ajuda na precisão das previsões, mas também melhora a compreensão dos mecanismos subjacentes responsáveis pela atividade hemolítica.

Análise de Correlação

A análise de correlação foi aplicada para identificar relações entre características extraídas dos peptídeos e suas concentrações de HC50. Isso destacou quais propriedades específicas influenciam a determinação da atividade hemolítica. Conhecer essas correlações pode guiar os pesquisadores na concepção de peptídeos mais seguros para uso terapêutico.

Modelos de Aprendizado de Máquina

Uma diversidade de classificadores de aprendizado de máquina foi empregada para classificar peptídeos hemolíticos e não-hemolíticos. Modelos como Extra Trees, Máquinas de Vetores de Suporte e Florestas Aleatórias foram usados, demonstrando níveis variados de desempenho. O modelo de Floresta Aleatória, em particular, mostrou fortes capacidades preditivas com base na complexidade e riqueza das características que ele poderia lidar.

Além dos modelos tradicionais de aprendizado de máquina, modelos avançados de linguagem de proteínas foram utilizados para capturar informações contextuais das sequências de peptídeos. Esses modelos, treinados em vastos conjuntos de dados de sequências de proteínas, produziram embeddings de alta dimensão que melhoraram significativamente a previsão da atividade hemolítica.

Modelos Híbridos para Previsões Aprimoradas

Para maximizar a precisão preditiva, uma abordagem híbrida foi adotada, combinando informações de características de motivos com modelos de aprendizado de máquina. Ao aplicar uma técnica de pontuação ponderada, as previsões do método baseado em motivos foram integradas com as saídas de aprendizado de máquina para refinar as classificações. Esse método permitiu previsões mais informadas enquanto equilibrava taxas de verdadeiros positivos e falsos positivos.

Modelos de Regressão para Prever Valores HC50

Modelos de regressão também foram desenvolvidos para prever valores HC50 diretamente. Várias técnicas, incluindo regressões de Floresta Aleatória e Extra Trees, foram utilizadas, mostrando resultados promissores. O uso de embeddings de modelos de linguagem aprimorou ainda mais a precisão das previsões, tornando-as mais aplicáveis para o desenvolvimento de peptídeos terapêuticos.

Avaliação de Desempenho

Avaliar o desempenho dos modelos preditivos é crucial para estabelecer sua confiabilidade. Para classificação, métricas como sensibilidade, especificidade e precisão foram aplicadas, enquanto a análise de regressão utilizou o Coeficiente de Correlação de Pearson e o Erro Absoluto Médio para avaliar a precisão das previsões.

O método HemoPI2 foi comparado a ferramentas existentes que prevêem atividade hemolítica, destacando seu desempenho superior. O HemoPI2 alcançou uma área sob a curva (AUC) alta, o que indica sua eficácia em diferenciar entre peptídeos hemolíticos e não-hemolíticos.

Conclusão

O HemoPI2 representa um avanço significativo na capacidade de classificar e quantificar peptídeos hemolíticos com base exclusivamente em suas sequências primárias. Com seu foco em aplicações práticas no desenvolvimento de peptídeos terapêuticos, essa ferramenta pode potencialmente agilizar o processo de descoberta de medicamentos e melhorar o design de remédios peptídicos mais seguros. A combinação de aprendizado de máquina, análise estrutural e identificação de motivos posiciona o HemoPI2 como um recurso valioso para pesquisadores na área.

O trabalho realizado pode ter um impacto significativo na compreensão da toxicidade de peptídeos e do índice terapêutico, abrindo caminho para novos desenvolvimentos que priorizam a segurança do paciente no design de medicamentos. Ao disponibilizar o HemoPI2 gratuitamente online, a comunidade científica pode aproveitar essa ferramenta para diversas aplicações, contribuindo, no final das contas, para o avanço das terapias peptídicas.

Os detalhes sobre composição de aminoácidos, preferências posicionais, motivos únicos e descobertas de correlação fornecem uma base rica para pesquisas contínuas voltadas a melhorar o design de medicamentos peptídicos.

Fonte original

Título: Prediction of Hemolytic Peptides and their Hemolytic Concentration (HC50)

Resumo: Several peptide-based drugs fail in clinical trials due to their toxicity or hemolytic activity against red blood cells (RBCs). Existing methods predict hemolytic peptides but not the concentration (HC50) required to lyse 50% of RBCs. In this study, we developed a classification model and regression model to identify and quantify the hemolytic activity of peptides. Our models were trained and validated on 1924 peptides with experimentally determined HC50 against mammalian RBCs. Analysis indicates that hydrophobic and positively charged residues were associated with higher hemolytic activity. Our classification models achieved a maximum AUC of 0.909 using a hybrid model of ESM-2 and a motif-based approach. Regression models using compositional features achieved R of 0.739 with R{superscript 2} of 0.543. Our models outperform existing methods and are implemented in the web-based platform HemoPI2 and standalone software for designing hemolytic peptides with desired HC50 values (http://webs.iiitd.edu.in/raghava/hemopi2/). HighlightsO_LIDeveloped classification and regression models to predict hemolytic activity and HC50 values of peptides. C_LIO_LIA hybrid model combining machine learning and motif prediction excels in accuracy. C_LIO_LIBenchmarking of the existing classification methods on independent datasets. C_LIO_LIWeb server, standalone software, and pip package for hemolytic activity prediction of peptides/proteins. C_LI

Autores: Gajendra P.S. Raghava, A. S. Rathore, N. Kumar, S. Choudhury, N. K. Mehta

Última atualização: 2024-07-24 00:00:00

Idioma: English

Fonte URL: https://www.biorxiv.org/content/10.1101/2024.07.23.604887

Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.07.23.604887.full.pdf

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes