Melhorando a Descoberta de Medicamentos com iScore
o iScore oferece um jeito mais rápido de prever a ligação de medicamentos a proteínas.
― 6 min ler
Índice
- Desafios do Docking Molecular Tradicional
- A Introdução do Aprendizado de Máquina nas Funções de Pontuação
- Apresentando o IScore: Uma Nova Função de Pontuação
- Como o iScore Funciona
- Avaliando o iScore
- Poder de Pontuação do iScore
- Poder de Ranqueamento do iScore
- Poder de Triagem do iScore
- Velocidade e Eficiência do iScore
- Conclusão
- Fonte original
- Ligações de referência
O docking molecular é um método popular usado na descoberta de medicamentos pra entender como pequenas Moléculas, tipo possíveis remédios, podem se ligar a Proteínas no corpo. Ao prever como essas pequenas moléculas se agarram a proteínas específicas, os pesquisadores conseguem identificar quais podem ser os melhores tratamentos.
A eficácia do docking molecular depende de duas partes principais: amostragem e Pontuação. Amostragem é o processo de buscar diferentes formas e configurações dessas pequenas moléculas pra ver como elas se encaixam na proteína. A pontuação mede o quão bem essas moléculas se ligam à proteína, ajudando os cientistas a entender quais candidatos têm o melhor potencial.
Desafios do Docking Molecular Tradicional
Apesar de a parte de pontuação do processo ser rápida, a amostragem leva muito tempo e recursos. Isso pode tornar todo o processo de docking caro e lento, especialmente ao testar muitas moléculas. Além disso, não existem bancos de dados suficientes de compostos disponíveis pra teste, o que significa que muitas moléculas com potencial de remédio ficam sem exploração.
As funções de pontuação tradicionais, que ajudam os pesquisadores a decidir o quão bem uma molécula pode se ligar a uma proteína, têm suas limitações. Embora tenham melhorado com o tempo, ainda enfrentam problemas de precisão e velocidade. Métodos mais sofisticados, como a perturbação de energia livre (FEP), também existem, mas precisam de muito poder computacional e só podem ser aplicados a bibliotecas menores de moléculas.
A Introdução do Aprendizado de Máquina nas Funções de Pontuação
Avanços recentes em aprendizado de máquina (ML) mostraram que ele pode ajudar a criar funções de pontuação melhores. Funções baseadas em ML se destacaram em testes e são geralmente mais rápidas que as tradicionais. Porém, todas as funções de pontuação ainda precisam entender bem como proteínas e moléculas interagem, o que significa que ainda enfrentam desafios na fase de amostragem mais lenta.
Apresentando o IScore: Uma Nova Função de Pontuação
Este artigo apresenta uma nova função de pontuação chamada iScore. O iScore é diferente porque consegue prever como as moléculas se ligam às proteínas sem precisar analisar interações detalhadas entre elas. Em vez disso, ele usa um conjunto de descrições simples tanto da molécula quanto do local de ligação da proteína.
Ao pular a etapa de amostragem complexa, o iScore consegue economizar bastante tempo e recursos. Ele também pode avaliar uma grande coleção de novas moléculas contra uma proteína de interesse, ajudando os pesquisadores a encontrar compostos que talvez não tenham sido considerados antes.
Como o iScore Funciona
O iScore foi treinado usando um conjunto de dados específico que inclui muitos complexos proteína-ligante, permitindo que ele aprenda como diferentes características influenciam a afinidade de ligação. Três abordagens de aprendizado de máquina foram usadas no desenvolvimento do iScore: Rede Neural Profunda, Floresta Aleatória e eXtreme Gradient Boosting. Além disso, foi criado um modelo híbrido que combina as forças desses três métodos pra melhorar ainda mais o desempenho.
Avaliando o iScore
A eficácia do iScore foi amplamente testada em comparação com métodos de pontuação tradicionais usando vários conjuntos de dados. Os resultados mostraram que o iScore supera outras funções de pontuação em vários aspectos: quão precisamente prevê a afinidade de ligação (poder de pontuação), quão bem classifica diferentes candidatos (poder de ranqueamento) e quão efetivamente identifica os melhores candidatos entre uma seleção aleatória (poder de triagem).
Poder de Pontuação do iScore
O poder de pontuação do iScore é medido observando o quão perto suas previsões estão dos resultados experimentais reais. Quando comparado com outras funções de pontuação, o iScore demonstrou uma forte correlação com dados experimentais, o que significa que suas previsões eram confiáveis e precisas.
Poder de Ranqueamento do iScore
O poder de ranqueamento avalia o quão bem o iScore pode ordenar potenciais candidatos a drogas com base em sua eficácia prevista. Descobriu-se que o iScore é melhor em classificar esses candidatos do que muitas funções de pontuação existentes, tornando-o uma ferramenta forte para pesquisadores que buscam priorizar quais moléculas testar mais a fundo.
Poder de Triagem do iScore
O poder de triagem refere-se à capacidade de identificar corretamente as melhores moléculas de ligação entre muitas opções. O iScore mostrou taxas de sucesso impressionantes na identificação dos principais candidatos, superando outros métodos. Essa habilidade de destacar as melhores opções é crucial nas etapas iniciais da descoberta de medicamentos.
Velocidade e Eficiência do iScore
Uma das características que mais se destaca no iScore é sua velocidade. Ele demonstrou ser capaz de triáge rapidamente milhares de compostos, tornando-se altamente eficiente para testar grandes bibliotecas de moléculas. Essa rapidez é essencial na descoberta de medicamentos, onde o tempo é muitas vezes um fator crítico no desenvolvimento de novas medicações.
Conclusão
Em resumo, o iScore representa um avanço significativo nas funções de pontuação usadas na descoberta de medicamentos. Ao entrelaçar aprendizado de máquina com descrições mais simples das características moleculares e proteicas, ele consegue prever afinidades de ligação de forma rápida e precisa. Sua capacidade de ranquear e triáge novas moléculas de forma eficaz aumenta sua utilidade na busca por novos remédios. À medida que a descoberta de medicamentos continua a evoluir, ferramentas como o iScore vão desempenhar um papel importante em acelerar o processo e ajudar pesquisadores a explorar vastos espaços químicos que antes eram muito demorados ou exigiam muitos recursos para investigar. Através de metodologias inovadoras e capacidades de triagem eficientes, o iScore está abrindo caminho para o futuro do desenvolvimento de medicamentos, oferecendo promessas de encontrar novos tratamentos para várias doenças.
Título: iScore: A ML-Based Scoring Function for de novo Drug Discovery
Resumo: In the quest for accelerating de novo drug discovery, the development of efficient and accurate scoring functions represents a fundamental challenge. This study introduces iScore, a novel machine learning (ML)-based scoring function designed to predict the binding affinity of protein-ligand complexes with remarkable speed and precision. Uniquely, iScore circumvents the conventional reliance on explicit knowledge of protein-ligand interactions and full picture of atomic contacts, instead leveraging a set of ligand and binding pocket descriptors to evaluate binding affinity. This approach avoids the inefficient and slow conformational sampling stage, thereby enabling the rapid screening of ultra-huge molecular libraries, a crucial advancement given the practically infinite dimensions of chemical space. iScore was rigorously trained and validated using the PDBbind 2020 refined set, CASF 2016, and CSAR NRC-HiQ Set1/2, employing three distinct ML methodologies: Deep Neural Network (iScore-DNN), Random Forest (iScore-RF), and eXtreme Gradient Boosting (iScore-XGB). A hybrid model, iScore-Hybrid, was subsequently developed to incorporate the strengths of these individual base learners. The hybrid model demonstrated a Pearson correlation coefficient (R) of 0.78 and a root mean square error (RMSE) of 1.23 in cross-validation, outperforming the individual base learners and establishing new benchmarks for scoring power (R = 0.814, RMSE=1.34), ranking power ({rho} = 0.705), and screening power (success rate at top 10% = 73.7%).
Autores: Leif A. Eriksson, S. J. Mahdizadeh
Última atualização: 2024-04-03 00:00:00
Idioma: English
Fonte URL: https://www.biorxiv.org/content/10.1101/2024.04.02.587723
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.04.02.587723.full.pdf
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.