Avanços no Design de Medicamentos Usando a Tecnologia DrugGPS
O DrugGPS melhora o design de medicamentos ao focar nas semelhanças de bolsos de proteínas.
― 8 min ler
Índice
Gerar novos remédios que consigam se ligar bem a alvos específicos no corpo é um grande desafio na ciência médica. Para facilitar esse processo, os cientistas usam modelos de computador especiais que conseguem criar essas moléculas de remédio. Esses modelos analisam a forma e as características das proteínas que precisam ser atingidas pelos medicamentos.
Avanços recentes em deep learning, um tipo de inteligência artificial, tornaram possível criar moléculas de remédio 3D com base na forma dos bolsos das proteínas que elas precisam se ligar. No entanto, muitos modelos atuais trabalham de forma independente e acabam não reconhecendo que certos tipos de bolsos de proteínas podem se comportar de forma semelhante, mesmo que tenham uma aparência diferente. Este artigo destaca um novo método chamado DrugGPS, que visa projetar moléculas de remédio que podem se adaptar a diferentes bolsos de proteínas usando características compartilhadas, chamadas de subbolsos.
Contexto
Design de Medicamentos e Aprendizado de Máquina
O design de medicamentos evoluiu bastante ao longo dos anos. No passado, ele dependia muito da busca manual em bancos de dados de moléculas existentes para encontrar candidatos a medicamentos potenciais. Esse método é bem demorado e nem sempre eficaz para criar novas moléculas que podem ainda não existir nesses bancos de dados.
Recentemente, modelos de deep learning começaram a ser usados nesse campo. Esses modelos conseguem criar moléculas de remédio 3D diretamente considerando as características específicas dos bolsos de proteínas-alvo. No entanto, muitos modelos existentes têm dificuldade em se adaptar a novas formas de proteínas porque não conseguem reconhecer semelhanças entre diferentes bolsos.
O Papel dos Subbolsos
Subbolsos são áreas pequenas dentro de bolsos de proteínas maiores onde as moléculas do remédio realmente se ligam. Mesmo que dois bolsos de proteínas não pareçam iguais, eles podem ter subbolsos semelhantes que conseguem atrair os mesmos tipos de fragmentos de medicamentos. Reconhecer essas semelhanças é fundamental para melhorar como as moléculas de remédios podem ser projetadas para trabalhar com novos alvos de proteínas que os modelos ainda não viram.
DrugGPS: Uma Nova Abordagem
Visão Geral do DrugGPS
O DrugGPS tem como objetivo melhorar como as moléculas de remédios são desenhadas ao focar em aprender com protótipos de subbolsos. Ao entender como diferentes bolsos se relacionam uns com os outros, o modelo consegue criar moléculas de remédio que se ligam de forma eficaz a novos alvos.
O conceito principal do DrugGPS é construir um modelo que aprende com uma variedade de bolsos de proteínas e suas respectivas interações com diferentes fragmentos de medicamentos. Isso ajuda o modelo a generalizar melhor para prever como um novo remédio pode funcionar com uma proteína na qual ele ainda não foi treinado.
Principais Características do DrugGPS
Aprendizado de Protótipos de Subbolsos: O DrugGPS aprende a reconhecer subbolsos e suas relações com diferentes fragmentos de medicamentos. Focando nessas áreas menores, o modelo consegue criar candidatos a remédios mais relevantes e eficientes.
Gráfico de Interação Global: O método constrói um gráfico global que representa as interações entre subbolsos e drogas. Esse gráfico ajuda o modelo a entender como diferentes bolsos se relacionam e como os fragmentos de medicamentos podem se ligar a eles.
Codificador de Contexto Hierárquico: Essa característica permite que o modelo observe informações em pequena escala (nível atômico) e de maior escala (nível de resíduo), fornecendo uma visão abrangente de como as moléculas de remédios podem interagir com proteínas.
O Processo do DrugGPS
Preparação de Dados
Para construir um modelo poderoso, o DrugGPS é treinado em grandes conjuntos de dados que contêm pares de proteínas e os medicamentos que se ligam a elas. Os dados são processados cuidadosamente para focar em interações de alta qualidade e garantir que o modelo aprenda de forma eficaz com exemplos diversos.
Aprendendo a Gerar Moléculas
O DrugGPS aprende a gerar moléculas passo a passo. Inicialmente, o modelo observa a estrutura geral do bolso da proteína e os fragmentos de remédios disponíveis. Depois, ele decide quais partes do remédio adicionar, um fragmento de cada vez, com base no contexto existente.
Durante esse processo, várias decisões importantes são tomadas:
Seleção de Motivo Focal: O modelo identifica um fragmento foco que já está presente no remédio. Isso ajuda a guiar que tipo de fragmentos são adicionados a seguir.
Previsão de Motivo: Com base no bolso de proteína dado, o modelo prevê qual deve ser o próximo fragmento, visando aumentar a afinidade de ligação.
Previsão de Ligação: Uma vez decidido o próximo fragmento, o modelo determina como ele deve ser ligado à estrutura existente. Muitas vezes há várias formas válidas de fazer isso, e o modelo busca encontrar a melhor opção.
Previsão de Ângulo de Rotação: Por fim, o modelo prevê a rotação necessária para o novo fragmento garantir que a estrutura geral permaneça estável e funcional.
Treinando o Modelo
Treinar o DrugGPS envolve realizar simulações onde o modelo tenta gerar moléculas de medicamentos e depois verifica como bem elas se ligam às proteínas-alvo. Sempre que o modelo comete um erro, são feitas ajustes para melhorar as previsões futuras.
Ao usar técnicas como atenção multi-cabeça em um contexto baseado em gráfico, o modelo continuamente refina sua compreensão de como criar candidatos a remédios eficazes.
Validação Experimental
Testando a Capacidade de Generalização
O DrugGPS é testado sob várias condições para ver como ele se sai quando enfrenta novos bolsos de proteínas que ele não encontrou antes. Isso é crucial porque o objetivo final é que o modelo gere candidatos a remédios úteis em cenários reais, onde não pode confiar em dados anteriores.
Diferentes divisões nos dados são usadas para desafiar o modelo:
- Divisão Baseada em Sequência: Essa abordagem agrupa dados com base em semelhanças de sequência de proteínas.
- Divisão Baseada em Bolso: Esse método agrupa proteínas com base em semelhanças em seus bolsos de ligação, focando em seus aspectos estruturais.
Métricas de Desempenho
Para avaliar o DrugGPS, várias métricas são consideradas:
- Pontuação Vina: Essa pontuação mede como bem os remédios gerados conseguem se ligar aos bolsos-alvo. Pontuações mais baixas são melhores, indicando ligações mais fortes.
- Drug-likeness: O modelo verifica se as moléculas geradas têm potencial para serem medicamentos.
- Sintéticos (Dificuldade de Síntese): Essa métrica avalia quão facilmente uma determinada molécula pode ser sintetizada em um ambiente de laboratório.
Resultados
O DrugGPS demonstrou um desempenho superior em relação a vários modelos existentes na geração de moléculas de remédios que não só se ligam de forma eficaz, mas também possuem propriedades químicas desejáveis. Os experimentos mostram que o conhecimento global sobre estruturas e interações melhora significativamente o processo de geração.
Estudos de Caso e Exemplos
Candidatos a Medicamentos Bem-Sucedidos
Várias moléculas de remédios geradas foram validadas e mostraram afinidades de ligação superiores a medicamentos conhecidos. Por exemplo, os candidatos a remédios produzidos pelo DrugGPS foram comparados com medicamentos de referência, e muitos deles exibiram desempenho superior com base em várias métricas.
Diversidade e Novidade
Um dos resultados empolgantes do uso do DrugGPS é sua capacidade de gerar estruturas moleculares diversas. Isso é importante no design de medicamentos, pois abre portas para tratamentos potencialmente novos que podem não ter sido considerados antes.
Direções Futuras
Embora o DrugGPS tenha mostrado resultados promissores, ainda há áreas para melhoria. O modelo poderia ser aprimorado ainda mais integrando mais conhecimentos bioquímicos e explorando estratégias de aprendizado de máquina mais avançadas.
Outra possibilidade para desenvolvimento poderia ser estender a abordagem para outras áreas de descoberta de drogas e design de proteínas, levando potencialmente a aplicações ainda mais amplas em biotecnologia e medicina.
Conclusão
O design de medicamentos é um processo complexo, mas métodos como o DrugGPS estão tornando tudo mais eficiente e eficaz. Ao focar nas relações entre bolsos de proteínas e fragmentos de remédios, o modelo pode gerar melhores candidatos para o desenvolvimento de medicamentos. Isso representa um avanço empolgante na área, com o potencial de contribuir significativamente para futuras descobertas na medicina.
Título: Learning Subpocket Prototypes for Generalizable Structure-based Drug Design
Resumo: Generating molecules with high binding affinities to target proteins (a.k.a. structure-based drug design) is a fundamental and challenging task in drug discovery. Recently, deep generative models have achieved remarkable success in generating 3D molecules conditioned on the protein pocket. However, most existing methods consider molecular generation for protein pockets independently while neglecting the underlying connections such as subpocket-level similarities. Subpockets are the local protein environments of ligand fragments and pockets with similar subpockets may bind the same molecular fragment (motif) even though their overall structures are different. Therefore, the trained models can hardly generalize to unseen protein pockets in real-world applications. In this paper, we propose a novel method DrugGPS for generalizable structure-based drug design. With the biochemical priors, we propose to learn subpocket prototypes and construct a global interaction graph to model the interactions between subpocket prototypes and molecular motifs. Moreover, a hierarchical graph transformer encoder and motif-based 3D molecule generation scheme are used to improve the model's performance. The experimental results show that our model consistently outperforms baselines in generating realistic drug candidates with high affinities in challenging out-of-distribution settings.
Autores: Zaixi Zhang, Qi Liu
Última atualização: 2023-05-22 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2305.13997
Fonte PDF: https://arxiv.org/pdf/2305.13997
Licença: https://creativecommons.org/licenses/by-nc-sa/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.