Simple Science

Ciência de ponta explicada de forma simples

# Biologia# Farmacologia e Toxicologia

Desafios na Triagem Virtual para Descoberta de Medicamentos

Métodos atuais que usam impressões digitais moleculares enfrentam limitações significativas no desenvolvimento de medicamentos.

― 7 min ler


Limitações da TriagemLimitações da TriagemVirtualprever a atividade dos remédios.Impressões moleculares não dão conta de
Índice

A triagem virtual é uma técnica usada no desenvolvimento de medicamentos pra encontrar moléculas pequenas que possam se ligar a um alvo específico no corpo, como uma proteína. Com os avanços na tecnologia, os pesquisadores agora conseguem pesquisar bilhões de moléculas candidatas pra encontrar as que provavelmente vão funcionar. Um método comum é começar com um grupo pequeno de moléculas ativas conhecidas e procurar outras com estruturas similares.

Princípio da Propriedade Similar

Uma ideia chave por trás dessa abordagem é o chamado princípio da propriedade similar (PPS). O PPS sugere que moléculas pequenas com estruturas parecidas geralmente têm propriedades biológicas semelhantes. Esse princípio é intuitivo e tem sido a base pra prever como uma molécula pode se comportar em ambientes biológicos, incluindo sua atividade e toxicidade. Porém, medir esse princípio de forma objetiva pode ser complicado. Diferentes tipos de similaridade podem ser relevantes, dependendo do que tá sendo analisado. Por exemplo, certos tipos de relações estrutura-atividade podem focar em partes específicas de uma molécula, enquanto outros consideram a estrutura como um todo.

Impressões Moleculares

O primeiro passo pra comparar moléculas pequenas é criar o que chamamos de impressão molecular. Essa impressão é como um código único que captura as características estruturais e químicas da molécula. Depois de gerar essas impressões, os pesquisadores as comparam pra ver quais moléculas são similares. A suposição é que se duas moléculas têm impressões similares, elas também podem ter funções biológicas parecidas. Esse método teve algum sucesso em prever propriedades como solubilidade e partição, embora não funcione sempre bem pra prever como uma molécula vai interagir com um alvo.

Contexto e Regiões de Ligação

É importante notar que a atividade biológica de uma molécula depende muito das interações com proteínas específicas. Cada proteína tem regiões de ligação únicas, e essas diferenças fazem com que a mesma molécula se comporte de maneiras bem diferentes ao interagir com proteínas diferentes. Por isso, depender apenas de impressões moleculares pode não ser suficiente pra capturar a diversidade das interações biológicas. Essa limitação trouxe dúvidas sobre a eficácia de usar impressões pra prever quais moléculas vão se ligar efetivamente.

Limitações dos Métodos Atuais

Embora existam limitações conhecidas ao usar impressões moleculares baseadas no PPS, esse método ainda é bastante utilizado no desenvolvimento de medicamentos. A simplicidade e a rapidez da triagem virtual baseada em impressões a tornam atraente, mesmo que nem sempre leve a previsões eficazes da atividade dos medicamentos. Diferentes tipos de impressões moleculares foram desenvolvidos pra ajudar a identificar moléculas pequenas ativas a partir de grandes bibliotecas, mas os resultados variam, e não há uma abordagem única que funcione pra todos.

Avaliando Impressões

Vários tipos de impressões podem ser classificados com base em como codificam as informações moleculares, incluindo características lineares, características circulares e subestruturas pré-definidas. Cada um desses métodos calcula uma representação única das moléculas. Pra avaliar quão bem essas impressões funcionam na prática, os pesquisadores usam conjuntos de dados de benchmark que incluem compostos ativos e inativos conhecidos. Cada conjunto de dados pode diferir nos tipos de moléculas que inclui, o que pode influenciar os resultados.

Métricas de Avaliação da Triagem Virtual

Pra avaliar quão bem um método de triagem virtual funciona, os pesquisadores frequentemente analisam sua capacidade de identificar corretamente moléculas ativas. Um jeito comum de fazer isso é através da curva de característica operacional do receptor (ROC), que observa o equilíbrio entre verdadeiros positivos (identificações corretas) e falsos positivos (identificações erradas). Um método aleatório teria uma pontuação em torno de 0,5 nessa curva, enquanto um método perfeito teria uma pontuação de 1,0. Porém, na realidade, os pesquisadores muitas vezes querem que o método identifique rapidamente moléculas ativas em meio a uma grande quantidade de inativas, então métricas simples podem não capturar completamente a eficácia de um método de triagem.

Pra resolver isso, algumas métricas alternativas foram desenvolvidas pra avaliar melhor o enriquecimento inicial de compostos ativos. Uma dessas medidas é chamada de fator de retenção de iscas (DRF), que mostra quão bem um método consegue filtrar compostos inativos mantendo os ativos. Essa medida pode ser mais fácil de interpretar e mais consistente entre diferentes conjuntos de dados.

Desempenho das Estratégias de Impressão

Os pesquisadores realizaram um estudo que analisou quão bem diferentes métodos de impressão conseguiam identificar moléculas ativas. Eles calcularam as semelhanças de vários compostos em relação às moléculas ativas conhecidas e compararam o desempenho de diferentes tipos de impressões em múltiplos conjuntos de dados de benchmark. Os resultados mostraram que a maioria das impressões teve um desempenho ruim, com muitas com pontuações abaixo dos níveis aceitáveis tanto para as medidas ROC quanto DRF. Isso sugere que as estratégias de impressão não estão enriquecendo efetivamente moléculas ativas em grandes bibliotecas.

Distribuições de Similaridade

Pra entender melhor as distribuições de similaridade entre moléculas ativas e inativas, os pesquisadores analisaram coeficientes de Tanimoto para pares de moléculas. Eles descobriram que, em muitos casos, as similaridades entre pares ativos-ativos se sobrepunham significativamente às similaridades entre pares ativos-inativos. Isso significa que muitas vezes era difícil distinguir entre esses dois grupos apenas com base em suas impressões moleculares.

Algumas impressões mostraram um pequeno grupo de moléculas ativas de alta similaridade, dando uma falsa impressão de que poderia ser possível estabelecer um ponto de corte pra selecionar apenas compostos ativos. Porém, mesmo com um ponto de corte alto, um número significativo de compostos inativos também deveria ter pontuações acima desse limite, levando a um alto risco de falsos positivos.

Avaliação em Moléculas Inativas Confirmadas

Outro conjunto de dados foi examinado pra fornecer insights sobre a eficácia da similaridade das impressões pra prever atividade. Esse conjunto incluía um grande número de compostos que tinham sido confirmados como inativos. Nesse caso, os pesquisadores descobriram que mesmo comparando compostos ativos com esse conjunto de compostos inativos, havia pouca evidência de poder preditivo das impressões.

Correlação com Potência

Além de avaliar a capacidade das impressões de identificar compostos ativos, os pesquisadores também avaliaram se a similaridade das impressões estava correlacionada com a potência das moléculas ativas. Ao analisar um conjunto de dados específico, eles descobriram que a correlação entre a similaridade das impressões e a potência dos compostos era geralmente fraca. Isso indica que ter uma alta similaridade de impressão não significa que um composto será mais eficaz ou potente.

Conclusão

Em conclusão, enquanto os métodos computacionais oferecem oportunidades empolgantes pra descobrir novos candidatos a medicamentos, as abordagens atuais que usam impressões moleculares mostraram limitações significativas. Esses métodos têm dificuldade em distinguir de maneira confiável compostos ativos de inativos, o que é crucial no desenvolvimento de medicamentos. Esforços futuros devem focar em encontrar maneiras melhores de representar moléculas, especialmente aquelas que considerem o contexto de suas interações com alvos específicos. Enfatizar as propriedades da superfície molecular e se afastar de representações simplistas de impressões pode ser a chave pra melhorar a eficácia da triagem virtual na descoberta de medicamentos.

Fonte original

Título: Do molecular fingerprints identify diverse active drugs in large-scale virtual screening? (no)

Resumo: Computational approaches for small-molecule drug discovery now regularly scale to consideration of libraries containing billions of candidate small molecules. One promising approach to increased speed in evaluating billion-molecule libraries is to develop succinct representations of each molecule that enable rapid identification of molecules with similar properties. Molecular fingerprints are thought to provide a mechanism for producing such representations. Here, we explore the utility of commonly-used fingerprints in the context of predicting similar molecular activity. We show that fingerprint similarity provides little discriminative power between active and inactive molecules for a target protein based on a known active - while they may sometimes provide some enrichment for active molecules in a drug screen, a screened dataset will still be dominated by inactive molecules. We also demonstrate that high-similarity actives appear to share a scaffold with the query active, meaning that they could more easily be identified by structural enumeration. Furthermore, even when limited to only active molecules, fingerprint similarity values do not correlate with compound potency. In sum, these results highlight the need for a new wave of molecular representations that will improve the capacity to detect biologically active molecules based on similarity to other such molecules.

Autores: Vishwesh Venkatraman, A. Roy, D. Demekas, J. Gaiser, R. Xiong, T. Wheeler

Última atualização: 2024-06-08 00:00:00

Idioma: English

Fonte URL: https://www.biorxiv.org/content/10.1101/2022.09.20.508800

Fonte PDF: https://www.biorxiv.org/content/10.1101/2022.09.20.508800.full.pdf

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes