ModiFinder: Uma Nova Ferramenta para Identificar Modificações Químicas
O ModiFinder ajuda a localizar modificações químicas em pequenas moléculas usando dados de espectrometria de massa.
― 6 min ler
Índice
As Modificações químicas em pequenas moléculas podem ser difíceis de identificar. Os pesquisadores costumam usar técnicas como Espectrometria de Massa em tandem (MS/MS) pra analisar e entender essas estruturas químicas. No entanto, interpretar os dados de MS/MS pra descobrir a estrutura exata dessas moléculas pequenas não é uma tarefa fácil. Até 87% dos espectros gerados em certos experimentos ficam sem identificação.
Pra resolver esse problema, os cientistas desenvolveram métodos que envolvem comparar espectros de compostos conhecidos com os de substâncias desconhecidas. Essas abordagens podem conectar compostos conhecidos com estruturas semelhantes a compostos desconhecidos. Mas, enquanto esses métodos mostram semelhanças, eles muitas vezes deixam as diferenças específicas abertas à interpretação. Isso pode ser bem demorado pra quem trabalha com química, já que precisam analisar os dados manualmente.
Pra melhorar esse processo, foi criado um novo tool chamado ModiFinder. Esse tool tem o objetivo de ajudar a determinar onde uma modificação pode estar em um composto desconhecido em comparação a uma estrutura conhecida. Comparando os espectros de massa dos dois compostos, o ModiFinder ajuda a indicar a probabilidade de diferentes partes da molécula serem o local da modificação.
Como o ModiFinder Funciona
O ModiFinder pega os espectros MS/MS de um composto conhecido e de um desconhecido, além da estrutura 2D do composto conhecido. Ele começa identificando áreas potenciais no composto conhecido que podem mostrar semelhanças estruturais com o desconhecido.
Primeiro, os dados MS/MS são limpos, removendo picos de baixa intensidade e normalizando os dados pra reduzir o ruído. Depois, o ModiFinder identifica picos correspondentes entre os espectros conhecido e desconhecido. Picos que mudam de massa são anotados como deslocados, enquanto os que permanecem iguais são considerados não deslocados.
Pra cada pico dos espectros, o ModiFinder atribui um conjunto de possíveis Subestruturas baseado na estrutura do composto conhecido. Isso segue um processo conhecido como fragmentação combinatória. As subestruturas de cada pico são analisadas pra ver como se relacionam com os deslocamentos de massa observados.
Quando um pico muda, isso sugere que a área ligada a esse pico pode conter o local da modificação. Por outro lado, picos que não se deslocam são considerados menos prováveis de conter a modificação. As pontuações que indicam a probabilidade de onde ocorre uma modificação são calculadas pra cada átomo da estrutura conhecida. Pontuações mais altas sugerem uma maior probabilidade de que aquele átomo seja o local da modificação.
No final, o ModiFinder produz uma distribuição de pontuações de probabilidade, destacando as áreas mais prováveis onde a modificação pode estar localizada na estrutura do composto conhecido.
Avaliação de Desempenho
Pra avaliar como o ModiFinder funciona, os pesquisadores usaram pares de compostos conhecidos que tinham apenas uma modificação estrutural. Ao comparar o desempenho do ModiFinder com métodos de seleção aleatória e outras ferramentas de previsão, a eficácia do tool pôde ser medida.
A avaliação focou em duas áreas principais: quão perto os locais de modificação previstos estavam dos locais reais e quão informativas eram as previsões. O tool se mostrou melhor que escolhas aleatórias na identificação de locais de modificação.
Várias versões do ModiFinder foram testadas. A versão básica funcionou bem, mas foi aprimorada com refinamentos que consideravam fórmulas moleculares e compostos relacionados. Uma versão "oracle" do tool usou locais de modificação conhecidos pra obter desempenho ainda melhor.
Mais de 12.000 pares de compostos foram analisados, sendo que uma parte significativa mostrou pelo menos um pico deslocado. Os resultados indicaram que a presença desses picos deslocados era essencial pra identificar com precisão os locais de modificação.
A Importância dos Picos Deslocados
Os achados destacaram a importância dos picos deslocados na determinação dos locais de modificação. Espectros com picos deslocados geralmente apresentaram melhor desempenho na identificação de onde ocorreram as modificações. Quanto mais picos deslocados, melhor tendia a ser o desempenho do ModiFinder.
Mesmo com a complexidade aumentada na interpretação dos dados, ter mais picos deslocados levou a um conjunto mais rico de potenciais subestruturas a considerar, reduzindo a sobreposição nas interpretações. Isso, por sua vez, ajudou a melhorar a precisão em apontar onde as modificações provavelmente aconteceriam.
Desafios com Ambiguidade
Um dos desafios contínuos para o ModiFinder era a ambiguidade potencial que surgia durante o processo de anotação de subestruturas. Fragmentações mais detalhadas às vezes resultavam em maior ambiguidade, dificultando a identificação dos verdadeiros locais de modificação. Isso era particularmente evidente em estruturas simétricas, onde muitos átomos podiam parecer igualmente prováveis de serem o local da modificação.
Pra combater isso, os pesquisadores usaram estratégias pra reduzir essa ambiguidade, como refinamento das atribuições de subestruturas com assistência computacional. Esses passos resultaram em identificações mais claras do local da modificação.
Interface do Usuário e Especialização do Domínio
Pra tornar o tool mais acessível, uma interface web amigável foi desenvolvida. Essa interface permite que especialistas aproveitem seu conhecimento, ajudando a eliminar potenciais subestruturas incorretas com base em sua experiência. A combinação da entrada do usuário com os achados computacionais do ModiFinder levou a previsões melhoradas.
Nas aplicações práticas, especialistas do domínio usaram com sucesso o tool pra identificar modificações em produtos naturais complexos. Refinando os locais previstos com base em sua compreensão da química dos compostos, eles conseguiram aumentar significativamente a precisão na localização.
Aplicações do Mundo Real
As capacidades do ModiFinder se estendem a vários campos que utilizam espectrometria de massa pra análise, incluindo toxicologia, farmacologia e descoberta de drogas. O potencial do tool pra ajudar na identificação de modificações químicas pode levar a melhores insights sobre produtos naturais e seus derivados.
Por exemplo, pesquisadores investigaram dois produtos naturais, Kirromycin e Naphthomycin B, utilizando o ModiFinder pra localizar modificações estruturais com sucesso notável. Ambos os casos mostraram como as previsões computacionais combinadas com insights de especialistas poderiam resultar em pontuações de localização mais altas, mostrando as vantagens práticas de usar o ModiFinder na pesquisa.
Conclusão
O desafio de identificar e localizar modificações químicas em pequenas moléculas é significativo, mas tools como o ModiFinder podem simplificar esse processo. Ao automatizar partes da análise e permitir um refinamento por especialistas, o ModiFinder pode aumentar bastante a eficiência e a precisão na identificação de pequenas moléculas.
O desenvolvimento contínuo de técnicas pra melhorar a fragmentação MS/MS e os métodos de aquisição de dados provavelmente continuará a apoiar o crescimento de tools como o ModiFinder. À medida que a área da espectrometria de massa evolui, o potencial pra aplicação mais ampla desses métodos computacionais em vários domínios científicos continua promissor.
Título: ModiFinder: Tandem Mass Spectral Alignment Enables Structural Modification Site Localization
Resumo: Untargeted tandem mass spectrometry (MS/MS) has become a high-throughput method to measure small molecules in complex samples. One key goal is the transformation of these MS/MS spectra into chemical structures. Computational techniques such as MS/MS library search have enabled the re-identification of known compounds. Analog library search and molecular networking extend this identification to unknown compounds. While there have been advancements in metrics for the similarity of MS/MS spectra of structurally similar compounds, there is still a lack of automated methods to provide site specific information about structural modifications. Here we introduce ModiFinder that leverages the alignment of peaks in MS/MS spectra between structurally related known and unknown small molecules. Specifically, ModiFinder focuses on shifted MS/MS fragment peaks in the MS/MS alignment. These shifted peaks putatively represent substructures of the known molecule that contain the site of the modification. ModiFinder synthesizes these information together and scores the likelihood for each atom in the known molecule to be the modification site. We demonstrate in this manuscript how ModiFinder can effectively localize modifications which extends the capabilities of MS/MS analog searching and molecular networking to accelerate the discovery of novel compounds.
Autores: Mingxun Wang, M. R. Z. Shahneh, M. Strobel, G. A. Vitale, C. Geibel, Y. El Abiead, N. Garg, A. T. Aron, V. V. Phelan, D. Petras
Última atualização: 2024-02-21 00:00:00
Idioma: English
Fonte URL: https://www.biorxiv.org/content/10.1101/2024.02.17.580849
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.02.17.580849.full.pdf
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.