Nova Método Melhora Análise de Mudanças de Trait
O HyperTraPS-CT avança a compreensão dos processos de acumulação em várias áreas científicas.
― 8 min ler
Índice
Em várias áreas como biologia, medicina e física, os pesquisadores estudam processos de acumulação. Esses processos envolvem a coleta ou perda de certas Características ao longo do tempo. Eles podem ser vistos em coisas como a evolução das espécies ou como as doenças progridem em pacientes. As características podem ser tão simples quanto Mutações genéticas em um paciente com câncer ou sintomas específicos mostrados por alguém com uma doença.
Ao descobrir como essas características mudam com o tempo, os cientistas podem aprender mais sobre os mecanismos por trás desses processos. Eles também podem fazer previsões sobre características que ainda não foram medidas e estimar como os sistemas podem se comportar no futuro. Essa abordagem ajuda a identificar características que impulsionam o progresso através de caminhos de acumulação ou que são influenciadas por ele.
O Estudo das Características Evolutivas
A investigação de como as características mudam ao longo do tempo em espécies relacionadas tem uma longa história. No entanto, encontrar métodos gerais que funcionem bem para grandes conjuntos de Dados pode ser bem complicado. Muitos métodos foram criados para ajudar a visualizar essas mudanças, como construir árvores filogenéticas ou analisar a dinâmica das características nessas árvores. Alguns desses métodos estão incluídos em ferramentas de software populares.
Por outro lado, uma área separada de pesquisa foca em como as características se acumulam na progressão do câncer. Essas abordagens geralmente descrevem como as mutações acontecem ao longo do tempo. Alguns métodos clássicos se baseiam em modelos de Markov, que examinam Transições entre diferentes estados da doença com base em observações. Os pesquisadores também usaram redes bayesianas para analisar essas características em estudos de câncer.
Novos Métodos para Análise de Dados
Para enfrentar os desafios da análise de grandes conjuntos de dados, um novo método chamado HyperTraPS foi desenvolvido. Esse método não faz suposições rigorosas sobre os estados das características ou a independência de suas aquisições. Ele funciona dentro de uma estrutura bayesiana, que permite a incorporação de conhecimento prévio e incerteza.
HyperTraPS se concentra nas transições entre estados em vez de observações individuais. Isso o torna útil para trabalhar com dados longitudinais, dados filogenéticos ou amostras transversais. Ele usa um método de amostragem que analisa caminhos que provavelmente seriam vistos em transições reais. Isso é mais eficiente em comparação com outros métodos que podem ter dificuldades com conjuntos de dados maiores.
Além do HyperTraPS, dois métodos relacionados chamados inferência de paisagem fenotípica e HyperHMM foram desenvolvidos. Esses métodos expandiram os tipos de interações permitidas entre as características analisadas. Enquanto o HyperTraPS é eficaz em identificar novos caminhos na progressão do câncer, sua flexibilidade também permitiu aplicações em várias outras áreas.
Conectando Dados e Tempo
Uma diferença significativa entre os vários métodos está em como eles lidam com o tempo. Algumas abordagens usam um tempo de amostragem implícito que estabelece uma escala de tempo contínua para as dinâmicas inferidas. Outros, como o HyperTraPS, consideram apenas a ordem das transições sem focar no tempo.
No entanto, em muitos estudos, há algum grau de informação temporal disponível. Isso pode ser na forma de comprimentos de ramos em árvores filogenéticas. Como as mudanças podem ocorrer em momentos desconhecidos, é crucial considerar a incerteza em torno desses tempos de observação.
Para lidar com isso, o HyperTraPS foi estendido para o HyperTraPS-CT. Esse novo método incorpora tempos absolutos, que podem ser especificados com precisão ou representados como uma faixa de valores possíveis. O HyperTraPS-CT mantém as vantagens do método HyperTraPS original ao mesmo tempo que adiciona a capacidade de utilizar informações temporais.
Como o HyperTraPS-CT Funciona
O HyperTraPS-CT analisa estados observados descritos pela presença ou ausência de características binárias. Cada característica pode ser representada como uma parte de uma string binária, onde '1' indica a presença e '0' indica a ausência daquela característica. O método permite transições entre esses estados a uma taxa definida.
Usando dados observados, o HyperTraPS-CT pode calcular a probabilidade de passar de um estado para outro ao longo de janelas de tempo definidas. Embora possa lidar com a complexidade total de caminhos em pequenos conjuntos de dados, conjuntos de dados maiores podem exigir técnicas de amostragem para se concentrar nas transições mais prováveis.
O algoritmo constrói caminhos que são compatíveis com o estado final, reduzindo o desperdício computacional ao evitar caminhos que não correspondem às observações. Esse processo eficiente permite que os pesquisadores estimem as probabilidades de transição e identifiquem caminhos relevantes de mudança.
Inferência Dinâmica e Previsões
Uma vez que a probabilidade de transições é estabelecida, os pesquisadores podem explorar diferentes estruturas de parâmetros para entender melhor as dinâmicas em jogo. O HyperTraPS-CT pode acomodar vários modelos que descrevem como as características influenciam umas às outras com base em sua estrutura.
Essa flexibilidade permite que os cientistas analisem dados de diferentes fontes, como conjuntos de dados transversais ou longitudinais. O método também pode incorporar informações prévias para refinar os resultados da análise.
Além disso, o HyperTraPS-CT inclui um conjunto de saídas que fornecem insights sobre as dinâmicas subjacentes das características estudadas. Isso inclui ordens de transições, escalas de tempo esperadas e estados previstos em vários momentos no tempo.
Aplicações no Mundo Real
O HyperTraPS e suas extensões foram aplicados com sucesso em várias áreas, incluindo o estudo da progressão do câncer e a evolução da resistência antimicrobiana na tuberculose.
Por exemplo, pesquisadores usaram o HyperTraPS-CT para avaliar como as mutações se acumulam na leucemia mieloide aguda. Os métodos identificam caminhos de aquisição de mutações, revelando insights sobre como o câncer evolui ao longo do tempo. Os resultados mostraram uma ordenação consistente de mutações e identificaram interações entre diferentes caminhos de mutação.
Em outra aplicação, o HyperTraPS-CT foi usado para analisar a evolução da resistência a drogas na tuberculose. Usando um conjunto de dados que rastreia cepas bacterianas, os pesquisadores puderam inferir os caminhos de aquisição de resistência a drogas. Ao considerar informações temporais contínuas, eles descobriram dinâmicas importantes que métodos discretos tradicionais poderiam perder.
Previsões e Direções Futuras
O HyperTraPS-CT não apenas ajuda na análise de dados existentes, mas também na realização de previsões sobre comportamentos futuros. Por exemplo, com base nos dados observados, o método pode prever a próxima resistência provável a se desenvolver nas cepas bacterianas.
Os pesquisadores testaram as capacidades preditivas do HyperTraPS-CT treinando modelos em subconjuntos de dados. Eles descobriram que o modelo poderia prever com precisão os próximos passos na aquisição de características. Além disso, poderia inferir características não vistas a partir de dados parcialmente observados, demonstrando sua utilidade em aplicações do mundo real.
A flexibilidade do HyperTraPS-CT também permite que os cientistas explorem interações de ordem superior, que podem contribuir para a compreensão de dinâmicas complexas em processos de acumulação. À medida que mais dados se tornam disponíveis e os métodos evoluem, o HyperTraPS-CT e abordagens semelhantes continuarão a se adaptar, encontrando aplicações em uma gama mais ampla de questões científicas.
Conclusão
Processos de acumulação são fundamentais para entender mudanças em características em áreas como biologia e medicina. Com métodos como o HyperTraPS-CT, os pesquisadores podem analisar estruturas de dados complexas e fazer previsões sobre dinâmicas de características ao longo do tempo. Ao incorporar informações temporais e permitir flexibilidade nas fontes de dados, esses novos métodos aprimoram nossa capacidade de estudar e entender os mecanismos subjacentes que impulsionam esses processos.
Título: HyperTraPS-CT: Inference and prediction for accumulation pathways with flexible data and model structures
Resumo: Accumulation processes, where many potentially coupled features are acquired over time, occur throughout the sciences, from evolutionary biology to disease progression, and particularly in the study of cancer progression. Existing methods for learning the dynamics of such systems typically assume limited (often pairwise) relationships between feature subsets, cross-sectional or untimed observations, small feature sets, or discrete orderings of events. Here we introduce HyperTraPS-CT (Hypercubic Transition Path Sampling in Continuous Time) to compute posterior distributions on continuous-time dynamics of many, arbitrarily coupled, traits in unrestricted state spaces, accounting for uncertainty in observations and their timings. We demonstrate the capacity of HyperTraPS-CT to deal with cross-sectional, longitudinal, and phylogenetic data, which may have no, uncertain, or precisely specified sampling times. HyperTraPS-CT allows positive and negative interactions between arbitrary subsets of features (not limited to pairwise interactions), supporting Bayesian and maximum-likelihood inference approaches to identify these interactions, consequent pathways, and predictions of future and unobserved features. We also introduce a range of visualisations for the inferred outputs of these processes and demonstrate model selection and regularisation for feature interactions. We apply this approach to case studies on the accumulation of mutations in cancer progression and the acquisition of anti-microbial resistance genes in tuberculosis, demonstrating its flexibility and capacity to produce predictions aligned with applied priorities.
Autores: Iain Johnston, O. N. L. Aga, M. Brun, K. Giannakis, K. A. Dauda, R. Diaz-Uriarte
Última atualização: 2024-03-12 00:00:00
Idioma: English
Fonte URL: https://www.biorxiv.org/content/10.1101/2024.03.07.583841
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.03.07.583841.full.pdf
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.