Simple Science

Ciência de ponta explicada de forma simples

# Biologia# Biologia evolutiva

Rastreamento de Germes: Insights Genômicos sobre a Disseminação e Evolução

Explore como dados genômicos ajudam a estudar a disseminação de germes e a evolução.

― 9 min ler


Rastreamento Genômico deRastreamento Genômico dePatógenosatravés de dados genéticos.Analisando a propagação de germes
Índice

Dados genômicos ajudam a gente a estudar muitos germes prejudiciais. Esses dados estão disponíveis para vários germes em vários sites. Conseguir esses dados não é só fácil, mas também barato, principalmente para novas amostras clínicas coletadas em hospitais. Comparando o material genético desses germes, a gente consegue entender como eles causam doenças, como se espalham e como mudam com o tempo. Esse campo de estudo é conhecido como filodinâmica de patógenos.

Uma área específica dentro desse campo analisa como os germes se espalham por diferentes lugares. Essa abordagem é chamada de filogeografia de patógenos. Os pesquisadores trabalham para descobrir quantos germes vivem em diferentes áreas e como eles se movem entre esses locais.

Entendendo os Modelos Populacionais em Genética

Na genética populacional, existem modelos que ajudam a explicar como os organismos evoluem com o tempo. Alguns modelos conhecidos incluem o modelo de Wright-Fisher e o modelo de Moran. Esses modelos focam em como uma amostra de uma população herda sua ancestralidade. Quando as populações não se misturam, mas sim que são estruturadas de acordo com locais específicos, usamos uma versão modificada desses modelos.

Esse modelo modificado é conhecido como modelo coalescente estruturado. Ele ajuda os pesquisadores a entender como os genes são transmitidos através das gerações em diferentes locais. Esse modelo observa a ancestralidade de germes de várias localidades e ajuda a rastrear o movimento desses germes ao longo do tempo.

Desafios no Uso do Modelo Coalescente Estruturado

Usar o modelo coalescente estruturado para coletar informações nem sempre é fácil. A complexidade de diferentes componentes pode dificultar a criação de uma imagem clara da genealogia dos germes. Dados de alta dimensão e relacionamentos complicados aumentam ainda mais essa complexidade.

Os métodos atuais para analisar genealogias estruturadas geralmente se dividem em duas categorias. Um usa a Cadeia de Markov Monte Carlo (MCMC) para amostrar as histórias de migração com precisão, enquanto o outro é um método mais simples que faz aproximações. No entanto, o primeiro método pode ser lento e exigir muito processamento, especialmente para grandes conjuntos de dados, enquanto o último é mais fácil de usar, mas pode não oferecer resultados precisos.

A maneira mais comum de estudar como os germes se espalham geograficamente é chamada de análise de traços discretos (DTA). Nesse método, a localização dos germes é modelada como mudando ao longo dos ramos de uma árvore genética, semelhante a como ocorrem as mutações nas sequências genéticas. Embora a DTA não seja uma representação perfeita, pode ser útil para aproximar o modelo coalescente estruturado.

A Necessidade de Novas Abordagens

Muitos métodos existentes para inferir histórias de migração não são otimizados quando a filogenia já é conhecida. Para resolver esse problema, os pesquisadores costumam separar as tarefas de inferir a filogenia e as histórias de migração. Fazendo isso, eles podem se concentrar em coletar dados com base nas informações genéticas existentes, tornando o processo mais eficiente.

Essa nova abordagem permite que os pesquisadores atualizem as histórias de migração com base nas filogenias já determinadas. Eles podem fazer isso usando uma versão condicional da DTA. Ao utilizar esse método, os pesquisadores podem aplicá-lo efetivamente a vários conjuntos de dados simulados e reais, mostrando sua utilidade.

O Básico do Modelo Coalescente Estruturado

O modelo coalescente estruturado ajuda a entender a genealogia de um grupo de indivíduos que compartilham características genéticas semelhantes. Nesse modelo, cada par de linhagens pode rastrear um ancestral comum a uma certa taxa. Ao adicionar estrutura à população, os pesquisadores podem ver como essas linhagens são atribuídas a subgrupos específicos ao longo do tempo.

Sob o modelo coalescente estruturado, ocorrem três eventos principais: amostragem, coalescência e migração. Eventos de amostragem introduzem novos indivíduos no grupo, enquanto eventos de coalescência se referem a pares de linhagens que encontram um ancestral comum. Eventos de migração acontecem quando uma linhagem se move de um subgrupo para outro. Analisando esses eventos, os pesquisadores podem formar uma genealogia completa da população estudada.

Análise de Traços Discretos

A Análise de Traços Discretos (DTA) fornece uma estrutura para estudar a distribuição geográfica dos germes. Na DTA, eventos de migração são adicionados a uma árvore genética como pontos que vêm de um processo que avança. Esse método é menos exigente em termos de computação em comparação com o modelo coalescente estruturado ao avaliar a probabilidade de várias histórias.

No entanto, ao analisar eventos de migração e coalescência de forma independente, os pesquisadores podem subestimar as taxas reais de migração. Essa é uma limitação do uso da DTA sozinha, pois não captura completamente as complexidades da dinâmica coalescente estruturada.

Inferência Bayesiana

A inferência bayesiana envolve usar conhecimento prévio combinado com dados observados para estimar quão prováveis são vários cenários. No contexto do modelo coalescente estruturado, os pesquisadores buscam tirar conclusões sobre histórias de migração, taxas de migração e taxas de coalescência com base em uma árvore genética fixa.

Estabelecer distribuições prévias é crucial para obter inferências confiáveis. Diferentes métodos podem usar várias distribuições prévias, o que pode levar a resultados diferentes. Isso significa que os pesquisadores devem decidir cuidadosamente sobre os melhores priors a serem usados com base no contexto específico de seu estudo.

Técnicas de Cadeia de Markov Monte Carlo (MCMC)

A MCMC é uma técnica poderosa usada para amostrar de distribuições complexas. No caso de modelos coalescentes estruturados, a MCMC pode ajudar os pesquisadores a gerar amostras de histórias de migração e parâmetros evolutivos. Isso envolve diferentes operadores para atualizar esses parâmetros.

Para avaliar parâmetros evolutivos, são usados dois tipos de atualizações de Gibbs. Ao empregar essas atualizações, os pesquisadores podem calcular distribuições condicionais e obter insights sobre a ancestralidade e as histórias de migração dos patógenos.

Atualizações de História de Migração

Atualizar histórias de migração é uma parte vital da análise de modelos coalescentes estruturados. Os pesquisadores precisam de métodos eficazes para gerar propostas para essas atualizações com base nos parâmetros evolutivos atuais. Amostrando de subárvores específicas da árvore genética, eles podem simular processos de migração considerando a demografia presente em cada ponto.

Esse processo envolve uma abordagem passo a passo detalhada, que combina filtragem reversa e técnicas de amostragem para frente. Essas etapas permitem que os pesquisadores calculam efetivamente a distribuição de demes em diferentes pontos na árvore.

Importância da Seleção de Subárvore

Escolher qual subárvore atualizar impacta a eficiência da análise. Selecionar subárvores maiores pode tornar as atualizações mais complicadas por causa do número de eventos que contêm. Uma abordagem equilibrada é essencial para garantir que as atualizações se mantenham viáveis em termos de computação.

Amostragem de Nó Coalescente

Uma vez que uma subárvore é selecionada, os pesquisadores podem começar a atualizar o deme em cada evento coalescente. Utilizando técnicas de propagação de crenças, eles podem calcular distribuições condicionais em cada ponto da árvore. Isso ajuda a garantir que o deme selecionado seja consistente com as informações contextuais ao redor.

Amostragem de História de Migração

O passo final na atualização das histórias de migração envolve amostrar ao longo dos ramos da subárvore selecionada. Ao empregar a DTA, os pesquisadores podem obter realizações de processos de Markov com base nos demes fixos presentes. Esse processo gera uma história de migração que reflete com precisão as relações entre as linhagens amostradas.

Avaliando Probabilidades de Aceitação

Depois de propor atualizações de histórias de migração, é necessário avaliar a probabilidade de aceitação para determinar sua validade. Usando métodos da MCMC, os pesquisadores podem calcular a razão de aceitação e garantir que suas propostas de atualizações sejam viáveis dentro do contexto do modelo coalescente estruturado.

Implementação de Técnicas de MCMC

Os pesquisadores implementaram essas técnicas em pacotes de software independentes, que podem ser usados para inferência com o modelo coalescente estruturado. Essas ferramentas permitem que os pesquisadores aproveitem os métodos discutidos anteriormente, facilitando a análise das histórias de migração e parâmetros evolutivos.

Aplicações Práticas

As metodologias discutidas foram cuidadosamente testadas em conjuntos de dados simulados e dados empíricos publicados anteriormente. Essas aplicações demonstraram a eficiência das novas abordagens em vários contextos.

Conclusão

Neste artigo, discutimos a importância dos dados genômicos para entender organismos patogênicos. O modelo coalescente estruturado e suas aplicações na análise de histórias de migração mostraram grande potencial. Ao empregar técnicas inovadoras, os pesquisadores podem obter insights mais profundos sobre como os germes se espalham entre as populações e evoluem ao longo do tempo.

Os pesquisadores estão continuamente refinando essas metodologias para garantir que proporcionem resultados confiáveis. Combinando métodos estatísticos inovadores com o conhecimento existente, podemos aprimorar nossa compreensão da evolução dos patógenos e informar respostas de saúde pública.

Fonte original

Título: Bayesian Inference of Pathogen Phylogeography using the Structured Coalescent Model

Resumo: Over the past decade, pathogen genome sequencing has become well established as a powerful approach to study infectious disease epidemiology. In particular, when multiple genomes are available from several geographical locations, comparing them is informative about the relative size of the local pathogen populations as well as past migration rates and events between locations. The structured coalescent model has a long history of being used as the underlying process for such phylogeographic analysis. However, the computational cost of using this model does not scale well to the large number of genomes frequently analysed in pathogen genomic epidemiology studies. Several approximations of the structured coalescent model have been proposed, but their effects are difficult to predict. Here we show how the exact structured coalescent model can be used to analyse a precomputed dated phylogeny, in order to perform Bayesian inference on the past migration history, the effective population sizes in each location, and the directed migration rates from any location to another. We describe an efficient reversible jump Markov Chain Monte Carlo scheme which is implemented in a new R package. We use simulations to demonstrate the scalability and correctness of our method and to compare it with existing comparable software. We also applied our new method to several state-of-the-art datasets on the population structure of real pathogens to showcase the relevance of our method to current data scales and research questions.

Autores: Xavier Didelot, I. Roberts, R. G. Everitt, J. Koskela

Última atualização: 2024-10-17 00:00:00

Idioma: English

Fonte URL: https://www.biorxiv.org/content/10.1101/2024.10.14.617553

Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.10.14.617553.full.pdf

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes