Novo Método Melhora o Rastreamento da Disseminação de Doenças
Apresentando o BREATH, uma nova ferramenta pra analisar a transmissão de doenças usando dados de sequenciamento de genoma completo.
― 11 min ler
Índice
- Desafios no Rastreamento da Transmissão
- Métodos para Reconstituir a Transmissão
- BREATH: Um Novo Método
- Mapeando a Transmissão em Árvores Filogenéticas
- Como Funciona a Decomposição Bayesiana
- Considerando Dinâmicas de Transmissão e Amostragem
- Probabilidade para Hospedeiros Individuais
- Abordando Cadeias de Transmissão Não Amostradas
- Usando MCMC pra Atualizações de Parâmetros
- Analisando um Surto de TB
- Implicações das Descobertas
- Direções Futuras
- Conclusão
- Fonte original
- Ligações de referência
O sequenciamento de genoma completo (WGS) é um método que analisa todo o código genético dos organismos, incluindo patógenos que causam doenças. Esse método tá sendo usado cada vez mais pra rastrear doenças infecciosas em humanos e animais. Com o custo do WGS caindo e sua utilidade em entender como as doenças se espalham, muitos pesquisadores tão apostando nele por várias razões.
Com os dados do WGS, os cientistas conseguem melhorar o conhecimento sobre como as doenças são transmitidas, encontrar conexões entre diferentes surtos que talvez não tivessem sido ligadas antes, entender quando as transmissões rolam e identificar pares prováveis de hospedeiros envolvidos na propagação da doença. Essa informação também pode destacar fatores de risco para a disseminação das doenças, tanto relacionados ao hospedeiro quanto à cepa específica do patógeno.
Desafios no Rastreamento da Transmissão
Apesar das percepções úteis dos dados do WGS, ainda pode rolar uma incerteza sobre quem infectou quem. Em muitos casos, pares de indivíduos podem compartilhar material genético muito similar, ou até idêntico, do patógeno. Isso acontece muito em infecções duradouras como a tuberculose. Nesses casos, um hospedeiro pode carregar várias formas diferentes do patógeno, o que gera confusão na hora de tentar ligar infecções a hospedeiros específicos.
O timing também pode ser enganoso; saber quando surgiram os sintomas ou quando um caso foi detectado nem sempre ajuda a determinar quando a infecção real aconteceu. Pode haver outros hospedeiros envolvidos que não foram observados ou sequenciados, o que adiciona mais complexidade pra entender quem infectou quem. Esses problemas apresentam desafios significativos em descobrir os padrões de transmissão de doenças, mas os dados do WGS continuam sendo uma fonte valiosa de informação sobre a história das infecções, pois variações genéticas podem fornecer pistas importantes.
Métodos para Reconstituir a Transmissão
Pra lidar com esses desafios, vários métodos foram desenvolvidos pra reconstituir quem infectou quem, o que chamamos de Árvore de Transmissão, usando dados WGS de patógenos. Alguns exemplos desses métodos são Outbreaker2, TransPhylo e BEASTLIER. Cada um desses métodos tem pontos fortes e fracos diferentes. Por exemplo, o Outbreaker2 combina dados genéticos e Epidemiológicos e pode considerar hospedeiros que não foram amostrados, mas não leva em conta a diversidade dentro de um hospedeiro. O TransPhylo inclui essa consideração, mas precisa de uma árvore fixa pra trabalhar. O BEASTLIER e o phybreak estimam tanto as árvores genéticas quanto as de transmissão juntas, mas não permitem hospedeiros não amostrados.
As Árvores Filogenéticas são cruciais pra analisar dados de sequência porque usam modelos complexos que consideram variações em como as mudanças genéticas acontecem. Essas árvores podem ajudar a melhorar nossa compreensão e reconstituição das rotas de transmissão. Contudo, ao lidar com períodos curtos, pode não haver mudanças genéticas suficientes pra criar uma árvore filogenética confiável.
Pra gerenciar a incerteza nas árvores filogenéticas, o TransPhylo foi adaptado pra analisar várias árvores ao mesmo tempo. Esse processo exige bastante tempo e pode não capturar totalmente a incerteza das árvores filogenéticas reais. Portanto, é importante incluir conhecimento prévio sobre como a transmissão ocorre antes de fazer a análise filogenética.
BREATH: Um Novo Método
Apresentamos um novo método chamado Análise Bayesiana de Reconstituição e Evolução de Histórias de Transmissão (BREATH). Esse método estimula tanto os eventos de transmissão quanto a árvore filogenética ao mesmo tempo, levando em conta hospedeiros não amostrados e a diversidade encontrada dentro de um hospedeiro. Fazendo isso, ele permite que informações sobre o processo de transmissão, como o tempo provável entre infecções e a probabilidade de transmissão de pessoa pra pessoa ou de fazenda pra fazenda, influenciem a árvore filogenética.
O método usa uma abordagem específica pra entender as relações entre as árvores e os parâmetros que regem a propagação do patógeno. O BREATH integra diferentes tipos de informação em uma única estrutura, facilitando a análise de dinâmicas complexas de transmissão.
Mapeando a Transmissão em Árvores Filogenéticas
O BREATH usa uma técnica pra anotar uma árvore filogenética com uma árvore de transmissão, utilizando um método semelhante a "colorir". Nesse contexto, cada ponto na árvore filogenética tá ligado a um hospedeiro específico, seja esse hospedeiro amostrado ou não. Um aspecto importante desse método envolve diferenciar entre hospedeiros individuais não amostrados e aqueles que pertencem a cadeias de hospedeiros não amostrados.
Pra esclarecer a terminologia, usamos "ancestral à amostra" (ATTS) pra hospedeiros que têm pelo menos um hospedeiro em sua linhagem que foi amostrado. Os hospedeiros podem ser separados por vários outros hospedeiros nessa linhagem. "Multiplicamente ancestral à amostra" (MATTS) significa que um hospedeiro é o ancestral de pelo menos dois hospedeiros que são ATTS. Essa distinção ajuda a esclarecer como os hospedeiros se relacionam entre si em termos de infecção.
O BREATH garante que qualquer hospedeiro MATTS colore pelo menos um nó interno da árvore filogenética. Se um nó for colorido por um hospedeiro não amostrado, esse hospedeiro também deve ser MATTS. Isso estabelece um limite de quantos hospedeiros individuais não amostrados (IUHs) podem existir, enquanto o número de hospedeiros em cadeias não amostradas continua a crescer. Esse método permite mais flexibilidade na modelagem de indivíduos não amostrados sem aumentar a complexidade da análise geral.
Como Funciona a Decomposição Bayesiana
No BREATH, a genealogia do patógeno é representada como uma árvore filogenética cronometrada, enquanto a árvore de transmissão mapeia os eventos de infecção. A coloração da árvore filogenética retrata os eventos de transmissão e indica cadeias de transmissão não amostradas.
A análise envolve vários parâmetros que descrevem o processo epidemiológico, o tamanho efetivo da população dentro de um hospedeiro e o modelo evolutivo. O modelo assume que apenas uma única linhagem é passada durante um evento de transmissão. Os dados de sequência e os tempos de amostragem também são levados em consideração pra melhorar a estimativa das relações entre os eventos de transmissão.
A probabilidade dos dados de sequência dado a filogenia e os parâmetros é calculada, e essa probabilidade ajuda a informar as probabilidades prévias associadas aos parâmetros de transmissão e evolutivos.
Considerando Dinâmicas de Transmissão e Amostragem
Pra modelar efetivamente o processo de transmissão, o método usa uma abordagem de eventos recorrentes. Essa abordagem divide os eventos em duas categorias principais: amostragem e transmissão pra outros hospedeiros. Cada evento tem uma função de intensidade que descreve a probabilidade de que o evento ocorra a qualquer momento.
O modelo calcula as probabilidades de vários cenários, incluindo as chances de que indivíduos infectem outros ou sejam amostrados. Isso ajuda a criar contribuições de probabilidade mais precisas pro modelo geral.
Além disso, o BREATH reconhece que um surto pode ainda estar rolando quando a análise acontece. Esse fato pode introduzir viés, já que eventos mais rápidos são geralmente mais notados.
Probabilidade para Hospedeiros Individuais
O BREATH calcula a probabilidade de infecção pra hospedeiros individuais que acabam infectando outros. Isso envolve avaliar até que ponto um indivíduo poderia potencialmente transmitir a infecção a outros, além de sua probabilidade de ser amostrado.
A probabilidade geral pra um hospedeiro individual combina seu potencial pra infectar outros e o timing da sua amostragem. Essa informação se conecta ao modelo maior, criando uma representação interconectada das dinâmicas de transmissão.
Abordando Cadeias de Transmissão Não Amostradas
A probabilidade para cadeias de indivíduos não amostrados também é considerada. Essa cadeia se forma quando um infectador passa o patógeno pra alguém que não é amostrado, continuando até que um indivíduo amostrado seja infectado ou um hospedeiro MATTS seja alcançado.
Nesse caso, o número de infecções ocorrendo numa cadeia é tratado como uma distribuição geométrica. Essa abordagem permite que o modelo avalie a probabilidade de que qualquer cadeia de transmissão atinja um hospedeiro amostrado.
Usando MCMC pra Atualizações de Parâmetros
O método Bayesiano utiliza técnicas de Cadeia de Markov Monte Carlo (MCMC) pra propor e amostrar os vários parâmetros envolvidos no modelo. Isso permite que o modelo se adapte e refine suas estimativas com base na compreensão em evolução das dinâmicas de transmissão.
MCMC envolve criar propostas que podem adicionar ou remover infecções, o que ajuda a manter uma representação equilibrada dos dados. O processo inclui operações específicas pra mover infecções entre hospedeiros e ajustar parâmetros de bloco pra modelagem das cadeias de transmissão.
Analisando um Surto de TB
Pra demonstrar a utilidade do BREATH, foi feita uma análise de um surto de tuberculose que ocorreu na Alemanha. O conjunto de dados incluía várias amostras de casos que surgiram entre 1997 e 2010. Os parâmetros do modelo foram definidos com base em análises anteriores desse surto, permitindo uma interpretação eficaz dos dados.
Os resultados revelaram percepções importantes sobre as características do surto. Usando o BREATH, os pesquisadores conseguiram identificar conexões de transmissão chave e esclarecer a linha do tempo do surto. Variações nos resultados também foram evidentes quando o BREATH foi comparado a outros métodos existentes como TransPhylo, com o BREATH apresentando probabilidades de transmissão overall mais baixas.
Implicações das Descobertas
As descobertas da análise do surto de TB sugerem que mesmo com dados de sequenciamento avançados, ainda há uma incerteza significativa sobre quem infectou quem. Essa incerteza é ainda mais agravada pela presença de hospedeiros não amostrados e variações dentro das infecções individuais. No entanto, certos eventos de transmissão de alta probabilidade foram identificados.
A pesquisa destacou distintos fases de transmissão ao longo do surto e forneceu insights sobre possíveis pontos onde o surto poderia ter sido controlado.
Direções Futuras
Enquanto o BREATH se mostrou uma ferramenta poderosa pra analisar dinâmicas de transmissão, há várias áreas prontas pra melhorar. Por exemplo, ele assume que os hospedeiros são removidos da população assim que são amostrados, o que pode nem sempre refletir a realidade. Também seria benéfico explorar diferentes modelos pra representar as dinâmicas populacionais dos hospedeiros.
Entender como diferentes fatores influenciam a transmissão, como imunidade e infectividade, também vai melhorar a precisão das análises futuras. Permitir reinfecções no modelo poderia fornecer ainda mais insights sobre os padrões de disseminação da doença.
Conclusão
O BREATH representa um avanço significativo na nossa capacidade de analisar e entender dinâmicas de transmissão usando dados de sequenciamento de genoma completo. Ele fornece uma estrutura que considera as complexidades dos hospedeiros não amostrados e a diversidade dentro dos hospedeiros, ao mesmo tempo em que oferece insights informativos sobre a história de transmissão dos patógenos.
O método não só tem implicações pra entender doenças infecciosas em humanos, mas também possui potencial pra rastrear infecções zoonóticas e auxiliar na gestão de surtos. À medida que nosso entendimento sobre a transmissão de doenças continua a crescer, ferramentas como o BREATH serão cruciais pra informar estratégias de saúde pública e controlar surtos futuros de forma eficaz.
Título: Taking a BREATH (Bayesian Reconstruction and Evolutionary Analysis of Transmission Histories) to simultaneously infer phylogenetic and transmission trees for partially sampled outbreaks
Resumo: We introduce and apply Bayesian Reconstruction and Evolutionary Analysis of Transmission Histories (BREATH), a method to simultaneously construct phylogenetic trees and transmission trees using sequence data for a person-to-person outbreak. BREATHs transmission process that accounts for a flexible natural history of infection (including a latent period if desired) and a separate process for sampling. It allows for unsampled individuals and for individuals to have diverse within-host infections. BREATH also accounts for the fact that an outbreak may still be ongoing at the time of analysis, using a recurrent events approach to account for right truncation. We perform a simulation study to verify our implementation, and apply BREATH to a previously-described 13-year outbreak of tuber-culosis. We find that using a transmission process to inform the phylogenetic reconstruction results in better resolution of the phylogeny (in topology, branch length and tree height) and a more precise estimate of the time of origin of the outbreak. Considerable uncertainty remains about transmission events in the outbreak, but our reconstructed transmission network resolves two major waves of transmission consistent with the previously-described epidemiology, estimates the numbers of unsampled individuals, and describes some highprobability transmission pairs. An open source implementation of BREATH is available from https://github.com/rbouckaert/transmission as the BREATH package to BEAST 2.
Autores: Caroline Colijn, M. D. Hall, R. Bouckaert
Última atualização: 2024-07-15 00:00:00
Idioma: English
Fonte URL: https://www.biorxiv.org/content/10.1101/2024.07.11.603095
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.07.11.603095.full.pdf
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.