Apresentando o Goldfinder: uma nova ferramenta pra analisar relacionamentos genéticos
Goldfinder facilita o estudo de combinações de genes em populações bacterianas.
― 6 min ler
Índice
O Pangenoma se refere ao conjunto completo de genes encontrados em uma população de bactérias ou arqueias. Cada organismo individual dentro dessa população carrega apenas uma parte desses genes, mas juntos, eles formam um pool genético maior. Isso significa que alguns genes são comuns entre muitos organismos, enquanto outros são encontrados em apenas alguns. Além disso, os genes precisam trabalhar juntos de forma eficaz para permitir que o organismo prospere.
O Papel das Combinações de Genes
Pesquisas mostram que o efeito de um gene na aptidão de um organismo pode variar dependendo de outros genes presentes. Isso sugere que alguns genes podem interagir positivamente, trazendo benefícios quando trabalham juntos, enquanto outros podem competir ou interferir entre si, levando a efeitos negativos. Por exemplo, os sistemas de defesa bacteriana que protegem contra vírus ou outros elementos genéticos nocivos costumam consistir em vários genes que colaboram. Outro exemplo inclui grupos específicos de genes responsáveis por produzir substâncias essenciais. Esses genes precisam estar presentes juntos para que todo o processo de produção funcione.
Pressão de Seleção sobre Combinações de Genes
O objetivo de estudar essas combinações de genes é determinar quais estão sob Seleção Natural. Ao examinar quais genes frequentemente aparecem juntos em diferentes cepas de bactérias, os cientistas podem inferir se certos genes tendem a coexistir ou a evitar uns aos outros. No entanto, é importante considerar que alguns genes podem aparecer juntos simplesmente devido à herança conjunta de um ancestral comum, em vez de serem funcionalmente relacionados.
Se dois genes são frequentemente encontrados juntos porque ambos foram passados por gerações do mesmo ancestral, esse fenômeno é conhecido como ligação por descendência. Por outro lado, se eles foram ganhos ou perdidos várias vezes em uma linhagem, isso indica que provavelmente precisam trabalhar juntos. Portanto, os cientistas devem analisar as relações evolutivas entre diferentes cepas para separar a coocorrência ou a evitação genuína da mera ancestralidade compartilhada.
Abordagens Existentes para Estudar Combinações de Genes
Muitas ferramentas foram criadas para analisar como os genes aparecem juntos e levar em conta as relações evolutivas. No entanto, essas ferramentas costumam depender de modelos matemáticos complexos, que podem ser demorados e podem considerar apenas um pequeno número de genes de cada vez. Outros modelos menos complexos são mais rápidos, mas podem não usar o conjunto completo de genes na análise.
Uma área de pesquisa intimamente relacionada são os estudos de associação de genomas, que examinam as ligações entre variações genéticas e características específicas. Nesse contexto, entender as relações genéticas globais entre bactérias é crucial, especialmente ao avaliar combinações de genes.
Apresentando o Goldfinder
Aí vem o Goldfinder, uma ferramenta projetada para estudar as relações entre genes considerando a ancestralidade compartilhada. O Goldfinder é eficiente e baseado em um método não paramétrico que utiliza simulações com uma árvore genética fornecida.
O Goldfinder tem como objetivo identificar pares de genes que frequentemente aparecem juntos ou tendem a evitar uns aos outros. Os genes podem mostrar padrões semelhantes não porque estão diretamente relacionados, mas devido à sua herança de ancestrais ou à estrutura da população. Genes que oferecem um benefício significativo quando estão juntos provavelmente ocorrerão mais frequentemente em uma população.
O Goldfinder distingue entre pares de genes que co-ocorrem devido à ancestralidade compartilhada e aqueles que o fazem por causa da seleção natural. Para isso, a ferramenta gera padrões esperados com base nas relações entre as cepas e identifica combinações que aparecem mais frequentemente do que o acaso sugeriria.
Como o Goldfinder Funciona
O Goldfinder requer duas informações principais: uma árvore filogenética enraizada, que mostra como diferentes cepas estão relacionadas, e os padrões de presença-ausência de genes para cada cepa. Se a árvore não estiver enraizada, o Goldfinder determinará um ponto de raiz usando um método de ponto médio.
Depois de obter esses dados, o Goldfinder calcula pontuações que refletem a probabilidade de coocorrência ou evitação de genes. Essas pontuações diferem em quão efetivamente identificam relações genuínas em comparação com ocorrências aleatórias. O Goldfinder usa três métodos de pontuação distintos: a pontuação terminal, a pontuação Coinfinder e a pontuação simultânea.
A pontuação terminal avalia quantas cepas têm ambos os genes presentes ou ausentes, enquanto a pontuação Coinfinder foca na presença de um gene em relação à ausência de outro. A pontuação simultânea leva isso um passo adiante, examinando os ramos da árvore filogenética para ver como os genes mudaram de estado ao longo do tempo.
Simulando Distribuições Nulas
Para entender o que constitui um nível incomum de coocorrência entre genes, o Goldfinder se baseia em simulações para criar uma distribuição de pontuações esperadas se não houvesse relações genuínas entre os genes. Isso significa rodar simulações onde os genes evoluem independentemente. Ao comparar dados reais com essa distribuição simulada, o Goldfinder pode derivar valores de p para pares de genes que mostram se a sua coocorrência ou evitação é estatisticamente significativa.
A ferramenta também pode criar redes que visualizam essas relações, ilustrando quais genes tendem a se agrupar e quais evitam uns aos outros. Isso oferece uma imagem mais clara das conexões dentro do pool genético.
Identificando Clusters de Genes
Quando um número significativo de pares de genes é encontrado associado, o Goldfinder pode conectá-los, formando redes maiores de genes que coocorrem. Dentro dessas redes, clusters densos de genes que aparecem frequentemente juntos podem ser identificados usando algoritmos projetados para esse propósito.
Além disso, o Goldfinder pode analisar as dissociações entre esses clusters de genes, fornecendo insights sobre como diferentes grupos de genes interagem ou evitam uns aos outros.
Visualização e Aplicações Práticas
O Goldfinder gera várias visualizações que permitem aos usuários explorar as redes de Coocorrências de genes. Essas visualizações podem ser examinadas ainda mais usando softwares projetados para representação gráfica, facilitando a compreensão das relações entre os genes.
Pesquisadores podem aplicar o Goldfinder a várias populações bacterianas, ajudando a descobrir insights sobre as dinâmicas evolutivas em jogo. Ao comparar as descobertas do Goldfinder com as de ferramentas existentes, fica claro que, enquanto o Goldfinder pode identificar menos pares de genes, ele frequentemente reconhece uma gama mais ampla de genes envolvidos na co-seleção.
Essa ferramenta ajuda os pesquisadores a discernir as forças que moldam a diversidade genética em populações bacterianas, oferecendo um método para futuros estudos que buscam desvendar as complexidades encontradas nas comunidades microbianas.
Título: Goldfinder: Unraveling Networks of Gene Co-occurrence and Avoidance in Bacterial Pangenomes
Resumo: The pangenome is the set of all genes present in a prokaryotic species. Most pangenomes contain many accessory genes that are present in only some of the species members. Genes need to function together, and it has been suggested that selection for certain gene combinations affects the structure of prokaryotic pangenomes. Nevertheless, genes might also co-occur simply due to being linked on the genome, and efficient tools are needed to distinguish linkage from co-selection. Here we present Goldfinder, an approach to infer co-occurrence and co-avoidance between gene pairs by taking the phylogenetic relationships of the species into account. The approach is implemented in an efficient Python script available at https://github.com/fbaumdicker/goldfinder. We also provide scripts for clustering co-occurring genes and for visualizing the resulting co-occurrence and co-avoidance networks in Cytoscape. In comparison to the co-occurrence inference tool Coinfinder, Goldfinder finds fewer co-occurring pairs in a real species pangenome, suggesting that fewer spurious associations due to phylogenetic dependencies are detected. We conclude that Goldfinder is a fast and accurate tool to infer gene co-occurrence and co-avoidance, which will enable large-scale analyses to infer co-selected genes across bacterial pangenomes.
Autores: Franz Baumdicker, A. Gavriilidou, E. Paulitz, C. Resl, N. Ziemert, A. Kupczok
Última atualização: 2024-05-02 00:00:00
Idioma: English
Fonte URL: https://www.biorxiv.org/content/10.1101/2024.04.29.591652
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.04.29.591652.full.pdf
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.