Simple Science

Ciência de ponta explicada de forma simples

# Biologia# Biologia evolutiva

Avanços em Filogenômica e Relações Evolutivas

Analisando como novas técnicas melhoram nossa compreensão das conexões entre as espécies.

― 7 min ler


Filogenômica ReveladaFilogenômica Reveladaespécies.Uma análise profunda da evolução das
Índice

Filogenética é o estudo das relações evolutivas entre as espécies. Ajuda os cientistas a entender como diferentes espécies estão relacionadas entre si com base nas informações genéticas delas. Com os avanços da tecnologia, os pesquisadores agora conseguem analisar grandes quantidades de dados genéticos, o que levou ao desenvolvimento de um campo mais especializado chamado filogenômica. Esse campo usa dados de genomas inteiros, ou partes grandes deles, para criar representações mais precisas de como as espécies estão conectadas.

A Evolução da Filogenômica

Os primeiros estudos em filogenética costumavam se basear em um pequeno número de genes para estimar as relações. No entanto, à medida que a tecnologia melhorou, os pesquisadores começaram a usar dados de muitos genes de uma vez. Essa mudança permitiu a criação de árvores filogenéticas mais robustas, que são representações visuais das relações entre as espécies. Apesar desses avanços, conflitos ainda surgiram ao comparar árvores geradas a partir de diferentes conjuntos de genes.

Descobertas Importantes na Pesquisa Inicial em Filogenômica

As pesquisas revelaram três descobertas significativas no campo da filogenômica. Primeiro, usar dados de múltiplos genes geralmente produzia árvores que tinham um forte suporte, ou seja, as relações ilustradas nessas árvores eram confiáveis. Segundo, quando regiões de genes individuais eram analisadas separadamente, muitas vezes mostravam árvores conflitantes. Isso indicava que diferentes genes podiam contar histórias diferentes sobre as relações evolutivas. Por último, os pesquisadores descobriram que árvores geradas a partir de diferentes métodos analíticos ou conjuntos de dados também podiam mostrar conflitos, ressaltando a complexidade de entender a história evolutiva.

A presença desses conflitos geralmente aponta para erro sistemático, que é um problema em que o método analítico usado é falho de um jeito que distorce consistentemente as verdadeiras relações. A atração de longas ramificações, um tipo específico de erro, ocorre quando espécies não relacionadas parecem estar intimamente relacionadas porque desenvolveram características semelhantes de forma independente.

O Desafio das Árvores de Genes Conflitantes

Os conflitos entre as árvores de genes individuais podem surgir de vários fatores. Um fator é o erro estocástico, que ocorre quando os dados de um gene específico não são suficientes para retratar com precisão sua história evolutiva. No entanto, fontes biológicas de discórdia também podem criar esses conflitos. Por exemplo, a ordenação incompleta de linhagens é um processo natural que pode levar a diferentes genes mostrando relações variadas entre as espécies. Duplicação de genes e transferência horizontal de genes são outros processos que podem causar discrepâncias nas filogenias estimadas.

Árvores de genes conflitantes podem complicar a determinação de uma árvore de espécies, que é um diagrama que ilustra as relações evolutivas entre as espécies. Esses conflitos podem levar a erros nas análises ao usar métodos simples que assumem uma única árvore evolutiva.

Métodos para Melhorar Análises Filogenômicas

Para enfrentar os desafios apresentados por árvores de genes conflitantes, novos métodos foram desenvolvidos. Um dos métodos envolve usar uma abordagem de coalescência multiespécies, que leva em conta processos como a ordenação incompleta de linhagens de forma mais sofisticada. Esse método melhora a estimativa de árvores de espécies integrando informações de múltiplas árvores de genes e reconhecendo as complexidades da história evolutiva.

Outro método envolve criar árvores resumo a partir das árvores de genes, onde as relações mais consistentes entre as árvores de genes são usadas para estimar uma árvore de espécies. Essa abordagem permite uma compreensão mais sutil das relações evolutivas, mesmo quando algumas árvores de genes estão em conflito.

Coleta e Análise de Dados

Para realizar uma análise abrangente dos dados filogenômicos, os pesquisadores coletam informações genéticas de uma grande variedade de espécies. Os dados geralmente vêm de regiões específicas do DNA conhecidas como elementos ultraconservados, que são altamente preservados entre diferentes espécies. Focando nessas regiões, os cientistas podem coletar informações genéticas importantes que podem ser comparadas entre muitos táxons.

Uma vez que os dados genéticos são coletados, eles passam por um processo rigoroso de limpeza para remover quaisquer sequências de baixa qualidade. Os pesquisadores então alinham as sequências para identificar semelhanças e diferenças entre as espécies. Esse alinhamento é crucial para estimar com precisão as árvores filogenéticas.

Desempenho de Diferentes Análises Filogenômicas

Os pesquisadores avaliam o desempenho de vários métodos analíticos com base em quão efetivamente eles recuperam relações evolutivas conhecidas. Em testes envolvendo pássaros como exemplo principal, um dos métodos tradicionais usados foi a análise de máxima verossimilhança. Esse método funcionou bem para a maioria dos ramos nas árvores filogenéticas, indicando que poderia recuperar muitas relações de forma confiável.

No entanto, métodos mais novos, como métodos de resumo de árvores de genes e métodos de coalescência multiespécie, também foram testados para ver como bem eles recuperaram relações entre pássaros. Esses métodos tiveram desempenhos diferentes, com alguns sendo mais eficazes em recuperar relações próximas enquanto outros tiveram dificuldade com conexões evolutivas mais profundas.

O METAL, outro método que usa medições de distância entre espécies para estimar relações de árvores, enfrentou desafios ao lidar com dados ausentes. Dados ausentes podem impactar negativamente a estimativa de comprimentos de ramificação e a precisão geral da árvore resultante.

Abordando Dados Ausentes e Seu Impacto

Dados ausentes são uma questão comum em estudos filogenômicos, especialmente ao lidar com grandes conjuntos de dados. Em alguns casos, certos táxons podem ter lacunas extensas nos dados, tornando difícil tirar conclusões confiáveis sobre suas relações. Várias estratégias podem ajudar a mitigar o impacto dos dados ausentes, incluindo a seleção cuidadosa de quais táxons incluir nas análises e optar por conjuntos de dados que tenham uma melhor cobertura geral.

Quando os pesquisadores removeram táxons mal amostrados de seus conjuntos de dados, eles encontraram melhorias no desempenho de muitas análises. Isso revelou que uma consideração cuidadosa da qualidade e cobertura dos dados é essencial em estudos filogenômicos.

O Papel das Métricas de Distância na Análise

Diferentes métricas de distância podem influenciar a eficácia de métodos como o METAL. Os pesquisadores geralmente descobrem que usar distâncias corrigidas leva a estimativas mais precisas. Distâncias logdet surgiram como uma escolha particularmente confiável em muitas análises. No entanto, era importante garantir que as distâncias refletissem com precisão as relações evolutivas sendo estudadas.

Usando vários métodos de cálculo de distância, os pesquisadores compararam o desempenho de análises baseadas em distância, descobrindo que algumas funcionavam melhor com tipos específicos de dados genéticos. Isso ressaltou a necessidade de uma seleção cuidadosa tanto dos estimadores de distância quanto dos métodos analíticos para melhorar a eficácia dos estudos filogenômicos.

Conclusão

O campo da filogenômica fez grandes avanços em entender as relações evolutivas entre as espécies através do uso de grandes conjuntos de dados genômicos. Apesar de muitos avanços, desafios permanecem, especialmente com árvores de genes conflitantes, dados ausentes e a seleção de métodos analíticos apropriados.

Pesquisas contínuas e esforços para refinar esses métodos são essenciais para avançar nosso entendimento das complexas relações entre as espécies. Ao melhorar a qualidade dos dados, utilizar técnicas analíticas mais sofisticadas e abordar cuidadosamente os desafios apresentados pelos dados ausentes, os estudos filogenômicos podem levar a representações mais precisas da história evolutiva da vida na Terra.

Fonte original

Título: Testing the mettle of METAL: A comparison of phylogenomic methods using a challenging but well-resolved phylogeny

Resumo: The evolutionary histories of different genomic regions typically differ from each other and from the underlying species phylogeny. This makes species tree estimation challenging. Here, we examine the performance of phylogenomic methods using a well-resolved phylogeny that nevertheless contains many difficult nodes, the species tree of living birds. We compared trees generated by maximum likelihood (ML) analysis of concatenated data, gene tree summary methods, and SVDquartets. We also conduct the first empirical test of a "new" method called METAL (Metric algorithm for Estimation of Trees based on Aggregation of Loci), which is based on evolutionary distances calculated using concatenated data. We conducted this test using a novel dataset comprising more than 4,000 ultraconserved element (UCE) loci from almost all bird families and two existing UCE and intron datasets sampled from almost all avian orders. We identified "reliable clades" very likely to be present in the true avian species tree and used them to assess method performance. ML analyses of concatenated data recovered almost all reliable clades with less data and greater robustness to missing data than other methods. METAL recovered many reliable clades, but only performed well with the largest datasets. Gene tree summary methods (weighted ASTRAL and weighted ASTRID) performed well; they required less data than METAL but more data than ML concatenation. SVDquartets exhibited the worst performance of the methods tested. In addition to the methodological insights, this study provides a novel estimate of avian phylogeny with almost 99% of the currently recognized avian families. Only one of the 181 reliable clades we examined was consistently resolved differently by ML concatenation versus other methods, suggesting that it may be possible to achieve consensus on the deep phylogeny of extant birds.

Autores: Edward L. Braun, C. H. Oliveros, N. D. White Carreiro, M. Zhao, T. C. Glenn, R. T. Brumfield, R. T. Kimball, B. C. Faircloth

Última atualização: 2024-03-22 00:00:00

Idioma: English

Fonte URL: https://www.biorxiv.org/content/10.1101/2024.02.28.582627

Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.02.28.582627.full.pdf

Licença: https://creativecommons.org/licenses/by-nc/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes