Novo Conjunto de Dados Revela Tendências na Diversidade de Vertebrados
Conjunto de dados de pesquisa sobre métricas de diversificação para cinco grupos de vertebrados liberado.
― 7 min ler
Índice
A pesquisa sobre biodiversidade tem sido, em grande parte, dominada por países mais ricos. Isso se deve, principalmente, ao acesso que eles têm a grana e tecnologia. No entanto, cada vez mais pesquisadores e instituições estão defendendo políticas de ciência aberta. Essas políticas buscam tornar o conhecimento científico acessível a todos, especialmente em regiões que não têm apoio financeiro ou recursos tecnológicos. Ao compartilhar dados e pesquisas de forma mais livre, a ciência pode avançar e beneficiar um público mais amplo.
Nos últimos anos, os artigos de dados se tornaram bem comuns em revistas científicas. Esses textos apresentam quantidades significativas de dados, que podem ajudar outros pesquisadores que precisam dessas informações, mas que não estão focados em coletá-las. Isso pode economizar tempo e reduzir custos para os pesquisadores. Um ótimo exemplo disso é o conjunto de dados do WorldClim, que foi citado mais de 20.000 vezes desde seu lançamento.
Este estudo tem como objetivo fornecer um conjunto de dados sobre métricas de diversificação para cinco grupos principais de vertebrados. Inclui matrizes que mostram a presença ou ausência de espécies. Gerar esses dados exige um bom poder computacional e algumas habilidades avançadas em programação, tornando esse conjunto de dados bem valioso para quem se interessa pelos campos de macroecologia e macroevolução. Os dados foram coletados durante uma análise movida pela curiosidade, e a intenção é compartilhar isso com a comunidade. Uma breve descrição do conjunto de dados será fornecida, mas uma análise detalhada das razões por trás das tendências de biodiversidade observadas não será apresentada.
Coleta de Dados
Amostragem Filogenética
Esse projeto utilizou super-árvores totalmente amostradas e calibradas no tempo para cinco grupos de vertebrados: anfíbios, répteis, aves, mamíferos e tubarões. Essas árvores foram coletadas de várias fontes e estão disponíveis online. Como essas filogenias são combinadas de espécies com DNA e aquelas sem, podem criar dados que nem sempre são simples. Para lidar com essa incerteza, foram selecionadas 100 árvores aleatórias para cada grupo para a análise.
Taxas de Diversificação
Para comparar como diferentes grupos evoluem ao longo do tempo, foram usadas duas metodologias diferentes para calcular taxas de diversificação. Uma se chama DivRate, que estima a taxa de especiação de forma direta. Ela mede quantas espécies surgem de um ancestral comum. A outra metodologia, BAMM, usa uma abordagem mais complexa que permite diferentes taxas de especiação e extinção ao longo do tempo.
Nas análises, 100 árvores para cada grupo de vertebrados foram estudadas usando ambos os métodos. Devido à grande demanda computacional, a análise foi realizada em um servidor de alto desempenho. Os resultados foram então processados com um software específico para garantir precisão. Levou cerca de seis meses para rodar todas as análises por causa da quantidade enorme de dados envolvidos.
Matrizes de Presença-Ausência
Para organizar melhor os dados, foram criadas matrizes de presença-ausência usando polígonos de distribuição da Lista Vermelha da IUCN, que é uma fonte bem conhecida de dados sobre biodiversidade. Para anfíbios, répteis, mamíferos e tubarões, foi usado o conjunto de dados mais recente. Para aves, foi referenciado um conjunto de dados anterior. Geometrias inválidas dos polígonos foram resolvidas usando software GIS antes de gerar as matrizes de presença-ausência.
Harmonização Taxonômica
Para garantir consistência, foram incluídos identificadores únicos do Global Biodiversity Information Facility (GBIF) para cada espécie. Esses identificadores ajudam a rastrear espécies independentemente das mudanças de nome ao longo do tempo. O emparelhamento dos nomes das espécies foi feito usando uma ferramenta interna do GBIF que tenta alinhar nomes diferentes por meio de correspondências exatas ou pequenas diferenças. Algumas espécies não puderam ser emparelhadas, então foram usadas medidas adicionais para garantir uma correspondência mais precisa dos nomes das espécies.
Resultados
Com base nos dados coletados, as taxas de diversificação para cada grupo de vertebrados mostraram taxas semelhantes e lentas, com uma tendência geral observada. No entanto, diferentes métricas forneceram resultados variados, com o BAMM mostrando menos variação. Apesar das incertezas nos dados, as taxas de especiação permaneceram consistentes em duas das três métricas analisadas.
As matrizes de presença-ausência identificaram com sucesso padrões de biodiversidade, mostrando maior riqueza de espécies em regiões tropicais. Houve pequenas variações na riqueza de espécies entre diferentes regiões, refletindo os padrões conhecidos de diversidade. No total, um número considerável de espécies foi comum entre os conjuntos de dados.
Padrões Geográficos
Os padrões geográficos das taxas de diversificação podem variar dependendo do método utilizado. Por exemplo, o método BAMM indicou que os anfíbios tinham taxas de especiação mais altas em regiões específicas, enquanto o método DivRate mostrou tendências diferentes. Da mesma forma, os répteis mostraram resultados variados com base na métrica utilizada. Para os mamíferos, o BAMM indicou taxas mais altas em espécies marinhas nas regiões tropicais, enquanto o DivRate refletiu taxas elevadas em certas regiões continentais.
Os padrões para as aves mostraram uma distribuição mais uniforme das taxas de especiação, mas picos foram notados em áreas específicas. Para os tubarões, o método BAMM produziu taxas gerais mais baixas, enquanto o DivRate indicou taxas mais altas em regiões oceânicas.
Discussão
Embora esse conjunto de dados não seja o primeiro do tipo, ele oferece uma compilação bem organizada de dados que está acessível para pesquisa. Pode fornecer insights sobre padrões de macroecologia e macroevolução, que são importantes para entender como diferentes espécies evoluem ao longo do tempo. O conjunto de dados permite que pesquisadores conectem taxas de diversificação com dados geográficos ou climáticos para buscar padrões em uma escala mais ampla.
No entanto, é essencial considerar a natureza inclinada dos dados ao analisá-los. Tirar médias pode levar a interpretações erradas. Ao invés disso, usar medianas ou medidas relativas pode resultar em resultados mais precisos. Além disso, a forma como os dados são apresentados influencia sua interpretação, especialmente quando a faixa de variação é pequena.
É crucial lembrar que as métricas utilizadas podem diferir em suas classificações taxonômicas devido a vários fatores, incluindo datas de publicação. Os pesquisadores são encorajados a harmonizar a taxonomia das espécies ao usar esse conjunto de dados para garantir precisão. Os IDs únicos fornecidos podem ajudar muito nesse sentido, facilitando a correspondência de espécies entre diferentes conjuntos de dados.
Conclusão
Esse conjunto de dados sobre métricas de diversificação para vertebrados serve como um recurso valioso para pesquisadores. Com o cuidado adequado na análise e interpretação dos dados, ele pode oferecer insights sobre padrões de biodiversidade e os processos que os impulsionam. O objetivo é facilitar a pesquisa e incentivar mais exploração nos campos de macroecologia e macroevolução. Os usuários são encorajados a se familiarizar com as metodologias e interpretações dos dados para maximizar seu uso em estudos futuros.
Título: A dataset containing speciation rates, uncertainty, and presence-absence matrices for more than 34,000 vertebrate species
Resumo: The increasing availability of phylogenetic data has facilitated the exploration of macroecological and macroevolutionary patterns across diverse spatial and temporal scales. However, calculating some model-based diversification metrics often requires significant computational power and time. To address this, I present a comprehensive dataset of Bayesian diversification rates for over 34,000 vertebrate species, spanning five major groups: amphibians, birds, mammals, reptiles, and sharks. This is the first large-scale dataset of its kind, providing both continuous and binary data for speciation rates and presence-absence matrices, respectively, with global coverage. The dataset not only enables analyses of evolutionary and spatial diversity patterns but also democratizes access to data-intensive studies. Additionally, as it is based on Markov chains, the dataset can be customized and extended without the need to start from scratch, offering flexibility for future research on diversification dynamics.
Autores: Juan Daniel Vasquez-Restrepo
Última atualização: 2024-12-02 00:00:00
Idioma: English
Fonte URL: https://www.biorxiv.org/content/10.1101/2024.04.09.588748
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.04.09.588748.full.pdf
Licença: https://creativecommons.org/licenses/by-nc/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.