Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Biología # Bioinformática

Nuevo conjunto de datos revela tendencias en la diversidad de vertebrados

Se ha publicado un conjunto de datos de investigación sobre métricas de diversificación para cinco grupos de vertebrados.

Juan Daniel Vasquez-Restrepo

― 7 minilectura


Conjunto de Datos sobre Conjunto de Datos sobre la Diversidad de Vertebrados Lanzado abiertamente. diversificación de especies compartidas Nuevas ideas sobre métricas de
Tabla de contenidos

La investigación sobre biodiversidad ha estado mayormente dominada por los países más ricos. Esto se debe en gran parte a su acceso a dinero y tecnología. Sin embargo, cada vez más investigadores e instituciones están presionando por políticas de ciencia abierta. Estas políticas buscan hacer que el conocimiento científico esté disponible para todos, especialmente en regiones que carecen de apoyo financiero o recursos tecnológicos. Al compartir datos e investigaciones de manera más libre, la ciencia puede avanzar y beneficiar a una audiencia más amplia.

En los últimos años, los trabajos de datos se han vuelto bastante comunes en las revistas científicas. Estos trabajos presentan grandes cantidades de datos, que pueden ayudar a otros investigadores que necesitan esa información pero no se enfocan en recopilarla ellos mismos. Esto puede ahorrar tiempo y reducir costos para los investigadores. Un gran ejemplo de esto es el conjunto de datos WorldClim, que ha sido citado más de 20,000 veces desde su lanzamiento.

Este estudio tiene como objetivo proporcionar un conjunto de datos sobre métricas de diversificación para cinco grupos principales de vertebrados. Incluye matrices que muestran la presencia o ausencia de especies. Generar estos datos requiere un poder de computación considerable y algunas habilidades de programación avanzadas, lo que hace que este conjunto de datos sea bastante valioso para quienes están interesados en los campos de la macroecología y la macroevolución. Los datos fueron recopilados durante un análisis impulsado por la curiosidad, y la intención es compartirlos con la comunidad. Se proporcionará una breve descripción del conjunto de datos, pero no se ofrecerá un análisis detallado de las razones detrás de las tendencias observadas en biodiversidad.

Recolección de datos

Muestreo Filogenético

Este proyecto utilizó super-árboles totalmente muestreados y calibrados en el tiempo para cinco grupos de vertebrados: anfibios, reptiles, aves, mamíferos y tiburones. Estos árboles fueron recopilados de varias fuentes y están disponibles en línea. Debido a que estas filogenias combinan especies con ADN y aquellas sin él, pueden generar datos que no siempre son sencillos. Para tener en cuenta esta incertidumbre, se seleccionaron 100 árboles aleatorios para cada grupo para el análisis.

Tasas de Diversificación

Para comparar cómo evolucionan diferentes grupos con el tiempo, se utilizaron dos métodos diferentes para calcular las tasas de diversificación. Uno se llama DivRate, que estima la tasa de especiación de manera sencilla. Mide cuántas especies emergen de un ancestro común. El otro método, BAMM, utiliza un enfoque más complejo que permite diferentes tasas de especiación y extinción a lo largo del tiempo.

En los análisis, se estudiaron 100 árboles para cada grupo de vertebrados usando ambos métodos. Debido a las altas demandas computacionales, el análisis se llevó a cabo en un servidor de alto rendimiento. Los resultados se procesaron con un software específico para asegurar precisión. Tomó alrededor de seis meses realizar todos los análisis debido a la gran cantidad de datos involucrados.

Matrices de Presencia-Ausencia

Para organizar aún más los datos, se crearon matrices de presencia-ausencia utilizando polígonos de distribución de la Lista Roja de la IUCN, un recurso bien conocido para datos de biodiversidad. Para anfibios, reptiles, mamíferos y tiburones, se utilizó el conjunto de datos más reciente. Para aves, se referenció un conjunto de datos anterior. Las geometrías inválidas de los polígonos se resolvieron utilizando software SIG antes de generar las matrices de presencia-ausencia.

Armonización Taxonómica

Para asegurar consistencia, se incluyeron identificadores únicos de la Global Biodiversity Information Facility (GBIF) para cada especie. Estos identificadores ayudan a rastrear especies independientemente de los cambios de nombre a lo largo del tiempo. La coincidencia de nombres de especies se realizó utilizando una herramienta integrada de GBIF que intenta alinear diferentes nombres a través de coincidencias exactas o ligeras diferencias. Algunas especies no pudieron ser emparejadas, por lo que se tomaron medidas adicionales para asegurar un emparejamiento más preciso de nombres de especies.

Resultados

Basado en los datos recopilados, las tasas de diversificación para cada grupo de vertebrados mostraron tasas similares y lentas, con una tendencia general observada. Sin embargo, diferentes métricas proporcionaron resultados variados, siendo BAMM el que mostró menos variación. A pesar de las incertidumbres en los datos, las tasas de especiación se mantuvieron consistentes en dos de las tres métricas analizadas.

Las matrices de presencia-ausencia identificaron con éxito patrones de biodiversidad, mostrando una mayor riqueza de especies en regiones tropicales. Hubo ligeras variaciones en la riqueza de especies en diferentes regiones, reflejando los patrones de diversidad conocidos. En total, un número considerable de especies era común entre los conjuntos de datos.

Patrones Geográficos

Los patrones geográficos de tasas de diversificación pueden variar según el método utilizado. Por ejemplo, el método BAMM indicó que los anfibios tenían tasas de especiación más altas en regiones específicas, mientras que el método DivRate mostró tendencias diferentes. De manera similar, los reptiles mostraron resultados variados según la métrica utilizada. Para los mamíferos, BAMM indicó tasas más altas en especies marinas en regiones tropicales, mientras que DivRate reflejó tasas elevadas en ciertas regiones continentales.

Los patrones para las aves mostraron una distribución más uniforme de tasas de especiación, pero se notaron picos en áreas específicas. Para los tiburones, el método BAMM produjo tasas generales más bajas, mientras que DivRate indicó tasas más altas en regiones oceánicas.

Discusión

Si bien este conjunto de datos no es el primero de su tipo, ofrece una recopilación bien organizada de datos que están abiertamente disponibles para la investigación. Puede proporcionar información sobre patrones de macroecología y macroevolución, que son importantes para entender cómo evolucionan las diferentes especies a lo largo del tiempo. El conjunto de datos permite a los investigadores vincular tasas de diversificación con datos geográficos o climáticos para buscar patrones a una escala más amplia.

Sin embargo, es esencial considerar la naturaleza sesgada de los datos al analizarlos. Tomar promedios podría llevar a interpretaciones engañosas. En cambio, usar medianas o medidas relativas podría generar resultados más precisos. Además, la forma en que se presentan los datos influye en su interpretación, especialmente cuando el rango de variación es pequeño.

Es crucial tener en cuenta que las métricas utilizadas pueden diferir en sus clasificaciones taxonómicas debido a varios factores, incluyendo fechas de publicación. Se alienta a los investigadores a armonizar la taxonomía de las especies al utilizar este conjunto de datos para garantizar precisión. Los ID únicos proporcionados pueden ayudar significativamente en este sentido, facilitando el emparejamiento de especies entre diferentes conjuntos de datos.

Conclusión

Este conjunto de datos sobre métricas de diversificación para vertebrados sirve como un recurso valioso para los investigadores. Con el cuidado adecuado en el análisis e interpretación de los datos, puede proporcionar información sobre patrones de biodiversidad y los procesos que los impulsan. El objetivo es facilitar la investigación y fomentar una mayor exploración en los campos de la macroecología y la macroevolución. Se alienta a los usuarios a familiarizarse con las metodologías y las interpretaciones de los datos para maximizar su uso potencial en estudios futuros.

Fuente original

Título: A dataset containing speciation rates, uncertainty, and presence-absence matrices for more than 34,000 vertebrate species

Resumen: The increasing availability of phylogenetic data has facilitated the exploration of macroecological and macroevolutionary patterns across diverse spatial and temporal scales. However, calculating some model-based diversification metrics often requires significant computational power and time. To address this, I present a comprehensive dataset of Bayesian diversification rates for over 34,000 vertebrate species, spanning five major groups: amphibians, birds, mammals, reptiles, and sharks. This is the first large-scale dataset of its kind, providing both continuous and binary data for speciation rates and presence-absence matrices, respectively, with global coverage. The dataset not only enables analyses of evolutionary and spatial diversity patterns but also democratizes access to data-intensive studies. Additionally, as it is based on Markov chains, the dataset can be customized and extended without the need to start from scratch, offering flexibility for future research on diversification dynamics.

Autores: Juan Daniel Vasquez-Restrepo

Última actualización: 2024-12-02 00:00:00

Idioma: English

Fuente URL: https://www.biorxiv.org/content/10.1101/2024.04.09.588748

Fuente PDF: https://www.biorxiv.org/content/10.1101/2024.04.09.588748.full.pdf

Licencia: https://creativecommons.org/licenses/by-nc/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.

Artículos similares