Nouveau jeu de données révèle des tendances dans la diversité des vertébrés
Jeux de données de recherche sur les mesures de diversification pour cinq groupes de vertébrés publiés.
― 8 min lire
Table des matières
La recherche sur la biodiversité a surtout été dominée par les pays riches. C'est surtout à cause de leur accès à l'argent et à la technologie. Mais de plus en plus de chercheurs et d'institutions militent pour des politiques de science ouverte. Ces politiques visent à rendre la connaissance scientifique accessible à tous, surtout dans les régions qui manquent de soutien financier ou de ressources technologiques. En partageant les données et les recherches plus librement, la science peut progresser et profiter à un public plus large.
Ces dernières années, les articles de données se sont beaucoup répandus dans les revues scientifiques. Ces articles présentent des quantités significatives de données, ce qui peut aider d'autres chercheurs qui ont besoin de ces infos mais ne se concentrent pas sur leur collecte. Cela peut faire gagner du temps et réduire les coûts pour les chercheurs. Un super exemple de ça est le jeu de données WorldClim, qui a été cité plus de 20 000 fois depuis sa sortie.
Cette étude vise à fournir un ensemble de données sur les métriques de diversification pour cinq grands groupes de vertébrés. Elle inclut des matrices qui montrent la présence ou l'absence d'espèces. Générer ces données nécessite une puissance de calcul considérable et des compétences en programmation avancées, rendant ainsi cet ensemble de données assez précieux pour ceux qui s'intéressent aux domaines de la macroécologie et de la macroévolution. Les données ont été rassemblées lors d'une analyse menée par curiosité, et l'intention est de les partager avec la communauté. Une brève description de l'ensemble de données sera fournie, mais une analyse détaillée des raisons derrière les tendances observées en matière de biodiversité ne sera pas offerte.
Collecte de données
Échantillonnage phylogénétique
Ce projet a utilisé des super-arbres entièrement échantillonnés et calibrés dans le temps pour cinq groupes de vertébrés : amphibiens, reptiles, oiseaux, mammifères et requins. Ces arbres ont été collectés à partir de diverses sources et sont disponibles en ligne. Comme ces phylogénies sont combinées à partir d'espèces avec ADN et d'autres sans, elles peuvent créer des données qui ne sont pas toujours simples. Pour tenir compte de cette incertitude, 100 arbres aléatoires ont été sélectionnés pour chaque groupe pour l'analyse.
Taux de diversification
Pour comparer comment différents groupes évoluent au fil du temps, deux méthodes différentes pour calculer les taux de diversification ont été utilisées. L'une s'appelle DivRate, qui estime le taux de spéciation de manière simple. Elle mesure combien d'espèces émergent d'un ancêtre commun. L'autre méthode, BAMM, utilise une approche plus complexe qui permet des taux de spéciation et d'extinction différents au fil du temps.
Dans les analyses, 100 arbres pour chaque groupe de vertébrés ont été étudiés en utilisant les deux méthodes. En raison des exigences de calcul élevées, l'analyse a été effectuée sur un serveur haute performance. Les résultats ont ensuite été traités avec un logiciel spécifique pour garantir leur précision. Il a fallu environ six mois pour exécuter toutes les analyses en raison des grandes quantités de données impliquées.
Matrices de présence-absence
Pour organiser davantage les données, des matrices de présence-absence ont été créées à l'aide de polygones de distribution provenant de la Liste Rouge de l'IUCN, une ressource bien connue pour les données sur la biodiversité. Pour les amphibiens, reptiles, mammifères et requins, le jeu de données le plus récent a été utilisé. Pour les oiseaux, un ancien jeu de données a été référencé. Les géométries invalides des polygones ont été résolues à l'aide d'un logiciel SIG avant de générer les matrices de présence-absence.
Harmonisation taxonomique
Pour assurer la cohérence, des identifiants uniques du Global Biodiversity Information Facility (GBIF) ont été inclus pour chaque espèce. Ces identifiants aident à suivre les espèces indépendamment des changements de nom au fil du temps. L'appariement des noms d'espèces a été réalisé à l'aide d'un outil intégré du GBIF qui tente d'aligner différents noms par des correspondances exactes ou des différences légères. Certaines espèces n'ont pas pu être appariées, donc des mesures supplémentaires ont été prises pour assurer un appariement plus précis des noms d'espèces.
Résultats
D'après les données collectées, les taux de diversification pour chaque groupe de vertébrés ont montré des taux similaires et lents, avec une tendance générale observée. Cependant, différentes métriques ont fourni des résultats variés, avec BAMM affichant moins de variation. Malgré les incertitudes des données, les taux de spéciation sont restés constants à travers deux des trois métriques analysées.
Les matrices de présence-absence ont réussi à identifier des motifs de biodiversité, montrant une richesse spécifique plus élevée dans les régions tropicales. Il y avait de légères variations dans la richesse spécifique selon les régions, reflétant les motifs de diversité connus. En tout, un nombre considérable d'espèces était commun entre les ensembles de données.
Motifs géographiques
Les motifs géographiques des taux de diversification peuvent varier selon la méthode utilisée. Par exemple, la méthode BAMM a indiqué que les amphibiens avaient des taux de spéciation plus élevés dans certaines régions, tandis que la méthode DivRate montrait des tendances différentes. De même, les reptiles montraient des résultats variés selon la métrique utilisée. Pour les mammifères, BAMM a indiqué des taux plus élevés chez les espèces marines dans les régions tropicales, tandis que DivRate reflétait des taux élevés dans certaines régions continentales.
Les motifs pour les oiseaux montraient une distribution plus uniforme des taux de spéciation, mais des pics ont été notés dans des zones spécifiques. Pour les requins, la méthode BAMM a produit des taux globaux plus bas, tandis que DivRate indiquait des taux plus élevés dans les régions océaniques.
Discussion
Bien que cet ensemble de données ne soit pas le premier de son genre, il offre une compilation bien organisée de données qui est ouvertement accessible pour la recherche. Il peut fournir des infos sur les motifs de macroécologie et de macroévolution, qui sont importants pour comprendre comment différentes espèces évoluent au fil du temps. L'ensemble de données permet aux chercheurs de lier les taux de diversification avec des données géographiques ou climatiques pour chercher des motifs à une échelle plus large.
Cependant, il est essentiel de prendre en compte la nature asymétrique des données lors de leur analyse. Prendre des moyennes pourrait conduire à des interprétations trompeuses. Au lieu de cela, utiliser des médianes ou des mesures relatives pourrait donner des résultats plus précis. De plus, la façon dont les données sont présentées influence leur interprétation, surtout lorsque l'étendue des variations est petite.
C'est crucial de garder à l'esprit que les métriques utilisées pourraient différer dans leurs classifications taxonomiques à cause de divers facteurs, y compris les dates de publication. Les chercheurs sont encouragés à harmoniser la taxonomie des espèces lorsqu'ils utilisent cet ensemble de données pour garantir l'exactitude. Les ID uniques fournis peuvent aider énormément dans ce sens, facilitant l'appariement des espèces entre différents ensembles de données.
Conclusion
Cet ensemble de données sur les métriques de diversification pour les vertébrés est une ressource précieuse pour les chercheurs. Avec le bon soin dans l'analyse et l'interprétation des données, il peut donner des insights sur les motifs de biodiversité et les processus qui les animent. Le but est de faciliter la recherche et d'encourager une exploration plus poussée dans les domaines de la macroécologie et de la macroévolution. Les utilisateurs sont encouragés à se familiariser avec les méthodologies et les interprétations des données pour maximiser son potentiel d'utilisation dans les études futures.
Titre: A dataset containing speciation rates, uncertainty, and presence-absence matrices for more than 34,000 vertebrate species
Résumé: The increasing availability of phylogenetic data has facilitated the exploration of macroecological and macroevolutionary patterns across diverse spatial and temporal scales. However, calculating some model-based diversification metrics often requires significant computational power and time. To address this, I present a comprehensive dataset of Bayesian diversification rates for over 34,000 vertebrate species, spanning five major groups: amphibians, birds, mammals, reptiles, and sharks. This is the first large-scale dataset of its kind, providing both continuous and binary data for speciation rates and presence-absence matrices, respectively, with global coverage. The dataset not only enables analyses of evolutionary and spatial diversity patterns but also democratizes access to data-intensive studies. Additionally, as it is based on Markov chains, the dataset can be customized and extended without the need to start from scratch, offering flexibility for future research on diversification dynamics.
Auteurs: Juan Daniel Vasquez-Restrepo
Dernière mise à jour: 2024-12-02 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.04.09.588748
Source PDF: https://www.biorxiv.org/content/10.1101/2024.04.09.588748.full.pdf
Licence: https://creativecommons.org/licenses/by-nc/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.