Créer une base de données complète d'images pour les reptiles
Un projet pour organiser les images de spécimens de reptiles pour un meilleur accès à la recherche.
― 8 min lire
Table des matières
- Le défi de trouver des photos d’animaux
- Un nouveau projet pour les images de reptiles
- Méthodes et matériaux utilisés
- Objectifs taxonomiques du projet
- Standardisation et accessibilité
- Caractéristiques morphologiques capturées
- Répondre aux défis et futures directions
- Lier les données et améliorer les ressources
- Applications des images de référence
- Améliorations et objectifs futurs
- Conclusion
- Source originale
- Liens de référence
Les images jouent un rôle super important en biomédecine, aidant les chercheurs et les Taxonomistes à étudier différentes espèces. Malheureusement, il n'y a pas beaucoup de bases de données qui offrent des collections d'images bien structurées. Celles qui existent ne respectent souvent pas les directives FAIR, qui rendent les données trouvables, accessibles, interopérables et réutilisables.
Pour la biodiversité et la taxonomie, deux bases de données utiles sont Morphobank et Morphosource. Morphobank se concentre sur les traits et les images dans un contexte phylogénétique, tandis que Morphosource se spécialise dans les images 3D comme les scans CT. Ces plateformes aident à la collecte organisée d'images biologiques.
Le défi de trouver des photos d’animaux
Il y a des milliers de photos d'animaux disponibles sur internet, mais beaucoup sont collectées de manière aléatoire. Il existe des initiatives pour systématiser ces collections, surtout pour les reptiles. iNaturalist est une plateforme populaire qui documente des observations en nature, avec des millions d'images. Cependant, ce n'est pas spécifiquement axé sur la taxonomie. Récemment, iNaturalist a commencé à ajouter des photos d’échantillons de musées, mais ce n’est pas encore une ressource taxonomique dédiée.
Les taxonomistes ont besoin de bases de données spécialisées qui fournissent des images standardisées pour faciliter la comparaison et l'identification des espèces. De nombreux musées d'histoire naturelle ont des images sur leurs sites, mais celles-ci ne couvrent souvent qu'une petite partie de leurs collections. La nature dispersée des images sur différents sites rend difficile leur recherche et leur utilisation par les chercheurs.
Un nouveau projet pour les images de reptiles
Ce projet vise à créer une collection systématique d'images de reptiles prises sur des échantillons préservés. Nous avons collaboré avec 20 collections dans le monde entier pour photographier plus de 1 000 espèces de reptiles, ce qui a donné plus de 14 000 images. Chaque image est étiquetée avec des informations importantes, comme les localités et d'autres détails. Cela facilite le tri des images par caractéristiques spécifiques et les références avec d'autres bases de données comme VertNet et la Reptile Database. La collection est accessible via Morphobank, permettant aux utilisateurs de retracer chaque image jusqu’à son spécimen spécifique.
Comme étude de cas, nous présentons des photos de 8 espèces de la sous-famille Lacertinae, qui comprend de nombreux genres de lézards. Les images incluent différentes vues des Spécimens, montrant leurs côtés dorsal et ventral, ainsi que des gros plans de la tête. Des règles sont incluses dans les images pour les mesures de taille.
Méthodes et matériaux utilisés
Nous avons collecté un total de 62,6 Go d'images, comprenant 15 675 photographies de 1 045 espèces de reptiles. Parmi celles-ci, 14 239 photos montrent de réels spécimens, tandis que 1 436 montrent des étiquettes avec des informations supplémentaires. L'objectif était de maintenir la cohérence dans les images, en montrant les mêmes perspectives, comme les vues dorsales et ventrales du corps entier et des gros plans de la tête et du tronc.
Pour nettoyer les redondances dans nos images, nous avons utilisé un outil pour supprimer les photos qui étaient au moins 85 % similaires les unes aux autres. Des Métadonnées ont été ajoutées aux images à l'aide d'un logiciel personnalisé, étiquetant chaque vue et les parties du corps visibles. Ces étiquettes aident les utilisateurs à rechercher facilement des caractéristiques spécifiques comme "tête" ou "ventral". Les images et leurs métadonnées sont disponibles dans Morphobank et Figshare sous le numéro de projet.
Notre collection comprend désormais plus de 14 239 photos standardisées de 1 045 espèces de reptiles. Ces images peuvent servir de référence pour des études comparatives et l'identification des espèces. Actuellement, 81 des 1 342 spécimens dans notre base de données sont des types primaires, mais d'autres spécimens de type seront ajoutés au fur et à mesure qu'ils seront disponibles.
Objectifs taxonomiques du projet
Notre objectif initial était d'obtenir des images de tous les genres de lézards, idéalement en capturant au moins une espèce de chacun. Bien que nous n'ayons pas encore atteint cet objectif, nous avons photographié 490 genres de lézards, représentant 81 % du total. Suivre la représentation de tous les genres est un défi, car de nouveaux genres de lézards continuent d’être décrits. Depuis 2000, 122 nouveaux genres de lézards ont été identifiés, et beaucoup ne sont pas inclus dans notre projet actuel.
Nous avons réussi à capturer des photos de 53 familles, dont 29 ont tous leurs genres représentés. Certaines des plus grandes familles incluent Anguidae et Phyllodactylidae, qui comptent plus de dix genres. Pour près de la moitié de toutes les familles de reptiles, nous avons rassemblé des images de 80 % ou plus de leurs genres.
Standardisation et accessibilité
Pour améliorer l'accessibilité, nous avons retiré environ 20 % des images en tant que doublons et étiqueté les photos restantes avec des métadonnées détaillées. Cela facilite la recherche de caractéristiques spécifiques dans Morphobank et Figshare.
L'objectif est de créer une base de données de référence standardisée d'images d'échantillons. Nous cherchons à ce que notre collection respecte les directives FAIR, garantissant qu'elle soit trouvable, accessible, interopérable et réutilisable. Les images sont sous licence Creative Commons et liées à d'autres bases de données comme la Reptile Database pour un accès plus facile aux descriptions originales et à la littérature.
Caractéristiques morphologiques capturées
Chacune de nos photos capture de nombreuses écailles individuelles, ainsi que leurs caractéristiques telles que la taille, la forme et les motifs. Nous estimons avoir documenté au moins un million de caractères uniques grâce à notre projet. Cette base de données devient particulièrement précieuse lorsqu'elle est combinée avec d'autres sources qui décrivent les espèces.
Les descriptions historiques contiennent souvent des informations détaillées sur les caractéristiques des écailles, qui seront accessibles en même temps que notre base de données d'images. Par exemple, certains genres de lézards ont des caractéristiques distinctes qui peuvent être facilement reconnues, même par ceux qui ne sont pas experts.
Répondre aux défis et futures directions
Ce projet n'est qu'une première étape vers la création d'une base de données d'images de référence complète. Même si nous parvenons à collecter des images de toutes les espèces de reptiles, cela ne reflétera pas la pleine diversité au sein de chaque espèce. Les variations géographiques et individuelles nécessiteront plus d'images pour une représentation précise.
De plus, de nombreux spécimens manquent de métadonnées essentielles, comme des localités précises ou des données biologiques comme le sexe ou l'âge. Ces lacunes peuvent freiner la recherche. Une autre préoccupation est le problème d'incertitude taxonomique ; certains spécimens peuvent être mal identifiés, et les noms changent souvent à mesure que les taxonomistes découvrent de nouvelles informations.
Lier les données et améliorer les ressources
Un aspect essentiel de ce projet est de relier les données collectées aux images et aux bases de données de collection. Cela ouvre des possibilités de liaison avec les données d'observation provenant de plateformes comme iNaturalist ou des données de conservation de l'IUCN. À mesure que les données génomiques deviennent plus pertinentes, relier les phénotypes aux séquences ADN sera également significatif.
Applications des images de référence
La bibliothèque de référence peut être utilisée à diverses fins. D'abord, elle peut aider aux études taxonomiques pour la comparaison et l'identification des espèces. Cela peut être utile pour les naturalistes amateurs qui n'ont pas accès à des informations détaillées sur les espèces. Ensuite, les images permettent aux chercheurs d'examiner plus facilement les traits, surtout lorsqu'elles sont combinées avec des termes standardisés.
Par exemple, les chercheurs peuvent trouver toutes les images montrant un caractère particulier, comme le côté dorsal d'une tête. Cela pourrait également permettre des études sur la variation géographique des espèces. De plus, une analyse automatisée des images pourrait être appliquée à cet ensemble de données, surtout que les reptiles ont des écailles distinctes qui sont plus faciles à quantifier que chez d'autres animaux.
Améliorations et objectifs futurs
Notre objectif principal est d'élargir la collection d'images pour couvrir toutes les espèces de reptiles et finalement toutes les espèces des royaumes animal et végétal. Bien que cela puisse sembler ambitieux, inclure les variations dans les espèces ouvre des possibilités infinies. Ajouter des scans 3D est une option, mais les avantages pourraient ne pas compenser le temps et les ressources nécessaires.
Maintenir la base de données et ses connexions avec d'autres ressources demeure un défi. Cependant, l'adoption d'identifiants standardisés devrait aider à rationaliser ce processus à l'avenir, permettant une transition plus fluide entre les bases de données.
Conclusion
Ce projet représente un effort important pour créer une collection de photos structurée, accessible et standardisée pour les reptiles. Nous encourageons la communauté scientifique à utiliser cette ressource pour faciliter d'autres recherches et explorations dans le domaine de la taxonomie.
Titre: A reference database of reptile images
Résumé: While there are millions of reptile images available online, they are not well organized and not easily findable, accessible, interoperable, or reproducible (FAIR). More importantly, they are not standardized and thus hardly comparable. Here we present a reference database of more than 14,000 standardized images of 1,045 reptile species (969 lizard and 76 snake species), that are based on preserved specimens in 20 different collections, including 533 type species of genera and type specimens of 72 species. All images were taken with standardized views, including dorsal and ventral body shots as well as dorsal, ventral, and lateral views of the heads and other body parts. Although only 11 out of the 20 collections are cross-referenced in Vertnet, some others are indexed in GBIF, and this fraction will certainly grow in the near future. The utility of this and similar image collections will further grow with additional material and further cross-referencing, e.g., to DNA sequence databases or citizen science projects. The images are searchable and freely available on Morphobank.org (Project 5121) and on Figshare.com.
Auteurs: Peter H Uetz, M. Patel, Z. Gbadamosi, S. Shoope, J. Nguyen
Dernière mise à jour: 2024-03-10 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.03.08.584020
Source PDF: https://www.biorxiv.org/content/10.1101/2024.03.08.584020.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.