Avancées dans l'identification des espèces de lézards
Une nouvelle technologie aide à identifier efficacement les espèces de lézards amazoniens.
― 8 min lire
Table des matières
- Le Rôle des Pièges Photo dans la Recherche sur la Biodiversité
- Le Passage de l'Identification Manuelle aux Processus Automatisés
- Utilisation de la Technologie Mobile pour l'Identification des Espèces
- Méthode de Collecte et de Traitement des Données
- Traitement des Images pour une Meilleure Classification
- Choix des Bons Modèles pour la Classification
- Évaluation de la Performance des Modèles
- Données Collectées et Améliorations Continues
- Conclusion : Rendre l'Identification des Espèces Plus Accessible
- Source originale
Les lézards font partie d'un grand groupe de reptiles appelés Squamata, qui inclut aussi les serpents. Une des caractéristiques principales des lézards, c'est leur peau écailleuse. Pour identifier les différentes Espèces de lézards, les scientifiques examinent divers traits physiques, appelés caractéristiques, surtout ceux qu'on trouve sur les écailles de leur tête, de leur corps et de leur queue.
Ces dernières années, la technologie a rendu plus facile pour les scientifiques d'étudier et de suivre les lézards et d'autres animaux sauvages. Avec des outils comme des enregistreurs de son et des pièges photo, les chercheurs peuvent collecter plein d'infos sans dépenser trop d'argent. Ça a été super utile pour répondre à des questions importantes : a) Quelles espèces de lézards sont trouvées dans une certaine zone ? b) Quels comportements montrent-ils ? et c) Combien de lézards vivent dans cette région ? Suivre ces lézards dans les forêts est un boulot difficile qui demande une bonne planification et des compétences, ce qui rend ça assez compliqué pour ceux qui essaient de protéger ces animaux.
Le Rôle des Pièges Photo dans la Recherche sur la Biodiversité
Une des principales sources de Données pour étudier la biodiversité, ce sont les Images des pièges photo. Ces images aident les scientifiques à identifier les espèces, comprendre leurs nombres et déterminer où elles vivent. Cependant, la surveillance à distance a ses propres défis, surtout quand il s'agit d'identifier des animaux sur de grandes zones.
Les efforts récents pour l'identification automatique des espèces peuvent être classés en deux groupes principaux : la recherche en laboratoire et celle sur le terrain. Dans la recherche en laboratoire, les scientifiques suivent des directives strictes pour prendre des images et travaillent généralement en étroite collaboration avec un expert. En revanche, la recherche sur le terrain permet aux scientifiques de prendre des photos avec des appareils mobiles, ce qui peut être plus facile et flexible.
Par exemple, en étudiant les insectes, les méthodes de laboratoire sont souvent préférées car examiner des spécimens prend du temps et demande des soins particuliers. D'un autre côté, les mammifères et les poissons sont généralement identifiés grâce à des images prises sur le terrain. Les plantes, elles, peuvent souvent être étudiées aussi bien en laboratoire que dans la nature.
Les chercheurs utilisent souvent des techniques avancées comme l'apprentissage automatique pour analyser ces images. Cette technologie leur permet d'apprendre des données et d'améliorer leur capacité à identifier les espèces grâce à la Classification des images.
Le Passage de l'Identification Manuelle aux Processus Automatisés
Avant l'arrivée de technologies comme la vision par ordinateur et l'intelligence artificielle, identifier des espèces nécessitait souvent beaucoup de travail manuel. Cette approche peut entraîner des erreurs et des sous-estimations, surtout quand il s'agit de compter de grands groupes d'animaux comme les oiseaux de mer ou les chauves-souris. Le passage aux systèmes d'identification automatisés a changé la donne, permettant une collecte de données plus précise et efficace.
Avec la classification automatique des images, les chercheurs peuvent appliquer ces nouvelles méthodes à différentes espèces. De nombreuses études récentes montrent comment la classification automatique fonctionne bien grâce à des techniques d'apprentissage profond. Ces études se concentrent sur l'utilisation d'algorithmes de vision par ordinateur pour classifier diverses espèces animales.
Utilisation de la Technologie Mobile pour l'Identification des Espèces
Dans une nouvelle étude, des chercheurs ont créé un programme open-source pour classifier automatiquement des images de lézards de la forêt amazonienne. Ils ont conçu ce programme pour être utilisé sur des smartphones, le rendant accessible à tous. Grâce à des Modèles avancés pour le traitement des images, ils ont obtenu d'excellents résultats en classifiant différentes espèces de lézards.
Bien que de nombreux chercheurs aient utilisé ces techniques avancées pour d'autres animaux, il a été constaté que très peu les ont appliquées aux images tridimensionnelles de lézards amazoniens. L'équipe a validé son travail grâce à une combinaison de données synthétiques et d'images réelles d'une collection muséale.
Méthode de Collecte et de Traitement des Données
L'équipe de recherche a collecté des échantillons dans un musée au Brésil, qui possède une grande collection d'amphibiens et de reptiles. Ils se sont concentrés sur trois espèces spécifiques de lézards trouvées en Amazonie. Après avoir pris des photos de chaque lézard sous différents angles (dorsal, latéral et ventral), ils ont créé un ensemble d'images représentant chaque spécimen.
Pour créer un ensemble de données utile pour l'analyse, les chercheurs ont retiré les images de mauvaise qualité. Ils se sont retrouvés avec une collection de 240 images de lézards, garantissant une représentation proportionnelle de chaque espèce.
Traitement des Images pour une Meilleure Classification
Le traitement des images a impliqué de les organiser de façon à ce que chaque vue dorsale, latérale et ventrale d'un lézard soit représentée par différents canaux de couleur. Après avoir redimensionné les images, ils ont divisé les données en ensembles d'entraînement et de validation, utilisant diverses techniques pour améliorer les données. En faisant de légères modifications aux images, ils ont pu créer beaucoup plus d'échantillons pour mieux entraîner leurs modèles.
Choix des Bons Modèles pour la Classification
L'équipe a choisi des modèles MobileNet pour leur système d'identification des espèces car ils sont efficaces et fonctionnent bien sur les appareils mobiles. Ils ont comparé différentes versions de MobileNet et les ont utilisés pour extraire des caractéristiques des images. Cette combinaison aide à éviter le surajustement du modèle, ce qui peut se produire quand un modèle apprend trop des données d'entraînement, le rendant moins performant sur de nouvelles données.
Les chercheurs ont également sélectionné des modèles d'apprentissage automatique traditionnels, qui ont connu du succès dans les études biologiques. Ils ont utilisé plusieurs algorithmes pour voir lesquels fonctionnaient le mieux avec leurs caractéristiques extraites.
Évaluation de la Performance des Modèles
Pour comparer la performance des différents modèles, les chercheurs ont utilisé des tests statistiques. Cette évaluation a montré qu'un des modèles les plus simples fonctionnait aussi bien qu'un modèle plus complexe. Cette découverte suggère qu'un modèle moins compliqué pourrait encore donner des résultats précis, le rendant plus accessible.
L'équipe a créé des matrices de confusion pour visualiser à quel point leur modèle classifiait bien les différentes espèces de lézards. Ils ont constaté que le modèle faisait un excellent travail d'identification des espèces avec précision.
Données Collectées et Améliorations Continues
La collection du musée a été utilisée pour rassembler des échantillons tridimensionnels, permettant un examen approfondi des espèces de lézards. La recherche s'est concentrée sur l'assurance que les données étaient collectées de manière précise et cohérente, ce qui est important pour les études en cours dans ce domaine.
Au lieu d'utiliser des outils coûteux comme la numérisation 3D, les chercheurs ont opté pour une approche basée sur les smartphones, plus accessible. Ce choix leur a permis de capturer des images sans avoir besoin de compétences ou d'équipements spécialisés.
Conclusion : Rendre l'Identification des Espèces Plus Accessible
En utilisant des méthodes innovantes de collecte et de traitement des données, les chercheurs ont commencé à rendre l'identification des espèces plus facile et plus accessible. C'est particulièrement utile pour les efforts de conservation et l'étude de la biodiversité. Grâce aux avancées technologiques, il est devenu possible de surveiller la faune avec plus de précision et d'efficacité.
Le travail réalisé sur les lézards amazoniens illustre l'importance d'utiliser des outils modernes pour améliorer notre compréhension de la faune. Alors que la technologie continue d'évoluer, le potentiel pour plus de découvertes et de meilleures stratégies de conservation est énorme.
À travers cette étude, les chercheurs ont montré qu'avec des ressources limitées, on peut réaliser des progrès significatifs dans l'identification et la compréhension des espèces. Cette approche peut servir de modèle pour de futures études en conservation de la faune à travers le monde.
Titre: LizardNet: A mobile hybrid deep learning tool for classification of 3D representations of Amazonian lizards
Résumé: Image classification is a highly significant field in machine learning (ML), especially when applied to address longstanding and challenging issues in the biological sciences. In this study, we present the development of a hybrid deep learning-based tool suitable for deployment on mobile devices. This tool is aimed at processing and classifying three-dimensional samples of endemic lizard species from the Amazon rainforest. The dataset used in our experiment was collected at the Museu Paraense Emilio Goeldi (MPEG), Belem-PA, Brazil, and comprises three species: a) Anolis fuscoauratus; b) Hoplocercus spinosus; and c) Polychrus marmoratus. We compared the effectiveness of four artificial neural networks (ANN) for feature extraction: a) MobileNet; b) MobileNetV2; c) MobileNetV3Small; and d) MobileNetV3Large. Additionally, we evaluated five classical ML models for classifying the extracted patterns: a) Support Vector Machine (SVM); b) GaussianNB (GNB); c) AdaBoost (ADB); d) K-Nearest Neighbors (KNN); and e) Random Forest (RF). Our most effective model, MobileNetV3-Small + Linear SVM, achieved an accuracy of 0.948 and a f1-score of 0.955. Notably, it not only proved to be the least complex model among all combinations but also demonstrated the best performance after a statistical comparison. These results indicate that the combination of deep learning (DL) models with less complex classical ML algorithms, which have a lower error propensity, emerges as a viable and efficient technique for classifying three-dimensional lizard species samples. Such an approach facilitates taxonomic identification work for professionals in the field and provides a tool adaptable for integration into mobile data recording equipment, such as smartphones. Author summaryThe taxonomic classification of lizards requires an exceptional level of knowledge and attention to minute details beyond the ordinary to accurately categorize specimens. Such tasks impose significant mental and visual costs on humans, unlike computer vision algorithms capable of extracting visual patterns from images imperceptible to the human eye. In this research, we utilized a dataset from the herpetarium of the Emilio Goeldi Museum in Belem-PA, Brazil. The data were self-captured, with each sample comprised of three photos: dorsal, lateral, and ventral views of each specimen. The sample size was constrained by the quality and abundance of preserved specimens, necessitating the application of a data augmentation method on the pre-separated training and validation sets. This augmentation led to a considerable increase in the number of samples per species, from a few dozen to several hundred. Our experimental approach involved utilizing pre-trained neural networks to extract 3D sample characteristics, subsequently classified using classical machine learning algorithms. This hybrid strategy was adopted due to the nature of data collection and synthetic data augmentation. Our method enables specimen identification through three-dimensional representations, allowing for a more comprehensive utilization of morphological information by the model.
Auteurs: Bruno Duarte Gomes, A. G. da Silva, R. P. de Oliveira, E. A. de Carvalho, C. d. O. Bastos
Dernière mise à jour: 2024-01-17 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.01.15.575627
Source PDF: https://www.biorxiv.org/content/10.1101/2024.01.15.575627.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.