IA et suivi des fleurs sauvages : une nouvelle approche
Utiliser l'IA pour améliorer le suivi des fleurs sauvages et la santé des écosystèmes.
― 10 min lire
Table des matières
- Suivi des Fleurs Sauvages
- Le Dataset de Fleurs Sauvages d'Eindhoven
- Défis dans le Suivi des Fleurs Sauvages
- Détection d'objets pour le Suivi des Fleurs Sauvages
- Construction du Dataset EWD
- Définition des Unités de Compte Florales
- Annotation du EWD
- Entraînement du Modèle IA
- Performance du Modèle
- Conclusion
- Source originale
- Liens de référence
Les fleurs sauvages, aussi appelées plantes à fleurs, sont des plantes qui produisent des fleurs qui se transforment ensuite en fruits contenant des graines après la pollinisation. Ces plantes jouent un rôle essentiel dans notre environnement. Elles existent depuis environ 130 millions d'années, ce qui les rend relativement nouvelles par rapport à d'autres formes de vie comme les mammifères. Actuellement, il y a plus de 300 000 espèces de plantes à fleurs, ce qui est plus que toutes les autres types de plantes réunies. Ce sont les plantes les plus courantes qu'on trouve sur terre.
Les fleurs sauvages se présentent sous plein de couleurs, formes et textures différentes. Cette variété les aide à attirer des pollinisateurs comme les abeilles et les papillons. Au-delà de leur beauté, les fleurs sauvages fournissent des services essentiels. Par exemple, leurs systèmes racinaires aident à garder le sol sain, à purifier l'eau et à prévenir l'érosion. Les plantes aident aussi à réguler les températures en ville, fournissent des matériaux pour la construction, de la nourriture et plein de médicaments. En plus, grâce à la photosynthèse, les plantes absorbent le dioxyde de carbone, ce qui peut aider à réduire le changement climatique.
Une diversité de plantes est cruciale pour maintenir les écosystèmes en bonne santé. Cependant, beaucoup de ces écosystèmes sont en danger à cause de la perte de biodiversité. Pour aider à maintenir ces écosystèmes, il est important d'avoir des systèmes en place pour suivre la santé des différentes espèces au fil du temps.
Suivi des Fleurs Sauvages
Actuellement, le suivi des fleurs sauvages implique souvent que des gens comptent les fleurs à la main sur le terrain. Cette méthode peut être lente et sujette à des erreurs. Bien qu'il existe des apps pour smartphones qui aident à identifier différentes espèces de plantes, beaucoup de ces apps ne sont pas capables de gérer des images montrant plusieurs plantes en même temps. Elles fonctionnent mieux avec des photos en gros plan d'une seule fleur.
Du coup, il y a besoin de meilleures méthodes pour surveiller les fleurs sauvages à plus grande échelle. Utiliser l'intelligence artificielle (IA) pour analyser des images pourrait être une solution. La technologie IA a avancé dans plusieurs domaines, comme les voitures autonomes et l'imagerie médicale, mais elle n'a pas encore été largement appliquée au suivi des fleurs sauvages.
L'objectif est de créer un système IA qui peut compter automatiquement les fleurs sauvages sur des images montrant différentes espèces en même temps. Cette tâche comporte deux étapes principales : d'abord, créer une collection d'images étiquetées avec des données précises sur les fleurs dans chaque image ; ensuite, entraîner un modèle IA pour reconnaître et compter les différentes espèces.
Le Dataset de Fleurs Sauvages d'Eindhoven
Le Dataset de Fleurs Sauvages d'Eindhoven (EWD) est une collection de plus de 2000 images de haute qualité de fleurs sauvages prises d'en haut dans cinq types de paysages différents aux Pays-Bas, comme les bords de route et les parcs. Les images incluent une grande variété d'herbes et ont été capturées sur deux saisons de floraison.
Dans la création du dataset, un expert en plantes a pris des notes sur les espèces présentes dans chaque image. L'objectif était de s'assurer que le dataset inclut plein de différentes espèces de fleurs sauvages et assez d'images de chacune. Cela permettrait au modèle IA d'apprendre et de reconnaître la variété de fleurs dans leur habitat naturel sans privilégier une en particulier.
Le dataset contient non seulement des images, mais aussi des Annotations qui indiquent quelles fleurs sont présentes dans chaque image et leurs types spécifiques. La qualité des annotations est essentielle car elle garantit que n'importe quelle IA entraînée sur ces données peut apprendre de manière précise.
Défis dans le Suivi des Fleurs Sauvages
Il y a des défis distincts liés à la surveillance des fleurs sauvages. Les arrière-plans des images peuvent être chargés, rendant difficile de voir les fleurs. De plus, les fleurs passent par diverses étapes de croissance, des boutons aux fleurs complètement écloses puis flétries, ce qui change leur apparence avec le temps. Par conséquent, identifier les fleurs correctement devient plus compliqué.
Comme il existe beaucoup de types de fleurs sauvages, un modèle IA doit être capable de reconnaître des différences subtiles entre des espèces similaires. Cela nécessite une approche sophistiquée pour apprendre sur les fleurs sauvages.
Pour relever ces défis, certaines méthodes de base peuvent être utilisées, comme utiliser des caractéristiques comme la couleur et la forme pour aider à identifier les fleurs. Des techniques plus avancées impliquent l'utilisation de l'apprentissage profond, où les modèles apprennent à partir de grands ensembles de données étiquetées.
Détection d'objets pour le Suivi des Fleurs Sauvages
Au lieu de simplement identifier des fleurs individuelles, la détection d'objets implique de reconnaître et de localiser plusieurs fleurs dans une seule image. Cette approche répond à deux questions : Quelles fleurs sont présentes ? Et où sont-elles situées dans l'image ? Cette méthode est essentielle pour compter avec précision les fleurs dans une scène.
Pour la détection d'objets, les images doivent être étiquetées avec des boîtes englobantes autour des fleurs. Ces étiquettes aident l'IA à apprendre quelles parties d'une image correspondent à quelles fleurs.
En comparant les prédictions de l'IA avec les étiquettes réelles, on peut mesurer la performance du modèle. Par exemple, le score de précision moyenne (mAP) nous aide à comprendre à quel point le modèle détecte et compte les fleurs avec précision.
Alors que certains modèles sont conçus pour l'efficacité, d'autres se concentrent davantage sur la précision. Pour ce projet, l'accent est mis sur la précision car c'est plus crucial pour un suivi précis.
Construction du Dataset EWD
La collecte des images EWD a impliqué des techniques spécifiques pour s'assurer que les données collectées étaient utiles. Chaque image a été prise d'environ 1,5 à 1,9 mètres au-dessus du sol et offrait une vue claire d'une zone d'environ 1 mètre carré. La collecte s'est faite sur deux saisons de floraison complètes pour garantir une diversité de fleurs.
Les images ont été prises dans divers environnements comme des parcs urbains, des bords de route et des terres agricoles, offrant une vue bien ronde de la diversité des fleurs sauvages. Dans le cadre de la collecte de données, l'expert a enregistré des détails sur les plantes de chaque image pour garantir une identification appropriée plus tard.
Pour s'assurer que le dataset reste confidentiel et ne divulgue pas les emplacements de plantes rares, toutes les métadonnées ont été supprimées.
Définition des Unités de Compte Florales
Chaque fleur fait partie d'un groupe connu sous le nom d'inflorescence, qui peut varier entre les différentes familles de plantes. Comprendre ces types d'inflorescence est vital pour compter les fleurs avec précision. Dans certains cas, il peut être difficile de distinguer les fleurs individuelles, surtout si elles sont densément regroupées. Dans ces cas, une méthode simple est utilisée, comme compter les fleurs individuelles ou des groupes de fleurs plus larges.
Cette étude utilise des unités de compte florales (FCUs) basées sur le type d'inflorescence, permettant un comptage cohérent à travers le dataset. Pour chaque espèce à fleurs dans le dataset, des lignes directrices spécifiques ont été établies pour garantir la cohérence.
Annotation du EWD
Ajouter des annotations aux images peut être un processus long. Pour garantir des annotations de haute qualité, un expert a suivi des directives visant à rendre le processus aussi clair et objectif que possible.
Les règles incluent de s'assurer que toutes les fleurs visibles sont annotées, d'utiliser des boîtes englobantes serrées, et d'exclure les fleurs dans des états de qualité inférieure. Suivre ces règles aide l'IA à apprendre à ignorer les données non pertinentes ou déroutantes, ce qui pourrait affecter négativement sa performance.
En utilisant un outil dédié à l'annotation, le dataset a été construit de manière organisée et prête à être utilisée pour l'entraînement de l'IA.
Entraînement du Modèle IA
Après avoir préparé le dataset, l'étape suivante était d'entraîner un modèle IA capable de détecter et de compter automatiquement les fleurs sauvages. Le processus d'entraînement implique de nourrir l'IA avec les images de haute résolution et leurs annotations correspondantes pour lui apprendre à reconnaître différentes espèces de fleurs et leurs emplacements.
Pour un traitement efficace, les images ont été divisées en petits morceaux pour maintenir la qualité tout en s'adaptant à la taille d'entrée du modèle. Cette approche aide à récupérer les détails essentiels nécessaires pour l'identification des fleurs.
De plus, pour éviter un biais dans le modèle dû à la représentation inégale des différentes espèces de fleurs dans le dataset, un sous-ensemble équilibré a été créé. Cette méthode garantit que chaque espèce est représentée de manière égale pendant l'entraînement.
Performance du Modèle
Après avoir terminé l'entraînement, le modèle a été testé pour évaluer à quel point il pouvait identifier et compter les fleurs. Le modèle entraîné a pu générer des prédictions pour les emplacements et les espèces de fleurs avec un taux de précision élevé, mesuré par le score de précision moyenne.
L'IA a bien performé pour la plupart des espèces, surtout celles avec des inflorescences claires et simples. Cependant, certaines espèces avec des structures florales complexes se sont révélées plus difficiles à détecter pour le modèle.
Dans l'ensemble, les résultats montrent que l'IA peut bien généraliser sur des images non vues, ce qui est un bon signe pour son utilisation future dans le suivi des fleurs sauvages.
Conclusion
Ce travail a produit deux contributions significatives : un dataset de haute qualité pour le suivi des fleurs sauvages et un modèle de détection d'objets fonctionnel capable d'identifier et de compter les espèces de fleurs à partir d'images.
L'EWD fournit une base solide pour des recherches futures et est disponible pour la communauté scientifique. Le modèle entraîné sur l'EWD est capable de reconnaître et de compter une variété d'espèces de fleurs, en faisant un outil précieux pour surveiller les fleurs sauvages.
À mesure que la technologie évolue, le potentiel de l'IA dans la recherche écologique croît, ouvrant la voie à une meilleure compréhension et protection de nos environnements naturels. En garantissant des données de haute qualité et des processus d'entraînement rigoureux, nous pouvons développer des solutions efficaces pour surveiller nos écosystèmes et soutenir la biodiversité.
Titre: Data-centric AI approach for automated wildflower monitoring
Résumé: Both researchers and policy makers are in need of standards and tools that help understanding and assessing natural capital. Wildflowers are a major component of our natural capital; they play an essential role in ecosystems, improve soil health, supply food and medicines, and curb climate change. In this paper, we present the Eindhoven Wildflower Dataset (EWD) as well as a PyTorch object detection model that is able to identify and count wildflowers. EWD, collected over two entire flowering seasons and expert annotated, contains 2002 top-view images of flowering plants captured in the wild in five different landscape types (roadsides, urban green spaces, cropland, weed-rich grassland, marshland). It holds a total of 65571 annotations for 160 species belonging to 31 different families of flowering plants and serves as a reference dataset for automating wildflower monitoring. To ensure consistent annotations, we define specific floral count units (largely based on inflorescences) and provide extensive annotation guidelines. With a 0.82 mAP (@IoU > 0.50) score the presented baseline model, trained with a balanced subset of EWD, is to the best of our knowledge superior in its class. Our approach empowers automated quantification of wildflower richness and abundance and encourages the development of standards for AI-based wildflower monitoring. The annotated EWD dataset is publicly available on the DataverseNL research data repository, and the code to train and run the baseline model is supplied as supplementary material.
Auteurs: Gerard Schouten, B. Michielsen, B. Gravendeel
Dernière mise à jour: 2024-04-22 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.04.18.590040
Source PDF: https://www.biorxiv.org/content/10.1101/2024.04.18.590040.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.