Améliorer les prévisions de récolte de chou-fleur avec la technologie
Une méthode pour améliorer les prévisions de récolte des choux-fleurs en utilisant l'apprentissage profond.
― 8 min lire
Table des matières
Le chou-fleur est une culture qui doit être récoltée à la main, et il a des normes de qualité strictes pour la vente. Ça rend le timing de la récolte super important. Mais savoir quand un chou-fleur est prêt à être récolté peut être compliqué parce que la tête du chou-fleur est souvent cachée par ses feuilles. La technologie, surtout l'apprentissage profond, peut aider à estimer quand les choux-fleurs sont prêts pour la récolte, mais parfois, elle peut se tromper à cause des différences dans les conditions de culture et d'un nombre limité de données d'entraînement.
Cet article discute d'une méthode pour améliorer la précision de la prédiction du moment de récolte des choux-fleurs. La méthode consiste à analyser la fiabilité d'un classificateur qui décide si un chou-fleur est prêt ou pas. En regardant les parties importantes des images, on peut attribuer des scores de fiabilité à chaque prédiction. Ces scores peuvent aider les agriculteurs à prendre de meilleures décisions et améliorer la précision des prédictions.
Importance du Timing de la Récolte
Des prédictions exactes sur le moment de la récolte sont essentielles pour les agriculteurs. Récolter au bon moment peut conduire à un meilleur rendement et plus de profits. Pour le chou-fleur, le timing devient encore plus délicat car la qualité doit respecter des normes élevées pour la vente. Les choux-fleurs prêts à être récoltés ne le sont peut-être que pour une courte période.
Le climat peut grandement affecter la croissance du chou-fleur. Des champs plantés à différents moments peuvent avoir des choux-fleurs prêts à être récoltés en même temps, et même dans le même champ, les plantes peuvent croître à des rythmes différents. À cause de ça, les travailleurs doivent souvent récolter chaque chou-fleur à la main, ce qui prend du temps.
Dans l'agriculture numérique, les images satellites ou de drones peuvent aider à surveiller les cultures au fil du temps. Les modèles d'apprentissage automatique analysent ces images pour classifier la maturité des cultures. Cela peut fournir aux agriculteurs des prédictions utiles sur combien ils vont récolter et quand. Comme l'agriculteur dépend des prédictions du modèle, il est essentiel qu'il puisse faire confiance à ces résultats.
Aperçu de la Méthode
On se concentre sur le fait de déterminer si des choux-fleurs individuels sont prêts à être récoltés. Notre objectif est de créer un Score de fiabilité pour chaque prédiction faite par le modèle qui aide l'agriculteur dans sa prise de décision.
Pour y parvenir, on utilise une méthode appelée saliency mapping, qui met en avant les parties d'une image importantes pour faire une classification. On regroupe ces cartes en clusters et les relie aux scores de confiance de notre modèle pour créer des scores de fiabilité pour nos prédictions.
Bien qu'il existe des travaux précédents qui essaient d'améliorer les modèles en ajoutant des explications, ils nécessitent généralement une forme d'interaction humaine pendant l'entraînement ou le réentraînement. Notre approche est différente car elle fournit un score de fiabilité après que le modèle a été entraîné, sans avoir besoin d'aide humaine. Ça veut dire qu'on peut l'utiliser avec des modèles existants sans besoin de changements ou de réentraînement.
Contributions du Travail
Ce travail vise à fournir une méthode facile à utiliser pour obtenir des scores de fiabilité sans nécessiter une interaction humaine intensive. On démontre son efficacité avec une application spécifique : améliorer les prédictions de maturité des choux-fleurs en utilisant un jeu de données appelé GrowliFlower. Notre approche améliore les prédictions de manière significative, conduisant à des taux de précision plus élevés.
Détails du Cadre
Notre cadre a un processus en cinq étapes :
Classification : On classe les images de choux-fleurs comme "Prêt" ou "Pas prêt" pour la récolte dans un délai de trois jours.
Saliency Mapping : On génère des cartes de saillance pour les images afin de mettre en évidence les caractéristiques importantes liées à la décision.
Clustering : On utilise une méthode appelée clustering spectral pour regrouper des cartes de saillance similaires et les relier à des scores de fiabilité.
Diffusion : On communique la fiabilité de nos prédictions aux agriculteurs.
Ajustement : On utilise le score de fiabilité pour améliorer les prédictions initiales de classification.
Dans l'étape de classification, on utilise un réseau ResNet18, mais notre cadre peut fonctionner avec d'autres classificateurs aussi.
Techniques de Saliency Mapping
Les cartes de saillance aident à expliquer les décisions du modèle en montrant quelles zones d'une image influencent les prédictions. Pour notre tâche, ces cartes peuvent indiquer des zones critiques à considérer lors de la décision si un chou-fleur est prêt à être récolté. On a utilisé trois méthodes de saliency mapping :
Grad-CAM : Cette méthode utilise des informations de gradient du modèle pour mettre en avant des régions dans l'image qui contribuent aux prédictions.
Occlusion Sensitivity Mapping (OSM) : Cette approche examine comment l'occlusion affecte les prédictions du modèle en masquant des parties de l'image.
Local Interpretable Model-Agnostic Explanations (LIME) : Cette méthode perturbe l'entrée pour voir comment les prédictions changent et utilise un modèle simple pour les expliquer.
On a trouvé que Grad-CAM fournissait les cartes les plus intéressantes pour notre but. Elle mettait en avant des régions où la tête du chou-fleur pourrait être même quand elle était couverte par des feuilles.
Clustering des Cartes de Saillance
Après avoir généré des cartes de saillance, on les regroupe pour mieux comprendre les prédictions du modèle. Le clustering aide à révéler des motifs et potentiellement des prédictions problématiques. On a réalisé un clustering spectral sur nos cartes de saillance, ce qui permet de regrouper selon des similarités au-delà des simples couleurs RGB.
On a réduit les dimensions de nos données pour maintenir une représentation significative tout en assurant la performance du modèle. En analysant ces clusters, on peut voir comment différentes prédictions se comportent, en particulier concernant les Classifications correctes et incorrectes.
Résultats et Analyse
Nos expériences montrent que les clusters de cartes de saillance ne correspondent pas toujours aux classes de maturité à récolter. C'est attendu dans la classification binaire, où les images peuvent partager des caractéristiques indépendamment de leur maturité pour la récolte.
En utilisant des matrices de confusion, on a évalué la performance de notre modèle sur les ensembles de validation et de test. On a atteint une précision globale d'environ 76 % sur l'ensemble de validation. Pour les données de test, environ 72 % des prédictions étaient exactes.
L'analyse de clustering a révélé que certains clusters avaient un taux d'erreur élevé, ce qui signifie que les prédictions étaient probablement fausses. Spécifiquement, on a trouvé qu'un cluster particulier contenait environ 95 % de prédictions fausses, ce qui indiquait que les échantillons de ce cluster étaient généralement peu fiables.
Quand on a ajusté les prédictions en fonction de nos résultats de clustering, on a vu des taux de précision améliorés. Les ajustements ont fait grimper la précision globale à environ 90 % sur l'ensemble de validation, tandis que la précision d'inférence a augmenté à environ 88 %.
Conclusion
Cette méthode réussit à fournir un moyen d'évaluer et d'améliorer la précision des prédictions de maturité à récolter pour les choux-fleurs. L'intégration de cartes de saillance et de clustering nous permet de dériver des scores de fiabilité pour les prédictions sans avoir besoin d'interaction humaine pendant le processus.
Notre approche non seulement améliore la précision mais offre aussi aux agriculteurs des insights compréhensibles et exploitables dans la gestion de leurs cultures. En générant des interprétations des décisions du modèle, on permet aux agriculteurs de prendre des décisions éclairées sur la récolte des choux-fleurs.
À l'avenir, ce cadre peut être appliqué à d'autres cultures et tâches multi-classes, aidant à améliorer encore la fiabilité et la prise de décision en agriculture. La flexibilité de notre méthode signifie qu'elle peut facilement s'intégrer avec des modèles d'apprentissage automatique existants utilisés dans les pratiques agricoles.
Titre: Reliability Scores from Saliency Map Clusters for Improved Image-based Harvest-Readiness Prediction in Cauliflower
Résumé: Cauliflower is a hand-harvested crop that must fulfill high-quality standards in sales making the timing of harvest important. However, accurately determining harvest-readiness can be challenging due to the cauliflower head being covered by its canopy. While deep learning enables automated harvest-readiness estimation, errors can occur due to field-variability and limited training data. In this paper, we analyze the reliability of a harvest-readiness classifier with interpretable machine learning. By identifying clusters of saliency maps, we derive reliability scores for each classification result using knowledge about the domain and the image properties. For unseen data, the reliability can be used to (i) inform farmers to improve their decision-making and (ii) increase the model prediction accuracy. Using RGB images of single cauliflower plants at different developmental stages from the GrowliFlower dataset, we investigate various saliency mapping approaches and find that they result in different quality of reliability scores. With the most suitable interpretation tool, we adjust the classification result and achieve a 15.72% improvement of the overall accuracy to 88.14% and a 15.44% improvement of the average class accuracy to 88.52% for the GrowliFlower dataset.
Auteurs: Jana Kierdorf, Ribana Roscher
Dernière mise à jour: 2023-05-24 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2305.15149
Source PDF: https://arxiv.org/pdf/2305.15149
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.