Amélioration des mesures de l'indice de surface foliaire avec BiLSTM
Cette étude améliore les prédictions de LAI en intégrant des données SAR et optiques.
― 7 min lire
Table des matières
L'Indice de surface foliaire (LAI) est une mesure clé qui nous aide à comprendre combien de surface de feuille il y a dans un champ de culture. C'est super important pour prédire le rendement des cultures comme le blé d'hiver. Par contre, le temps nuageux peut rendre difficile la capture d'images claires des cultures avec des capteurs optiques traditionnels comme Sentinel-2. Ce manque d'images crée des lacunes dans les données, rendant la prédiction des rendements plus compliquée.
Pour régler ce souci, on peut utiliser un autre type de capteur connu sous le nom de Radar à Synthèse d'Ouverture (SAR). Le SAR peut prendre des images peu importe la météo, ce qui nous permet de surveiller les conditions des cultures de manière constante. Une mesure spécifique des données SAR, appelée le ratio entre différents canaux, montre une forte connexion avec les données LAI sur les champs de blé d'hiver. Cette étude examine l'utilisation de données temporelles du SAR Sentinel-1 et d'images optiques Sentinel-2 pour améliorer la précision des mesures de LAI.
Le défi des données
Quand il s'agit de mesurer le LAI, avoir des données cohérentes et fiables dans le temps est super important. Cependant, pendant la saison de croissance des cultures, les nuages peuvent empêcher les capteurs optiques comme Sentinel-2 de capturer des images claires. Ce problème crée beaucoup d'informations manquantes sur les conditions des cultures. Mais on a de la chance, car on a maintenant accès à plus d'un type de capteur et à plus d'images. En combinant les données de ces capteurs, on peut combler les lacunes dans nos enregistrements.
L'objectif est d'améliorer les mesures de LAI en estimant les valeurs manquantes en utilisant à la fois les données SAR et optiques. Les capteurs SAR peuvent fournir des images fiables peu importe les conditions météorologiques, tandis que les capteurs optiques donnent des images de haute qualité quand les conditions le permettent. Ensemble, ils peuvent offrir une vue plus complète des conditions des cultures.
Méthodes pour combler les lacunes
Il y a plusieurs façons de gérer les données manquantes, comme la régression, l'interpolation et la complétion de matrice. L'interpolation est une méthode qui tente de fournir une transition douce entre les points de données. Cependant, elle a besoin d'assez de points environnants pour le faire efficacement. Les méthodes de régression trouvent des relations entre différents ensembles de données pour estimer les valeurs manquantes. Bien que la régression puisse bien fonctionner, elle peut avoir du mal quand les relations sont complexes.
Étant donné la nature des données, on peut aborder le problème d'estimation des valeurs LAI comme une tâche pour comprendre comment les différentes données de séries temporelles se rapportent les unes aux autres. Pour cela, on propose d'utiliser un certain type de réseau de neurones appelé Bidirectional Long Short-Term Memory (BiLSTM). Ce genre de réseau peut prendre en compte les informations des données passées et futures, lui permettant d'apprendre des relations complexes au sein des données.
Pourquoi utiliser BiLSTM ?
Le réseau apprend des deux directions des données, ce qui signifie qu'il peut capturer des informations importantes qu'un modèle LSTM standard pourrait manquer. Cette propriété est particulièrement utile quand il y a beaucoup de variabilité dans les données ou quand certaines valeurs sont manquantes. L'approche BiLSTM nous permet de faire des prédictions plus précises sur le LAI, même quand il n'y a que quelques images disponibles ou quand les périodes de floraison et de sénescence se produisent.
Préprocessing des données
Avant de nourrir les données au réseau BiLSTM, on doit bien les préparer. On analyse deux régions différentes, une en Allemagne et l'autre en Chine, pour entraîner et évaluer les méthodes d'imputation. Les images Sentinel-2 et Sentinel-1 de ces zones sont recueillies et traitées pour s'assurer qu'on tire le meilleur parti des données disponibles.
Pour Sentinel-2, on effectue une correction atmosphérique pour s'assurer que les images reflètent avec précision les conditions des cultures. On sélectionne seulement les images qui n'ont pas été fortement affectées par les nuages pour créer une série temporelle fiable pour le LAI.
Pour Sentinel-1, on collecte des images des mêmes périodes et localisations. On traite ces images pour réduire le bruit et améliorer la qualité des données qu'on va utiliser pour notre analyse.
Comparer différentes méthodes
Après avoir traité les données, on applique diverses méthodes pour voir laquelle donne les meilleurs résultats d'imputation pour les valeurs LAI manquantes. On compare la performance de BiLSTM avec d'autres méthodes plus simples comme la régression polynomiale et exponentielle.
Dans les régions avec des conditions de culture similaires, les méthodes plus simples peuvent fonctionner raisonnablement bien. Cependant, elles ont souvent du mal quand les relations entre les ensembles de données deviennent plus compliquées. Dans ces cas, le réseau BiLSTM se démarque, fournissant des résultats bien meilleurs.
Résultats expérimentaux
On a réalisé plusieurs tests pour comparer comment chaque méthode fonctionne pour estimer les valeurs LAI manquantes. Les résultats ont montré que les réseaux LSTM et BiLSTM ont largement surpassé les méthodes de régression plus simples. Non seulement ils ont réussi à combler les lacunes de manière plus efficace, mais ils ont aussi produit des estimations plus fiables pendant les périodes de croissance critiques pour le blé d'hiver.
Dans une expérience, le modèle a réussi à capter les variations du LAI pendant les saisons pluvieuses quand la couverture nuageuse a limité les données disponibles des capteurs optiques. Même dans des situations où les données SAR montraient un bruit ou une variabilité accrue, le réseau BiLSTM maintenait son exactitude.
Analyse spatiale
En plus d'examiner la performance temporelle, on a aussi analysé les résultats spatiaux. On a regardé à quel point les valeurs imputées corrélaient bien avec les mesures réelles prises sur le terrain. Les méthodes LSTM et BiLSTM ont donné de meilleurs résultats d'erreur quadratique moyenne (RMSE) comparé aux méthodes de régression, indiquant une plus grande précision.
Les valeurs imputées montraient des transitions douces à travers les champs, suggérant que les méthodes étaient efficaces pour maintenir les caractéristiques spatiales des zones cultivées. Dans les cas où les valeurs LAI étaient mesurées directement, les résultats de la méthode BiLSTM étaient souvent beaucoup plus proches des données observées.
Conclusion
Cette étude montre qu'utiliser un réseau BiLSTM pour combiner des données de différentes sources peut significativement améliorer la fiabilité des mesures de LAI dans des champs de culture comme le blé d'hiver. En comblant efficacement les valeurs manquantes, on peut mieux prédire les rendements des cultures et gérer les pratiques agricoles plus efficacement.
Les résultats prometteurs de cette approche indiquent qu'elle peut être appliquée à d'autres scénarios où les données temporelles ont des lacunes. À mesure que la technologie avance et que plus de données deviennent disponibles, on peut s'attendre à améliorer encore les efforts de surveillance et de gestion agricoles.
Avec des recherches et un développement continus, l'intégration de différents types de sources de données conduira à de meilleures pratiques agricoles et à une meilleure sécurité alimentaire. Le travail présenté ici fournit une base solide pour de futures avancées dans le domaine de la télédétection et de la surveillance des cultures.
Titre: Combining multitemporal optical and SAR data for LAI imputation with BiLSTM network
Résumé: The Leaf Area Index (LAI) is vital for predicting winter wheat yield. Acquisition of crop conditions via Sentinel-2 remote sensing images can be hindered by persistent clouds, affecting yield predictions. Synthetic Aperture Radar (SAR) provides all-weather imagery, and the ratio between its cross- and co-polarized channels (C-band) shows a high correlation with time series LAI over winter wheat regions. This study evaluates the use of time series Sentinel-1 VH/VV for LAI imputation, aiming to increase spatial-temporal density. We utilize a bidirectional LSTM (BiLSTM) network to impute time series LAI and use half mean squared error for each time step as the loss function. We trained models on data from southern Germany and the North China Plain using only LAI data generated by Sentinel-1 VH/VV and Sentinel-2. Experimental results show BiLSTM outperforms traditional regression methods, capturing nonlinear dynamics between multiple time series. It proves robust in various growing conditions and is effective even with limited Sentinel-2 images. BiLSTM's performance surpasses that of LSTM, particularly over the senescence period. Therefore, BiLSTM can be used to impute LAI with time-series Sentinel-1 VH/VV and Sentinel-2 data, and this method could be applied to other time-series imputation issues.
Auteurs: W. Zhao, F. Yin, H. Ma, Q. Wu, J. Gomez-Dans, P. Lewis
Dernière mise à jour: 2023-07-14 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2307.07434
Source PDF: https://arxiv.org/pdf/2307.07434
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.