Migliorare la classificazione delle colture con dati combinati
Un nuovo metodo migliora la classificazione delle colture usando più fonti di dati per avere una precisione migliore.
― 7 leggere min
Indice
- L'Approccio
- Risultati e Prestazioni
- Importanza della Mappatura dei Tipi di Coltura
- Lavoro Correlato nella Classificazione delle Colture
- La Nostra Metodologia: Combinare Diversi Tipi di Dati
- Creazione di un Nuovo Dataset
- Valutazione e Confronto dei Modelli
- Affrontare le Sfide nella Classificazione delle Colture
- Direzioni Future
- Fonte originale
- Link di riferimento
Classificare correttamente i raccolti durante la stagione di crescita è davvero importante. Questa classificazione aiuta a stimare la produzione agricola e a monitorare il terreno agricolo. Però, classificare i raccolti può essere complicato a causa dei modelli naturali di crescita e di come cambiano nel tempo e in diverse aree.
Metodi recenti che usano il deep learning sembrano promettenti, ma la maggior parte si basa su un solo tipo di dato, come immagini satellitari o modelli di rotazione delle colture. Il nostro nuovo metodo combina diversi tipi di dati per migliorare l'accuratezza in vari periodi di crescita e paesi.
L'Approccio
Il nostro approccio utilizza tre tipi di dati:
Dati di telerilevamento: Osservazioni da satelliti, in particolare Sentinel-2 e Landsat 8.
Dati di Rotazione delle Colture: Informazioni su quali raccolti sono stati coltivati in un appezzamento di terreno nelle stagioni precedenti.
Dati di Distribuzione Locale delle Colture: Comprensione di come i raccolti sono distribuiti in un'area specifica.
Per testare il nostro metodo, abbiamo creato un nuovo dataset contenente informazioni su circa 7,4 milioni di appezzamenti agricoli in Francia e nei Paesi Bassi. Ogni appezzamento è collegato a dati temporali che includono misurazioni di riflettanza superficiale e importanti variabili di salute delle piante. Inoltre, abbiamo sviluppato un nuovo modo di raggruppare i tipi di colture che aiuta a valutare le prestazioni del modello.
Risultati e Prestazioni
Le prestazioni del nostro metodo sono state testate utilizzando diversi raggruppamenti di tipi di raccolto, variando da 151 a solo 8 tipi. L'accuratezza è variata dal 91% al 95% per i Paesi Bassi e dall'85% all'89% per la Francia. Allenando il modello su un dataset più grande, il nostro metodo ha mostrato anche di adattarsi e funzionare bene in diversi paesi.
L'addestramento preliminare su un dataset ha aiutato a migliorare le prestazioni del nostro modello quando applicato a un altro, permettendogli di adattarsi meglio a nuovi compiti con esempi limitati.
Importanza della Mappatura dei Tipi di Coltura
Mappare i tipi di coltura è fondamentale per monitorare la produzione agricola e la sicurezza alimentare globale. I sistemi satellitari forniscono dati preziosi perché possono osservare ampie aree in modo costante e ripetuto. Dal 2015, i dati del programma Copernicus dell'Unione Europea, in particolare da Sentinel-1 e Sentinel-2, hanno offerto dati affidabili ad alta risoluzione.
La maggior parte dei metodi attuali per la classificazione delle colture si concentra solo sui dati della stagione di crescita, ignorando cambiamenti annuali cruciali nelle pratiche agricole.
Il nostro metodo combina i dati di rotazione delle colture con quelli di telerilevamento e informazioni locali, offrendo una visione più completa dei tipi di coltura nel tempo. Abbiamo anche costruito un dataset di più anni di dati temporali dagli stessi appezzamenti, permettendo analisi migliori.
Lavoro Correlato nella Classificazione delle Colture
La ricerca sulla classificazione delle colture è stata divisa in diverse aree, concentrandosi su:
Uso di Solo Dati di Telerilevamento: Alcuni studi classificano le colture a livello di appezzamento utilizzando dati da satelliti come Sentinel-2. Questi studi spesso confrontano modelli di deep learning come i Transformers e le reti LSTM.
Integrazione dei Dati di Rotazione delle Colture: È emersa anche ricerca che combina telerilevamento con dati di rotazione delle colture. Tuttavia, questi metodi spesso usano modelli più semplici e non catturano efficacemente la complessità delle variazioni delle colture nel tempo.
Classificazione Anticipata della Stagione: Identificare i tipi di colture all'inizio della stagione di crescita sta diventando un focus principale. Alcuni studi hanno iniziato a utilizzare metodi specializzati per migliorare le capacità previsionali della stagione iniziale.
Nonostante questi progressi, pochi studi hanno cercato di integrare efficacemente diverse modalità di dati, specialmente su come cambiano le dinamiche stagionali.
La Nostra Metodologia: Combinare Diversi Tipi di Dati
Il nostro metodo si distingue per la fusione di dati di rotazione delle colture, telerilevamento e distribuzione locale delle colture. Usiamo reti neurali per elaborare insieme queste modalità, aggiungendo una struttura gerarchica che aiuta ad analizzare sia i modelli di coltura a breve che a lungo termine.
Rotazione delle Colture: Questo è trattato come una sequenza di parole in una frase, utilizzando un metodo simile ai modelli linguistici trovati nell'elaborazione del linguaggio naturale. Modellando le sequenze di colture, possiamo prevedere meglio i raccolti futuri.
Dati di Telerilevamento: I dati di Sentinel-2 e Landsat 8 vengono utilizzati per arricchire la nostra comprensione della salute delle colture e delle loro caratteristiche nel tempo.
Distribuzione Locale delle Colture: Questi approfondimenti ci aiutano a capire come le pratiche agricole e il clima influenzano la distribuzione delle colture.
Integrando questi tipi di dati in modo strutturato, possiamo migliorare la capacità del modello di analizzare i tipi di colture con maggiore precisione.
Creazione di un Nuovo Dataset
Abbiamo rilasciato un nuovo dataset che fornisce informazioni dettagliate sulle colture insieme ai dati di telerilevamento, coprendo più stagioni di crescita dal 2016 al 2020. Il nostro dataset contiene oltre 7,4 milioni di appezzamenti, offrendo una risorsa significativa per ulteriori ricerche e sviluppi.
Raccolta Dati
I dati sono stati raccolti da due paesi: Francia e Paesi Bassi, selezionati per i loro registri accessibili e la diversità nelle pratiche agricole. Ci siamo assicurati che i dati sugli appezzamenti provenienti da più stagioni fossero armonizzati per consentire confronti accurati.
Struttura del Dataset
Il dataset include:
- Etichette del tipo di coltura per ogni appezzamento.
- Dati temporali di telerilevamento che forniscono approfondimenti sull'indice di area fogliare (LAI) e la frazione di radiazione fotosinteticamente attiva assorbita (FAPAR).
- Dati Storici su quali colture sono state piantate negli anni precedenti.
Questo ricco dataset offre grandi opportunità per costruire modelli che possono prevedere i tipi di colture con maggiore precisione.
Valutazione e Confronto dei Modelli
Le prestazioni del nostro metodo sono state confrontate con approcci esistenti utilizzando diversi criteri di valutazione come precisione, richiamo e punteggi F1. I nostri risultati hanno mostrato che integrare vari tipi di dati ha portato a un’accuratezza più alta rispetto ai metodi tradizionali a dati singoli.
Classificazione Anticipata della Stagione
Un aspetto significativo della nostra ricerca è il miglioramento della classificazione anticipata della stagione. Abbiamo implementato una tecnica di aumento dei dati che permette al modello di fare previsioni basate su dati parziali, aiutando a classificare i raccolti anche prima della fine della stagione di crescita.
Adattamento Trasversale tra Paesi
Abbiamo anche esaminato quanto bene il nostro modello potesse trasferire conoscenze tra paesi. Questa analisi trasversale ha mostrato che i modelli addestrati in un paese potevano essere efficacemente adattati per funzionare bene in un altro, evidenziando la robustezza del nostro metodo.
Affrontare le Sfide nella Classificazione delle Colture
Il campo della classificazione delle colture affronta varie sfide, tra cui:
Variabilità dei Dati: Diverse regioni hanno pratiche agricole diverse, rendendo difficile creare modelli unici per tutti.
Informazioni Insufficienti: Molti modelli esistenti si basano pesantemente su dati specifici, ignorando la complessità dei sistemi agricoli.
Dinamiche Stagionali: Il modo in cui le colture cambiano nel tempo deve essere rappresentato accuratamente nei modelli per garantirne l'efficacia.
Il nostro metodo affronta queste problematiche impiegando un'ampia gamma di tipi di dati e una struttura di modello più sofisticata che cattura la complessità delle dinamiche agricole.
Direzioni Future
Guardando al futuro, ci sono diverse strade per la ricerca futura:
Espansione dei Dataset: Aggiungere più paesi e regioni può aiutare a migliorare l'accuratezza e la generalizzazione del modello.
Raffinamento dei Modelli: Testare diverse architetture e configurazioni può ulteriormente migliorare le prestazioni.
Integrazione dei Dati Meteorologici: Includere dati meteorologici potrebbe fornire ulteriori approfondimenti su come il clima influisce sulla crescita e classificazione delle colture.
Sviluppo di Modelli Regionali: Concentrarsi su aree specifiche può aiutare a creare modelli più adatti alle pratiche agricole locali.
Utilizzo di Tecniche Avanzate: Implementare metodi come il meta-apprendimento potrebbe migliorare la classificazione con pochi esempi e affrontare le sfide nelle variazioni stagionali.
In conclusione, il nostro studio presenta un nuovo metodo per classificare i raccolti sfruttando una varietà di fonti di dati e tecniche di modellazione avanzate. Combinando con successo telerilevamento, dati di rotazione delle colture e distribuzioni locali, abbiamo gettato le basi per un monitoraggio agricolo più accurato ed efficiente. I nostri risultati contribuiscono in modo significativo al campo della gestione agricola e promettono di migliorare le valutazioni della sicurezza alimentare.
Titolo: Boosting Crop Classification by Hierarchically Fusing Satellite, Rotational, and Contextual Data
Estratto: Accurate in-season crop type classification is crucial for the crop production estimation and monitoring of agricultural parcels. However, the complexity of the plant growth patterns and their spatio-temporal variability present significant challenges. While current deep learning-based methods show promise in crop type classification from single- and multi-modal time series, most existing methods rely on a single modality, such as satellite optical remote sensing data or crop rotation patterns. We propose a novel approach to fuse multimodal information into a model for improved accuracy and robustness across multiple years and countries. The approach relies on three modalities used: remote sensing time series from Sentinel-2 and Landsat 8 observations, parcel crop rotation and local crop distribution. To evaluate our approach, we release a new annotated dataset of 7.4 million agricultural parcels in France and Netherlands. We associate each parcel with time-series of surface reflectance (Red and NIR) and biophysical variables (LAI, FAPAR). Additionally, we propose a new approach to automatically aggregate crop types into a hierarchical class structure for meaningful model evaluation and a novel data-augmentation technique for early-season classification. Performance of the multimodal approach was assessed at different aggregation level in the semantic domain spanning from 151 to 8 crop types or groups. It resulted in accuracy ranging from 91\% to 95\% for NL dataset and from 85\% to 89\% for FR dataset. Pre-training on a dataset improves domain adaptation between countries, allowing for cross-domain zero-shot learning, and robustness of the performances in a few-shot setting from France to Netherlands. Our proposed approach outperforms comparable methods by enabling learning methods to use the often overlooked spatio-temporal context of parcels, resulting in increased preci...
Autori: Valentin Barriere, Martin Claverie, Maja Schneider, Guido Lemoine, Raphaël d'Andrimont
Ultimo aggiornamento: 2023-11-07 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2305.12011
Fonte PDF: https://arxiv.org/pdf/2305.12011
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.
Link di riferimento
- https://www.latex-project.org/lppl.txt
- https://lenova.river-valley.com/svn/elsbst/trunk/elsarticle-template-1-num.tex
- https://www.overleaf.com/project/5ba8be9aff461425affd515fl
- https://github.com/maja601/EuroCrops
- https://eur-lex.europa.eu/eli/reg_impl/2023/138
- https://jeodpp.jrc.ec.europa.eu/ftp/jrc-opendata/DRLL/CropDeepTrans/data/sankey_All_crops.html
- https://github.com/WFP-VAM/vam.whittaker
- https://jeodpp.jrc.ec.europa.eu/bdap/
- https://jeodpp.jrc.ec.europa.eu/ftp/jrc-opendata/DRLL/CropDeepTrans/