Simple Science

Scienza all'avanguardia spiegata semplicemente

# Ingegneria elettrica e scienze dei sistemi# Visione artificiale e riconoscimento di modelli# Apprendimento automatico# Elaborazione di immagini e video

Monitoraggio dei cambiamenti costieri in Irlanda

Un nuovo dataset mira a monitorare i cambiamenti costieri in Irlanda in modo preciso.

Conor O'Sullivan, Ambrish Kashyap, Seamus Coveney, Xavier Monteys, Soumyabrata Dev

― 8 leggere min


Monitoraggio deiMonitoraggio deicambiamenti costieri inIrlandadell'Irlanda.monitoraggio delle coste in cambiamentoUn nuovo set di dati migliora il
Indice

La costa dell'Irlanda è una risorsa fondamentale, influenzata da vari fattori come l'erosione, la sedimentazione e le attività umane. Monitorare questi cambiamenti non è semplice, soprattutto perché l'Irlanda ha una lunga costa di circa 4.578 chilometri. Si stima che attualmente il 20% di questa costa stia erodendo, un problema che probabilmente peggiorerà a causa dei cambiamenti climatici e dell'innalzamento del livello del mare. Per tenere traccia di questi cambiamenti, possiamo usare immagini satellitari e tecniche moderne, ma c'è stata poca ricerca focalizzata specificamente sull'Irlanda.

Per affrontare questa lacuna, introduciamo il dataset Landsat Irish Coastal Segmentation, che aiuterà a migliorare i metodi per identificare i corpi idrici costieri. Questo dataset è progettato per affrontare questioni uniche legate al clima e alle caratteristiche costiere dell'Irlanda, e offre anche un modo per testare diversi metodi automatizzati per la segmentazione.

L'importanza del monitoraggio della costa

La costa irlandese è minacciata da cambiamenti sia naturali che causati dall'uomo. L'erosione causata dalle onde e dalle condizioni climatiche può rimodellare la terra, mentre le attività umane come la costruzione possono influenzare anche le aree costiere. Monitorare questi cambiamenti è fondamentale per comprendere la salute degli ecosistemi costieri e per prendere decisioni informate sull'uso del suolo e sugli sforzi di conservazione.

La complessità di osservare accuratamente questi cambiamenti è dovuta, in parte, alla varietà di tipologie costiere presenti attorno all'Irlanda, che vanno dalle spiagge sabbiose ai dirupi rocciosi. Ogni tipo di costa risponde in modo diverso alle forze esterne, il che rende essenziale utilizzare metodi variegati per monitorarle.

Il dataset

Il dataset Landsat Irish Coastal Segmentation (LICS) è una risorsa unica sviluppata per aiutare nella segmentazione dei corpi idrici costieri. Consiste in immagini satellitari scattate nel corso di molti anni, fornendo una visione completa delle caratteristiche della costa. Questo dataset permetterà ai ricercatori di sviluppare modelli migliori per identificare i confini tra terra e oceano, migliorando la nostra capacità di monitorare i cambiamenti costieri.

Il dataset include un focus su vari fattori che potrebbero influenzare le prestazioni del modello. Questi includono i tipi di coste, il periodo dell'anno in cui sono state scattate le immagini e l'altitudine solare, che si riferisce all'angolo del sole sopra l'orizzonte.

Selezione delle scene

Per creare il dataset LICS, abbiamo prima raccolto un gran numero di immagini satellitari Landsat che coprivano la costa irlandese da aprile 1984 a maggio 2023. Questo ha comportato la raccolta di metadati per tutte le scene potenziali, portando a un totale di 14.850 scene. Ogni scena copre un'area specifica e ci siamo concentrati su 11 tiles che catturavano diverse parti della costa.

Successivamente, abbiamo filtrato queste scene in base a criteri specifici per garantire dati di alta qualità. Abbiamo selezionato solo immagini di specifici satelliti Landsat e rimosso qualsiasi scena con un'alta percentuale di copertura nuvolosa, poiché ciò avrebbe influito sulla visibilità. Attraverso questo processo, abbiamo ottenuto 326 scene.

Da queste, abbiamo ulteriormente selezionato 100 scene, assicurandoci di avere una rappresentazione bilanciata di vari anni e altitudini solari. Questa selezione attenta assicura che il dataset catturi una vasta gamma di condizioni che influenzano la costa.

Bande spettrali e ritaglio

Le scene selezionate contengono diverse bande spettrali che forniscono informazioni diverse sulla terra e sull'acqua. Ogni immagine ha una risoluzione di 30 metri, adatta per i nostri compiti di segmentazione.

Data la dimensione maggiore delle scene Landsat, abbiamo ritagliato queste immagini in quadrati più piccoli di 256 per 256 pixel per addestrare efficacemente i nostri modelli. Per i test, abbiamo selezionato casualmente location nelle tiles per garantire una rappresentazione equa della costa mantenendo un buon equilibrio tra terra e oceano.

In totale, abbiamo creato 30.000 istanze di addestramento e 100 istanze di test dalle immagini ritagliate. Questo aiuta a testare l'efficacia del modello nell'identificare i corpi idrici costieri.

Processo di annotazione

Le annotazioni per il dataset di addestramento sono state create manualmente. Questo ha comportato il disegno di forme attorno alle aree d'acqua nelle immagini satellitari, assegnando un valore di 1 per l'oceano e 0 per la terra. Le annotazioni grezze hanno impiegato tra i 15 e i 25 minuti per completare ciascuna scena, fornendo un compromesso ragionevole tra velocità e accuratezza.

Per il dataset di test, abbiamo impiegato più tempo per creare annotazioni precise. Utilizzando immagini ad alta risoluzione e aiuti visivi aggiuntivi, abbiamo assicurato che il dataset di test rappresentasse accuratamente i confini tra terra e oceano. Questo processo mirava a ridurre la probabilità di errori che potrebbero influenzare la valutazione dei modelli.

Classificazione del tipo di costa

Per ottenere ulteriori informazioni, abbiamo classificato ogni immagine di test in base al suo tipo di costa, "rocciosa" o "sabbiosa". La maggior parte della costa irlandese è composta da rocce dure o spiagge sabbiose. Analizzando visivamente le location di test, le abbiamo classificate e assicurato che la maggior parte del tipo di costa fosse riflessa nella classificazione finale.

Approcci di segmentazione

Per determinare l'efficacia dei nostri modelli, abbiamo utilizzato diversi approcci per segmentare i corpi idrici. Un metodo ampiamente utilizzato è l'Indice di Differenza Normalizzata dell'Acqua (NDWI). Questo approccio valuta i corpi idrici in base ai valori di intensità dei pixel, offrendo un modo rapido per classificare le aree come terra o acqua senza richiedere dati di addestramento.

Oltre all'NDWI, abbiamo testato un metodo di machine learning chiamato Extreme Gradient Boosting (XGBoost) per vedere come si comportava rispetto ai modelli di deep learning. Abbiamo utilizzato specificamente l'architettura U-NET per il deep learning, progettata per la segmentazione delle immagini. Questo modello U-NET utilizza vari strati per analizzare le immagini e può considerare il contesto dei pixel circostanti quando fa previsioni.

Metriche di valutazione

Per valutare quanto bene si sono comportati i nostri modelli, abbiamo considerato diverse metriche basate sul numero di veri positivi, falsi positivi, veri negativi e falsi negativi. Queste metriche ci aiutano a capire quanti pixel sono stati classificati correttamente come terra o acqua. Abbiamo anche esaminato come i modelli si sono comportati specificamente vicino alla costa, dove le classificazioni errate sono spesso più comuni.

Un'altra metrica utilizzata è stata il Figure of Merit (FOM), che valuta l'accuratezza della rilevazione dei bordi per la costa. Questa metrica ci aiuta a capire quanto siano allineate le nostre coste previste con le coste reali.

Risultati

Valutando le tecniche di segmentazione, abbiamo scoperto che il modello U-NET ha raggiunto un'accuratezza del 95,0%, promettente rispetto al metodo tradizionale NDWI che ha avuto un'accuratezza media del 97,2%. Anche se U-NET ha funzionato bene, l'NDWI ha eccelso nel rilevare i bordi della costa, dimostrando la sua forza per questo compito specifico.

È importante notare che il modello U-NET ha mostrato alcune debolezze nella previsione accurata delle coste. In particolare, ha avuto difficoltà a classificare erroneamente i pixel vicino alla costa, probabilmente a causa delle annotazioni grezze nel dataset di addestramento. Al contrario, l'NDWI tendeva a classificare erroneamente i pixel oceanici più distanti dalla terra.

Sfide e limitazioni

Sebbene il nostro studio mostri il potenziale per i metodi di deep learning, è fondamentale considerare le limitazioni del nostro dataset e dei nostri metodi. Ad esempio, le annotazioni di addestramento potrebbero introdurre bias a causa della loro natura grezza. Inoltre, poiché abbiamo utilizzato una selezione di immagini relativamente prive di nuvole, il modello potrebbe non essere robusto come potrebbe essere contro condizioni più variabili.

In aggiunta, il metodo per sviluppare i dati di addestramento è stato laborioso e la dipendenza dal giudizio di una singola persona per le annotazioni potrebbe influenzare l'accuratezza.

Variazioni del tipo di costa e del tempo

I nostri risultati suggeriscono che le prestazioni del modello U-NET variavano in base al tipo di costa. Ha funzionato meglio su coste più uniformi mentre ha faticato con le coste frastagliate, comuni sulla costa occidentale dell'Irlanda. D'altra parte, l'NDWI ha mostrato prestazioni migliori in generale.

Quando si guarda all'accuratezza in base ai vari decenni, abbiamo trovato variazioni, con la migliore prestazione nel 2010 e la peggiore nel 2020. Tuttavia, questo potrebbe essere influenzato dalle specifiche aree costiere scelte per la valutazione in quegli anni.

L'altitudine solare, o l'angolo del sole, ha anche influenzato le prestazioni del modello. Per U-NET, le variazioni di accuratezza erano inferiori rispetto a quelle osservate con NDWI. Questo suggerisce che, sebbene l'altitudine solare influenzi gli indici spettrali, U-NET rimane coerente in diverse condizioni.

Importanza delle bande diverse

Un'analisi dell'importanza delle diverse bande spettrali utilizzate dal modello U-NET ha rivelato che non tutte le bande contribuiscono in modo equo all'efficacia del modello. Le bande Near-Infrared (NIR) e Short-Wave Infrared (SWIR) hanno avuto il maggiore impatto, mentre altre bande hanno contribuito poco alle previsioni.

Conclusione e futuri sviluppi

Il dataset Landsat Irish Coastal Segmentation è una risorsa preziosa per migliorare la nostra comprensione della costa irlandese. Fornendo immagini satellitari di alta qualità e annotazioni estensive, questo dataset può aiutare a sviluppare modelli più accurati per monitorare i cambiamenti costieri.

Sebbene i modelli attuali mostrino promesse, è necessario ulteriore lavoro per migliorare le loro prestazioni. La ricerca futura si concentrerà sulla raffinazione del processo di annotazione per creare dati di addestramento più accurati. Esplorando metodi semi-supervisionati, possiamo sviluppare dataset più ampi mantenendo alta la qualità delle annotazioni.

Inoltre, indagare su definizioni alternative per il monitoraggio delle coste, come il livello dell'acqua alta o le linee di vegetazione, potrebbe migliorare la nostra comprensione dei cambiamenti costieri. L'impiego di immagini satellitari ad alta risoluzione potrebbe anche fornire approfondimenti più dettagliati.

Con la continua ricerca e sviluppo di questi metodi, speriamo di creare modelli in grado di monitorare più efficacemente la salute della dinamica costa irlandese.

Fonte originale

Titolo: Enhancing coastal water body segmentation with Landsat Irish Coastal Segmentation (LICS) dataset

Estratto: Ireland's coastline, a critical and dynamic resource, is facing challenges such as erosion, sedimentation, and human activities. Monitoring these changes is a complex task we approach using a combination of satellite imagery and deep learning methods. However, limited research exists in this area, particularly for Ireland. This paper presents the Landsat Irish Coastal Segmentation (LICS) dataset, which aims to facilitate the development of deep learning methods for coastal water body segmentation while addressing modelling challenges specific to Irish meteorology and coastal types. The dataset is used to evaluate various automated approaches for segmentation, with U-NET achieving the highest accuracy of 95.0% among deep learning methods. Nevertheless, the Normalised Difference Water Index (NDWI) benchmark outperformed U-NET with an average accuracy of 97.2%. The study suggests that deep learning approaches can be further improved with more accurate training data and by considering alternative measurements of erosion. The LICS dataset and code are freely available to support reproducible research and further advancements in coastal monitoring efforts.

Autori: Conor O'Sullivan, Ambrish Kashyap, Seamus Coveney, Xavier Monteys, Soumyabrata Dev

Ultimo aggiornamento: 2024-09-05 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2409.15311

Fonte PDF: https://arxiv.org/pdf/2409.15311

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Articoli simili