Monitoreo de los Cambios Costeros en Irlanda
Un nuevo conjunto de datos tiene como objetivo rastrear con precisión los cambios costeros en Irlanda.
Conor O'Sullivan, Ambrish Kashyap, Seamus Coveney, Xavier Monteys, Soumyabrata Dev
― 10 minilectura
Tabla de contenidos
- La Importancia del Monitoreo de la Costa
- El Conjunto de Datos
- Selección de Escenas
- Bandas Espectrales y Recorte
- Proceso de Anotación
- Clasificación de Tipos de Costa
- Enfoques de Segmentación
- Métricas de Evaluación
- Resultados
- Desafíos y Limitaciones
- Variaciones de Tipo Costero y Temporal
- Importancia de Diferentes Bandas
- Conclusión y Trabajo Futuro
- Fuente original
- Enlaces de referencia
La costa de Irlanda es un recurso vital que se ve afectado por varios factores como la erosión, sedimentación y actividades humanas. Monitorear estos cambios no es fácil, especialmente porque Irlanda tiene una larga costa de unos 4,578 kilómetros. Se estima que el 20% de esta costa está actualmente en erosión, un problema que probablemente empeore por el cambio climático y el aumento del nivel del mar. Para seguir estos cambios, podemos usar imágenes satelitales y técnicas modernas, pero ha habido poca investigación centrada específicamente en Irlanda.
Para abordar esta falta, presentamos el conjunto de datos de Segmentación Costera Irlandesa de Landsat, que ayudará a mejorar los métodos para identificar cuerpos de agua costeros. Este conjunto de datos está diseñado para abordar problemas únicos relacionados con el clima y las características de la costa de Irlanda, y también proporciona una forma de probar diferentes métodos automatizados para la segmentación.
La Importancia del Monitoreo de la Costa
La costa irlandesa está amenazada tanto por cambios naturales como por humanos. La erosión causada por las olas y las condiciones climáticas puede remodelar la tierra, mientras que actividades humanas como la construcción también pueden afectar las áreas costeras. Monitorear estos cambios es crucial para entender la salud de los ecosistemas costeros y para tomar decisiones informadas sobre el uso del suelo y los esfuerzos de conservación.
La complejidad de observar estos cambios con precisión se debe, en parte, a la variedad de tipos de costa presentes alrededor de Irlanda, que van desde playas de arena hasta acantilados rocosos. Cada tipo de costa responde de manera diferente a las fuerzas externas, lo que hace esencial usar métodos variados para monitorearlos.
El Conjunto de Datos
El conjunto de datos de Segmentación Costera Irlandesa (LICS) es un recurso único desarrollado para ayudar en la segmentación de cuerpos de agua costeros. Consta de imágenes satelitales tomadas a lo largo de muchos años, proporcionando una visión completa de las características de la costa. El conjunto de datos permitirá a los investigadores desarrollar mejores modelos para identificar los límites entre la tierra y el océano, lo que puede mejorar nuestra capacidad para monitorear los cambios costeros.
El conjunto de datos incluye un enfoque en varios factores que podrían influir en el rendimiento del modelo. Estos incluyen los tipos de costas, la época del año en que se tomaron las imágenes y la altitud solar, que se refiere al ángulo del sol sobre el horizonte.
Selección de Escenas
Para crear el conjunto de datos LICS, primero recopilamos un gran número de imágenes satelitales de Landsat que cubren la costa irlandesa desde abril de 1984 hasta mayo de 2023. Esto involucró reunir metadatos para todas las escenas potenciales, llegando a un total de 14,850 escenas. Cada escena cubre un área específica, y nos enfocamos en 11 mosaicos que capturan diferentes partes de la costa.
Luego, filtramos estas escenas según criterios específicos para asegurar datos de alta calidad. Solo seleccionamos imágenes de satélites Landsat específicos y eliminamos escenas que tenían un alto porcentaje de cobertura de nubes, ya que esto afectaría la visibilidad. A través de este proceso, terminamos con 326 escenas.
De estas, seleccionamos 100 escenas, asegurándonos de tener una representación equilibrada de varios años y altitudes solares. Esta cuidadosa selección asegura que el conjunto de datos capture una amplia gama de condiciones que afectan la costa.
Bandas Espectrales y Recorte
Las escenas seleccionadas contienen varias bandas espectrales que proporcionan información diferente sobre la tierra y el agua. Cada imagen tiene una resolución de 30 metros, que es adecuada para nuestras tareas de segmentación.
Dado el tamaño más grande de las escenas de Landsat, recortamos estas imágenes en cuadrados más pequeños de 256 por 256 píxeles para entrenar nuestros modelos de manera efectiva. Para las pruebas, seleccionamos al azar ubicaciones en los mosaicos para asegurar una representación justa de la costa mientras mantenemos un buen equilibrio entre tierra y océano.
En total, creamos 30,000 instancias de entrenamiento y 100 instancias de prueba a partir de las imágenes recortadas. Esto ayuda a probar la efectividad del modelo para identificar cuerpos de agua costeros.
Proceso de Anotación
Las anotaciones para el conjunto de datos de entrenamiento se crearon manualmente. Esto implicó dibujar formas alrededor de áreas de agua en las imágenes satelitales, asignando un valor de 1 para el océano y 0 para la tierra. Las anotaciones iniciales tomaron entre 15 y 25 minutos para completarse para cada escena, proporcionando un compromiso razonable entre velocidad y precisión.
Para el conjunto de datos de prueba, nos tomamos más tiempo para crear anotaciones precisas. Usando imágenes de mayor resolución y ayudas visuales adicionales, nos aseguramos de que el conjunto de datos de prueba representara con precisión los límites entre tierra y océano. Este proceso tenía como objetivo disminuir la probabilidad de errores que podrían afectar la evaluación de los modelos.
Clasificación de Tipos de Costa
Para obtener más información, clasificamos cada imagen de prueba según su tipo de costa, ya sea "rocosa" o "arenosa". La mayor parte de la costa de Irlanda está compuesta por rocas duras o playas de arena. Al analizar visualmente los lugares de prueba, los clasificamos y aseguramos que la mayoría del tipo de costa se reflejara en la clasificación final.
Enfoques de Segmentación
Para determinar la efectividad de nuestros modelos, usamos diferentes enfoques para segmentar cuerpos de agua. Un método ampliamente utilizado es el Índice de Diferencia Normalizada de Agua (NDWI). Este enfoque evalúa los cuerpos de agua según los valores de intensidad de los píxeles, proporcionando una forma rápida de clasificar áreas como tierra o agua sin requerir datos de entrenamiento.
Además de NDWI, probamos un método de aprendizaje automático llamado Extreme Gradient Boosting (XGBoost) para ver cómo se desempeñaba frente a modelos de aprendizaje profundo. Específicamente usamos la arquitectura de aprendizaje profundo U-NET, que está diseñada para segmentación de imágenes. Este modelo U-NET utiliza varias capas para analizar las imágenes y puede considerar el contexto de los píxeles circundantes al hacer predicciones.
Métricas de Evaluación
Para evaluar cómo se desempeñaron nuestros modelos, consideramos diferentes métricas basadas en el número de verdaderos positivos, falsos positivos, verdaderos negativos y falsos negativos. Estas métricas nos ayudan a entender cuántos píxeles fueron clasificados correctamente como tierra o agua. También observamos cómo se desempeñaron los modelos específicamente cerca de la costa, donde las malas clasificaciones suelen ser más comunes.
Otra métrica utilizada fue la Figura de Mérito (FOM), que evalúa la precisión de la detección de bordes para la costa. Esta métrica nos ayuda a comprender qué tan cerca se alinearon nuestras líneas de costa predichas con las líneas de costa reales.
Resultados
Al evaluar las técnicas de segmentación, encontramos que el modelo U-NET alcanzó una precisión del 95.0%, lo cual es prometedor en comparación con el método tradicional NDWI que promedió una precisión del 97.2%. Aunque U-NET tuvo un buen desempeño, NDWI destacó en la detección de bordes de la costa, demostrando su fortaleza para esta tarea específica.
Es importante señalar que el modelo U-NET mostró algunas debilidades al predecir con precisión las costas. En particular, tuvo problemas al clasificar mal los píxeles cerca de la costa, probablemente debido a las anotaciones imprecisas en el conjunto de datos de entrenamiento. En contraste, NDWI tendió a clasificar mal los píxeles oceánicos que estaban más lejos de la tierra.
Desafíos y Limitaciones
Si bien nuestro estudio muestra potencial para los métodos de aprendizaje profundo, es crucial considerar las limitaciones de nuestro conjunto de datos y métodos. Por ejemplo, las anotaciones de entrenamiento podrían introducir sesgos debido a su naturaleza imprecisa. Además, debido a que usamos una selección de imágenes relativamente despejadas, el modelo puede no ser tan robusto como podría ser frente a condiciones más variables.
Adicionalmente, el método para desarrollar los datos de entrenamiento fue laborioso, y la dependencia del juicio de una sola persona para las anotaciones puede afectar la precisión.
Variaciones de Tipo Costero y Temporal
Nuestros resultados sugieren que el desempeño del modelo U-NET varió según el tipo de costa. Se desempeñó mejor en costas más uniformes mientras tuvo problemas con costas irregulares, que son más comunes en la costa oeste de Irlanda. Por otro lado, NDWI mostró un mejor desempeño en general.
Al observar la precisión según diferentes décadas, encontramos variaciones, siendo el mejor desempeño en 2010 y el más bajo en 2020. Sin embargo, esto podría estar influenciado por las áreas costeras específicas elegidas para la evaluación en esos años.
La altitud solar, o el ángulo del sol, también impactó el rendimiento del modelo. Para U-NET, las variaciones en precisión fueron menores que las observadas con NDWI. Esto sugiere que, si bien la altitud solar afecta los índices espectrales, U-NET se mantiene consistente en diferentes condiciones.
Importancia de Diferentes Bandas
Un análisis de la importancia de las diferentes bandas espectrales utilizadas por el modelo U-NET reveló que no todas las bandas contribuyen de igual manera a la efectividad del modelo. Las bandas de Infrarrojo Cercano (NIR) y de Infrarrojo de Onda Corta (SWIR) tuvieron el mayor impacto, mientras que otras bandas contribuyeron poco a las predicciones.
Conclusión y Trabajo Futuro
El conjunto de datos de Segmentación Costera Irlandesa de Landsat es un recurso valioso para mejorar nuestra comprensión de la costa irlandesa. Al proporcionar imágenes satelitales de alta calidad y amplias anotaciones, este conjunto de datos puede ayudar a desarrollar modelos más precisos para monitorear cambios costeros.
Si bien los modelos actuales muestran promesas, se necesita más trabajo para mejorar su desempeño. La investigación futura se enfocará en refinar el proceso de anotación para crear datos de entrenamiento más precisos. Al explorar métodos semi-supervisados, podemos desarrollar conjuntos de datos más grandes mientras mantenemos una alta calidad de anotaciones.
Además, investigar definiciones alternativas para monitorear costas, como la línea de marea alta o las líneas de vegetación, podría mejorar nuestra comprensión de los cambios costeros. Emplear imágenes satelitales de mayor resolución podría también proporcionar información más detallada.
Con la investigación continua y el desarrollo de estos métodos, esperamos crear modelos que puedan monitorear de manera más efectiva la salud de la dinámica costa de Irlanda.
Título: Enhancing coastal water body segmentation with Landsat Irish Coastal Segmentation (LICS) dataset
Resumen: Ireland's coastline, a critical and dynamic resource, is facing challenges such as erosion, sedimentation, and human activities. Monitoring these changes is a complex task we approach using a combination of satellite imagery and deep learning methods. However, limited research exists in this area, particularly for Ireland. This paper presents the Landsat Irish Coastal Segmentation (LICS) dataset, which aims to facilitate the development of deep learning methods for coastal water body segmentation while addressing modelling challenges specific to Irish meteorology and coastal types. The dataset is used to evaluate various automated approaches for segmentation, with U-NET achieving the highest accuracy of 95.0% among deep learning methods. Nevertheless, the Normalised Difference Water Index (NDWI) benchmark outperformed U-NET with an average accuracy of 97.2%. The study suggests that deep learning approaches can be further improved with more accurate training data and by considering alternative measurements of erosion. The LICS dataset and code are freely available to support reproducible research and further advancements in coastal monitoring efforts.
Autores: Conor O'Sullivan, Ambrish Kashyap, Seamus Coveney, Xavier Monteys, Soumyabrata Dev
Última actualización: 2024-09-05 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2409.15311
Fuente PDF: https://arxiv.org/pdf/2409.15311
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.