Avances en Aprendizaje Automático para Modelos Oceánicos
Examinando cómo el aprendizaje automático puede mejorar los modelos climáticos a través de una mejor parametrización.
― 9 minilectura
Tabla de contenidos
- El reto de los remolinos
- Usando aprendizaje automático
- El modelo y su evaluación
- Entendiendo la dinámica oceánica
- Limitaciones de la parametrización tradicional
- La promesa del aprendizaje automático
- Implementando el modelo de aprendizaje automático
- Evaluación de rendimiento en línea
- Hallazgos de la prueba
- Ajustando la parametrización
- Conclusión y trabajo futuro
- Fuente original
- Enlaces de referencia
Los modelos climáticos nos ayudan a entender cómo funciona la atmósfera y los océanos de nuestro planeta. Estos modelos son importantes para predecir el clima y cambios en el tiempo. Uno de los retos que enfrentan los modelos climáticos es cómo manejar pequeñas características oceánicas llamadas Remolinos. Estos remolinos pueden influir en corrientes oceánicas más grandes, pero a menudo son demasiado pequeños para ser modelados directamente. Para lidiar con estas pequeñas características, los científicos han estado trabajando en formas de usar el Aprendizaje automático para mejorar los modelos climáticos.
El reto de los remolinos
Los remolinos son corrientes que giran y pueden variar en tamaño de unos 10 a 100 kilómetros. Pueden afectar corrientes oceánicas más grandes y son responsables del transporte de calor y sal. Dado que los modelos climáticos no pueden resolver directamente estas escalas pequeñas, los científicos requieren un método para predecir su impacto en los sistemas más grandes. Aquí es donde entra la Parametrización.
La parametrización es una técnica que estima el efecto de los procesos a pequeña escala en modelos a gran escala. Simplifica las interacciones complejas en el océano y permite cálculos más manejables. Sin embargo, desarrollar parametrizaciones efectivas ha sido un reto de larga data en la ciencia del clima.
Usando aprendizaje automático
Recientemente, el aprendizaje automático ha ganado atención como una herramienta para mejorar la parametrización. El aprendizaje automático puede analizar grandes cantidades de datos para encontrar patrones que pueden no ser visibles para los científicos usando métodos tradicionales. Al entrenar con datos de simulaciones de alta resolución, los modelos de aprendizaje automático pueden aprender a predecir cómo características oceánicas pequeñas como los remolinos influyen en la dinámica oceánica más grande.
El modelo y su evaluación
En este estudio, implementamos una parametrización de aprendizaje automático en un modelo oceánico numérico. El modelo numérico que usamos se llama MOM6, que simula la circulación oceánica. Nos enfocamos en un modelo de aprendizaje automático específico diseñado para predecir la fuerza de momento de los remolinos de mesoescala. Nuestro objetivo es ver qué tan bien se desempeña este modelo de aprendizaje automático cuando se integra en el modelo oceánico.
Probando el modelo
Probamos la parametrización de aprendizaje automático en un contexto diferente al que se creó originalmente. Esto se hace para ver si el modelo de aprendizaje automático puede funcionar efectivamente en diferentes condiciones oceánicas. Evaluamos su desempeño en términos de estabilidad, precisión y eficiencia computacional.
La parametrización de aprendizaje automático se trata como una parametrización tradicional. Se inserta en el modelo existente y se prueba bajo varias condiciones, incluyendo diferentes profundidades oceánicas, patrones de flujo y resoluciones de cuadrícula.
Resultados de la prueba
Nuestras pruebas muestran que la parametrización de aprendizaje automático se puede implementar sin modificaciones significativas. Sin embargo, también encontramos que tiene algunas limitaciones. Por ejemplo, el modelo requiere ajustes para predecir efectivamente el momento a diferentes profundidades. Además, la parametrización no funciona tan bien cerca de las costas como lo hace en el océano abierto. Esto es importante porque las regiones costeras juegan un papel fundamental en la dinámica oceánica.
También observamos que el costo computacional de ejecutar la parametrización de aprendizaje automático en procesadores tradicionales es alto. Esto puede dificultar su uso en simulaciones a gran escala, que son comunes en la ciencia climática.
Entendiendo la dinámica oceánica
Para comprender el impacto de nuestra parametrización de aprendizaje automático, necesitamos entender las ecuaciones que rigen la dinámica oceánica. Los modelos de circulación oceánica resuelven un conjunto de ecuaciones que describen cómo se mueve el agua y cómo es influenciada por fuerzas como el viento y la rotación de la Tierra.
Los remolinos y otras características a pequeña escala son una parte vital de estas ecuaciones. Contribuyen al intercambio de momento y energía, afectando corrientes oceánicas más grandes. El desafío radica en representar con precisión estos procesos a pequeña escala de una manera que se pueda computar eficientemente.
Limitaciones de la parametrización tradicional
Tradicionalmente, las parametrizaciones se han basado en modelos matemáticos que aproximan los efectos de procesos no resueltos. Sin embargo, estos modelos pueden introducir errores en las simulaciones climáticas. La incertidumbre creada por estos errores puede impactar las proyecciones climáticas y reducir la fiabilidad de las predicciones del modelo.
El papel de las observaciones
Históricamente, el desarrollo de parametrizaciones ha requerido una combinación de enfoques teóricos y observaciones. Los investigadores han confiado en datos recolectados del océano para refinar sus modelos con el tiempo. Sin embargo, incluso con esta evolución, las parametrizaciones tradicionales a menudo no logran abordar las complejidades del comportamiento oceánico.
La promesa del aprendizaje automático
La llegada del aprendizaje automático ofrece un nuevo enfoque para enfrentar estos desafíos. En lugar de confiar únicamente en modelos basados en física, los modelos de aprendizaje automático pueden ser entrenados directamente con datos observados. Esto les permite capturar las relaciones complejas entre características a pequeña escala y sus efectos en flujos a gran escala.
Sin embargo, a pesar de la promesa del aprendizaje automático en el desarrollo de parametrizaciones, pocos han sido implementados completamente dentro de modelos de circulación general, y evaluar su efectividad sigue siendo complejo.
Implementando el modelo de aprendizaje automático
En este estudio, usamos un modelo de aprendizaje automático específico, llamado GZ21, que está diseñado para predecir los efectos de los remolinos de mesoescala. Este modelo es un tipo de red neuronal llamada red neuronal convolucional (CNN), que es buena procesando datos espaciales.
Para integrar este modelo de aprendizaje automático en el modelo de circulación oceánica MOM6, enfrentamos algunos retos técnicos debido a las diferencias en lenguajes de programación. MOM6 está escrito en Fortran, mientras que la mayoría de los modelos de aprendizaje automático se desarrollan utilizando Python. Esta barrera del lenguaje complica el proceso de implementación.
Acoplando Fortran y Python
Una forma de superar esta barrera es mediante un módulo llamado Forpy. Esta herramienta permite una fácil interacción entre Python y Fortran, lo que permite que el modelo de aprendizaje automático opere dentro del modelo oceánico basado en Fortran. Al usar Forpy, podemos transferir datos de manera eficiente entre los dos lenguajes y aprovechar las fortalezas de ambos.
Evaluación de rendimiento en línea
Para probar el modelo de aprendizaje automático integrado en el modelo de circulación oceánica, configuramos simulaciones que miden su rendimiento en tiempo real. El rendimiento en línea se refiere a qué tan bien el modelo puede inferir predicciones en tiempo real durante una simulación, en lugar de simplemente probarlo de forma aislada.
En nuestra evaluación, configuramos un escenario idealizado llamado un doble giro impulsado por viento para observar cómo la parametrización influencia la dinámica del flujo. Esta configuración nos permite comparar resultados con simulaciones que no utilizan la parametrización de aprendizaje automático.
Comparando resoluciones
También examinamos cómo se desempeña el modelo de aprendizaje automático en diferentes resoluciones espaciales. Al simular las mismas condiciones en varios tamaños de cuadrícula, podemos evaluar cómo los impactos de la parametrización cambian con la escala del modelo. Esto es importante porque diferentes resoluciones pueden afectar significativamente los resultados del modelo.
Hallazgos de la prueba
Nuestro análisis muestra que la inclusión de la parametrización de aprendizaje automático conduce a mejoras en las características del flujo, especialmente en las capas superiores del océano. El uso de la parametrización mejora los niveles de energía dentro del modelo, haciendo que el flujo sea más dinámico y realista.
Sin embargo, también notamos algunas discrepancias. Por ejemplo, aunque la parametrización aumenta el transferido de energía en general, puede sobrestimar los efectos en ciertos escenarios. Esto indica que aunque el aprendizaje automático tiene potencial, un ajuste cuidadoso y validación son esenciales.
Ajustando la parametrización
Ajustar la parametrización de aprendizaje automático implica modificar sus salidas para optimizar el rendimiento. Esta es una práctica común en la modelación climática. Para nuestro modelo de aprendizaje automático, exploramos diferentes estrategias de ajuste para lograr los mejores resultados.
Consideramos dos métodos de ajuste. El primero implica usar un factor de escalado uniforme en ambas capas del modelo oceánico. La segunda estrategia implica factores de escalado separados para las capas superior e inferior. Nuestros hallazgos indican que el rendimiento puede ser significativamente mejorado mediante un ajuste cuidadoso.
Conclusión y trabajo futuro
En conclusión, nuestra exploración sobre el uso del aprendizaje automático para la parametrización en modelos de circulación oceánica revela un potencial prometedor. La capacidad de los modelos de aprendizaje automático para obtener información de los datos puede mejorar nuestra comprensión de los procesos a pequeña escala y su influencia en dinámicas más grandes.
Sin embargo, los desafíos permanecen. La necesidad de ajuste, particularmente en diferentes capas oceánicas y bajo varias condiciones, resalta la complejidad del comportamiento oceánico. Además, los costos computacionales asociados con las implementaciones de aprendizaje automático representan una barrera para su uso generalizado en modelos climáticos a gran escala.
Avanzando
La investigación futura debe centrarse en volver a entrenar modelos de aprendizaje automático con conjuntos de datos más completos, incluyendo datos de áreas costeras y diferentes profundidades. Esto podría ayudar a abordar algunos de los artefactos que observamos cerca de los límites en nuestras pruebas.
Además, el desarrollo continuo de métodos de acoplamiento eficientes entre lenguajes de programación facilitará la integración del aprendizaje automático en los modelos climáticos existentes. A medida que refinemos estos enfoques, anticipamos que el aprendizaje automático se convertirá en una herramienta valiosa para mejorar las predicciones climáticas y comprender las complejidades de los océanos de nuestro planeta.
Título: Implementation and Evaluation of a Machine Learned Mesoscale Eddy Parameterization into a Numerical Ocean Circulation Model
Resumen: We address the question of how to use a machine learned parameterization in a general circulation model, and assess its performance both computationally and physically. We take one particular machine learned parameterization \cite{Guillaumin1&Zanna-JAMES21} and evaluate the online performance in a different model from which it was previously tested. This parameterization is a deep convolutional network that predicts parameters for a stochastic model of subgrid momentum forcing by mesoscale eddies. We treat the parameterization as we would a conventional parameterization once implemented in the numerical model. This includes trying the parameterization in a different flow regime from that in which it was trained, at different spatial resolutions, and with other differences, all to test generalization. We assess whether tuning is possible, which is a common practice in general circulation model development. We find the parameterization, without modification or special treatment, to be stable and that the action of the parameterization to be diminishing as spatial resolution is refined. We also find some limitations of the machine learning model in implementation: 1) tuning of the outputs from the parameterization at various depths is necessary; 2) the forcing near boundaries is not predicted as well as in the open ocean; 3) the cost of the parameterization is prohibitively high on CPUs. We discuss these limitations, present some solutions to problems, and conclude that this particular ML parameterization does inject energy, and improve backscatter, as intended but it might need further refinement before we can use it in production mode in contemporary climate models.
Autores: Cheng Zhang, Pavel Perezhogin, Cem Gultekin, Alistair Adcroft, Carlos Fernandez-Granda, Laure Zanna
Última actualización: 2023-03-01 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2303.00962
Fuente PDF: https://arxiv.org/pdf/2303.00962
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.