Avancées en apprentissage automatique pour les modèles océaniques
Examiner comment l'apprentissage automatique peut améliorer les modèles climatiques grâce à une meilleure paramétrisation.
― 10 min lire
Table des matières
- Le défi des tourbillons
- Utilisation de l'apprentissage automatique
- Le modèle et son évaluation
- Comprendre la dynamique océanique
- Limites de la paramétrisation traditionnelle
- La promesse de l'apprentissage automatique
- Implémentation du modèle d'apprentissage automatique
- Évaluation des performances en ligne
- Conclusions des tests
- Réglage de la paramétrisation
- Conclusion et travaux futurs
- Source originale
- Liens de référence
Les modèles climatiques nous aident à comprendre comment fonctionne l'atmosphère et les océans de notre planète. Ces modèles sont importants pour prédire le temps et les changements climatiques. Un des défis des modèles climatiques est de gérer de petites caractéristiques océaniques appelées tourbillons. Ces tourbillons peuvent influencer des courants océaniques plus grands, mais ils sont souvent trop petits pour être modélisés directement. Pour faire face à ces petites caractéristiques, les scientifiques travaillent sur des manières d'utiliser l'Apprentissage automatique pour améliorer les modèles climatiques.
Le défi des tourbillons
Les tourbillons sont des courants tourbillonnants qui peuvent faire entre environ 10 kilomètres et 100 kilomètres de large. Ils peuvent affecter des courants océaniques plus grands et sont responsables du transport de chaleur et de sel. Comme les modèles climatiques ne peuvent pas directement résoudre ces petites échelles, les scientifiques ont besoin d'une méthode pour prédire leur impact sur les systèmes plus grands. C'est là que la paramétrisation entre en jeu.
La paramétrisation est une technique qui estime l'effet des processus à petite échelle sur des modèles à plus grande échelle. Elle simplifie les interactions complexes dans l'océan et permet des calculs plus faciles. Cependant, développer des paramétrisations efficaces a été un défi de longue date dans la science climatique.
Utilisation de l'apprentissage automatique
Récemment, l'apprentissage automatique a attiré l'attention comme un outil pour améliorer la paramétrisation. L'apprentissage automatique peut analyser d'énormes quantités de données pour trouver des motifs qui peuvent ne pas être visibles pour les scientifiques utilisant des méthodes traditionnelles. En s'entraînant sur des données provenant de simulations à haute résolution, les modèles d'apprentissage automatique peuvent apprendre à prédire comment de petites caractéristiques océaniques comme les tourbillons influencent la dynamique océanique plus large.
Le modèle et son évaluation
Dans cette étude, on implémente une paramétrisation basée sur l'apprentissage automatique dans un modèle numérique d'océan. Le modèle numérique que nous utilisons s'appelle MOM6, qui simule la circulation océanique. On se concentre sur un modèle d'apprentissage automatique spécifique conçu pour prédire la force de moment générée par les tourbillons de mésoéchelle. Notre but est de voir comment ce modèle d'apprentissage automatique fonctionne lorsqu'il est intégré dans le modèle océanique.
Tester le modèle
On teste la paramétrisation d'apprentissage automatique dans un contexte différent de celui pour lequel elle a été initialement créée. Cela se fait pour voir si le modèle d'apprentissage automatique peut fonctionner efficacement dans différentes conditions océaniques. On évalue sa performance en termes de stabilité, de précision et d'efficacité computationnelle.
La paramétrisation d'apprentissage automatique est traitée comme une paramétrisation traditionnelle. On l'insère dans le modèle existant et on la teste sous diverses conditions, y compris différentes profondeurs océaniques, motifs d'écoulement et résolutions de grille.
Résultats des tests
Nos tests montrent que la paramétrisation d'apprentissage automatique peut être implémentée sans modifications significatives. Cependant, on trouve aussi qu'elle a certaines limites. Par exemple, le modèle nécessite un réglage pour prédire efficacement le moment à différentes profondeurs. De plus, la paramétrisation ne fonctionne pas aussi bien près des côtes que dans l'océan ouvert. C'est important car les régions côtières jouent un rôle crucial dans la dynamique océanique.
On observe aussi que le coût computationnel de l'exécution de la paramétrisation d'apprentissage automatique sur des processeurs traditionnels est élevé. Cela peut compliquer son utilisation dans des simulations à grande échelle, qui sont courantes en science climatique.
Comprendre la dynamique océanique
Pour comprendre l'impact de notre paramétrisation d'apprentissage automatique, on a besoin de comprendre les équations qui régissent la dynamique océanique. Les modèles de circulation océanique résolvent un ensemble d'équations qui décrivent comment l'eau se déplace et comment elle est influencée par des forces comme le vent et la rotation de la Terre.
Les tourbillons et autres caractéristiques à petite échelle font partie intégrante de ces équations. Ils contribuent à l'échange de moment et d'énergie, affectant des courants océaniques plus grands. Le défi est de représenter avec précision ces processus à petite échelle d'une manière qui puisse être calculée efficacement.
Limites de la paramétrisation traditionnelle
Traditionnellement, les paramétrisations se sont basées sur des modèles mathématiques qui approchent les effets des processus non résolus. Cependant, ces modèles peuvent introduire des erreurs dans les simulations climatiques. L'incertitude créée par ces erreurs peut impacter les projections climatiques et réduire la fiabilité des prévisions des modèles.
Le rôle des observations
Historiquement, le développement de paramétrisations a nécessité une combinaison d'approches théoriques et d'observations. Les chercheurs se sont basés sur des données recueillies dans l'océan pour affiner leurs modèles au fil du temps. Pourtant, même avec cette évolution, les paramétrisations traditionnelles échouent souvent à traiter les complexités du comportement océanique.
La promesse de l'apprentissage automatique
L'avènement de l'apprentissage automatique offre une nouvelle approche pour faire face à ces défis. Au lieu de se baser uniquement sur des modèles basés sur la physique, les modèles d'apprentissage automatique peuvent être formés directement sur des données observées. Cela leur permet de capturer les relations complexes entre les caractéristiques à petite échelle et leurs effets sur les flux à plus grande échelle.
Cependant, malgré la promesse de l'apprentissage automatique dans le développement de paramétrisations, peu ont été entièrement mises en œuvre dans les modèles de circulation générale, et évaluer leur efficacité reste compliqué.
Implémentation du modèle d'apprentissage automatique
Dans cette étude, on utilise un modèle d'apprentissage automatique spécifique, appelé GZ21, qui est conçu pour prédire les effets des tourbillons de mésoéchelle. Ce modèle est un type de réseau de neurones appelé réseau de neurones convolutifs (CNN), qui est doué pour traiter des données spatiales.
Pour intégrer ce modèle d'apprentissage automatique dans le modèle de circulation océanique MOM6, on fait face à certains défis techniques dus aux différences dans les langages de programmation. MOM6 est écrit en Fortran, tandis que la plupart des modèles d'apprentissage automatique sont développés en Python. Cette barrière linguistique complique le processus d'implémentation.
Couplage de Fortran et Python
Une manière de surmonter cette barrière est d'utiliser un module appelé Forpy. Cet outil permet une interaction facile entre Python et Fortran, permettant au modèle d'apprentissage automatique de fonctionner au sein du modèle océanique basé sur Fortran. En utilisant Forpy, on peut transférer efficacement les données entre les deux langages et tirer parti des forces de chacun.
Évaluation des performances en ligne
Pour tester le modèle d'apprentissage automatique intégré dans le modèle de circulation océanique, on met en place des simulations qui mesurent ses performances en ligne. La performance en ligne fait référence à la capacité du modèle à inférer des prédictions en temps réel pendant une simulation, plutôt que de le tester simplement en isolation.
Dans notre évaluation, on met en place un scénario idéalisé appelé un double gyre entraîné par le vent pour observer comment la paramétrisation influence les dynamiques d'écoulement. Cette configuration permet de comparer les résultats avec des simulations qui n'utilisent pas la paramétrisation d'apprentissage automatique.
Comparer les résolutions
On examine aussi comment le modèle d'apprentissage automatique fonctionne à différentes résolutions spatiales. En simulant les mêmes conditions à différentes tailles de grille, on peut évaluer comment les impacts de la paramétrisation changent avec l'échelle du modèle. C'est important car différentes résolutions peuvent affecter significativement les résultats du modèle.
Conclusions des tests
Notre analyse montre que l'inclusion de la paramétrisation d'apprentissage automatique entraîne des améliorations dans les caractéristiques d'écoulement, en particulier dans les couches supérieures de l'océan. L'utilisation de la paramétrisation améliore les niveaux d'énergie dans le modèle, rendant le flux plus dynamique et réaliste.
Cependant, on remarque aussi des divergences. Par exemple, bien que la paramétrisation augmente le transfert d'énergie en général, elle peut surestimer les effets dans certains scénarios. Cela indique que bien que l'apprentissage automatique ait du potentiel, un réglage et une validation minutieux sont essentiels.
Réglage de la paramétrisation
Régler la paramétrisation d'apprentissage automatique implique d'ajuster ses sorties pour optimiser les performances. C'est une pratique courante dans la modélisation climatique. Pour notre modèle d'apprentissage automatique, on explore différentes stratégies de réglage pour obtenir les meilleurs résultats.
On considère deux méthodes de réglage. La première consiste à utiliser un facteur d'échelle uniforme dans les deux couches du modèle océanique. La seconde stratégie implique des facteurs d'échelle séparés pour les couches supérieures et inférieures. Nos résultats indiquent que les performances peuvent être considérablement améliorées par un réglage réfléchi.
Conclusion et travaux futurs
En conclusion, notre exploration de l'utilisation de l'apprentissage automatique pour la paramétrisation dans les modèles de circulation océanique révèle un potentiel prometteur. La capacité des modèles d'apprentissage automatique à extraire des informations des données peut améliorer notre compréhension des processus à petite échelle et de leur influence sur les dynamiques plus grandes.
Cependant, des défis subsistent. Le besoin de réglage, notamment dans différentes couches océaniques et sous diverses conditions, souligne la complexité du comportement océanique. De plus, les coûts computationnels associés aux implémentations d'apprentissage automatique représentent un obstacle à leur utilisation généralisée dans les modèles climatiques à grande échelle.
Avancer
Les recherches futures devraient se concentrer sur le réentraînement des modèles d'apprentissage automatique avec des ensembles de données plus complets, y compris des données issues de zones côtières et de différentes profondeurs. Cela pourrait aider à régler certains des artefacts que nous avons observés près des frontières dans nos tests.
De plus, le développement continu de méthodes de couplage efficaces entre les langages de programmation facilitera l'intégration de l'apprentissage automatique dans les modèles climatiques existants. À mesure que nous affinons ces approches, nous anticipons que l'apprentissage automatique deviendra un outil précieux pour améliorer les prévisions climatiques et comprendre les complexités des océans de notre planète.
Titre: Implementation and Evaluation of a Machine Learned Mesoscale Eddy Parameterization into a Numerical Ocean Circulation Model
Résumé: We address the question of how to use a machine learned parameterization in a general circulation model, and assess its performance both computationally and physically. We take one particular machine learned parameterization \cite{Guillaumin1&Zanna-JAMES21} and evaluate the online performance in a different model from which it was previously tested. This parameterization is a deep convolutional network that predicts parameters for a stochastic model of subgrid momentum forcing by mesoscale eddies. We treat the parameterization as we would a conventional parameterization once implemented in the numerical model. This includes trying the parameterization in a different flow regime from that in which it was trained, at different spatial resolutions, and with other differences, all to test generalization. We assess whether tuning is possible, which is a common practice in general circulation model development. We find the parameterization, without modification or special treatment, to be stable and that the action of the parameterization to be diminishing as spatial resolution is refined. We also find some limitations of the machine learning model in implementation: 1) tuning of the outputs from the parameterization at various depths is necessary; 2) the forcing near boundaries is not predicted as well as in the open ocean; 3) the cost of the parameterization is prohibitively high on CPUs. We discuss these limitations, present some solutions to problems, and conclude that this particular ML parameterization does inject energy, and improve backscatter, as intended but it might need further refinement before we can use it in production mode in contemporary climate models.
Auteurs: Cheng Zhang, Pavel Perezhogin, Cem Gultekin, Alistair Adcroft, Carlos Fernandez-Granda, Laure Zanna
Dernière mise à jour: 2023-03-01 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2303.00962
Source PDF: https://arxiv.org/pdf/2303.00962
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.