Simple Science

La science de pointe expliquée simplement

# Physique# Physique atmosphérique et océanique# Apprentissage automatique

Avancées dans les prévisions météo avec l'apprentissage automatique

Examiner le potentiel des modèles d'apprentissage automatique pour prédire des événements météorologiques extrêmes.

― 12 min lire


L'IA dans les prévisionsL'IA dans les prévisionsmétéotemps extrême.automatique dans les prévisions deÉvaluer le rôle de l'apprentissage
Table des matières

L'exactitude des Prévisions Météo utilisant l'apprentissage profond s'améliore rapidement. Beaucoup pensent que ça marque un changement significatif dans la façon dont les prévisions météo sont faites. Avec les nouvelles méthodes qui émergent, il est important d'évaluer ces techniques en profondeur, surtout que les modèles d'apprentissage profond n'offrent pas toujours des garanties physiques. Bien que les ensembles de données de référence aident à l'évaluation, ils manquent souvent d'infos sur les événements rares et graves. Ces cas sont cruciaux car l'exactitude des modèles peut en pâtir s'ils ne prennent pas correctement en compte les relations entre les différentes variables météorologiques.

Pour aborder ces problèmes, on compare différents modèles de prévision météo basés sur l'apprentissage profond comme GraphCast, PanguWeather, et FourCastNet avec le système de prévision haute résolution du Centre Européen pour les Prévisions Météorologiques à Moyen Terme (ECMWF). Cette comparaison se fait à travers trois études de cas axées sur des événements météorologiques significatifs : la canicule de 2021 dans le Nord-Ouest Pacifique, la canicule humide de 2023 en Asie du Sud, et la tempête hivernale en Amérique du Nord en 2021.

Nos résultats montrent que certains modèles de prévision météo basés sur l'Apprentissage automatique (ML) peuvent rivaliser avec l'exactitude du système haute résolution de l'ECMWF pour des événements météorologiques extrêmes, comme la canicule du Nord-Ouest Pacifique. Dans certains cas, ils ont montré des performances significativement meilleures que les Méthodes Traditionnelles. Cependant, face à des conditions sévères, les modèles ML peuvent rencontrer plus de difficultés que les méthodes traditionnelles. La méthode traditionnelle a constamment fourni une meilleure exactitude des prévisions à long terme pour les deux vagues de chaleur que nous avons étudiées. De plus, les modèles ML n'avaient pas accès à certaines variables clés nécessaires pour évaluer les risques sanitaires durant des événements comme la canicule humide de 2023 en Asie du Sud.

Dans l'ensemble, évaluer les performances et l'impact des modèles de prévision météo basés sur l'apprentissage automatique est crucial pour développer des systèmes de prévision fiables. Étant donné que les événements météorologiques ont d'énormes implications pour la société, il est essentiel que les prévisions soient à la fois exactes et dignes de confiance.

Ces dernières années, les modèles d'apprentissage automatique pour la prévision météo ont connu une avancée rapide. Cela a amené certains à parler de l'essor de ces modèles dans le domaine. Alors que certaines études se sont concentrées sur les prévisions à court terme, d'autres se sont concentrées sur des prévisions s'étendant de semaines à mois à l'avance, en particulier dans le cadre de temps à moyen terme.

Traditionnellement, la prévision numérique du temps a été la méthode établie pour la prévision à moyen terme. Cette approche implique l'utilisation de données météorologiques observées et d'équations mathématiques pour faire des prévisions. La comparaison pour les modèles ML implique généralement le Système de Prévision Intégrée de l'ECMWF, reconnu comme l'un des modèles de prévision météorologique globaux les plus fiables.

Les modèles météo ML actuels montrent des performances qui égalent ou, dans certains cas, dépassent les méthodes traditionnelles, surtout en regardant les scores variés à travers plusieurs variables et niveaux de pression. Parallèlement à la performance, les méthodes ML peuvent être plus éco-énergétiques et plus rapides dans le traitement des données. Cela a conduit beaucoup de gens à spéculer qu'un changement dans le paysage de la prévision à moyen terme est en train de se produire, où les modèles numériques traditionnels sont principalement utilisés pour l'assimilation des données tandis que les systèmes ML sont utilisés pour fournir des prévisions opérationnelles.

Des prévisions météo précises et fiables sont essentielles pour de nombreux aspects de la vie humaine. Par conséquent, des analyses approfondies sont nécessaires avant que les modèles de prévision par apprentissage automatique puissent être mis en œuvre dans des applications réelles.

Les événements météorologiques extrêmes peuvent avoir des conséquences graves, comme des dommages agricoles, des incendies de forêt et des inondations. Pour une gestion efficace des risques, des prévisions précises d'événements rares sont essentielles. Bien que les modèles ML puissent atteindre une grande exactitude globale, leurs performances lors d'événements extrêmes ne sont pas encore totalement comprises. Ces modèles rencontrent des défis lorsqu'ils doivent faire des prévisions dans des situations très différentes de ce pour quoi ils ont été entraînés. Un bon score de test ne prédit pas nécessairement le succès dans des conditions en dehors des données d'entraînement.

La performance des prévisions est souvent résumée à l'aide de métriques comme l'erreur quadratique moyenne (RMSE). En général, un score unique est calculé pour chaque délai de prévision et variable afin de donner une vue d'ensemble de la performance du modèle. De plus, d'autres facteurs impactant les prévisions ML ont été examinés dans des recherches passées. Par exemple, des études ont montré que de nombreux modèles ML ont tendance à lisser leurs prévisions sur des délais plus longs, conséquence de la façon dont les modèles sont entraînés.

Divers événements extrêmes ont été étudiés à travers le prisme de ces modèles prédictifs, y compris des températures extrêmes, des cyclones tropicaux et des tempêtes. Cependant, beaucoup de recherches restent nécessaires dans de nombreux domaines, en particulier en ce qui concerne l'étude de la manière dont plusieurs variables prédites interagissent entre elles et affectent l'impact des événements. Les études de cas sont essentielles pour gagner la confiance du public et découvrir d'éventuelles erreurs cachées dans les prévisions qui ne pourraient pas être visibles dans les statistiques récapitulatives.

Cette étude évalue la capacité de trois modèles météo ML populaires- GraphCast, PanguWeather, et FourCastNet- à prévoir avec précision des indicateurs d'impact critiques liés à des événements météorologiques extrêmes à travers des études de cas détaillées.

Données et Modèles

Dans cette étude, nous utilisons deux types de données : les données de réanalyse ERA5 et les données d'analyse HRES de l'ECMWF. Tous les modèles ML considérés ont été entraînés sur ERA5, qui combine des observations avec des prévisions à courte portée pour donner la meilleure estimation de l'état actuel de la météo. ERA5 fournit des données horaires sur diverses variables climatiques dans le monde entier depuis 1940.

Les modèles ML GraphCast et FourCastNet nécessitent des points de données toutes les six heures et ont été entraînés à des moments précis. Nous utilisons des prévisions du système haute résolution de l'ECMWF, qui a une résolution horizontale qui fournit plus d'informations. Les données de prévisions sont adaptées pour correspondre au timing des prévisions ML.

Il est crucial de garantir une comparaison équitable entre les modèles ML et le système de prévision traditionnel. Ainsi, nous utilisons les prévisions HRES comme référence pour éviter d'introduire des erreurs dues à différentes conditions initiales. Les modèles ML sont généralement entraînés sur des données ERA5, qui ne reflètent pas le cadre opérationnel réel, ajoutant de la complexité aux comparaisons avec HRES.

Études de Cas

Canicule du Nord-Ouest Pacifique 2021

Fin juin 2021, une canicule significative a frappé le Nord-Ouest Pacifique, provoquant des températures record. Cet événement a attiré une attention considérable en raison de ses énormes impacts sur les écosystèmes environnants et la santé humaine, entraînant plus de 1400 décès. Pendant cet événement, l'erreur de prévision des modèles traditionnels et ML était notable, avec des erreurs dépassant considérablement les métriques typiques.

Lorsque nous avons étudié la performance des modèles ML, nous avons constaté que les prévisions durant cette canicule n'étaient pas aussi précises que les performances durant un été normal. Bien que les modèles ML aient souvent bien performé dans des conditions standards, leur capacité à prédire les événements de température extrême était insuffisante, en particulier sur des délais plus longs.

Les modèles avaient du mal à prédire avec précision la plage de températures durant le pic de la canicule. En évaluant les erreurs de prévision, nous avons noté que bien que certains modèles aient eu des performances comparables aux modèles traditionnels, le système de prévision traditionnel montrait toujours une meilleure fiabilité.

Canicule Humide d'Asie du Sud 2023

En avril 2023, l'Asie du Sud a fait face à un défi significatif lorsque des températures élevées se sont combinées à des niveaux d'Humidité élevés. Cette situation peut entraîner des risques sanitaires graves, car le corps a plus de difficultés à réguler sa température sous une forte humidité. L'indice de chaleur, une métrique combinant température et humidité, est utilisé pour évaluer ces risques.

Malgré les tentatives de prévoir cet indice de chaleur, les modèles ML ont rencontré des difficultés à cause de limites dans la prédiction des variables d'humidité pertinentes. Ce manque a entravé notre capacité à évaluer efficacement les risques sanitaires. En analysant la performance des modèles ML, il est devenu évident qu'ils sous-estimaient l'humidité, ce qui a amplifié les inexactitudes dans l'indice de chaleur prédit durant cet événement sévère.

Tempête Hivernale Nord-Américaine 2021

La tempête hivernale nord-américaine de février 2021 a apporté des conditions dangereuses à une grande partie du continent. Cette tempête a causé des perturbations significatives, particulièrement au Texas, où des pannes d'infrastructure ont entraîné des coupures de courant généralisées et des interruptions de l'approvisionnement en eau.

En évaluant les prévisions pour cet événement, nous avons trouvé que bien que les modèles ML aient montré des résultats prometteurs, ils n'étaient pas systématiquement meilleurs que les méthodes traditionnelles. Dans certains cas, ils ont surpassé la prévision conventionnelle, en particulier pour prédire les variations de température. Cependant, les modèles ML ont rencontré des difficultés pour prédire certains aspects critiques avec précision, mettant en lumière les défis persistants pour adapter ces modèles aux conditions hivernales extrêmes.

Discussion et Conclusions

À travers les études de cas, nous avons observé diverses forces et faiblesses dans les modèles ML et les systèmes de prévision traditionnels. Lors de la canicule du Nord-Ouest Pacifique, tant les modèles ML que HRES ont performé de manière comparable, mais les méthodes traditionnelles ont démontré une meilleure compréhension de l'extrême des conditions. Le manque de capacités des modèles ML à prédire l'humidité au niveau de surface a gravement limité leur efficacité durant la canicule humide en Asie du Sud. Enfin, lors de la tempête hivernale nord-américaine, les modèles ML ont montré de fortes capacités prédictives dans certains domaines mais ont eu du mal avec d'autres.

Bien que cette recherche démontre le potentiel de l'apprentissage automatique dans la prévision météorologique, elle souligne aussi la nécessité d'améliorations et d'évaluations plus systématiques. S'assurer que ces modèles peuvent gérer des événements extrêmes est crucial pour leur application pratique dans la prévision du monde réel. De plus, les comparaisons directes des modèles devraient aller au-delà des variables météorologiques pour évaluer les impacts pratiques, ce qui pourrait améliorer la valeur des modèles dans des scénarios réels.

Les avancées dans ces modèles et de meilleures évaluations aideront finalement à affiner leur exactitude et leur fiabilité en matière de prévisions, ouvrant la voie à des systèmes de prévision météo améliorés. À mesure que l'impact des événements météorologiques extrêmes continue de croître, la demande de prévisions précises ne fera qu'augmenter, rendant ce travail essentiel pour protéger les communautés à l'échelle mondiale.

En conclusion, une évaluation continue et la recherche sur les méthodes d'apprentissage automatique seront clés pour progresser vers une prévision météo fiable qui pourra vraiment répondre aux besoins de la société face à des schémas météorologiques de plus en plus imprévisibles.

Source originale

Titre: Validating Deep-Learning Weather Forecast Models on Recent High-Impact Extreme Events

Résumé: The forecast accuracy of deep-learning-based weather prediction models is improving rapidly, leading many to speak of a "second revolution in weather forecasting". With numerous methods being developed, and limited physical guarantees offered by deep-learning models, there is a critical need for comprehensive evaluation of these emerging techniques. While this need has been partly fulfilled by benchmark datasets, they provide little information on rare and impactful extreme events, or on compound impact metrics, for which model accuracy might degrade due to misrepresented dependencies between variables. To address these issues, we compare deep-learning weather prediction models (GraphCast, PanguWeather, FourCastNet) and ECMWF's high-resolution forecast (HRES) system in three case studies: the 2021 Pacific Northwest heatwave, the 2023 South Asian humid heatwave, and the North American winter storm in 2021. We find evidence that machine learning (ML) weather prediction models can locally achieve similar accuracy to HRES on record-shattering events such as the 2021 Pacific Northwest heatwave and even forecast the compound 2021 North American winter storm substantially better. However, extrapolating to extreme conditions may impact machine learning models more severely than HRES, as evidenced by the comparable or superior spatially- and temporally-aggregated forecast accuracy of HRES for the two heatwaves studied. The ML forecasts also lack variables required to assess the health risks of events such as the 2023 South Asian humid heatwave. Generally, case-study-driven, impact-centric evaluation can complement existing research, increase public trust, and aid in developing reliable ML weather prediction models.

Auteurs: Olivier C. Pasche, Jonathan Wider, Zhongwei Zhang, Jakob Zscheischler, Sebastian Engelke

Dernière mise à jour: 2024-04-26 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2404.17652

Source PDF: https://arxiv.org/pdf/2404.17652

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires