Prévisions quotidiennes de l’étendue de glace de mer en Arctique

Les estimations et prévisions qui suivent sont basées sur les travaux de Philippe Goulet Coulombe, professeur à l’ESG, ainsi que ses collaborateurs Francis X. Diebold (University of Pennsylvania) et Maximilian Göbel (University of Lisbon). Voir, en particulier, Diebold, Goulet Coulombe et Göbel (2022). The English version of this page is available here.

La vitesse du réchauffement de l’Arctique est deux fois supérieure à celle de la planète. C’est un baromètre des conditions présentes et un prédicteur important de l’évolution future du climat. Moins de glace de mer et plus d’eau diminuent l’albédo (la capacité à réfléchir la lumière) de l’Arctique impliquant qu’une part grandissante de la chaleur solaire est absorbée par la terre plutôt que réfléchit dans l’atmosphère. Les répercussions immédiates sont l’accélération de l’augmentation des températures dans la région arctique, ainsi que, ultimement, celles de la planète entière. Notamment, cela favorise le dégel et l’érosion du pergélisol polaire, libérant ainsi d’importantes quantités de CO2 et de méthane qui, en elles-mêmes, représentent un risque de point de bascule pour le réchauffement climatique.

Avec 3,74 millions de kilomètres carrés au 15 septembre 2020, l’étendue de la glace de mer arctique (sea ice extent, SIE) s’est classée deuxième plus basse depuis les débuts de sa mesure par imagerie satellite en 1978 – derrière le minimum record de 2012. En effet, dans les 40 dernières années, l’étendue de la glace de mer estivale arctique a diminué d’environ 40 %. Une visualisation animée du phénomène est disponible ici. Un recul persistant de la SIE pourrait accélérer le réchauffement climatique et menacer la composition de l’écosystème de l’Arctique. La tendance baissière est bien encrée. La plupart des modèles climatiques et statistiques projettent qu’elle disparaitra en septembre (le point le plus bas du cycle saisonnier) quelque part entre 2040 et 2060. Cette fonte a des implications bien évidemment climatiques, mais aussi économiques et géopolitiques. Des exemples manifestes incluent l’ouverture de nouvelles routes plus rapides pour le transport des marchandises (plutôt que les routes traditionnelles via les canaux de Suez ou de Panama) et la question du contrôle de ce passage dans le territoire arctique.

Modèles

Pour toutes ces raisons, il y a une attention grandissante pour la prévision de l’étendue de glace arctique en septembre (l’équinoxe). En fait, l’intérêt est tel que le Sea Ice Prediction Network organise chaque année le Sea Ice Outlook (SIO), un sondage collectant les projections de divers groupes de chercheurs. Les prévisions sont soumises à quatre horizons différents (juin, juillet, août, septembre) et proviennent d’une panoplie de modèles, allant de modèles statistiques simples aux modèles structurels climatiques, en passant par les techniques d’apprentissage automatique (machine learning, ML). Les prévisions UPenn-UQAM sont basées sur des méthodes économétriques standards et ML, détaillées dans une succession d’articles scientifiques (Diebold et Rudebusch (sous presse, Journal of Econometrics), Goulet Coulombe et Göbel (2021, Journal of Climate), Diebold et Göbel (2022, Economics Letters), ainsi que Diebold, Göbel, et Goulet Coulombe (2022, à venir)). Les 5 modèles rapportés dans les résultats qui suivront sont :

  1. Feature-Engineered Linear Regression (FELR);
  2. Pocket Feature-Engineered Linear Regression (Pocket FELR);
  3. Feature-Engineered Machine Learning (FEML);
  4. Pocket Feature-Engineered Machine Learning (Pocket FEML);
  5. Vector Autoregression of the Arctic (VARCTIC).

Ces modèles ont pour but, entre autres, de procurer des prévisions de court et moyen terme de la SIE en une année donnée. Les deux premiers consistent en des régressions linéaires. Les prédicteurs sont construits à partir de différentes méthodes d’agrégation de valeurs récentes du SIE qui sont disponibles de façon journalière. Donc, la plupart des prévisions UPenn-UQAM sont disponibles et mises à jour quotidiennement plutôt que chaque mois (tel que regroupé par le SIO). « Pocket » signifie une version « de poche » du modèle, c.-à-d., plus parcimonieuse dans le choix d’inclusion des variables. Cela peut s’avérer préférable dans un environnement où le nombre d’observations pour estimer les paramètres (ou dit différemment, entrainer l’algorithme) est restreint (moins de 40 ans de données). Les modèles FEML sont une version Macroeconomic Random Forest (Goulet Coulombe, 2020) des FELRs où les coefficients de ces derniers changent dans le temps en fonction d’un algorithme ML. Cela permet au FEMLs de rendre compte de certaines nonlinearités pertinentes ayant été manquées par les FELRs. De plus, ceux-ci utilisent un plus grand ensemble de variables telles que la température ambiante, les émissions de CO2, et l’épaisseur de la glace. Le modèle VARCTIC emploie similairement un groupe de variables élargi, mais les inclut dans un modèle VAR bayésien et les prévisions sont obtenues de façon itérée à la fréquence mensuelle.

Prévisions pour septembre 2024

Les prévisions des modèles mentionnés ci-haut sont représentées dans la Figure 1. La tendance baissière y est particulièrement évidente. La zone rose correspond à la période « hors échantillon » qui sera utilisée pour évaluer la performance antérieure des approches proposées dans la Figure 3. Le dernier point de chaque ligne est la prédiction actuelle (en date du 30 septembre) de chaque algorithme pour septembre 2024. Les prévisions de 2013 à 2023 sont celles faites à la même date (i.e., les 30 septembre de 2013 à 2023) pour le SIE de cette année-là et donnent une idée de la fiabilité historique des diverses prévisions (qui sera plus systématiquement évalué dans la section suivante).

Figure 1 — Évolution historique de l’étendue de glace de mer arctique et prévisions des différents modèles au 30 septembre de chaque année depuis 2012. L’ombrage rose correspond à la période d’évaluation hors échantillon utilisée pour les calculs de la Figure 3 et les intervalles de confiance rapportés dans les Figures 2 et 4. Le glisseur (slider) permet de zoomer sur certaines périodes historiques et l’utilisateur peut décider de l’inclusion ou l’exclusion de certains modèles en cliquant sur ceux-ci dans la légende.

La valeur finale observée à la fin septembre 2023 est 4,37 millions de kilomètrescarrés. C’est inférieur aux deux dernières réalisations de 2021 (4,92) et 2022 (4,87).

Évidemment, il pourrait être prématuré de dire que la tendance à la baisse tire à sa fin. Néanmoins, il existe trois interprétations possibles (ou facteurs à prendre en compte) pour expliquer les réalisations « plus élevées » de 2021 et 2022. Premièrement, il y a la possibilité que le choc COVID négatif sur les émissions de CO2 fasse enfin son effet sur la mesure de l’étendue de la glace de mer. Dans les résultats de Goulet Coulombe et Göbel (2021) (et aussi d’autres chercheurs), il faut au moins 1,5 an pour qu’un choc négatif de CO2 ait un effet positif et durable notable sur l’étendue de la banquise. Deuxièmement, nous sommes au début d’un nouveau cycle du contenu thermique des océans qui pourrait atténuer la tendance abrupte que nous observons depuis 20 ans. Les observations récentes pourraient être la réalisation de ce phénomène. Troisièmement, il pourrait s’agir de toute autre forme de choc ascendant aléatoire, et que les modèles de carbone linéaires ou les modèles de tendance quadratique continuent de prédire correctement la disparition précoce de la glace de mer arctique en été. Comme vous pouvez le constater, ce ne sont que des suggestions puisque – bien qu’il soit régi par des lois physiques connues – le système climatique reste « observationnellement chaotique » pour les climatologues et les statisticiens. Cela semblera évidemment familier pour nos collègues (macro)économètres.

Naturellement, à quatre mois de la fin septembre, l’incertitude est vaste autour des prévisions. Celle-ci rétrécit à mesure que nous rapprochons de la cible fixe. Conséquemment, il est informatif de regarder l’historique des prévisions produites quotidiennement depuis le premier juin ainsi que les intervalles de confiance autour de celles-ci. Alors que nous entrons tout juste dans l’exercice de 2024, le chemin de prédictions disponibles est relativement court. En date du 30 septembre, tous les modèles concordent étroitement, prédisant une valeur plus élevé que celle de 2023. Notamment, la valeur de 2024 se situe confortablement dans l’intervalle de confiance de tous les modèles. Dans la figure 3, nous pouvons observer que les performances historiques de FELR et Pocket FELR surpassent celles de FEML et sa version « Pocket » pendant les premiers jours de juin. En faisant la moyenne des prévisions des deux modèles FELR au 30 juin, nous obtenons une prédiction de 4,63 millions de kilomètres carrés à la fin septembre. Ces estimations sont légèrement inférieures aux prévisions VARCTIC (à la mi-juin), qui s’alignent davantage sur les prévisions de fin juin de FEML et de sa version Pocket.

Figure 2 — Historique des prévisions et leurs intervalles de confiance pour septembre 2024. L’axe des x correspond à la date à laquelle la prévision fut calculée. Le glisseur (slider) permet de zoomer sur certaines périodes historiques. L’utilisateur peut décider de l’inclusion ou l’exclusion de certains modèles en cliquant sur ceux-ci dans la légende.

Prévisions passées et performance historique

Afin de savoir quel modèle utiliser et quand, nous pouvons employer une mesure de performance passée à chaque horizon de prévision. Les erreurs sont obtenues d’un exercice de prévision récursif pseudo-hors échantillon, ce qui garantit de ne pas favoriser les modèles ayant la capacité de « overfitter » la cible. La mesure retenue est la racine carrée de l’erreur quadratique moyenne (root mean squared error, RMSE), ce qui est standard dans la littérature et pénalise davantage les grandes erreurs que les petites. Les résultats sont presque identiques en utilisant l’erreur absolue moyenne.

Figure 3 — Performance hors échantillon des modèles sur la période 2013-2023. Puisqu’il s’agit du RMSE, plus la mesure est basse, mieux le modèle performe. L’abscisse correspond à la date à laquelle la prévision fut calculée. Le glisseur (slider) permet de zoomer sur certaines périodes historiques et l’utilisateur peut décider de l’inclusion ou l’exclusion de certains modèles en cliquant sur ceux-ci dans la légende.

Tout d’abord, Pocket FELR s’impose comme la meilleure référence jusqu’à la fin juin avec un RMSE plus petit sur toute la période. Compte tenu du petit échantillon d’estimation, il n’est pas tout à fait surprenant que les gains prédictifs apportés par FEML soient de taille limitée—les modèles ML surpassent typiquement les modèles simples lorsque beaucoup d’observations sont disponibles. Néanmoins, la performance de Pocket FEML entre 90 et 45 jours à l’avance est légèrement supérieure à celle de Pocket FELR et nettement meilleure que celle des trois autres options. Les améliorations par rapport au modèle plus simple vont parfois jusqu’à 0,2 million de kilomètres carrés. En somme, la recommandation est simple : il est avisé d’utiliser FELR en juin, août, et septembre et Pocket FEML en juillet.

Figure 4 — Historique des prévisions et leurs intervalles de confiance pour septembre 2023. L’abscisse correspond à la date à laquelle la prévision fut calculée. Le glisseur (slider) permet de zoomer sur certaines périodes historiques et l’utilisateur peut décider de l’inclusion ou l’exclusion de certains modèles en cliquant sur ceux-ci dans la légende.

En regardant l’ensemble des prévisions pour 2023, entre la mi-juin et la fin août, tous les modèles prédisaient une étendue de la glace de mer arctique (SIE) supérieure à la valeur observée de 4,37. Le pic de plus de 5,00 millions de km² a été atteint le 2 août, avant que tous les modèles n’entament une trajectoire descendante régulière jusqu’à la fin septembre. Le modèle VARCTIC a imité les trajectoires des modèles plus ponctuels FELR et FEML, bien qu’il ait été légèrement plus élevé lors de notre prévision de mi-septembre (gardez à l’esprit que le modèle VARCTIC avait été alimenté avec des données mensuelles jusqu’à la fin juin à ce moment-là). Néanmoins, le minimum observé de la SIE en 2023 était couvert par son intervalle de crédibilité à 90 %.

Ouvrages scientifiques sous-jacents

Diebold, Francis X., and Glenn D. Rudebusch. « Probability assessments of an ice-free Arctic: Comparing statistical and climate model projections. » Journal of Econometrics, sous presse.
Diebold, Francis X., and Maximilian Göbel. « A benchmark model for fixed-target Arctic sea ice forecasting. » Economics Letters 215 (2022): 110478.
Diebold, Francis X., Goulet Coulombe, Philippe, and Maximilian Göbel. « Assessing and Comparing
Fixed-Target Forecasts of Arctic Sea Ice: Glide Charts for Feature-Engineered Linear Regression and Machine Learning Models » arXiv:2206.10721.
Goulet Coulombe, Philippe. « The macroeconomy as a random forest. » Available at SSRN 3633110 (2020).
Goulet Coulombe, Philippe, and Maximilian Göbel. « Arctic amplification of anthropogenic forcing: a vector autoregressive analysis. » Journal of Climate 34.13 (2021): 5523-5541.