KI zum Verständnis des Klimasystems

Das Verständnis und die Detektion von kausalen Interaktionen im Klimasystem. Die Unterscheidung von kausalen Wechselwirkungen von reinen Korrelationen ist eine der Kernfragen in vielen Forschungsbereichen die sich mit gekoppelten Systemen beschäftigen, wie eben der Klimawissenschaft. Es finden sich viele Beispiele für Kopplungsmechanismen im Klimasystem (sogenannte "Teleconnections", Variabilitätsmoden wie die El Niño Southern Oscillation, oder groß-skalige Kopplungen von Extremwetterlagen, etc). In der Klimawissenschaft werden solche Kopplungen oft in der Form niedrigdimensionaler Korrelationen studiert, was aber notwendigerweise nicht die eigentliche Komplexität des Systems widerspiegelt. Insbesondere die Erklärbare KI bietet hier einen Mittelweg um das System in großer Komplexität zu studieren, aber immer noch in der Lage zu sein die gefundenen Interaktionen zu erklären, oder zumindest zu interpretieren.

Zum Beispiel können uns Kausalitätsalgorithmen auf diese Weise helfen globale Klimamodelle zu evaluieren. Ein solcher Evaluierungsprozess ist in der Abbildung rechts veranschaulicht (aus Nowack et al. Nature Communications, 2020): zuerst wird ein unüberwachter Schritt zur Dimensionsreduktion angewendet (PCA Varimax, Bild b) um die wichtigsten dynamischen Moden der Klimavariabilität in meteorologischen Daten des Oberflächendrucks auf Meereshöhe zu identifizieren (Muster für einzelne Tage von Druckdaten sind in a exemplarisch dargestellt). Wie in b zu sehen ist, sind die Zentren diese Moden über die ganze Erdoberfläche verteilt. Danach benutzen wir einen Algorithmus der darauf abzielt kausale Interaktionen in Zeitreihen der Moden zu detektieren (PCMCI, eingeführt in Runge et al. Science Advances, 2019). Die daraus resultierenden kausalen Interaktionsnetzwerke helfen uns zu quantifizieren und zu visualisieren wie Variabilität in einer Region jene in anderen Weltregionen beeinflussen kann.

Ein großer Vorteil dieser daten-basierten Herangehensweisen ist, dass sie sowohl auf Beobachtungsdaten als auch auf von Klimamodellen produzierten Daten angewendet werden können. Die daraus konstruierten kausalen Netzwerke können danach miteinander auf Konsistenz verglichen werden. Vergleiche von Distanzmetriken für Netzwerke können zur komplexen, hochdimensionalen Modellevaluierung genutzt werden (d).

Ein neuer Ansatz zur kausalen Modellierung in Klimasystemen kombiniert ein Modell zum Lernen von kausalen Repräsentationen (CDSD, eingeführt in Brouillard et al. arXiv, 2024) mit physikalisch informierten Nebenbedingungen und einem Bayesian Filter, um stabile Langzeitprojektionen zu ermöglichen. Durch diese Methodik wird nicht nur eine genauere Emulation von Klimadynamiken erreicht, sondern auch eine verbesserte Interpretierbarkeit der zugrunde liegenden kausalen Beziehungen. Die Experimente mit synthetischen Daten (SAVAR, eingeführt in Tibau et al. Environmental Data Science 2022) zeigten, dass das Modell latente Variablen korrekt identifizieren und kausale Graphen stabil rekonstruieren kann, selbst bei zunehmender Komplexität.

Ausgewählte Veröffentlichungen aus dem Themenbereich:

(1) Nowack et al. Causal networks for climate model evaluation and constrained projections. Nature Communications (2020).
(2) Runge et al. Detecting and quantifying causal associations in large nonlinear time series datasets. Science Advances (2019).
(3) Kuhn-Régnier et al. The importance of antecedent vegetation and drought conditions as global drivers of burnt area. Biogeosciences (2021).
(4) Nowack et al. On the role of ozone feedback in the ENSO amplitude response under global warming. Geophysical Research Letters (2022).
(5) Brouillard et al. Causal Representation Learning in Temporal Data via Single-Parent Decoding. arXiv (2024).
(6) Tibau et al. A Spatiotemporal Stochastic Climate Model for Benchmarking Causal Discovery Methods for Teleconnections. Environmental Data Science (2022).