Klima- und Klimafolgenforschung müssen sich weit mehr als die klassischen Naturwissenschaften (abgesehen von der Astrophysik) auf Computersimulationen und Beobachtungsdaten verlassen, weil das Klimasystem - oder auch nur signifikante Untersysteme desselben - im Labor nicht nachgebildet werden können. Dies hat zur Folge, dass den Methoden der Modellierung, der Numerik, des "Scientific Computing" (der deutsche Begriff "wissenschaftliches Rechnen" trifft es nicht ganz) und der intelligenten Datenanalyse (data science) eine herausragende Bedeutung in diesen Forschungsgebieten zukommt.
In diesem Seminar besprechen wir ausgewählte Arbeiten der aktuellen wissenschaftlichen Literatur sowie entsprechende Passagen aus etablierten Lehrbüchern, um den Teilnehmenden das breite Methodenspektrum der Klima- und Klimafolgenforschung näherzubringen.
Thematik im SoSe '23: Vorhersage von El Niño/La Niña-Episoden mittels Methoden des maschinellen Lernens
Wettervorhersage und Klimamodellierung stellen extreme Varianten der typischen Aufgabe der Erdsystemforschung dar, bedingte Vorhersagen über das zukünftige Geschehen im Erdsystem zu erstellen. Der Zeithorizont von Wettervorhersagen liegt bei unter 10 Tagen und in diesem Zeitrahmen sind echte Vorhersagen mit noch akzeptablen Unsicherheiten möglich. Danach wirkt sich die chaotische Natur etwa der Atmosphären- und Ozeanströmungen massiv aus und je weiter in der Zukunft der Vorhersagezeitpunkt liegt, desto mehr muss auf Wahrscheinlichkeitsaussagen für das Auftreten bestimmter Systemzustände zurückgegriffen werden. In der Tat ist "Klima" definiert als die "Statistik des Wetters über einem längeren Zeithorizont (typischerweise 30 Jahre), so dass die Klimamodellierung nicht Wetterzustände selbst, sondern Wahrscheinlichkeitsverteilungen über möglichen Wetterzuständen versucht vorherzusagen. Dabei berücksichtigt selbstverständlich auch die großen Unsicherheiten, die sich aus der Entwicklung der Weltpolitik im Hinblick auf den Klimawandel ergeben, und kann daher Aussagen immer nur als sogenannte "Szenarien" präsentieren: Unter diesen und jenen Voraussetzungen, z.B. zum globalen menschlich bedingten CO2-Ausstoß über die nächsten 100 Jahre, sind folgende Wahrscheinlichkeiten für das Auftreten bestimmter Wetterphänomene zu erwarten.
Die "El Niño Southern Oscillation" (ENSO) zeichnet sich durch in Abständen von 2-7 Jahren wiederkehrende Schwankungen eines ausgeprägten Strömungsmusters des pazifischen Atmosphären-Ozean-Systems aus. Diese Schwankungen haben beträchtliche Auswirkungen auf das weltweite Wettergeschehen, mit teils dramatischen Konsequenzen z.B. für die Landwirtschaft. Um dieser eine verbesserte, mittelfristige Planung ihres Resourceneinsatzes zu ermöglichen, ist es höchst wünschenswert, das Auftreten der ENSO-Episoden möglichst weit im Voraus mit hoher Wahrscheinlichkeit vorherzusagen. In jüngerer Zeit wetteifern in diesem Gebiet physikalisch motivierte Simulationsmodelle, die aus Wettervorhersage- oder Klimamodellen oder aus Kombinationen beider abgeleitet sind, mit rein datenbasierten Ersatzmodellen des ENSO-Systems. In diesem Semester diskutieren wir zwei solcher, rein aus Beobachtungsdaten abgeleiteter Vorhersagemodelle sowie die maschinellen Lernmethoden, auf denen sie aufbauen.
Die relevanten Veröffentlichungen sind:
- He et al. (2020), ReLU deep neural networks and linear finite elements, J. Comput. Math., 38:3, 502-527
- Siegel, Xu (2020), Approximation rates for neural networks with general activation functions, Neural Networks, 128, 313-321
- Ham et al. (2019). Deep learning for multi-year ENSO forecasts. Nature, 573:7775, 568–572
- Gerber et al. (2020), Low-cost scalable discretization, prediction, and feature selection for complex systems, Science Advances, 6, eaaw0961
- Horenko (2020), On scalable entropic breaching of the overfitting barrier in small-data problems, Neural Computation, 32:8, 1563-1579
- Vecchi et al. (2022), Scalable entropy-optimal machine learning classification for small-data problems, Neural Computation, 34:5, 1220-1255
Die Arbeiten werden zeitnah unter dem Reiter "Resourcen" (siehe Spalte links) bereitgestellt.
Durchführung des Seminars:
Jeweils zwei bis drei Teilnehmende des Seminars sollten eine der oben genannten Arbeiten in zwei Seminarterminen vorstellen. Dabei beleuchtet der erste Vortrag etwaige Grundlagen, auf die in den Arbeiten zurückgegriffen wird, während der zweite Vortrag darauf aufbauend die wesentlichen Aussagen der Arbeiten präsentiert.
Anrechung der erbrachten Leistungen:
Regelmäßige Teilnahme wird bestätigt, wenn Sie regelmäßig an den Seminarsitzungen teilnehmen, aktive Teilnahme wird bestätigt, wenn Sie selbst einen Teil der genannten Arbeiten im Sinne der oben beschriebenen Durchführung des Seminars vorgestellt haben.