Derivation and characterization of a new filter for nonlinear high-dimensional data assimilation

Herleitung und Charakterisierung eines neuen Filters für die nichtlineare, hochdimensionale Datenassimilation

  • Data assimilation (DA) combines model forecasts with real-world observations to achieve an optimal estimate of the state of a dynamical system. The quality of predictions in nonlinear and chaotic systems such as atmospheric or oceanic circulation is strongly sensitive to the initial conditions. Therefore, beyond the consistent reconstruction of past states, a primary relevance of advanced DA methods concerns the proper model initialization. The ensemble Kalman filter (EnKF) and its deterministic variants, mostly square root filters such as the ensemble transform Kalman filter (ETKF), represent a popular alternative to variational DA schemes. They are applied in a wide range of research and operations. Their forecast step employs an ensemble integration that fully respects the nonlinear nature of the analyzed system. In the analysis step, they implicitly assume the prior state and observation errors to be Gaussian. Consequently, in nonlinear systems, the mean and covariance of the analysis ensemble are biased and these filters remain suboptimal. In contrast, the fully nonlinear, non-Gaussian particle filter (PF) relies on Bayes' theorem without further assumptions, which guarantees an exact asymptotic behavior. However, it is exposed to weight collapse, particularly in higher-dimensional settings, known as the curse of dimensionality. This work presents a new method to obtain an analysis ensemble with mean and covariance that exactly match the corresponding Bayesian estimates. This is achieved by a deterministic matrix square root transformation of the forecast ensemble, and subsequently a suitable random rotation that significantly contributes to filter stability while preserving the required second-order statistics. The forecast step remains as in the ETKF. The algorithm, which is fairly easy to implement and computationally efficient, is referred to as the nonlinear ensemble transform filter (NETF). The limitation with respect to fully-nonlinear filtering is that the NETF only considers the mean and covariance of the Bayesian analysis density, neglecting higher-order moments. The properties and performance of the proposed algorithm are investigated via a set of experiments. The results indicate that such a filter formulation can increase the analysis quality, even for relatively small ensemble sizes, compared to other ensemble filters in nonlinear, non-Gaussian scenarios. They also confirm that localization enhances the applicability of this PF-inspired scheme in larger-dimensional systems. Finally, the novel filter is coupled to a large-scale ocean general circulation model with a realistic observation scenario. The NETF remains stable with a small ensemble size and shows a consistent behavior. Additionally, its analyses exhibit low estimation errors, as revealed by a comparison with a free ensemble integration and the ETKF. The results confirm that, in principle, the filter can be applied successfully and as simple as the ETKF in high-dimensional problems. No further modifications are needed, even though the algorithm is only based on the particle weights. Thus, it is able to overcome the curse of dimensionality, even in deterministic systems. This proves that the NETF constitutes a promising and user-friendly method for nonlinear high-dimensional DA.
  • Die Datenassimilation (DA) kombiniert Modellvorhersagen mit empirischen Beobachtungen, um den Zustand eines dynamischen Systems optimal zu schätzen. Die Qualität von Prognosen in nichtlinearen und chaotischen Systemen, wie etwa Atmosphäre oder Ozean, hängt stark von den Anfangsbedingungen ab. Neben ihrer Anwendung zur konsistenten Rekonstruktion vergangener Zustände sind fortschrittliche DA-Methoden daher von großer Relevanz für die korrekte Initialisierung von Modellen. Der Ensemble Kalman Filter (EnKF) und dessen deterministische Varianten, vor allem sogenannte Quadratwurzelfilter wie der Ensemble Transform Kalman Filter (ETKF), stellen eine gängige Alternative zu variationellen DA-Methoden dar. Sie sind sowohl in der Forschung als auch in operativen Anwendungen weit verbreitet. Ihr Vorhersageschritt nutzt eine Ensembleintegration, wodurch die Nichtlinearität des betrachteten Systems uneingeschränkt berücksichtigt wird. Im Analyseschritt wird jedoch implizit angenommen, dass Zustands- und Beobachtungsfehler einer Normalverteilung folgen. Daher unterliegen Mittel und Kovarianz des Analyseensembles in nichtlinearen Systemen einem systematischen Fehler. Im Gegensatz dazu greift der vollständig nichtlineare Partikelfilter (PF) lediglich auf Bayes’ Theorem zurück, was ein exaktes asymptotisches Verhalten garantiert. Allerdings sind PF insbesondere in hochdimensionalen Systemen nicht anwendbar, da die Partikelgewichte kollabieren. Die vorliegende Arbeit präsentiert eine neue Methode, um ein Analyseensemble zu generieren, dessen Mittelwert und Kovarianz exakt den entsprechenden Bayes’schen Schätzern entsprechen. Hierzu wird das Vorhersageensemble mittels einer Wurzelmatrix transformiert. Anschließend wird eine geeignete Zufallsrotation im Ensemble-Unterraum durchgeführt, welche die Stabilität des Filters deutlich verbessert, ohne die ersten beiden Momente zu verändern. Der Vorhersageschritt bleibt gegenüber dem ETKF unverändert. Der Algorithmus ist einfach zu implementieren und rechentechnisch effizient. Er wird als Nonlinear Ensemble Transform Filter (NETF) bezeichnet. Seine grundsätzliche Einschränkung besteht darin, dass nur Mittelwert und Kovarianz der Bayes’schen Analyseverteilung berücksichtigt werden, während höhere Momente vernachlässigt werden. Eigenschaften und Leistungsverhalten des NETF werden in verschiedenen Simulationen untersucht. Die Resultate zeigen, dass die neue Methode die Qualität der Analyse in nichtlinearen, nicht-Gauß’schen Szenarien im Vergleich zu anderen Ensemblefiltern deutlich verbessern kann, sogar für relativ kleine Ensemblegrößen. Hierbei wird die Anwendbarkeit in Systemen höherer Dimension durch eine Lokalisierung der Analyse ermöglicht. Zum Schluss wird der neue Filter mit einem großskaligen Modell der Ozeanzirkulation mit realistischem Beobachtungsszenario gekoppelt. Der NETF bleibt stabil und weist bereits bei einer kleinen Ensemblegröße Analysen mit niedrigen Schätzfehlern auf. Damit wird bestätigt, dass der Filter erfolgreich und ähnlich einfach wie der ETKF für hochdimensionale Probleme angewendet werden kann. Weitere Modifikationen sind nicht erforderlich, obwohl der Algorithmus ausschließlich auf den Partikelgewichten basiert. Somit erweist sich der NETF als eine vielversprechende und anwenderfreundliche Methode für die nichtlineare, hochdimensionale DA.

Download full text files

Export metadata

Metadaten
Author:Julian TödterGND
URN:urn:nbn:de:hebis:30:3-377953
Publisher:Univ.-Bibliothek
Place of publication:Frankfurt am Main
Referee:Bodo AhrensORCiDGND, Leopold HaimbergerORCiDGND
Advisor:Bodo Ahrens
Document Type:Doctoral Thesis
Language:English
Date of Publication (online):2015/07/03
Year of first Publication:2015
Publishing Institution:Universitätsbibliothek Johann Christian Senckenberg
Granting Institution:Johann Wolfgang Goethe-Universität
Date of final exam:2015/06/19
Release Date:2015/07/03
Tag:data assimilation; estimation theory; filter; nonlinear; stochastics
Page Number:200
HeBIS-PPN:361489072
Institutes:Geowissenschaften / Geographie / Geowissenschaften
Dewey Decimal Classification:5 Naturwissenschaften und Mathematik / 55 Geowissenschaften, Geologie / 550 Geowissenschaften
Sammlungen:Universitätspublikationen
Licence (German):License LogoDeutsches Urheberrecht