.. [Das16] Das S., Mullick S. S., Suganthan P. N., *Recent Advances in Differential Evolution - An Updated Survey*, Swarm and Evolutionary Computation, 27, pp.1-30, 2016
+.. [Dautray85] Dautray R., Lions J.-L., et al., *Mathematical Analysis and Numerical Methods for Science and Technology*, Tome 1 à 6, Springer, 1988
+
.. [Evensen94] Evensen G., *Sequential data assimilation with a nonlinear quasi-geostrophic model using Monte Carlo methods to forecast error statistics*, Journal of Geophysical Research, 99(C5), pp.10143–10162, 1994
.. [Evensen03] Evensen G., *The Ensemble Kalman Filter: theoretical formulation and practical implementation*, Seminar on Recent developments in data assimilation for atmosphere and ocean, ECMWF, 8 to 12 September 2003
.. [Ide97] Ide K., Courtier P., Ghil M., Lorenc A. C., *Unified notation for data assimilation: operational, sequential and variational*, Journal of the Meteorological Society of Japan, 75(1B), pp.181-189, 1997
+.. [Jazwinski70] Jazwinski A. H., *Stochastic Processes and Filtering Theory*, Academic Press, 1970
+
.. [Johnson08] Johnson S. G., *The NLopt nonlinear-optimization package*, http://ab-initio.mit.edu/nlopt
.. [Kalnay03] Kalnay E., *Atmospheric Modeling, Data Assimilation and Predictability*, Cambridge University Press, 2003
.. [LeDimet86] Le Dimet F.-X., Talagrand 0., *Variational algorithms for analysis and assimilation of meteorological observations*, Tellus, 38A, pp.97-110, 1986
+.. [Lions68] Lions J.-L., *Optimal Control of Systems Governed by Partial Differential Equations*, Springer, 1971
+
.. [Lorenc86] Lorenc A. C., *Analysis methods for numerical weather prediction*, Quarterly Journal of the Royal Meteorological Society, 112, pp.1177-1194, 1986
.. [Lorenc88] Lorenc A. C., *Optimal nonlinear objective analysis*, Quarterly Journal of the Royal Meteorological Society, 114, pp.205–240, 1988
their errors. Parts of the framework are also known under the names of
*parameter estimation*, *inverse problems*, *Bayesian estimation*, *optimal
interpolation*, *field reconstruction*, etc. The ADAO module currently offers
-more than 100 different algorithmic methods and allows the study of about 350
-distinct applied problems. More details can be found in the section
+more than one hundred different algorithmic methods and allows the study of
+about 350 distinct applied problems. More details can be found in the section
:ref:`section_theory`.
The documentation for this module is divided into several major categories,
the observations, with *a priori* system physical and mathematical knowledge,
embedded in numerical models. The goal is to obtain the best possible estimate
of the system real state and of its stochastic properties. Note that this real
-state (or "*true state*") can not be reached, but can only be estimated.
+state (or "*true state*") cannot usually be reached, but can only be estimated.
Moreover, despite the fact that the used information are stochastic by nature,
data assimilation provides deterministic techniques in order to perform very
efficiently the estimation.
section `Going further in the state estimation by optimization methods`_, but
they are far more general and can be used without data assimilation concepts.
-Two main types of applications exist in data assimilation, being covered by the
-same formalism: **parameters identification** and **fields reconstruction**.
-Before introducing the `Simple description of the data assimilation
-methodological framework`_ in a next section, we describe briefly these two
-types. At the end, some references allow `Going further in the data assimilation
-framework`_.
+Two main types of applications exist in data assimilation, which are covered by
+the same formalism: **fields reconstruction** and **parameters identification**.
+These are also referred to as **state estimation** and **parameters estimation**
+respectively. Before introducing the `Simple description of the data
+assimilation methodological framework`_ in a next section, these two types of
+applications are briefly described. At the end, some references allow `Going
+further in the data assimilation framework`_.
Fields reconstruction or measures interpolation
-----------------------------------------------
.. index:: single: fields reconstruction
.. index:: single: measures interpolation
.. index:: single: fields interpolation
+.. index:: single: state estimation
**Fields reconstruction (or interpolation)** consists in finding, from a
restricted set of real measures, the physical field which is the most
calculation. The calculation is thus an *a priori* estimation of the field that
we seek to identify.
-If the system evolves in time, the reconstruction has to be established on every
-time step, of the field as a whole. The interpolation process in this case is
-more complicated since it is temporal, and not only in terms of instantaneous
-values of the field.
+If the system evolves over time, the reconstruction of the whole field has to
+be established at each time step, taking into account the information over a
+time window. The interpolation process is more complicated in this case because
+it is temporal, and not only in terms of instantaneous field values.
A simple example of fields reconstruction comes from meteorology, in which one
look for value of variables such as temperature or pressure in all points of the
.. index:: single: background
.. index:: single: regularization
.. index:: single: inverse problems
+.. index:: single: parameters estimation
The **identification (or adjustment) of parameters** by data assimilation is a
form of state calibration which uses both the physical measurement and an *a
solution.
It is indicated here that these methods of "*3D-Var*" and "*BLUE*" may be
-extended to dynamic problems, called respectively "*4D-Var*" and "*Kalman
-filter*". They have to take into account the evolution operator to establish an
-analysis at the right time steps of the gap between observations and
-simulations, and to have, at every moment, the propagation of the background
-through the evolution model. In the same way, these methods can be used in case
-of non linear observation or evolution operators. Many other variants have been
-developed to improve the numerical quality of the methods or to take into
-account computer requirements such as calculation size and time.
+extended to dynamic or time-related problems, called respectively "*4D-Var*"
+and "*Kalman filter (KF)*" and their derivatives. They have to take into
+account an evolution operator to establish an analysis at the right time steps
+of the gap between observations and simulations, and to have, at every moment,
+the propagation of the background through the evolution model. In the same way,
+these methods can be used in case of non linear observation or evolution
+operators. Many other variants have been developed to improve the numerical
+quality of the methods or to take into account computer requirements such as
+calculation size and time.
Going further in the data assimilation framework
------------------------------------------------
training courses or lectures like [Bouttier99]_ and [Bocquet04]_ (along with
other materials coming from geosciences applications), or general documents
like [Talagrand97]_, [Tarantola87]_, [Asch16]_, [Kalnay03]_, [Ide97]_,
-[Tikhonov77]_ and [WikipediaDA]_.
+[Tikhonov77]_ and [WikipediaDA]_. In a more mathematical way, one can also
+consult [Lions68]_, [Jazwinski70]_.
Note that data assimilation is not restricted to meteorology or geo-sciences,
but is widely used in other scientific domains. There are several fields in
.. [Das16] Das S., Mullick S. S., Suganthan P. N., *Recent Advances in Differential Evolution - An Updated Survey*, Swarm and Evolutionary Computation, 27, pp.1-30, 2016
+.. [Dautray85] Dautray R., Lions J.-L., et al., *Analyse mathématique et calcul numérique pour les sciences et les techniques*, Tome 1 à 9, Masson, 1985-1988
+
.. [Evensen94] Evensen G., *Sequential data assimilation with a nonlinear quasi-geostrophic model using Monte Carlo methods to forecast error statistics*, Journal of Geophysical Research, 99(C5), pp.10143–10162, 1994
.. [Evensen03] Evensen G., *The Ensemble Kalman Filter: theoretical formulation and practical implementation*, Seminar on Recent developments in data assimilation for atmosphere and ocean, ECMWF, 8 to 12 September 2003
.. [Ide97] Ide K., Courtier P., Ghil M., Lorenc A. C., *Unified notation for data assimilation: operational, sequential and variational*, Journal of the Meteorological Society of Japan, 75(1B), pp.181-189, 1997
+.. [Jazwinski70] Jazwinski A. H., *Stochastic Processes and Filtering Theory*, Academic Press, 1970
+
.. [Johnson08] Johnson S. G., *The NLopt nonlinear-optimization package*, http://ab-initio.mit.edu/nlopt
.. [Kalnay03] Kalnay E., *Atmospheric Modeling, Data Assimilation and Predictability*, Cambridge University Press, 2003
.. [LeDimet86] Le Dimet F.-X., Talagrand 0., *Variational algorithms for analysis and assimilation of meteorological observations*, Tellus, 38A, pp.97-110, 1986
+.. [Lions68] Lions J.-L., *Contrôle optimal de systèmes gouvernés par des équations aux dérivées partielles*, Dunod, 1968
+
.. [Lorenc86] Lorenc A. C., *Analysis methods for numerical weather prediction*, Quarterly Journal of the Royal Meteorological Society, 112, pp.1177-1194, 1986
.. [Lorenc88] Lorenc A. C., *Optimal nonlinear objective analysis*, Quarterly Journal of the Royal Meteorological Society, 114, pp.205–240, 1988
méthodes incluses dans ce cadre sont également connues sous les noms
d'*estimation de paramètres*, de *problèmes inverses*, d'*estimation
bayésienne*, d'*interpolation optimale*, de *reconstruction de champs*, etc. Le
-module ADAO offre actuellement plus de 100 méthodes algorithmiques différentes
-et permet l'étude d'environ 350 problèmes appliqués distincts. De plus amples
-détails peuvent être trouvés dans la partie proposant :ref:`section_theory`.
+module ADAO offre actuellement plus d'une centaine de méthodes algorithmiques
+différentes et permet l'étude d'environ 350 problèmes appliqués distincts. De
+plus amples détails peuvent être trouvés dans la partie proposant
+:ref:`section_theory`.
La documentation de ce module est divisée en plusieurs grandes catégories,
relatives à la documentation théorique (indiquée dans le titre de section par
.. index:: single: observation
.. index:: single: a priori
-L'**assimilation de données** est un cadre général bien établi pour le calcul de
+**L'assimilation de données** est un cadre général bien établi pour le calcul de
l'estimation optimale de l'état réel d'un système, au cours du temps si
nécessaire. Il utilise les valeurs obtenues en combinant des observations et des
modèles *a priori*, incluant de plus des informations sur leurs erreurs.
En d'autres termes, l'assimilation de données est un moyen de fusionner les
données mesurées d'un système, qui sont les observations, avec des
connaissances physique et mathématique *a priori* du système, intégrées dans
-les modèles numériques. L'objectif est d'obtenir la meilleure estimation possible
-de l'état réel du système et de ses propriétés stochastiques. On note que cet
-état réel (ou "*état vrai*") ne peut être atteint, mais peut seulement être
-estimé. De plus, malgré le fait que les informations utilisées sont
-stochastiques par nature, l'assimilation de données fournit des techniques
-déterministes afin de réaliser l'estimation de manière très efficace.
+les modèles numériques. L'objectif est d'obtenir la meilleure estimation
+possible de l'état réel du système et de ses propriétés stochastiques. On note
+que cet état réel (ou "*état vrai*") ne peut être habituellement atteint, mais
+peut seulement être estimé. De plus, malgré le fait que les informations
+utilisées sont stochastiques par nature, l'assimilation de données fournit des
+techniques déterministes afin de réaliser l'estimation de manière très
+efficace.
Comme l'assimilation de données cherche l'estimation la **meilleure possible**,
la démarche technique sous-jacente intègre toujours de l'optimisation afin de
utilisées sans les concepts d'assimilation de données.
Deux types principaux d'applications existent en assimilation de données, qui
-sont couverts par le même formalisme : l'**identification de paramètres** et la
-**reconstruction de champs**. Avant d'introduire la `Description simple du cadre
-méthodologique de l'assimilation de données`_ dans une prochaine section, nous
-décrivons brièvement ces deux types d'applications. A la fin de ce chapitre,
-quelques références permettent d'`Approfondir le cadre méthodologique de
-l'assimilation de données`_ et d'`Approfondir l'estimation d'état par des
-méthodes d'optimisation`_.
+sont couverts par le même formalisme : la **reconstruction de champs** et
+**l'identification de paramètres**. On parle aussi respectivement
+**d'estimation d'états** et **d'estimation de paramètres**. Avant d'introduire
+la `Description simple du cadre méthodologique de l'assimilation de données`_
+dans une prochaine section, on décrit brièvement ces deux types d'applications.
+A la fin de ce chapitre, quelques références permettent d'`Approfondir le cadre
+méthodologique de l'assimilation de données`_ et d'`Approfondir l'estimation
+d'état par des méthodes d'optimisation`_.
Reconstruction de champs ou interpolation de données
----------------------------------------------------
.. index:: single: reconstruction de champs
.. index:: single: interpolation de données
.. index:: single: interpolation de champs
+.. index:: single: estimation d'états
La **reconstruction (ou l'interpolation) de champs** consiste à trouver, à
partir d'un nombre restreint de mesures réelles, le (ou les) champ(s)
par la simulation globale du champ. Le champ calculé est donc une estimation *a
priori* du champ que l'on cherche à identifier.
-Si le système évolue dans le temps, la reconstruction doit être établie à chaque
-pas de temps, du champ dans son ensemble. Le processus d'interpolation est dans
-ce cas plus compliqué car il est temporel, et plus seulement en termes de
+Si le système évolue dans le temps, la reconstruction du champ dans son
+ensemble doit être établie à chaque pas de temps, en tenant compte des
+informations sur une fenêtre temporelle. Le processus d'interpolation est plus
+compliqué dans ce cas car il est temporel, et plus seulement en termes de
valeurs instantanées du champ.
Un exemple simple de reconstruction de champs provient de la météorologie, dans
.. index:: single: ébauche
.. index:: single: régularisation
.. index:: single: problèmes inverses
+.. index:: single: estimation de paramètres
-L'**identification (ou l'ajustement) de paramètres** par assimilation de
+**L'identification (ou l'ajustement) de paramètres** par assimilation de
données est une forme de calage d'état qui utilise simultanément les mesures
-physiques et une estimation *a priori* des paramètres (appelée l'"*ébauche*")
+physiques et une estimation *a priori* des paramètres (appelée "*l'ébauche*")
d'état que l'on cherche à identifier, ainsi qu'une caractérisation de leurs
erreurs. De ce point de vue, cette démarche utilise toutes les informations
disponibles sur le système physique, avec des hypothèses restrictives mais
-réalistes sur les erreurs, pour trouver l'"*estimation optimale*" de l'état
+réalistes sur les erreurs, pour trouver "*l'estimation optimale*" de l'état
vrai. On peut noter, en termes d'optimisation, que l'ébauche réalise la
"*régularisation*", au sens mathématique de Tikhonov [Tikhonov77]_
[WikipediaTI]_, du problème principal d'identification de paramètres. On peut
*de filtrage* donnent la même solution.
On indique que ces méthodes de "*3D-Var*" et de "*BLUE*" peuvent être étendues
-à des problèmes dynamiques, sous les noms respectifs de "*4D-Var*" et de
-"*filtre de Kalman*". Elles doivent alors prendre en compte l'opérateur
-d'évolution pour établir aux bons pas de temps une analyse de l'écart entre les
-observations et les simulations et pour avoir, à chaque instant, la propagation
-de l'ébauche à travers le modèle d'évolution. De la même manière, ces méthodes
-peuvent aussi être utilisées dans le cas d'opérateurs d'observation ou
-d'évolution non linéaires. Un grand nombre de variantes ont été développées
-pour accroître la qualité numérique des méthodes ou pour prendre en compte des
-contraintes informatiques comme la taille ou la durée des calculs.
+à des problèmes dynamiques ou temporels, sous les noms respectifs de "*4D-Var*"
+et de "*Filtre de Kalman (KF)*" et leurs dérivés. Elles doivent alors prendre
+en compte un opérateur d'évolution pour établir aux bons pas de temps une
+analyse de l'écart entre les observations et les simulations et pour avoir, à
+chaque instant, la propagation de l'ébauche à travers le modèle d'évolution. De
+la même manière, ces méthodes peuvent aussi être utilisées dans le cas
+d'opérateurs d'observation ou d'évolution non linéaires. Un grand nombre de
+variantes ont été développées pour accroître la qualité numérique des méthodes
+ou pour prendre en compte des contraintes informatiques comme la taille ou la
+durée des calculs.
Approfondir le cadre méthodologique de l'assimilation de données
----------------------------------------------------------------
[Bouttier99]_ et [Bocquet04]_ (ainsi que d'autres documents issus des
applications des géosciences), ou des documents généraux comme [Talagrand97]_,
[Tarantola87]_, [Asch16]_, [Kalnay03]_, [Ide97]_, [Tikhonov77]_ et
-[WikipediaDA]_.
+[WikipediaDA]_. De manière plus mathématique, on pourra aussi consulter
+[Lions68]_, [Jazwinski70]_.
On note que l'assimilation de données n'est pas limitée à la météorologie ou aux
géo-sciences, mais est largement utilisée dans d'autres domaines scientifiques.
Certains aspects de l'assimilation de données sont aussi connus sous d'autres
noms. Sans être exhaustif, on peut mentionner les noms de *calage* ou de
-*recalage*, de *calibration*, d'*estimation d'état*, d'*estimation de
-paramètres*, d'*ajustement de paramètres*, de *problèmes inverses* ou
-d'*inversion*, d'*estimation bayésienne*, d'*interpolation de champs* ou
-d'*interpolation optimale*, d'*optimisation variationnelle*, d'*optimisation
+*recalage*, de *calibration*, *d'estimation d'état*, *d'estimation de
+paramètres*, *d'ajustement de paramètres*, de *problèmes inverses* ou
+*d'inversion*, *d'estimation bayésienne*, *d'interpolation de champs* ou
+*d'interpolation optimale*, *d'optimisation variationnelle*, *d'optimisation
quadratique*, de *régularisation mathématique*, de *méta-heuristiques*
d'optimisation, de *réduction de modèles*, de *lissage de données*, de pilotage
-des modèles par les données (« *data-driven* »), d’*apprentissage* de modèles
+des modèles par les données (« *data-driven* »), *d'apprentissage* de modèles
et de données (*Machine Learning* et Intelligence Artificielle), etc. Ces
termes peuvent être utilisés dans les recherches bibliographiques.