Salome HOME
Updating documentation by review and snippets (1)
[modules/adao.git] / doc / fr / methodology.rst
1 ..
2    Copyright (C) 2008-2019 EDF R&D
3
4    This file is part of SALOME ADAO module.
5
6    This library is free software; you can redistribute it and/or
7    modify it under the terms of the GNU Lesser General Public
8    License as published by the Free Software Foundation; either
9    version 2.1 of the License, or (at your option) any later version.
10
11    This library is distributed in the hope that it will be useful,
12    but WITHOUT ANY WARRANTY; without even the implied warranty of
13    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14    Lesser General Public License for more details.
15
16    You should have received a copy of the GNU Lesser General Public
17    License along with this library; if not, write to the Free Software
18    Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
19
20    See http://www.salome-platform.org/ or email : webmaster.salome@opencascade.com
21
22    Author: Jean-Philippe Argaud, jean-philippe.argaud@edf.fr, EDF R&D
23
24 .. _section_methodology:
25
26 ===========================================================================================
27 **[DocT]** Méthodologie pour élaborer une étude d'Assimilation de Données ou d'Optimisation
28 ===========================================================================================
29
30 Cette section présente un méthodologie générique pour construire une étude
31 d'Assimilation de Données ou d'Optimisation. Elle décrit les étapes
32 conceptuelles pour établir de manière indépendante cette étude. Elle est
33 indépendante de tout outil, mais le module ADAO permet de mettre en oeuvre
34 efficacement une telle étude. Les notations sont les mêmes que celles utilisées
35 dans :ref:`section_theory`.
36
37 Procédure logique pour une étude
38 --------------------------------
39
40 Pour une étude générique d'Assimilation de Données ou d'Optimisation, les
41 principales étapes méthodologiques peuvent être les suivantes:
42
43 - :ref:`section_m_step1`
44 - :ref:`section_m_step2`
45 - :ref:`section_m_step3`
46 - :ref:`section_m_step4`
47 - :ref:`section_m_step5`
48 - :ref:`section_m_step6`
49 - :ref:`section_m_step7`
50
51 Chaque étape est détaillée dans la section suivante.
52
53 Procédure détaillée pour une étude
54 ----------------------------------
55
56 .. _section_m_step1:
57
58 ÉTAPE 1: Spécifier la résolution du système physique et les paramètres à ajuster
59 ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
60
61 Une source essentielle de connaissance du système physique étudié est la
62 simulation numérique. Elle est souvent disponible à travers un ou des cas de
63 calcul, et elle est symbolisée par un **opérateur de simulation** (précédemment
64 inclus dans :math:`H`). Un cas de calcul standard rassemble des hypothèses de
65 modèles, une implémentation numérique, des capacités de calcul, etc. de manière
66 à représenter le comportement du système physique. De plus, un cas de calcul est
67 caractérisé par exemple par ses besoins en temps de calcul et en mémoire, par la
68 taille de ses données et de ses résultats, etc. La connaissance de tous ces
69 éléments est primordiale dans la mise au point d'une étude d'assimilation de
70 données ou d'optimisation.
71
72 Pour établir correctement une étude, il faut aussi choisir les inconnues
73 d'optimisation incluses dans la simulation. Fréquemment, cela peut être à l'aide
74 de modèles physiques dont les paramètres peuvent être ajustés. De plus, il est
75 toujours utile d'ajouter une connaissance de type sensibilité, comme par exemple
76 celle de la simulation par rapport aux paramètres qui peuvent être ajustés. Des
77 éléments plus généraux, comme la stabilité ou la régularité de la simulation par
78 rapport aux inconnues en entrée, sont aussi d'un grand intérêt.
79
80 En pratique, les méthodes d'optimisation peuvent requérir une information de
81 type gradient de la simulation par rapport aux inconnues. Dans ce cas, le
82 gradient explicite du code doit être donné, ou le gradient numérique doit être
83 établi. Sa qualité est en relation avec la stabilité ou la régularité du code de
84 simulation, et elle doit être vérifiée avec soin avant de mettre en oeuvre les
85 calculs d'optimisation. Des conditions spécifiques doivent être utilisées pour
86 ces vérifications.
87
88 Un **opérateur d'observation** est toujours requis, en complément à l'opérateur
89 de simulation. Cet opérateur d'observation, noté :math:`H` ou inclus dedans,
90 doit convertir les sorties de la simulation numérique en quelque-chose qui est
91 directement comparable aux observations. C'est un opérateur essentiel, car il
92 est le moyen pratique de comparer les simulations et les observations. C'est
93 usuellement réalisé par échantillonnage, projection ou intégration, des sorties
94 de simulation, mais cela peut être plus compliqué. Souvent, du fait que
95 l'opérateur d'observation fasse directement suite à celui de simulation dans un
96 schéma simple d'assimilation de données, cet opérateur d'observation utilise
97 fortement les capacités de post-traitement et d'extraction du code de
98 simulation.
99
100 .. _section_m_step2:
101
102 ÉTAPE 2: Spécifier les critères de qualification des résultats physiques
103 ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
104
105 Comme les systèmes étudiés ont une réalité physique, il est important d'exprimer
106 les **information physiques qui peuvent aider à qualifier un état simulé du
107 système**. Il y a deux grand types d'informations qui conduisent à des critères
108 permettant la qualification et la quantification de résultats d'optimisation.
109
110 Premièrement, provenant d'une connaissance mathématique ou numérique, un grand
111 nombre d'indicateurs standards permettent de qualifier, en relatif ou en absolu,
112 l'intérêt d'un état optimal. Par exemple, des équations d'équilibre ou des
113 conditions de fermeture sont des mesures complémentaires de la qualité d'un état
114 du système. Des critères bien choisis comme des RMS, des RMSE, des extrema de
115 champs, des intégrales, etc. permettent d'évaluer la qualité d'un état optimisé.
116
117 Deuxièmement, provenant d'une connaissance physique ou expérimentale, des
118 informations utiles peuvent être obtenus à partir de l'interprétation des
119 résultats d'optimisation. En particulier, la validité physique ou l'intérêt
120 technique permettent d'évaluer l'intérêt de résultats des résultats numériques
121 de l'optimisation.
122
123 Pour obtenir une information signifiante de ces deux types de connaissances, il
124 est recommandé, si possible, de construire des critères numériques pour
125 faciliter l'évaluation de la qualité globale des résultats numériques
126
127 .. _section_m_step3:
128
129 ÉTAPE 3: Identifier et décrire les observations disponibles
130 +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
131
132 En tant que seconde source d'information principale à propos du système physique
133 à étudier, les **observations, ou mesures,** notées :math:`\mathbf{y}^o`,
134 doivent être décrites avec soin. La qualité des mesures, leur erreurs
135 intrinsèques, leur particularités, sont importantes à connaître, pour pouvoir
136 introduire ces informations dans les calculs d'assimilation de données ou
137 d'optimisation.
138
139 Les observations doivent non seulement être disponibles, mais aussi doivent
140 pouvoir être introduites efficacement dans l'environnement numérique de calcul
141 ou d'optimisation. Ainsi l'environnement d'accès numérique aux observations est
142 fondamental pour faciliter l'usage effectif de mesures variées et de sources
143 diverses, et pour encourager des essais extensifs utilisant des mesures.
144 L'environnement d'accès numérique intègre la disponibilité de bases de données
145 ou pas, les formats de données, les interfaces d'accès, etc.
146
147 .. _section_m_step4:
148
149 ÉTAPE 4: Spécifier les éléments de modélisation de l'AD/Optimisation (covariances, ébauche...)
150 ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
151
152 Des éléments supplémentaires de modélisation en Assimilation de Données ou en
153 Optimisation permettent d'améliorer l'information à propos de la représentation
154 détaillée du système physique étudié.
155
156 La connaissance *a-priori* de l'état du système peut être représentée en
157 utilisant une **ébauche**, notée :math:`\mathbf{x}^b`, et la **matrice de
158 covariance des erreurs d'ébauche**, notée :math:`\mathbf{B}`. Ces informations
159 sont extrêmement importantes à compléter, en particulier pour obtenir des
160 résultats signifiants en Assimilation de Données.
161
162 Par ailleurs, des informations sur les erreurs d'observation peuvent être
163 utilisées pour compléter la **matrice de covariance des erreurs d'observation**,
164 notée :math:`\mathbf{R}`. Comme pour :math:`\mathbf{B}`, il est recommandé
165 d'utiliser des informations soigneusement vérifiées pour renseigner ces matrices
166 de covariances.
167
168 Dans le cas de simulations dynamiques, il est de plus nécessaire de définir un
169 **opérateur d'évolution** et la **matrice de covariance des erreurs
170 d'évolution** associée.
171
172 .. _section_m_step5:
173
174 ÉTAPE 5: Choisir l'algorithme d'optimisation et ses paramètres
175 ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
176
177 L'Assimilation de Données ou l'Optimisation demandent de résoudre un problème
178 d'optimisation, le plus souvent sous la forme d'un problème de minimisation.
179 Selon la disponibilité du gradient de la fonction coût en fonction des
180 paramètres d'optimisation, la classe recommandée de méthodes sera différente.
181 Les méthodes d'optimisation variationnelles ou avec linéarisation locale
182 nécessitent ce gradient. A l'opposé, les méthodes sans dérivées ne nécessitent
183 pas ce gradient, mais présentent souvent un coût de calcul notablement
184 supérieur.
185
186 A l'intérieur même d'une classe de méthodes d'optimisation, pour chaque méthode,
187 il y a usuellement un compromis à faire entre les *"capacités génériques de la
188 méthode"* et ses *"performances particulières sur un problème spécifique"*. Les
189 méthodes les plus génériques, comme par exemple la minimisation variationnelle
190 utilisant l':ref:`section_ref_algorithm_3DVAR`, présentent de remarquables
191 propriétés numériques d'efficacité, de robustesse et de fiabilité, ce qui
192 conduit à les recommander indépendamment du problème à résoudre. De plus, il est
193 souvent difficile de régler les paramètres d'une méthode d'optimisation, donc la
194 méthodes la plus robuste est souvent celle qui présente le moins de paramètres.
195 Au final, au moins au début, il est recommandé d'utiliser les méthodes les plus
196 génériques et de changer le moins possible les paramètres par défaut connus.
197
198 .. _section_m_step6:
199
200 ÉTAPE 6: Conduire les calculs d'optimisation et obtenir les résultats
201 +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
202
203 Après avoir mis au point une étude d'Assimilation de Données ou d'Optimisation,
204 les calculs doivent être conduits de manière efficace.
205
206 Comme l'optimisation requiert usuellement un grand nombre de simulations
207 physiques élémentaires du système, les calculs sont souvent effectués dans un
208 environnement de calculs hautes performances (HPC, ou Hight Performance
209 Computing) pour réduire le temps complet d'utilisateur. Même si le problème
210 d'optimisation est petit, le temps de simulation du système physique peut être
211 long, nécessitant des ressources de calcul conséquentes. Ces besoins doivent
212 être pris en compte suffisamment tôt dans la procédure d'étude pour être
213 satisfaits sans nécessiter un effort trop important.
214
215 Pour la même raison de besoins de calculs importants, il est aussi important de
216 préparer soigneusement les sorties de la procédure d'optimisation. L'état
217 optimal est la principale information requise, mais un grand nombre d'autres
218 informations spéciales peuvent être obtenues au cours du calcul d'optimisation
219 ou à la fin: évaluation des erreurs, états intermédiaires, indicateurs de
220 qualité, etc. Toutes ces informations, nécessitant parfois des calculs
221 additionnels, doivent être connues et demandées au début du processus
222 d'optimisation.
223
224 .. _section_m_step7:
225
226 ÉTAPE 7: Exploiter les résultats et qualifier leur pertinence physique
227 ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
228
229 Une fois les résultats obtenus, ils doivent être interprétés en termes de
230 significations physique et numérique. Même si la démarche d'optimisation donne
231 toujours un nouvel état optimal qui est au moins aussi bon que l'état *a
232 priori*, et le plus souvent meilleur, cet état optimal doit par exemple être
233 vérifié par rapport aux critères de qualité identifiés au moment de
234 :ref:`section_m_step2`. Cela peut conduire à des études statistiques ou
235 numériques de manière à évaluer l'intérêt d'un état optimal pour représenter la
236 système physique.
237
238 Au-delà de cette analyse qui doit être réalisée pour chaque étude d'Assimilation
239 de Données ou d'Optimisation, il est très utile d'exploiter les résultats
240 d'optimisation comme une partie intégrée dans une étude plus complète du système
241 physique d'intérêt.