Salome HOME
Updating copyright date information (1)
[modules/adao.git] / doc / fr / methodology.rst
1 ..
2    Copyright (C) 2008-2018 EDF R&D
3
4    This file is part of SALOME ADAO module.
5
6    This library is free software; you can redistribute it and/or
7    modify it under the terms of the GNU Lesser General Public
8    License as published by the Free Software Foundation; either
9    version 2.1 of the License, or (at your option) any later version.
10
11    This library is distributed in the hope that it will be useful,
12    but WITHOUT ANY WARRANTY; without even the implied warranty of
13    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14    Lesser General Public License for more details.
15
16    You should have received a copy of the GNU Lesser General Public
17    License along with this library; if not, write to the Free Software
18    Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
19
20    See http://www.salome-platform.org/ or email : webmaster.salome@opencascade.com
21
22    Author: Jean-Philippe Argaud, jean-philippe.argaud@edf.fr, EDF R&D
23
24 .. _section_methodology:
25
26 ===========================================================================================
27 **[DocT]** Méthodologie pour élaborer une étude d'Assimilation de Données ou d'Optimisation
28 ===========================================================================================
29
30 Cette section présente un méthodologie générique pour construire une étude
31 d'Assimilation de Données ou d'Optimisation. Elle décrit les étapes
32 conceptuelles pour établir de manière indépendante cette étude. Elle est
33 indépendante de tout outil, mais le module ADAO permet de mettre en oeuvre
34 efficacement une telle étude.
35
36 Procédure logique pour une étude
37 --------------------------------
38
39 Pour une étude générique d'Assimilation de Données ou d'Optimisation, les
40 principales étapes méthodologiques peuvent être les suivantes:
41
42     - :ref:`section_m_step1`
43     - :ref:`section_m_step2`
44     - :ref:`section_m_step3`
45     - :ref:`section_m_step4`
46     - :ref:`section_m_step5`
47     - :ref:`section_m_step6`
48     - :ref:`section_m_step7`
49
50 Chaque étape est détaillée dans la section suivante.
51
52 Procédure détaillée pour une étude
53 ----------------------------------
54
55 .. _section_m_step1:
56
57 ÉTAPE 1: Spécifier la résolution du système physique et les paramètres à ajuster
58 ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
59
60 Une source essentielle de connaissance du système physique étudié est la
61 simulation numérique. Elle est souvent disponible à travers un ou des cas de
62 calcul, et elle est symbolisée par un **opérateur de simulation** (précédemment
63 inclus dans :math:`H`). Un cas de calcul standard rassemble des hypothèses de
64 modèles, une implémentation numérique, des capacités de calcul, etc. de manière
65 à représenter le comportement du système physique. De plus, un cas de calcul est
66 caractérisé par exemple par ses besoins en temps de calcul et en mémoire, par la
67 taille de ses données et de ses résultats, etc. La connaissance de tous ces
68 éléments est primordiale dans la mise au point d'une étude d'assimilation de
69 données ou d'optimisation.
70
71 Pour établir correctement une étude, il faut aussi choisir les inconnues
72 d'optimisation incluses dans la simulation. Fréquemment, cela peut être à l'aide
73 de modèles physiques dont les paramètres peuvent être ajustés. De plus, il est
74 toujours utile d'ajouter une connaissance de type sensibilité, comme par exemple
75 celle de la simulation par rapport aux paramètres qui peuvent être ajustés. Des
76 éléments plus généraux, comme la stabilité ou la régularité de la simulation par
77 rapport aux inconnues en entrée, sont aussi d'un grand intérêt.
78
79 En pratique, les méthodes d'optimisation peuvent requérir une information de
80 type gradient de la simulation par rapport aux inconnues. Dans ce cas, le
81 gradient explicite du code doit être donné, ou le gradient numérique doit être
82 établi. Sa qualité est en relation avec la stabilité ou la régularité du code de
83 simulation, et elle doit être vérifiée avec soin avant de mettre en oeuvre les
84 calculs d'optimisation. Des conditions spécifiques doivent être utilisées pour
85 ces vérifications.
86
87 Un **opérateur d'observation** est toujours requis, en complément à l'opérateur
88 de simulation. Cet opérateur d'observation, noté :math:`H` ou inclus dedans,
89 doit convertir les sorties de la simulation numérique en quelque-chose qui est
90 directement comparable aux observations. C'est un opérateur essentiel, car il
91 est le moyen pratique de comparer les simulations et les observations. C'est
92 usuellement réalisé par échantillonnage, projection ou intégration, des sorties
93 de simulation, mais cela peut être plus compliqué. Souvent, du fait que
94 l'opérateur d'observation fasse directement suite à celui de simulation dans un
95 schéma simple d'assimilation de données, cet opérateur d'observation utilise
96 fortement les capacités de post-traitement et d'extraction du code de
97 simulation.
98
99 .. _section_m_step2:
100
101 ÉTAPE 2: Spécifier les critères de qualification des résultats physiques
102 ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
103
104 Comme les systèmes étudiés ont une réalité physique, il est important d'exprimer
105 les **information physiques qui peuvent aider à qualifier un état simulé du
106 système**. Il y a deux grand types d'informations qui conduisent à des critères
107 permettant la qualification et la quantification de résultats d'optimisation.
108
109 Premièrement, provenant d'une connaissance mathématique ou numérique, un grand
110 nombre d'indicateurs standards permettent de qualifier, en relatif ou en absolu,
111 l'intérêt d'un état optimal. Par exemple, des équations d'équilibre ou des
112 conditions de fermeture sont des mesures complémentaires de la qualité d'un état
113 du système. Des critères bien choisis comme des RMS, des RMSE, des extrema de
114 champs, des intégrales, etc. permettent d'évaluer la qualité d'un état optimisé.
115
116 Deuxièmement, provenant d'une connaissance physique ou expérimentale, des
117 informations utiles peuvent être obtenus à partir de l'interprétation des
118 résultats d'optimisation. En particulier, la validité physique ou l'intérêt
119 technique permettent d'évaluer l'intérêt de résultats des résultats numériques
120 de l'optimisation.
121
122 Pour obtenir une information signifiante de ces deux types de connaissances, il
123 est recommandé, si possible, de construire des critères numériques pour
124 faciliter l'évaluation de la qualité globale des résultats numériques
125
126 .. _section_m_step3:
127
128 ÉTAPE 3: Identifier et décrire les observations disponibles
129 +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
130
131 En tant que seconde source d'information principale à propos du système physique
132 à étudier, les **observations, ou mesures,** notées :math:`\mathbf{y}^o`,
133 doivent être décrites avec soin. La qualité des mesures, leur erreurs
134 intrinsèques, leur particularités, sont importantes à connaître, pour pouvoir
135 introduire ces informations dans les calculs d'assimilation de données ou
136 d'optimisation.
137
138 Les observations doivent non seulement être disponibles, mais aussi doivent
139 pouvoir être introduites efficacement dans l'environnement numérique de calcul
140 ou d'optimisation. Ainsi l'environnement d'accès numérique aux observations est
141 fondamental pour faciliter l'usage effectif de mesures variées et de sources
142 diverses, et pour encourager des essais extensifs utilisant des mesures.
143 L'environnement d'accès numérique intègre la disponibilité de bases de données
144 ou pas, les formats de données, les interfaces d'accès, etc.
145
146 .. _section_m_step4:
147
148 ÉTAPE 4: Spécifier les éléments de modélisation de l'AD/Optimisation (covariances, ébauche...)
149 ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
150
151 Des éléments supplémentaires de modélisation en Assimilation de Données ou en
152 Optimisation permettent d'améliorer l'information à propos de la représentation
153 détaillée du système physique étudié.
154
155 La connaissance *a-priori* de l'état du système peut être représentée en
156 utilisant l'**ébauche**, notée :math:`\mathbf{x}^b`, et la **matrice de
157 covariance des erreurs d'ébauche**, notée :math:`\mathbf{B}`. Ces informations
158 sont extrêmement importantes à compléter, en particulier pour obtenir des
159 résultats signifiants en Assimilation de Données.
160
161 Par ailleurs, des informations sur les erreurs d'observation peuvent être
162 utilisées pour compléter la **matrice de covariance des erreurs d'observation**,
163 notée :math:`\mathbf{R}`. Comme pour :math:`\mathbf{B}`, il est recommandé
164 d'utiliser des informations soigneusement vérifiées pour renseigner ces matrices
165 de covariances.
166
167 Dans le cas de simulations dynamiques, il est de plus nécessaire de définir un
168 **opérateur d'évolution** et la **matrice de covariance des erreurs
169 d'évolution** associée.
170
171 .. _section_m_step5:
172
173 ÉTAPE 5: Choisir l'algorithme d'optimisation et ses paramètres
174 ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
175
176 L'Assimilation de Données ou l'Optimisation demandent de résoudre un problème
177 d'optimisation, le plus souvent sous la forme d'un problème de minimisation.
178 Selon la disponibilité du gradient de la fonction coût en fonction des
179 paramètres d'optimisation, la classe recommandée de méthodes sera différente.
180 Les méthodes d'optimisation variationnelles ou avec linéarisation locale
181 nécessitent ce gradient. A l'opposé, les méthodes sans dérivées ne nécessitent
182 pas ce gradient, mais présentent souvent un coût de calcul notablement
183 supérieur.
184
185 A l'intérieur même d'une classe de méthodes d'optimisation, pour chaque méthode,
186 il y a usuellement un compromis à faire entre les *"capacités génériques de la
187 méthode"* et ses *"performances particulières sur un problème spécifique"*. Les
188 méthodes les plus génériques, comme par exemple la minimisation variationnelle
189 utilisant l':ref:`section_ref_algorithm_3DVAR`, présentent de remarquables
190 propriétés numériques d'efficacité, de robustesse et de fiabilité, ce qui
191 conduit à les recommander indépendamment du problème à résoudre. De plus, il est
192 souvent difficile de régler les paramètres d'une méthode d'optimisation, donc la
193 méthodes la plus robuste est souvent celle qui présente le moins de paramètres.
194 Au final, au moins au début, il est recommandé d'utiliser les méthodes les plus
195 génériques et de changer le moins possible les paramètres par défaut connus.
196
197 .. _section_m_step6:
198
199 ÉTAPE 6: Conduire les calculs d'optimisation et obtenir les résultats
200 +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
201
202 Après avoir mis au point une étude d'Assimilation de Données ou d'Optimisation,
203 les calculs doivent être conduits de manière efficace.
204
205 Comme l'optimisation requiert usuellement un grand nombre de simulations
206 physiques élémentaires du système, les calculs sont souvent effectués dans un
207 environnement de calculs hautes performances (HPC, ou Hight Performance
208 Computing) pour réduire le temps complet d'utilisateur. Même si le problème
209 d'optimisation est petit, le temps de simulation du système physique peut être
210 long, nécessitant des ressources de calcul conséquentes. Ces besoins doivent
211 être pris en compte suffisamment tôt dans la procédure d'étude pour être
212 satisfaits sans nécessiter un effort trop important.
213
214 Pour la même raison de besoins de calculs importants, il est aussi important de
215 préparer soigneusement les sorties de la procédure d'optimisation. L'état
216 optimal est la principale information requise, mais un grand nombre d'autres
217 informations spéciales peuvent être obtenues au cours du calcul d'optimisation
218 ou à la fin: évaluation des erreurs, états intermédiaires, indicateurs de
219 qualité, etc. Toutes ces informations, nécessitant parfois des calculs
220 additionnels, doivent être connues et demandées au début du processus
221 d'optimisation.
222
223 .. _section_m_step7:
224
225 ÉTAPE 7: Exploiter les résultats et qualifier leur pertinence physique
226 ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
227
228 Une fois les résultats obtenus, ils doivent être interprétés en termes de
229 significations physique et numérique. Même si la démarche d'optimisation donne
230 toujours un nouvel état optimal qui est au moins aussi bon que l'état *a
231 priori*, et le plus souvent meilleur, cet état optimal doit par exemple être
232 vérifié par rapport aux critères de qualité identifiés au moment de
233 :ref:`section_m_step2`. Cela peut conduire à des études statistiques ou
234 numériques de manière à évaluer l'intérêt d'un état optimal pour représenter la
235 système physique.
236
237 Au-delà de cette analyse qui doit être réalisée pour chaque étude d'Assimilation
238 de Données ou d'Optimisation, il est très utile d'exploiter les résultats
239 d'optimisation comme une partie intégrée dans une étude plus complète du système
240 physique d'intérêt.