doc/fr/methodology.rst

   1 ..
   2    Copyright (C) 2008-2019 EDF R&D
   3
   4    This file is part of SALOME ADAO module.
   5
   6    This library is free software; you can redistribute it and/or
   7    modify it under the terms of the GNU Lesser General Public
   8    License as published by the Free Software Foundation; either
   9    version 2.1 of the License, or (at your option) any later version.
  10
  11    This library is distributed in the hope that it will be useful,
  12    but WITHOUT ANY WARRANTY; without even the implied warranty of
  13    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
  14    Lesser General Public License for more details.
  15
  16    You should have received a copy of the GNU Lesser General Public
  17    License along with this library; if not, write to the Free Software
  18    Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
  19
  20    See http://www.salome-platform.org/ or email : webmaster.salome@opencascade.com
  21
  22    Author: Jean-Philippe Argaud, jean-philippe.argaud@edf.fr, EDF R&D
  23
  24 .. _section_methodology:
  25
  26 ===========================================================================================
  27 **[DocT]** Méthodologie pour élaborer une étude d'Assimilation de Données ou d'Optimisation
  28 ===========================================================================================
  29
  30 Cette section présente un méthodologie générique pour construire une étude
  31 d'Assimilation de Données ou d'Optimisation. Elle décrit les étapes
  32 conceptuelles pour établir de manière indépendante cette étude. Elle est
  33 indépendante de tout outil, mais le module ADAO permet de mettre en oeuvre
  34 efficacement une telle étude. Les notations sont les mêmes que celles utilisées
  35 dans :ref:`section_theory`.
  36
  37 Procédure logique pour une étude
  38 --------------------------------
  39
  40 Pour une étude générique d'Assimilation de Données ou d'Optimisation, les
  41 principales étapes méthodologiques peuvent être les suivantes:
  42
  43 - :ref:`section_m_step1`
  44 - :ref:`section_m_step2`
  45 - :ref:`section_m_step3`
  46 - :ref:`section_m_step4`
  47 - :ref:`section_m_step5`
  48 - :ref:`section_m_step6`
  49 - :ref:`section_m_step7`
  50
  51 Chaque étape est détaillée dans la section suivante.
  52
  53 Procédure détaillée pour une étude
  54 ----------------------------------
  55
  56 .. _section_m_step1:
  57
  58 ÉTAPE 1: Spécifier la résolution du système physique et les paramètres à ajuster
  59 ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
  60
  61 Une source essentielle de connaissance du système physique étudié est la
  62 simulation numérique. Elle est souvent disponible à travers un ou des cas de
  63 calcul, et elle est symbolisée par un **opérateur de simulation** (précédemment
  64 inclus dans :math:`H`). Un cas de calcul standard rassemble des hypothèses de
  65 modèles, une implémentation numérique, des capacités de calcul, etc. de manière
  66 à représenter le comportement du système physique. De plus, un cas de calcul est
  67 caractérisé par exemple par ses besoins en temps de calcul et en mémoire, par la
  68 taille de ses données et de ses résultats, etc. La connaissance de tous ces
  69 éléments est primordiale dans la mise au point d'une étude d'assimilation de
  70 données ou d'optimisation.
  71
  72 Pour établir correctement une étude, il faut aussi choisir les inconnues
  73 d'optimisation incluses dans la simulation. Fréquemment, cela peut être à l'aide
  74 de modèles physiques dont les paramètres peuvent être ajustés. De plus, il est
  75 toujours utile d'ajouter une connaissance de type sensibilité, comme par exemple
  76 celle de la simulation par rapport aux paramètres qui peuvent être ajustés. Des
  77 éléments plus généraux, comme la stabilité ou la régularité de la simulation par
  78 rapport aux inconnues en entrée, sont aussi d'un grand intérêt.
  79
  80 En pratique, les méthodes d'optimisation peuvent requérir une information de
  81 type gradient de la simulation par rapport aux inconnues. Dans ce cas, le
  82 gradient explicite du code doit être donné, ou le gradient numérique doit être
  83 établi. Sa qualité est en relation avec la stabilité ou la régularité du code de
  84 simulation, et elle doit être vérifiée avec soin avant de mettre en oeuvre les
  85 calculs d'optimisation. Des conditions spécifiques doivent être utilisées pour
  86 ces vérifications.
  87
  88 Un **opérateur d'observation** est toujours requis, en complément à l'opérateur
  89 de simulation. Cet opérateur d'observation, noté :math:`H` ou inclus dedans,
  90 doit convertir les sorties de la simulation numérique en quelque-chose qui est
  91 directement comparable aux observations. C'est un opérateur essentiel, car il
  92 est le moyen pratique de comparer les simulations et les observations. C'est
  93 usuellement réalisé par échantillonnage, projection ou intégration, des sorties
  94 de simulation, mais cela peut être plus compliqué. Souvent, du fait que
  95 l'opérateur d'observation fasse directement suite à celui de simulation dans un
  96 schéma simple d'assimilation de données, cet opérateur d'observation utilise
  97 fortement les capacités de post-traitement et d'extraction du code de
  98 simulation.
  99
 100 .. _section_m_step2:
 101
 102 ÉTAPE 2: Spécifier les critères de qualification des résultats physiques
 103 ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
 104
 105 Comme les systèmes étudiés ont une réalité physique, il est important d'exprimer
 106 les **information physiques qui peuvent aider à qualifier un état simulé du
 107 système**. Il y a deux grand types d'informations qui conduisent à des critères
 108 permettant la qualification et la quantification de résultats d'optimisation.
 109
 110 Premièrement, provenant d'une connaissance mathématique ou numérique, un grand
 111 nombre d'indicateurs standards permettent de qualifier, en relatif ou en absolu,
 112 l'intérêt d'un état optimal. Par exemple, des équations d'équilibre ou des
 113 conditions de fermeture sont des mesures complémentaires de la qualité d'un état
 114 du système. Des critères bien choisis comme des RMS, des RMSE, des extrema de
 115 champs, des intégrales, etc. permettent d'évaluer la qualité d'un état optimisé.
 116
 117 Deuxièmement, provenant d'une connaissance physique ou expérimentale, des
 118 informations utiles peuvent être obtenus à partir de l'interprétation des
 119 résultats d'optimisation. En particulier, la validité physique ou l'intérêt
 120 technique permettent d'évaluer l'intérêt de résultats des résultats numériques
 121 de l'optimisation.
 122
 123 Pour obtenir une information signifiante de ces deux types de connaissances, il
 124 est recommandé, si possible, de construire des critères numériques pour
 125 faciliter l'évaluation de la qualité globale des résultats numériques
 126
 127 .. _section_m_step3:
 128
 129 ÉTAPE 3: Identifier et décrire les observations disponibles
 130 +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
 131
 132 En tant que seconde source d'information principale à propos du système physique
 133 à étudier, les **observations, ou mesures,** notées :math:`\mathbf{y}^o`,
 134 doivent être décrites avec soin. La qualité des mesures, leur erreurs
 135 intrinsèques, leur particularités, sont importantes à connaître, pour pouvoir
 136 introduire ces informations dans les calculs d'assimilation de données ou
 137 d'optimisation.
 138
 139 Les observations doivent non seulement être disponibles, mais aussi doivent
 140 pouvoir être introduites efficacement dans l'environnement numérique de calcul
 141 ou d'optimisation. Ainsi l'environnement d'accès numérique aux observations est
 142 fondamental pour faciliter l'usage effectif de mesures variées et de sources
 143 diverses, et pour encourager des essais extensifs utilisant des mesures.
 144 L'environnement d'accès numérique intègre la disponibilité de bases de données
 145 ou pas, les formats de données, les interfaces d'accès, etc.
 146
 147 .. _section_m_step4:
 148
 149 ÉTAPE 4: Spécifier les éléments de modélisation de l'AD/Optimisation (covariances, ébauche...)
 150 ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
 151
 152 Des éléments supplémentaires de modélisation en Assimilation de Données ou en
 153 Optimisation permettent d'améliorer l'information à propos de la représentation
 154 détaillée du système physique étudié.
 155
 156 La connaissance *a-priori* de l'état du système peut être représentée en
 157 utilisant une **ébauche**, notée :math:`\mathbf{x}^b`, et la **matrice de
 158 covariance des erreurs d'ébauche**, notée :math:`\mathbf{B}`. Ces informations
 159 sont extrêmement importantes à compléter, en particulier pour obtenir des
 160 résultats signifiants en Assimilation de Données.
 161
 162 Par ailleurs, des informations sur les erreurs d'observation peuvent être
 163 utilisées pour compléter la **matrice de covariance des erreurs d'observation**,
 164 notée :math:`\mathbf{R}`. Comme pour :math:`\mathbf{B}`, il est recommandé
 165 d'utiliser des informations soigneusement vérifiées pour renseigner ces matrices
 166 de covariances.
 167
 168 Dans le cas de simulations dynamiques, il est de plus nécessaire de définir un
 169 **opérateur d'évolution** et la **matrice de covariance des erreurs
 170 d'évolution** associée.
 171
 172 .. _section_m_step5:
 173
 174 ÉTAPE 5: Choisir l'algorithme d'optimisation et ses paramètres
 175 ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
 176
 177 L'Assimilation de Données ou l'Optimisation demandent de résoudre un problème
 178 d'optimisation, le plus souvent sous la forme d'un problème de minimisation.
 179 Selon la disponibilité du gradient de la fonction coût en fonction des
 180 paramètres d'optimisation, la classe recommandée de méthodes sera différente.
 181 Les méthodes d'optimisation variationnelles ou avec linéarisation locale
 182 nécessitent ce gradient. A l'opposé, les méthodes sans dérivées ne nécessitent
 183 pas ce gradient, mais présentent souvent un coût de calcul notablement
 184 supérieur.
 185
 186 A l'intérieur même d'une classe de méthodes d'optimisation, pour chaque méthode,
 187 il y a usuellement un compromis à faire entre les *"capacités génériques de la
 188 méthode"* et ses *"performances particulières sur un problème spécifique"*. Les
 189 méthodes les plus génériques, comme par exemple la minimisation variationnelle
 190 utilisant l':ref:`section_ref_algorithm_3DVAR`, présentent de remarquables
 191 propriétés numériques d'efficacité, de robustesse et de fiabilité, ce qui
 192 conduit à les recommander indépendamment du problème à résoudre. De plus, il est
 193 souvent difficile de régler les paramètres d'une méthode d'optimisation, donc la
 194 méthodes la plus robuste est souvent celle qui présente le moins de paramètres.
 195 Au final, au moins au début, il est recommandé d'utiliser les méthodes les plus
 196 génériques et de changer le moins possible les paramètres par défaut connus.
 197
 198 .. _section_m_step6:
 199
 200 ÉTAPE 6: Conduire les calculs d'optimisation et obtenir les résultats
 201 +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
 202
 203 Après avoir mis au point une étude d'Assimilation de Données ou d'Optimisation,
 204 les calculs doivent être conduits de manière efficace.
 205
 206 Comme l'optimisation requiert usuellement un grand nombre de simulations
 207 physiques élémentaires du système, les calculs sont souvent effectués dans un
 208 environnement de calculs hautes performances (HPC, ou Hight Performance
 209 Computing) pour réduire le temps complet d'utilisateur. Même si le problème
 210 d'optimisation est petit, le temps de simulation du système physique peut être
 211 long, nécessitant des ressources de calcul conséquentes. Ces besoins doivent
 212 être pris en compte suffisamment tôt dans la procédure d'étude pour être
 213 satisfaits sans nécessiter un effort trop important.
 214
 215 Pour la même raison de besoins de calculs importants, il est aussi important de
 216 préparer soigneusement les sorties de la procédure d'optimisation. L'état
 217 optimal est la principale information requise, mais un grand nombre d'autres
 218 informations spéciales peuvent être obtenues au cours du calcul d'optimisation
 219 ou à la fin: évaluation des erreurs, états intermédiaires, indicateurs de
 220 qualité, etc. Toutes ces informations, nécessitant parfois des calculs
 221 additionnels, doivent être connues et demandées au début du processus
 222 d'optimisation.
 223
 224 .. _section_m_step7:
 225
 226 ÉTAPE 7: Exploiter les résultats et qualifier leur pertinence physique
 227 ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
 228
 229 Une fois les résultats obtenus, ils doivent être interprétés en termes de
 230 significations physique et numérique. Même si la démarche d'optimisation donne
 231 toujours un nouvel état optimal qui est au moins aussi bon que l'état *a
 232 priori*, et le plus souvent meilleur, cet état optimal doit par exemple être
 233 vérifié par rapport aux critères de qualité identifiés au moment de
 234 :ref:`section_m_step2`. Cela peut conduire à des études statistiques ou
 235 numériques de manière à évaluer l'intérêt d'un état optimal pour représenter la
 236 système physique.
 237
 238 Au-delà de cette analyse qui doit être réalisée pour chaque étude d'Assimilation
 239 de Données ou d'Optimisation, il est très utile d'exploiter les résultats
 240 d'optimisation comme une partie intégrée dans une étude plus complète du système
 241 physique d'intérêt.