doc/fr/methodology.rst

   1 ..
   2    Copyright (C) 2008-2018 EDF R&D
   3
   4    This file is part of SALOME ADAO module.
   5
   6    This library is free software; you can redistribute it and/or
   7    modify it under the terms of the GNU Lesser General Public
   8    License as published by the Free Software Foundation; either
   9    version 2.1 of the License, or (at your option) any later version.
  10
  11    This library is distributed in the hope that it will be useful,
  12    but WITHOUT ANY WARRANTY; without even the implied warranty of
  13    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
  14    Lesser General Public License for more details.
  15
  16    You should have received a copy of the GNU Lesser General Public
  17    License along with this library; if not, write to the Free Software
  18    Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
  19
  20    See http://www.salome-platform.org/ or email : webmaster.salome@opencascade.com
  21
  22    Author: Jean-Philippe Argaud, jean-philippe.argaud@edf.fr, EDF R&D
  23
  24 .. _section_methodology:
  25
  26 ===========================================================================================
  27 **[DocT]** Méthodologie pour élaborer une étude d'Assimilation de Données ou d'Optimisation
  28 ===========================================================================================
  29
  30 Cette section présente un méthodologie générique pour construire une étude
  31 d'Assimilation de Données ou d'Optimisation. Elle décrit les étapes
  32 conceptuelles pour établir de manière indépendante cette étude. Elle est
  33 indépendante de tout outil, mais le module ADAO permet de mettre en oeuvre
  34 efficacement une telle étude.
  35
  36 Procédure logique pour une étude
  37 --------------------------------
  38
  39 Pour une étude générique d'Assimilation de Données ou d'Optimisation, les
  40 principales étapes méthodologiques peuvent être les suivantes:
  41
  42     - :ref:`section_m_step1`
  43     - :ref:`section_m_step2`
  44     - :ref:`section_m_step3`
  45     - :ref:`section_m_step4`
  46     - :ref:`section_m_step5`
  47     - :ref:`section_m_step6`
  48     - :ref:`section_m_step7`
  49
  50 Chaque étape est détaillée dans la section suivante.
  51
  52 Procédure détaillée pour une étude
  53 ----------------------------------
  54
  55 .. _section_m_step1:
  56
  57 ÉTAPE 1: Spécifier la résolution du système physique et les paramètres à ajuster
  58 ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
  59
  60 Une source essentielle de connaissance du système physique étudié est la
  61 simulation numérique. Elle est souvent disponible à travers un ou des cas de
  62 calcul, et elle est symbolisée par un **opérateur de simulation** (précédemment
  63 inclus dans :math:`H`). Un cas de calcul standard rassemble des hypothèses de
  64 modèles, une implémentation numérique, des capacités de calcul, etc. de manière
  65 à représenter le comportement du système physique. De plus, un cas de calcul est
  66 caractérisé par exemple par ses besoins en temps de calcul et en mémoire, par la
  67 taille de ses données et de ses résultats, etc. La connaissance de tous ces
  68 éléments est primordiale dans la mise au point d'une étude d'assimilation de
  69 données ou d'optimisation.
  70
  71 Pour établir correctement une étude, il faut aussi choisir les inconnues
  72 d'optimisation incluses dans la simulation. Fréquemment, cela peut être à l'aide
  73 de modèles physiques dont les paramètres peuvent être ajustés. De plus, il est
  74 toujours utile d'ajouter une connaissance de type sensibilité, comme par exemple
  75 celle de la simulation par rapport aux paramètres qui peuvent être ajustés. Des
  76 éléments plus généraux, comme la stabilité ou la régularité de la simulation par
  77 rapport aux inconnues en entrée, sont aussi d'un grand intérêt.
  78
  79 En pratique, les méthodes d'optimisation peuvent requérir une information de
  80 type gradient de la simulation par rapport aux inconnues. Dans ce cas, le
  81 gradient explicite du code doit être donné, ou le gradient numérique doit être
  82 établi. Sa qualité est en relation avec la stabilité ou la régularité du code de
  83 simulation, et elle doit être vérifiée avec soin avant de mettre en oeuvre les
  84 calculs d'optimisation. Des conditions spécifiques doivent être utilisées pour
  85 ces vérifications.
  86
  87 Un **opérateur d'observation** est toujours requis, en complément à l'opérateur
  88 de simulation. Cet opérateur d'observation, noté :math:`H` ou inclus dedans,
  89 doit convertir les sorties de la simulation numérique en quelque-chose qui est
  90 directement comparable aux observations. C'est un opérateur essentiel, car il
  91 est le moyen pratique de comparer les simulations et les observations. C'est
  92 usuellement réalisé par échantillonnage, projection ou intégration, des sorties
  93 de simulation, mais cela peut être plus compliqué. Souvent, du fait que
  94 l'opérateur d'observation fasse directement suite à celui de simulation dans un
  95 schéma simple d'assimilation de données, cet opérateur d'observation utilise
  96 fortement les capacités de post-traitement et d'extraction du code de
  97 simulation.
  98
  99 .. _section_m_step2:
 100
 101 ÉTAPE 2: Spécifier les critères de qualification des résultats physiques
 102 ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
 103
 104 Comme les systèmes étudiés ont une réalité physique, il est important d'exprimer
 105 les **information physiques qui peuvent aider à qualifier un état simulé du
 106 système**. Il y a deux grand types d'informations qui conduisent à des critères
 107 permettant la qualification et la quantification de résultats d'optimisation.
 108
 109 Premièrement, provenant d'une connaissance mathématique ou numérique, un grand
 110 nombre d'indicateurs standards permettent de qualifier, en relatif ou en absolu,
 111 l'intérêt d'un état optimal. Par exemple, des équations d'équilibre ou des
 112 conditions de fermeture sont des mesures complémentaires de la qualité d'un état
 113 du système. Des critères bien choisis comme des RMS, des RMSE, des extrema de
 114 champs, des intégrales, etc. permettent d'évaluer la qualité d'un état optimisé.
 115
 116 Deuxièmement, provenant d'une connaissance physique ou expérimentale, des
 117 informations utiles peuvent être obtenus à partir de l'interprétation des
 118 résultats d'optimisation. En particulier, la validité physique ou l'intérêt
 119 technique permettent d'évaluer l'intérêt de résultats des résultats numériques
 120 de l'optimisation.
 121
 122 Pour obtenir une information signifiante de ces deux types de connaissances, il
 123 est recommandé, si possible, de construire des critères numériques pour
 124 faciliter l'évaluation de la qualité globale des résultats numériques
 125
 126 .. _section_m_step3:
 127
 128 ÉTAPE 3: Identifier et décrire les observations disponibles
 129 +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
 130
 131 En tant que seconde source d'information principale à propos du système physique
 132 à étudier, les **observations, ou mesures,** notées :math:`\mathbf{y}^o`,
 133 doivent être décrites avec soin. La qualité des mesures, leur erreurs
 134 intrinsèques, leur particularités, sont importantes à connaître, pour pouvoir
 135 introduire ces informations dans les calculs d'assimilation de données ou
 136 d'optimisation.
 137
 138 Les observations doivent non seulement être disponibles, mais aussi doivent
 139 pouvoir être introduites efficacement dans l'environnement numérique de calcul
 140 ou d'optimisation. Ainsi l'environnement d'accès numérique aux observations est
 141 fondamental pour faciliter l'usage effectif de mesures variées et de sources
 142 diverses, et pour encourager des essais extensifs utilisant des mesures.
 143 L'environnement d'accès numérique intègre la disponibilité de bases de données
 144 ou pas, les formats de données, les interfaces d'accès, etc.
 145
 146 .. _section_m_step4:
 147
 148 ÉTAPE 4: Spécifier les éléments de modélisation de l'AD/Optimisation (covariances, ébauche...)
 149 ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
 150
 151 Des éléments supplémentaires de modélisation en Assimilation de Données ou en
 152 Optimisation permettent d'améliorer l'information à propos de la représentation
 153 détaillée du système physique étudié.
 154
 155 La connaissance *a-priori* de l'état du système peut être représentée en
 156 utilisant l'**ébauche**, notée :math:`\mathbf{x}^b`, et la **matrice de
 157 covariance des erreurs d'ébauche**, notée :math:`\mathbf{B}`. Ces informations
 158 sont extrêmement importantes à compléter, en particulier pour obtenir des
 159 résultats signifiants en Assimilation de Données.
 160
 161 Par ailleurs, des informations sur les erreurs d'observation peuvent être
 162 utilisées pour compléter la **matrice de covariance des erreurs d'observation**,
 163 notée :math:`\mathbf{R}`. Comme pour :math:`\mathbf{B}`, il est recommandé
 164 d'utiliser des informations soigneusement vérifiées pour renseigner ces matrices
 165 de covariances.
 166
 167 Dans le cas de simulations dynamiques, il est de plus nécessaire de définir un
 168 **opérateur d'évolution** et la **matrice de covariance des erreurs
 169 d'évolution** associée.
 170
 171 .. _section_m_step5:
 172
 173 ÉTAPE 5: Choisir l'algorithme d'optimisation et ses paramètres
 174 ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
 175
 176 L'Assimilation de Données ou l'Optimisation demandent de résoudre un problème
 177 d'optimisation, le plus souvent sous la forme d'un problème de minimisation.
 178 Selon la disponibilité du gradient de la fonction coût en fonction des
 179 paramètres d'optimisation, la classe recommandée de méthodes sera différente.
 180 Les méthodes d'optimisation variationnelles ou avec linéarisation locale
 181 nécessitent ce gradient. A l'opposé, les méthodes sans dérivées ne nécessitent
 182 pas ce gradient, mais présentent souvent un coût de calcul notablement
 183 supérieur.
 184
 185 A l'intérieur même d'une classe de méthodes d'optimisation, pour chaque méthode,
 186 il y a usuellement un compromis à faire entre les *"capacités génériques de la
 187 méthode"* et ses *"performances particulières sur un problème spécifique"*. Les
 188 méthodes les plus génériques, comme par exemple la minimisation variationnelle
 189 utilisant l':ref:`section_ref_algorithm_3DVAR`, présentent de remarquables
 190 propriétés numériques d'efficacité, de robustesse et de fiabilité, ce qui
 191 conduit à les recommander indépendamment du problème à résoudre. De plus, il est
 192 souvent difficile de régler les paramètres d'une méthode d'optimisation, donc la
 193 méthodes la plus robuste est souvent celle qui présente le moins de paramètres.
 194 Au final, au moins au début, il est recommandé d'utiliser les méthodes les plus
 195 génériques et de changer le moins possible les paramètres par défaut connus.
 196
 197 .. _section_m_step6:
 198
 199 ÉTAPE 6: Conduire les calculs d'optimisation et obtenir les résultats
 200 +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
 201
 202 Après avoir mis au point une étude d'Assimilation de Données ou d'Optimisation,
 203 les calculs doivent être conduits de manière efficace.
 204
 205 Comme l'optimisation requiert usuellement un grand nombre de simulations
 206 physiques élémentaires du système, les calculs sont souvent effectués dans un
 207 environnement de calculs hautes performances (HPC, ou Hight Performance
 208 Computing) pour réduire le temps complet d'utilisateur. Même si le problème
 209 d'optimisation est petit, le temps de simulation du système physique peut être
 210 long, nécessitant des ressources de calcul conséquentes. Ces besoins doivent
 211 être pris en compte suffisamment tôt dans la procédure d'étude pour être
 212 satisfaits sans nécessiter un effort trop important.
 213
 214 Pour la même raison de besoins de calculs importants, il est aussi important de
 215 préparer soigneusement les sorties de la procédure d'optimisation. L'état
 216 optimal est la principale information requise, mais un grand nombre d'autres
 217 informations spéciales peuvent être obtenues au cours du calcul d'optimisation
 218 ou à la fin: évaluation des erreurs, états intermédiaires, indicateurs de
 219 qualité, etc. Toutes ces informations, nécessitant parfois des calculs
 220 additionnels, doivent être connues et demandées au début du processus
 221 d'optimisation.
 222
 223 .. _section_m_step7:
 224
 225 ÉTAPE 7: Exploiter les résultats et qualifier leur pertinence physique
 226 ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
 227
 228 Une fois les résultats obtenus, ils doivent être interprétés en termes de
 229 significations physique et numérique. Même si la démarche d'optimisation donne
 230 toujours un nouvel état optimal qui est au moins aussi bon que l'état *a
 231 priori*, et le plus souvent meilleur, cet état optimal doit par exemple être
 232 vérifié par rapport aux critères de qualité identifiés au moment de
 233 :ref:`section_m_step2`. Cela peut conduire à des études statistiques ou
 234 numériques de manière à évaluer l'intérêt d'un état optimal pour représenter la
 235 système physique.
 236
 237 Au-delà de cette analyse qui doit être réalisée pour chaque étude d'Assimilation
 238 de Données ou d'Optimisation, il est très utile d'exploiter les résultats
 239 d'optimisation comme une partie intégrée dans une étude plus complète du système
 240 physique d'intérêt.