To return to the METAFOR Statistical Downscaling page, click here.
11/29/2010: C. Pagé (CERFACS) feedbacks... to be translated ASAP !
METAFOR SD MindMap:
Predictor-PredictandRelationship
Pour dsclim, le prédicant est une relation linéaire entre les distances au types de temps + parfois, pour certaines saisons, selon un indice de température (soit une moyenne spatiale sur l'Europe, une covariance, etc etc). Le prédicteur est donc "caché" dans les distances aux types de temps et les centroides des types de temps.
Pour les régressions, cela n'est pas fait nécessairement sur tous les points du prédicteur. Dans le cas de dsclim c'est sur des points qui dégradent la résolution SAFRAN.
Predictors
Dans dsclim, il peut y avoir plus d'un prédicteur, et ça peut être différent selon les saisons...
Et le prédicteur peut être une variable dérivée, e.g. moyenne spatiale de la température sur le domaine grande échelle, et sur la terre (pas la mer) par exemple.
SeasonUsed
Toutes les combinaisons de saisons sont possibles (2 saisons, 3 saisons/an, du 15 juin au 15 septembre, etc)
Il manque:
Méthode pour le choix du jour analogue? (peut être assez dépendantes de plusieurs paramètres de configuration)
Distances aux types de temps:
Calcul de la distance avec quelle méthode? Euclidienne, etc.
Distances calculées dans quel espace? EOF? Champ réel?
Si multivariée, le calcul n'est pas nécessairement dans l'espace des EOFs pour toutes les variables prédicteurs.
Pour les EOFs: nombre d'EOFs? Pour le prédicteur, et pour le prédictant.
09/10/2010. M. kolasinski + P.A. Michelangeli (CLIMPACT) feedbacks
Ticket 630 : Test the draft downscaling vocabulary with 2 methods (one transfert function method like Dequé-et-al and one downscaling of extremes method)
Overall, it was possible to describe the 2 methods with the proposed vocabulary.
However, there a few remarks which would help describe more completely the 2 methods:
- In the “TransferFunction” branch, the codelist for the “Predictor-PredictandRelationShip” when the “schemeType” is “non linear“ should include “CDF matching methods” (this term should describes Dequé-et-al method, our methods, methods involving relations between CDFs 1 or methods estimating CDF parameters).
- In the “!StatisticalModel_KeyProperties” branch, under the “!StatDownscalingKeyProperties_Attributes”, the codelist for the “Predictor-PredictandRelationShip” includes « frequency of extremes ». It should be somewhere else (don't know where it should be at the moment).
- At the same level, since a “LearningPeriod” exists, there should be an “ApplicationPeriod” → 2 more dates to give.
- In the “!StatisticalModel_KeyProperties” branch, under “LargeScaleVariables” and “LocalVariables”, we think there should be something like a “Type” with the following codelist : “Extremes only”, “All data” or “No extremes”.
- In the “!StatisticalModel_KeyProperties” branch, under “LargeScaleVariables” and “LocalVariables”, for the “PredictorOrigin” or “PredictandOrigin”, there should be an intermediate level like “PredictorOriginType” and “PredictandOriginType”. The codelists associated with them should be: “Analysis/Reanalysis?”, “GCM” and “Satellite” for the first one, “Station”, “Gridded Observations”, “Satellite” for the second one. Maybe, we should add something like “PredictorOriginName” or “PredictandOriginName” with restricted codelists (a few famous datasets like “NCEP1”, “NCEP2”,“ERA40”, “ERAinterim”... ; to us, SAFRAN is a bit too specific, only MeteoFrance can use this dataset since it's not public if I am not wrong ; we should only propose public datasets in these codelists).
- In the “!StatisticalModel_KeyProperties” branch, under “LargeScaleVariables” , there should be a “PredictorFrequency” : it might happen when for multivariate downscaling, one uses a “monthly” predictor along with a second “daily” predictor to obtain a “daily” predictand. And we should add “monthly” in the codelist for those frequencies.
- In the “!StatisticalModel_KeyProperties” branch, under “LocalVariables”, there is one thing missing in the codelist for “Predictands” : “wind speed norm” (not as popular as “temperature” and “precipitation” but quite used).
- Extremes involves a different way to use the usual methods. In our case, the method for extremes is similar to the one developed for non extremes and it belongs to the same class ie “CDF matching methods” but it's different. So we suggest to highlight near the root of the tree that the method is applied to extremes (not only at the level of “LargeScaleVraiables” and “LocalVariables”).
Remarks on other methods
According to Paul-Antoine, “ClusteringMethods” are a subdivision of “ClassificationMethods. Those “ClusteringMethods” can be also divided into 2 categories :
- “PartitionalClustering” (codelist : “k-means”, “fuzzy c-means”, “Other”).
- “HierarchicalClustering” (codelist : “WARD”, “Other”).
- “NumberOfClustersType” (codelist : “objective”, “subjective” → if “objective”, the method gives the best number of clusters ; if “subjective”, the number of clusters is defined by the user and it is an input of the method).
Of course, we should keep the “NumberOfClusters”.
According to Paul-Antoine, the “SchemeType” in the “Classification” branch should be removed (it might be covered by the notion of “NumberOfClustersType”).
More general remarks on the proposed CV
We think it might be necessary to add something related to “PreProcessing” and “PostProcessing”.
Indeed, when we say we work on “precipitations”, it might be useful to know if we work on “anomalies”, the “full signal”, “EOFs”, a specific season(”DJF, “JJA”,...), “all seasons”... This might be specified in a PreProcessing tree.
The “PostProcessing” might be more tricky to describe. For instance, in our case, we downscale “anomalies”.Thus we need to “reconstruct/rebuild” the “full signal” from “anomalies”. It's a formula involving trends, seasonal cycles and downscaled anomalies from both observations and models. It may be useful to have this kind of information but it can be anything.
This might imply another CV complex structure. We could also add some “free text” parts to describe what we do as “PreProcessing” and “PostProcessing”.
Questions
Finally, we did not really understand the “ReconstructionMethod” notion. Could you explain more precisely what you mean ?
Is it possible to describe a process involving several downscaling methods (one after the other) described here (Benestad can use several methods in his downscaling process → “Downscaling precipitation extremes – correction of analog models through PDF predictions”, Theor Appl Climatol, 2009) ?
(1)CDFs : Cumulative Distribution Functions
09/07/2010. M. Dequé (CNRM) feedbacks ...to be translated ASAP !
Bonjour
Je suis toujours content de travailler pour METAFOR car notre rôle sur les scénarios régionaux s'est avéré marginal compte tenu de l'évolution du projet vers CMIP5.
Quelques commentaires sur ton mindmap.
1 J'ai soutenu il y a longtemps un mémoire sur les méthodes de régression non linéaire. Donc en France à la fin des années 1970 regression=transfert function
Néanmoins, je préférerais réserver le mot régression aux méthodes linéaires (il y en a plus d'une suivant le critère à minimiser)
2 Sous les weather generator, je mettrais une rubrique neural network, car c'est une technique très employée quand on veut mettre du non-linéaire et avoir l'air intelligent.
3 Je ne comprends pas trop la rubrique predictand-predictor relationship. Si on travaille sur des fréquences ou des paramètres statistiques au lieu de données quotidiennes, ce sont des caractéristiques des prédictands, pas de leur relations
4 Dans la rubrique predictors, il faut faire préciser si on travaille sur les champs eux-mêmes ou sur les composantes principales (technique très courante pour accroître la robustesse). Par contre, inutile de parler de variables canoniques: ça se fait beaucoup en statistiques prédictives, mais très peu en downscaling où on veut conserver toutes les caractéristiques locales du prédictand. De plus la CCA n'est rien d'autre qu'une régression linéaire. Je pense que cette phase de description du filtrage doit être décrite en amont de la méthode choisie (i.e. dans Statisticalmodel_keyproperties): on peut utiliser des EOF aussi bien pour des analogues que pour des fonctions de transfert
C'est du très beau travail quand même ! Je ne croyais pas qu'il était possible de faire renseigner la méthode statistique tant la variété est grande.
