Home
Etude d`évaluation de logiciels d`ajustements de lois
Contents
1. Loi de Jenkinson ou GEV T Loi de Pearson V LoidePolya se Loi de Weibull ou de Goodrich Je d d Le logiciel HFA se limite a la famille des lois gamma On peut th oriquement passer des lois gamma presque toutes les autres lois On trouve dans Bob e et Ashkar 1991 un tableau qui donne toutes les relations possibles avec les autres lois et les transformations de variables n cessaires pour y parvenir Par exemple de la loi gamma g n ralis e 4 param tres not e GG4 s a A m on passe la loi de Pearson III en posant s 1 la loi de Weibull 3 param tres en posant 1 la loi de Weibull 2 param tres en posant 1 etm 0 21 ala loi de Gumbel dissym trie positive en posant 1 m 0 et en travaillant sur la variable Y Ln X Mais ces relations sont donn es pour les chercheurs et praticiens qui souhaitent avoir un aper u rapide de la mani re dont les diff rentes distributions sont li es entre elles et non comme un mode d emploi pour ajuster les diff rentes lois gr ce au logiciel puisque les auteurs montrent au chapitre 9 que deux lois la log gamma et la gamma g n ralis e recouvrent l ensemble des autres distributions qu il est donc inutile d utiliser A ce niveau d abstraction statistique nous pensons qu il faut s parer th orie et pratique En effet les lois qui recouvrent la quasi totalit des autres lois ont 3 ou 4 param tres et nous a
2. laquelle on peut faire correspondre une variable normale r duite Vr telle que Vr F x eias 2T _oo On compare ces valeurs V un chantillon id al de n valeurs U rang es par ordre croissant et suivant exactement une loi normale Pour mesurer la distance entre la s rie des Vr et celle des Ur Brunet Moret propose de prendre la somme des carr s des surfaces comprises entre un axe d abscisses quidistantes 35 0 2 4 2 r 1 2r 2 r 1 2 n 1 2n 2 n 1 et la ligne bris e d finie par les points Qr Z avec Z V Ut Il semble que la probabilit li e la valeur du test puisse tre repr sent e dans les tailles d chantillons comprises entre 8 et 200 par une loi gamma incomplete dont les param tres s expriment en fonction de n Brunet Moret 1978 D apr s l auteur le point d licat de la construction du Test est la constitution de l chantillon id al qui n a pu tre r solue que d une fa on exp rimentale Les arguments pr sent s en faveur de ce test et contre le test X2 tant par l auteur que dans la notice d utilisation de DIXLOI nous semblent discutables Il est reproch au test X2 de renseigner seulement sur la possibilit qu a la loi choisie avec ses param tres calcul s de repr senter la distribution de l chantillon observ dans la zone de forte densit de probabilit Autrement dit de ne pas tre influenc par les carts importants
3. dire m lange de populations du seul fait d un tirage al atoire un chantillon peut pr senter des particularit s sous repr sentation ou sur repr sentation des fortes ou des faibles valeurs par exemple et le risque est d autant plus grand que l chantillon est petit Autrement dit un chantillon repr sente plus ou moins bien la population Bien ajuster le mod le loi de probabilit l chantillon est facile Il suffit de choisir des lois 3 ou 4 param tres associ es une transformation de la variable logarithme ou racine carr e par exemple Mais la fonction de r partition qui gr ce ces nombreux param tres va parfaitement d crire les sinuosit s de la distribution de l chantillon risque de conduire des extrapolations loign es de la r alit du fait des courbures qui permettent cette fonction de r partition de passer par les valeurs extr mes observ es Un moyen d augmenter l information apport e sur une station de mesure par un petit chantillon est d utiliser des observations de stations voisines qui ont un comportement identique autrement dit de proc der une analyse r gionale Pour une analyse r gionale les lois 3 ou 4 param tres pr sentent un inconv nient majeur li aux choix des m thodes d ajustement Si des m thodes d ajustement diff rentes moments maximum de vraisemblance appliqu es sur le m me chantillon conduisent des valeurs voisines en ce qui concerne
4. 1992 Stationnaires les variables appartenant une s rie chronologique sont dites stationnaires quand leurs caract ristiques statistiques moyenne autocovariance ne changent pas avec les saisons En hydrologie les variations naturelles dues aux saisons peuvent tre neutralis es en d coupant l ann e en p riodes pendant lesquelles on consid re que la variable est stationnaire On ne m langera pas les observations mensuelles de janvier et de juillet Cependant d une ann e l autre ind pendamment des fluctuations climatiques s culaires difficiles mettre en vidence il peut se produire des changements brutaux jumps en anglais suite des am nagements ou des volutions plus ou moins r guli res tendances dues par exemple au changement d occupation des terres urbanisation 3 3 2 Tests mis en oeuvre par les logiciels Seul le logiciel HFA propose des tests non param triques pour v rifier la qualit de l chantillon des observations TEST D INDEPENDANCE ET DE TENDANCE Le test propos est celui de Wald et Wolfowitz 1943 Ce test est peu souvent cit dans les ouvrages statistiques en fran ais et nous ne l avons rencontr que dans Lebart et Fenelon 1975 pour tester le caract re al atoire de s quences d observations d une variable qualitative deux modalit s jeu de pile ou face par exemple 13 Tel qu il est utilis par le logiciel HFA le test se pr sente ainsi x X2 Xj ee
5. En fait les valeurs tabul es ont t remplac es par une approximation polynomiale fonction de n la taille de l chantillon 15 HFA donne une repr sentation graphique du test de Grubbs et Beck L axe des abscisses repr sente le num ro d ordre des observations dans l chantillon Les valeurs observ es sont port es en ordonn e Les limites inf rieures et sup rieures estim es par le test d finissant les zones de horsains sont repr sent es par des lignes horizontales 3 3 3 Propositions Nous ne pensons pas qu il soit n cessaire ni m me utile de faire beaucoup de tests sur la qualit des chantillons qui est essentiellement sous la responsabilit de l utilisateur Pour les valeurs extr mes ou bien il s agit d erreurs de saisie et il suffit d afficher le minimum et le maximum pour d un seul coup d oeil les d tecter ou bien la valeur a t r ellement mesur e et il est difficile de justifier son limination Pour l homog n it et la stationnarit Les variations naturelles dues aux saisons sont connues des hydrologues Si un accident majeur a affect la s rie il est en g n ral connu de tous d but de la s cheresse en 1968 70 au Sahel mise en service du Barrage Seine en 1965 Si cet accident est mineur les tests non param triques peu puissants ont peu de chance de le d tecter Toutefois nous proposons de pr senter les graphiques suivants qui permettent de d tecter visuellement ces
6. Hydrology vol 42 pp 23 38 KENDALL S M STUART A 1943 The advanced theory of statistics Charles Griffin Londres 3 volumes 472 pages 723 pages 585 pages dans l dition de 1977 KISHORE A VIJAY P S 1989 A comparative evaluation of the estimators of the Log Pearson Type LP 3 Distribution Journal of Hydrology vol 105 pp 19 37 KITE G W 1975 Confidence limits for design events Water Resources Research vol 11 n 1 pp 48 53 KITE G W 1976 Frequency and risk analyses in hydrology Inland waters directorate water resources branch Ottawa Canada 407 pages KUMARASWAMY P 1980 A generalized probability density function for double bounded random processes Journal of Hydrology vol 46 pp 79 88 LABORDE J P 1984 Analyse des donn es et cartographie automatique en hydrologie l ments d hydrologie lorraine Th se d tat INPL 484 pages LEBART L FENELON J P 1975 Statistique et informatique appliqu es 3 me dition Dunod 439 pages LEBEL T BOYER J F 1989 DIXLOI Un ensemble de programmes FORTRAN 77 pour l ajustement de lois statistiques et leur repr sentation graphique Notice OVNIh n 3 du laboratoire d hydrologie ORSTOM 56 pages 66 LUBES H MASSON J M 1991 M thodes des moments de probabilit pond r s Application la loi de Jenkinson Hydrologie Continentale paraitre LUBES H 1992 Application de lois tronqu es aux distributions de pr c
7. de variance minimale est un estimateur efficace l efficacit d un estimateur non biais tant le rapport de la variance minimale sa propre variance Pour tout param tre il existe au moins un estimateur asymptotiquement efficace dont l efficacit tend vers 1 quand l effectif de l chantillon tend vers l infini Il existe d autres propri t s que nous ne d velopperons pas car elles ne nous serviront pas METHODES D ESTIMATION On a d une part une population o la variable X suit une loi th orique caract ris e par une expression math matique la fonction densit de probabilit qui comporte un ou plusieurs param tres dont les vraies valeurs inconnues sont a B y et que nous symboliserons par f x a B y et d autre part un chantillon d observations tir es de la population c est dire une s rie de valeurs x1 x2 Xj Xp Pour une valeur donn e de la variable X 2x ona Prob x lt X x dx f x a B y dx 26 METHODE DU MAXIMUM DE VRAISEMBLANCE Compte tenu de la loi de probabilit suppos e la m thode maximise la fonction de vraisemblance L a D y c est dire la probabilit d obtenir les valeurs de l chantillon des observations n L a B y Hos o B y 1 Math matiquement on sait calculer les valeurs a D y qui maximisent une fonction Pour cela on annule les d riv es partielles de la fonction de vraisemblance par rapport a D y Par commodit on trav
8. on peut aussi v rifier en fonction de la saison o il se produit si on a affaire la m me population Dans HFA la d finition des deux chantillons se fait de mani re interactive partir de deux types de graphiques possibles soit la chronologie des valeurs observ es avec les valeurs en ordonn e et le temps en abscisse les donn es doivent tre affect es au moins d un identificateur ann e soit les fr quences mensuelles des v nements avec les mois en abscisse et les fr quences en ordonn e les donn es doivent tre affect es au moins d un identificateur mois TEST DE DETECTION DES VALEURS EXTREMES INFERIEURES OU SUPERIEURES Les horsains outliers en anglais Masson 1992 Ce test est sujet discussions dans la mesure o des tirages al atoires artificiels dans une population donn e fournissent des chantillons avec des valeurs extr mes limin es par les tests Le test propos par le logiciel HFA est celui de Grubbs et Beck 1972 qui ne convient que si la population est normale Pour tenir compte de cette contrainte le logiciel HFA travaille sur le logarithme des observations comme le recommande le Conseil des Ressources en eau des Etats Unis d Am rique ce qui ne constitue toutefois qu une approximation quand la loi log normale ne convient pas Les valeurs extr mes inf rieures et sup rieures centr es r duites sont compar es des valeurs tabul es pour le niveau de signification 0 1
9. qui a une probabilit 1 o de recouvrir la vraie valeur du quantile c est l intervalle de confiance La probabilit 1 amp est appel e seuil ou degr de confiance et on lui donne le plus souvent les valeurs 90 ou 95 Pour calculer l intervalle de confiance du quantile il faut connaitre sa distribution d chantillonnage Cramer 1946 donne une expression de la densit de probabilit de la distribution d chantillonnage de Xp qui fait intervenir la loi de X Cependant L int grale de cette expression ne peut tre obtenue que par des m thodes num riques approximatives et compliqu es Le caract re rigoureux de la d marche ne se justifie pas en hydrologie parce que le choix d une loi ne r sulte pas d une th orie mais d une d marche exp rimentale Une tude par simulation a permis Kite 1975 de montrer en ce qui concerne les lois de probabilit habituellement utilis es en hydrologie que la distribution d chantillonnage des quantiles n est pas significativement diff rente d une loi normale L estimation de la moyenne Xp et de l cart type o Xp de la variable al atoire Xp permet donc de calculer la valeur de la variable centr e r duite U y APP o Xp dont l intervalle de confiance est Prob U 2 lt U lt U oJ2 1 Ux 2 et U o 2 sont des quantiles de la loi normale r duite A cause de la sym trie de la loi normale on a U n uU o2 46 En remplagant U par son expression o
10. s choisit parmi les lois propos es celles qui sont susceptibles de convenir l chantillon de donn es dont il dispose 54 Toutefois il n est pas rare nous avons pu le constater que le projeteur d une tude hydrologique suivant l exemple de la notice d utilisation DIXLOT ajuste toutes les lois propos es Cette mani re de proc der est assez choquante dans la mesure o le logiciel est utilis comme un appareil automatique dans lequel on place une extr mit le mat riel d observation pour recueillir l autre extr mit la solution suppos e exacte du probl me Par ailleurs un certain nombre de lois de probabilit deux param tres ne tol rent que des valeurs strictement positives Il en est ainsi des lois exponentielle de Weibull et gamma sans parler du cas plus trivial des transformations logarithmiques D autres lois comme la loi des fuites sont bien adapt es la pr sence de valeurs nulles Les lois trois param tres chappent ce probl me mais en pr sence de valeurs nulles le param tre de position si on le laisse s ajuster peut prendre une valeur n gative ce qui permet de calculer une probabilit pour des valeurs de la variable n gatives et sup rieures au param tre de position m me si cela n a pas de sens Cette constatation n a rien d tonnant le param tre de position ajust assure l galit des moments ou le maximum de vraisemblance mais ignore les contraintes physiques Pour
11. taill es les diff rentes techniques de calcul DIXLOI est livr avec une notice d utilisation de 56 pages Lebel et Boyer 1989 On y trouve des g n ralit s statistiques un mode d emploi du logiciel qui laisse parfois l utilisateur dans l embarras mais rien de pr cis sur les techniques de calcul utilis es pour estimer les param tres de telle ou telle loi Des r f rences indiqu es seule Kite 1976 permet d identifier des m thodes et techniques de calcul utilis es mais ne couvre pas l ensemble des lois trait es HFA est livr avec un livre qui traite dans le d tail des lois gamma la fois sous l aspect th orique et pratique On y trouve non seulement les formulations analytiques les diff rentes m thodes d estimation des param tres les liaisons avec les autres lois mais aussi partir d un exemple les r sultats d taill s des diff rentes m thodes il est possible de v rifier pas pas les r sultats donn s par le logiciel Par ailleurs un manuel d utilisation complet accompagne le logiciel 52 TROPHEE est accompagn d une notice d utilisation Y figure un organigramme d taill d crivant l enchainement des diff rentes t ches du module de traitements statistiques L utilisation des touches de fonctions et des diff rentes options est largement explicit e Du point du vue statistique par contre aucune pr cision n est apport e sur les algorithmes de calcul des param tres estim s des quantiles des
12. KiK i 1 n 1 n 2 6 n n Y 2 i 1 n 1 n 2 n 3 67 coefficient de dissym trie coefficient d aplatissement y5 17 Par ailleurs ALED trace un histogramme des donn es La largeur de la classe est estim e par l algorithme propos par D W Scott 1985 Le logiciel DIXLOI fournit a moyenne arithm tique la m diane observ e le mode probable a variance et l cart type le coefficient de variation le coefficient d asym trie le coefficient d aplatissement Ces quatre derni res caract ristiques sont celles de l chantillon Le logiciel HFA donne un tableau des moments de la population estim s partir de l chantillon Une colonne concerne les valeurs brutes l autre colonne concerne les valeurs apr s transformation logarithmique Ces moments sont a moyenne arithm tique la moyenne harmonique a moyenne g om trique l cart type le coefficient de dissym trie le coefficient de variation Le logiciel TROPHEE fournit des caract ristiques de la population estim es partir de l chantillon a moyenne arithm tique l cart type le coefficient de variation Il est regrettable avec les logiciels DIXLOI HFA et TROPHEE de ne pouvoir connaitre ces informations qu apr s avoir proc d l ajustement d une loi th orique puisque ces diff rentes caract ristiques qui ne sont pas visualis es l cran sont seulement rassem
13. Laloi gamma g n ralis e dont l int r t n est pas vident premi re vue et qu on pourrait tester au moins dans sa version 3 param tres gr ce au logiciel HFA Une loi utilis e par E D F Duband 1982 pour repr senter la distribution des hauteurs de pluie sur les dur es de 2 heures 5 jours et dont la fonction de r partition F x 1 ae X a p e x b 24 donne une probabilit aux valeurs nulles puisque F 0 1 a B On pourrait d ailleurs comparer cette fonction un m lange de 2 distributions exponentielles dont la densit de probabilit serait f x a a eX 1 a be bx De nouvelles lois de valeurs extr mes propos es pour satisfaire aux conditions suivantes Bien reproduire la variabilit des observations Etre peu sensibles aux valeurs extraordinaires horsains Avoir une expression explicite Comporter peu de param tres et tre faciles calculer Deux distributions semblent avoir beaucoup de ces qualit s la distribution des valeurs extr mes 4 deux composantes Rossi Fiorentino et Versace 1984 a distribution Wakeby Houghton 1978 Cependant Wakeby a besoin de cinq param tres La distribution deux composantes n a que 4 param tres mais la m thode du maximum de vraisemblance qui les estime ne converge pas toujours de plus l inversion de sa fonction de r partition n est pas explicite D apr s Ahmad Sinclair et Werritty 1988 la loi log logistique qui
14. ajuster des lois qui font intervenir une transformation logarithmique sur des donn es comportant quelques valeurs nulles certains projeteurs transforment ces valeurs nulles en valeurs presque nulles g n ralement 0 1 0 01 ou 0 001 On peut remarquer que 1 10 30 est plus proche de z ro que 1 10 Mais selon que l on retient l une ou l autre valeur les r sultats de l ajustement diff rent sensiblement et ce genre de pratique est viter Il r sulte de ces remarques une r flexion plus g n rale sur le param tre de position des lois 3 param tres qui en th orie correspond la borne inf rieure de la variable mais qui dans les faits n est le plus souvent qu un param tre d ajustement Le logiciel DIXLOI laisse l utilisateur le choix de fixer ce param tre de position par exemple si on juge que la borne inf rieure est physiquement z ro ou si on a s lectionn des observations sup rieures un seuil de le borner ou de l obtenir par ajustement ALED demande le seuil au dessus duquel on consid re la variable quand on ajuste une loi de Weibull ce seuil peut tre z ro et affecte cette valeur au param tre de position de la loi 55 Proposition On pourrait concevoir un logiciel 2 options une option libre pour hydrologue averti qui sait o il va et qui connait les voies emprunter pour y arriver Une option guid e pour le projeteur qui veut obtenir rapidement un r sultat sans trop se poser de
15. changements brutaux chronologie des valeurs observ es avec les valeurs en ordonn e et le temps en abscisse fr quences mensuelles des v nements avec les mois en abscisse et les fr quences en ordonn e Ind pendance c est une qualit qu on peut envisager de tester pour liminer d ventuelles s ries chronologiques autocorrel es que des utilisateurs non avertis pourraient tenter de traiter avec le logiciel Il suffirait de calculer le coefficient d autocorr lation avec retard de 1 et afficher un message s il se r v lait tre significativement diff rent de z ro au risque 0 1 par exemple 16 3 4 CALCUL DE QUELQUES CARACTERISTIQUES STATISTIQUES LIEES A L ECHANTILLON I peut s agir des caract ristiques statistiques de l chantillon ou de celles de la population estim es partir de l chantillon apr s correction d un biais ventuel Le logiciel ALED calcule la valeur minimale de l chantillon a valeur maximale de l chantillon l effectif de l chantillon a moyenne arithm tique l cart type le coefficient d asym trie ou de dissym trie le coefficient d aplatissement Les caract ristiques statistiques sont celles de la population estim es partir de l chantillon apr s correction du biais ventuel Si xj i 1 2 n sont les valeurs de l chantillon on a d apres Haan 1977 n 2 A 1 moyenne arithm tique H x Y cart type n y
16. ci dessus Le logiciel ALED ne calcule l intervalle de confiance d un quantile que pour la loi de Weibull 48 Proposition La m thode d crite ci dessus est celle qui est utilis e le plus g n ralement pour calculer les intervalles de confiance et elle convient tout a fait Le Minist re de l Agriculture propose une autre m thode que nous n avons pas retenue faute d en avoir compris les bases th oriques L op rateur devrait pouvoir choisir le degr de confiance 1 et d cider de visualiser ces intervalles de confiance soit sous forme graphique soit sous forme de tableaux pour un nombre fini de valeurs de p riodes de retour donn es 9 FICHIERS RESULTATS Les r sultats des ajustements r alis s sont parfois sauvegard s dans des fichiers ASCII ALED ne pr voit pas de stockage fichier des r sultats Ces derniers sont seulement visualis s l cran Il s agit des valeurs des param tres des lois ajust es la m thode d ajustement tant pr cis e et de la table des quantiles pour les probabilit s de non d passement de 0 01 0 99 par pas de 0 01 Une option permet par ailleurs d obtenir la valeur de la variable correspondant n importe quelle probabilit de non d passement rentr e au clavier DIXLOI les r sultats sont obligatoirement stock s dans un fichier dont le contenu peut ensuite tre imprim Deux types de fichiers sont propos s l un dit condens l autre dit complet contenant toutes les in
17. de sauvegarde rend ce mode de lecture ais sous diteur ASCII De plus une option d impression des donn es est op rationnelle Des sauvegardes en cours de saisie peuvent tre ex cut es ce qui est une possibilit appr ciable TROPHEE La saisie a lieu par l interm diaire d un masque de saisie type plein cran o les caract ristiques des champs num riques sont pr d termin es et de fen tres Des touches TL permettent de parcourir les donn es Les touches Del et Ins sont op rationnelles Apr s sauvegarde du fichier il est possible en ne quittant pas cet environnement de reprendre imm diatement la saisie ce qui peut se limiter une visualisation de l chantillon pour un dernier contr le 3 2 STRUCTURE DES FICHIERS DE DONNEES Sous r serve de respecter la structure des fichiers ASCII cr s apr s saisie au clavier des chantillons peuvent tre constitu s l ext rieur du logiciel L int r t est vident lorsque les observations tudier r sident d j sur un support magn tique il s agit alors de les mettre dans la forme et le type de codage ASCII attendus Les logiciels ne proc dent pas eux m mes cette r criture qui n cessite donc un d veloppement particulier Par ailleurs certains utilisateurs familiaris s la manipulation d un diteur ASCII donn souhaitent constituer un chantillon par ce moyen Toutes ces op rations sont d autant plus faciles que la structure
18. des lois 2 param tres Dans ce cas la probabilit est en abscisse et la variable en ordonn e Les intervalles de confiance cf 8 quand ils sont calcul s ne sont jamais repr sent s graphiquement Un titre 60 caract res au maximum est r p t syst matiquement sur chaque graphique Pour les graphiques concernant la fonction de r partition figurent le nom de la loi et la m thode d ajustement Les unit s de la variable ne sont pas clairement indiqu es Il n y a pas possibilit de modifier les informations ni d ajouter des l gendes 41 Il n est pas possible de repr senter les fonctions de r partition de plusieurs lois sur le m me graphique Il existe deux versions du logiciel une pour la carte graphique Hercule une autre pour les cartes graphiques CGA EGA et VGA Dans cette derni re version les possibilit s graphiques des cartes EGA et VGA ne sont pas exploit es car les graphiques ont toujours la d finition la plus faible li e la carte CGA Apr s avoir charg deux programmes DOS fournis avec le logiciel la touche PRINT SCREEN permet d imprimer les graphiques sur presque toutes les imprimantes matricielles courantes Dans DIXLOI il n y a pas d histogramme des valeurs observ es Ind pendamment de la bizarrerie qui oblige quitter le menu pour voir apparaitre les fonctions de r partition l cran l environnement graphique est assez riche Le titre de l chantillon apparait Les probabilit s d
19. des probabilit s des valeurs de rang r d un chantillon de taille n Michel 1989 L expression qui en r sulte dite de Chegodayev est r 0 3 FO 110 4 Elle est recommand e par Brunet Moret 1973 quand les param tres de la distribution sont connus a priori et elle est utilis e par les services du Minist re Frangais de l Agriculture 33 On peut choisir une expression qui donne l esp rance math matique des valeurs de rang r d un chantillon de taille n une probabilit qui est celle de la loi th orique Cunnane 1978 Les expressions obtenues qui d pendent donc de la loi th orique sont souvent compliqu es et remplac es par des formules plus simples permettant d approcher les r sultats exacts Ces expressions plus simples sont de la forme T F xy avec 0Sa lt 0 5 n 1 20 On d montre facilement qu avec la loi uniforme on aboutit l expression dite de Weibull I Fr 547 Les variables hydrologiques ayant des distributions g n ralement bien diff rentes d une loi uniforme cette expression n est pas recommand e Les expressions les mieux adapt es aux variables hydrologiques quand on ne sait pas exactement la loi th orique qui convient sont La formule de Hazen recommand e par Brunet Moret 1973 quand les param tres de la distribution sont estim s partir de l chantillon et qui s crit 0 5 F 2 La formule de Cunnane F xr D est aussi un bon compromis Comme l i
20. distribution de fr quence de cet chantillon Il existe un ventail tr s large de lois th oriques et de m thodes d ajustement de ces lois Utilisation des r sultats de l tape pr c dente pour noncer des probabilit s concernant l avenir Les logiciels tudi s ont pour but de faciliter la r alisation de la deuxi me tape de la d marche et laissent l hydrologue la responsabilit des tapes pr c dentes et suivantes Cependant m me pour cette seconde tape compte tenu du fait qu aucune th orie ne permet de choisir la loi suivie par la plupart des variables hydrologiques et que les tests d ad quation des ajustements donnent seulement des indications et non des certitudes le jugement de l hydrologue est pr serv et les logiciels n aboutissent en aucun cas au choix automatique d une loi ils laissent toujours l hydrologue d cider Ainsi gr ce aux logiciels l hydrologue a plus de temps et plus d informations pour exercer son jugement ce qui ne simplifie pas forc ment sa t che En effet une loi de probabilit est un mod le qui doit tre la fois descriptif et pr dictif D une part ce mod le doit bien s ajuster l chantillon des observations et d autre part il doit correctement estimer les risques c est dire la probabilit des v nements dans la population M me si on limine les erreurs diverses qui peuvent affecter l chantillon des observations erreurs de mesure h t rog n it c est
21. entre les valeurs les plus fortes de l chantillon et la loi ajust e Dans le test de Brunet Moret au contraire le poids des valeurs extr mes est bien sup rieur au poids des valeurs centrales Ces arguments sont plut t en faveur du test du x 2 Prenons l exemple d un chantillon de n 30 individus repr sentant la valeur maximale de nombreuses r alisations pluies journali res par exemple au cours de n saisons On montre facilement que l esp rance math matique de la plus forte valeur de cet chantillon a une p riode de retour de 54 saisons si on a affaire une loi de Gumbel Pour un nombre non n gligeable d chantillons la plus forte valeur aura donc une p riode de retour bien sup rieure 54 saisons 36 On calcule d ailleurs simplement qu avec 30 ann es d observations on a une probabilit de 1 0 99 30 0 26 d avoir au moins un v nement centennal Sur plusieurs chantillons ind pendants d effectif n 30 un sur 4 aura au moins un v nement centennal Il est donc normal d avoir des points extr mes qui s cartent de la loi th orique Pourquoi vouloir absolument affecter la fr quence de non d passement 0 984 correspondant U30 de l chantillon id al de Brunet Moret une valeur qui a une probabilit non n gligeable d avoir une fr quence de non d passement sup rieur 0 99 Pour illustrer le fait que de nombreux chantillons de faible effectif peuvent contenir des observations dont la fr q
22. les quantiles elles peuvent conduire des jeux de param tres tr s diff rents dont la combinaison donne cependant des fonctions de r partition tr s voisines Il en va ainsi des lois log Pearson et gamma g n ralis es Bob e et Ashkar 1991 Si on veut tudier r gionalement la valeur des param tres mieux vaut donc prendre des lois plus simples ou des caract ristiques statistiques plus stables moments Un bon mod le pr dictif est un mod le robuste peu sensible aux fluctuations d chantillonnage Il donne des r sultats voisins avec des chantillons qui ont des particularit s diff rentes Les lois de probabilit comportant peu de param tres sont les plus robustes mais les logiciels de ce point de vue n apportent pas d aide significative aucun d eux ne mettant en oeuvre des tests ou des indices de robustesse 2 LES PRODUITS EVALUES Le pr sent rapport rassemble les conclusions d une tude d valuation de logiciels d ajustements de lois statistiques sur des variables hydrologiques Cette tude a consist d crire les fonctionnalit s de chaque logiciel tudier l exactitude du contenu statistique et formuler des appr ciations Les avis apport s d bouchent sur des propositions pour concevoir un nouveau logiciel dont la particularit serait de guider l utilisateur tout au long de sa d marche statistique Les logiciels tudi s fonctionnent sur micro ordinateurs Nous avons compar les produits suivan
23. observations 57 C Sion retient les k plus forts d bits ind pendants observ s chaque ann e la valeur de F x donn e par la loi ajust e n est pas une probabilit annuelle de non d passement c est F x qui est approximativement une probabilit annuelle de non d passement etona 1 T I FG9 d Sion se trouve sur une rivi re des Alpes du Sud on pourra distinguer deux saisons le printemps avec des crues de fonte des neiges fortes surtout en volume et l automne avec des crues beaucoup plus pointues dues des orages On obtiendra la loi de probabilit des d bits maximaux d une saison par une des 3 m thodes ci dessus a b ou c Ces probabilit s de non d passement par saison F x et F2 x tant d termin e on obtiendra la probabilit de non d passement annuelle en faisant le produit des deux probabilit s pr c dentes et la p riode de retour T associ e une valeur de d bit x sera 1 I F160 F2 x T Cet exemple ne concerne qu une variable simple le d bit de pointe Si l on s int resse l ensemble d une crue d finie par son hydrogramme ou l ensemble d une averse d finie par son hy togramme le probl me est autrement complexe Les logiciels DIXLOI et TROPHEE donnent une estimation du risque dans les cas a et b p Le logiciel pourrait traiter des cas simples sur la base de ceux qui viennent d tre voqu s par un change de questions r ponses avec l utilisateur pour d fi
24. observations est impossible elle ne peut avoir lieu qu en s quence apr s la derni re valeur saisie La saisie termin e il n est plus possible sans quitter le logiciel de revisualiser les donn es et a fortiori d apporter des corrections avant de proc der au traitement statistique Ce qui est regrettable tant donn la structure rigide du fichier de sauvegarde des observations Cf 3 2 dont la manipulation sous diteur ASCII n cessite beaucoup d attention Il n est pas possible de reprendre une saisie interrompue HFA HFA utilise un masque de saisie et ses attributs Les observations sont introduites et revisualis es une une Chaque observation est affect e d un num ro d ordre Des touches de fonction sont pr d finies et notamment une fonction HELP qui sp cifie les conditions de saisie Les dates si elle sont rentr es doivent respecter le sch ma YYYY MM DD ann e mois jour Des contr les sont effectu es sur leur validit Les touches T permettent de parcourir tout instant le fichier observation apr s observation Les touches Del et Ins permettent de supprimer une observation ou d en ins rer une autre n importe quel endroit du fichier Apr s sauvegarde de l chantillon celui ci peut tre imm diatement r dit sur la m me grille d cran pour contr les compl mentaires 10 On peut regretter qu aucun moment une visualisation plein cran ne soit possible mais la structure simple du fichier
25. param tres de la loi aux valeurs du mode et des quantiles Ces m thodes donnent en g n ral des estimateurs de qualit m diocre 28 METHODE DES MOINDRES CARRES Quand il existe une relation lin aire entre la variable et sa fonction de r partition comme par exemple dans la loi de Gumbel x xQ s Ln Ln F x les couples x F x F x tant estim par une expression li e au rang des valeurs class es permettent l aide d une r gression lin aire classique d estimer les param tres de la loi Du point de vue statistique les estimateurs sont de qualit m diocre Cependant Laborde 1984 a montr que cette m thode appliqu e sur la moiti sup rieure des chantillons rang n 2 n de pluies journali res maximales des stations pluviom triques lorraines donnait des estimations du gradex meilleure que celles obtenues par la m thode des moments METHODE BASEE SUR LES STATISTIQUES D ORDRE Propos e par White 1964 pour la loi log Weibull et donc utilisable pour la loi de Gumbel moyennant un changement de signe Cf 4 cette m thode n cessite des tables de valeurs correspondant chaque rang des observations class es pour chaque effectif d chantillon tables limit es n 20 Bien que d apr s Raynal et Salas 1986 elle donne de bons r sultats nous citons cette m thode pour m moire METHODE DU MAXIMUM D ENTROPIE L entropie d un syst me complet de k v nements E mesure l incerti
26. possible ensuite d apporter des corrections sous r serve d avoir rep r le nombre d observations corriger et leur num ro d ordre Au niveau de la phase de saisie il n est pas possible de supprimer une observation ou d en ins rer une nouvelle Toutefois la structure du fichier de sauvegarde des observations particuli rement simple permet facilement ces op rations au moyen d un diteur ASCII Cf 8 3 2 Il n est pas possible enfin d interrompre la saisie en sauvegardant les donn es rentr es DIXLOI DIXLOI utilise un masque de saisie et dispose donc des fonctionnalit s qui lui sont attach es d finition de champs num riques alphanum riques Une premi re grille de saisie d finit les caract ristiques g n rales du fichier titre code nombre d chantillons pr sence de dates ou non et donc communes tous les chantillons le constituant Deux types de grille de saisie des valeurs num riques sont ensuite propos s en fonction de la pr sence ou non de dates de r f rence des observations Huit caract res num riques sont r serv s pour les dates sans signification impos e donc aucun contr le de validit n est effectu Chaque grille permet la saisie plein cran de 100 valeurs Des corrections ventuelles peuvent tre apport es grille par grille l aide de touches de fonction le retour la grille pr c dente tant impossible L insertion d une donn e sur une grille incompl te au sein d autres
27. questions Ce guidage ne serait pas contraignant mais indicatif Sans nous livrer une tude d taill e du probl me nous pouvons indiquer quelques pistes gr ce l erreur standard de Y et y2 sur les variables brutes ou transform es en logarithmes on peut admettre ou non les lois normales ou log normales 2 param tres En pr sence de valeurs nulles dans l chantillon on d conseillerait ne faudrait il pas interdire l utilisateur d ajuster des lois 2 param tres qui ne les tol rent pas En ce qui concerne le param tre de position il semble int ressant de disposer des deux possibilit s suivantes fixer le param tre de position ajuster le param tre de position Si l une des options ne donnait pas satisfaction il faudrait alors recommencer l ajustement avec l autre La loi de Gumbel suppose un coefficient de dissym trie de 1 139 Par simulation Rossi Fiorentino et Versace 1984 on devrait trouver des limites fonction de la taille de l chantillon au del desquelles la loi de Gumbel ne convient pas Certaines lois g om trique binomiale n gative tronqu e concernent des variables discr tes sup rieures ou gales 1 Leur utilisation serait d conseill e sur des variables continues 56 Les chantillons pr sentant un histogramme en i sont susceptibles de voir leur distribution bien ajust e par une loi exponentielle ou de Weibull On orienterait vers ces lois les ch
28. tre facultative la possibilit d introduire des donn es group es c est dire d indiquer le nombre de fois ot la m me valeur de la variable a t observ e est particuli rement int ressante notamment pour l tude des dur es des pisodes _ pluvieux partir des relev s pluviom triques on observe g n ralement plusieurs dizaines d pisodes de m me dur e exprim e en jours la p riode que recouvre les observations est une donn e essentielle pour le calcul de la p riode de retour d un v nement Toutefois il serait pr f rable que cette information soit demand e non pas la constitution de l chantillon mais l tape propre au calcul des p riodes de retour la possibilit d indiquer une date de r f rence pour chaque observation est int ressante Le rep rage des observations saisies peut en tre facilit De plus cette r f rence peut tre un crit re de constitution des sous chantillons permettant la mise en oeuvre du test de Mann Whitney Cf 3 3 2 A ce titre la r f rence du mois peut tre particuli rement utile l exception de ALED les logiciels imposent la sauvegarde de l chantillon d observations dans un fichier avant de proc der aux traitements statistiques Ceci n est pas une contrainte dans la mesure o il est toujours possible de d truire un fichier qu il n est pas utile de conserver sous le syst me d exploitation 13 DIXLOI impose un code tout fichier de donn es Ce
29. 1986 Estimation procedures for the type 1 extreme value distribution Journal of Hydrology vol 87 pp 315 336 RISSONS M 1988 Logiciel d hydrologie statistique Avant projet ISIM 3 parties de 47 45 et 58 pages ROCHE M 1963 Hydrologie de surface Gauthier Villars Paris 430 p ROSSI F FIORENTINO M VERSACE F P 1984 Two Component extreme value distribution for flood frequency analysis Water Resources Research vol 20 n 7 pp 847 856 SCOTT D W 1985 Frequency Polygons Theory and Application Journal of the American Statistical Association vol 80 n 390 pp 348 353 SONG D DING J 1988 The application of probability weighted moments in estimating the parameters of the Pearson type three distribution Journal of Hydrology vol 101 pp 47 63 WALD A WOLFOWITZ J 1943 An exact test for randomness in the non parametric case based on serial correlation Ann math statist 14 pp 378 388 68 WEIBULL W 1951 Statistical distribution function of wide application Journal of Applied Mechanics ASME Vol 18 p 293 297 WHITE J C 1964 Least square unbiased censored linear estimation for the Log Weibull extreme value distribution J Ind Math 14 pp 21 60 69
30. Laboratoire d Hydrologie Laboratoire d Hydrologie et Mod lisation ORSTOM Montpellier Universit Montpellier II ETUDE D EVALUATION DE LOGICIELS D AJUSTEMENTS DE LOIS STATISTIQUES SUR DES VARIABLES HYDROLOGIQUES H LUBES J M MASSON F vrier 1992 SOMMAIRE INTRODUCTION LES PRODUITS EVALUES LES ECHANTILLONS D OBSERVATIONS SAISIE TESTS EVENTUELS DE LEUR QUALITE ET CARACTERISTIQUES PRINCIPALES 3 1 SAISIE AU CLAVIER 3 1 1 Contenu de la saisie 3 1 2 Modalit s de saisie 3 2 STRUCTURE DES FICHIERS DE DONNEES 3 3 VERIFICATION DE LA QUALITE DES ECHANTILLONS 3 3 1 Qualit s des chantillons 3 3 2 Tests mis en oeuvre par les logiciels 3 3 3 Propositions 3 4 CALCUL DE QUELQUES CARACTERISTIQUES STATISTIQUES LIEES A L ECHANTILLON LES LOIS AJUSTEES METHODES D ESTIMATION DES PARAMETRES DES LOIS 5 1 Aper u th orique 5 2 M thodes propos es par les logiciels 5 3 Propositions LES DISTRIBUTIONS EMPIRIQUES ET TESTS D ADEQUATION DES LOIS AUX DISTRIBUTIONS EMPIRIQUES 6 1 CALCUL DES FREQUENCES EMPIRIQUES 6 1 1 Rappels th oriques 6 1 2 Les expressions utilis es par les logiciels 6 2 LES TESTS D ADEQUATION DES LOIS AUX DISTRIBUTIONS EMPIRIQUES 6 2 1 Rappels th oriques 6 2 2 Tests d ajustement propos s par les logiciels 6 2 3 Propositions Page 1 Page 2 Page 4 Page 4 Page 4 Page 9 Page 11 Page 12 Page 12 Page 13 Page 16 Page 17 Page 21 Page 25 Page 25 Page 32 Page 32 Page 33 Pag
31. RET Y 1969 Etude de quelques lois statistiques utilis es en Hydrologie Cahier ORSTOM s rie hydrologie VI n 3 100 pages BRUNET MORET Y 1973 Statistiques de rangs Cahier ORSTOM s rie hydrologie vol X n 2 pp 133 151 BRUNET MORET Y 1978 Recherche d un test d ajustement Cahier ORSTOM s rie hydrologie vol XV n 3 pp 261 280 C E R E S T A 1986 Aide m moire pratique des techniques statistiques pour ing nieurs et techniciens sup rieurs Num ro sp cial de la Revue de Statistique appliqu e Vol XXXIV 274 pages CRAMER H 1946 Mathematical Methods of Statistics Princeton University Press 368 pages CUNNANE C 1978 Unbiased plotting positions A review Journal of Hydrology vol 37 pp 205 222 DAVIS C S STEPHENS M A 1989 Empirical distribution function goodness of fit tests Algorithm AS 248 Applied Statistics vol 38 n 3 pp 535 543 DELAFOSSE E 1989 Logiciel ALED Avant projet ISIM STE Institut des Sciences de l Ing nieur de Montpellier Sciences et Technologies de l Eau 40 pages 64 DUBAND D 1982 Hydrologie statistique approfondie Cours donn l ENSHG INPG FIORENTINO M GABRIELE S 1984 A correction for the bias of maximum likelihood estimators of Gumbel parameters Journal of Hydrology vol 73 pp 39 49 GREENWOOD J A LANDWEHR J M MATALAS N G WALLIS J R 1979 Probability weighted moments Definition and relation to parameters of
32. Xn Sont les observations de l chantillon dans leur succession chronologique On calcule n 1 R Y Xi Xi 1 X Xn 1 1 Si les observations successives sont ind pendantes R suit une loi asymptotiquement normale de moyenne s 9 R et de variance Gi s4 s 4s2 s 48 54455 2 5 2 Re RN T 2 avec s nm r D m tant le moment d ordre r par rapport l origine des observations On peut donc transformer en une variable normale r duite U la valeur de R calcul e sur les observations et rejeter l ind pendance silu l gt U o 2 P Prenant un risque amp 5 par 1 0 2 exemple de se tromper si les observations successives sont vraiment ind pendantes Il faudrait tester par simulation la capacit de ce test d tecter des tendances D apr s Kendall et Stuart 1943 ce test ne serait pas plus efficace qu une r gression lin aire 14 TEST D HOMOGENEITE ET DE STATIONNARITE Le second test propos par le logiciel HFA est le test de Mann Whitney qu on trouve dans le chapitre des tests non param triques des ouvrages statistiques de base comme celui du C E R E S T A 1986 Ce test permet de d cider si 2 chantillons sont tir s ou non de la m me population Pour l appliquer il faut couper l chantillon des observations en deux parties la coupure tant par exemple li e un changement d appareil de mesure ou un am nagement S agissant du d bit maximal annuel d une rivi re
33. aille sur le logarithme de la fonction de vraisemblance Avec 1 ou 2 param tres la m thode donne g n ralement une solution explicite Avec 3 param tres ou plus on obtient un syst me d quations r soudre num riquement et la convergence n est pas assur e dans tous les cas L int r t de la m thode est qu elle fournit toujours Des estimateurs de variance minimale ou asymptotiquement minimale bien qu ils ne soient pas toujours non biais s mais pour une loi donn e il est souvent possible de corriger le biais Fiorentino et Gabriele 1984 Desestimateurs dont les distributions d chantillonnage sont asymptotiquement normales METHODE DES MOMENTS CLASSIQUES A partir de l expression de la loi th orique on peut exprimer les moments th oriques d ordre k en fonction des param tres de la loi Ainsi pour les moments par rapport l origine on a k moo B fx reso B y dx domaine de X La m thode des moments gale les k premiers moments calcul s sur l chantillon des observations aux k expressions th oriques correspondantes k nombre de param tres dans la loi 27 La m thode donne g n ralement des relations explicites simples ce qui a fait sa popularit Les estimateurs obtenus par la m thode des moments ont des distributions d chantillonnage asymptotiquement normales METHODES DIVERSES BASEES SUR LES MOMENTS Quand une loi utilise le logarithme de la variable Y Ln X loi log normale lo
34. am tres de la loi A A xp g a D y p Un d veloppement en s rie de Taylor autour des valeurs moyennes de ces param tres dont on ne retient que les premiers termes fournit l encore un moyen commode mais approximatif pour calculer la variance de xp Comme pr c demment le calcul fait intervenir les d riv es de la fonction g par rapport aux diff rents param tres d riv es qui d pendent de la loi de probabilit Les variances et covariances asymptotiques des estimateurs des param tres sont fournies par la matrice de dispersion dont on trouve la justification th orique dans Kendall et Stuart 1983 Pour des exemples d applications pratiques on pourra consulter Masson 1983 On remarque que le calcul de l intervalle de confiance est approximatif en ce qui concerne l estimation de la variance du quantile et de sa distribution d chantillonnage suppos e normale m me quand l effectif de l chantillon est petit que le calcul de l intervalle de confiance suppose que la loi th orique convient ce qui est choquant premiere vue A la r flexion on proc de toujours de la sorte tous les tests supposent l hypoth se Ho vraie et rares sont les exemples o on se pr occupe du risque de deuxi me esp ce risque de retenir Ho alors que c est une autre hypoth se H dite alternative qui convient Les logiciels DIXLOI HFA et TROPHEE calculent les intervalles de confiance selon les principes indiqu s
35. antiles correspondants des valeurs de fr quences de non d passement dont 0 001 0 005 0 01 0 99 0 995 0 999 les carts types de ces quantiles et les intervalles de confiance 50 80 et 95 TROPHEE Les r sultats des ajustements ne figurent l cran que sur les graphiques Toutefois une option permet d obtenir une impression de r sultats d taill s qui sont par ailleurs stock s dans un fichier temporaire Ce fichier est en effet effac lors de chaque nouvelle ex cution du module d ajustements statistiques 50 Il contient la fonction de r partition empirique avec le rappel de la formule de plotting position utilis e les caract ristiques essentielles de l chantillon pour chaque loi ajust e lerappel de l expression analytique de la fonction densit de probabilit les valeurs th oriques correspondant aux fr quences empiriques des valeurs observ es quelques quantiles caract ristiques et leurs intervalles de confiance 90 les r sultats des tests d ajustement Une option permet d obtenir l cran la valeur de la variable correspondant n importe quelle p riode de retour rentr e au clavier et r ciproquement Proposition Les r sultats retenir sont la fonction de r partition empirique avec le rappel de la formule de plotting position utilis e les caract ristiques essentielles de l chantillon les conclusions des tests de v rification de la qualit
36. antillons pr sentant de tels histogrammes I n en demeure pas moins qu avec un histogramme en cloche tr s dissym trique on pourra h siter entre plusieurs lois 3 param tres log normale gamma et Jenkinson par exemple C est ce niveau que les habitudes consacr es par l usage l exp rience et le jugement de l utilisateur doivent jouer 11 2 ESTIMATION DU RISQUE Le r sultat d un ajustement ne donne pas toujours une estimation directe du risque Pour illustrer l cart qui s pare le r sultat d un ajustement de l estimation du risque prenons un exemple simple et fr quent on s int resse aux pointes de crue d une rivi re un endroit pr cis de son cours et on veut associer diff rentes valeurs de ce d bit de pointe une p riode de retour exprim e en ann es a Si on retient le d bit maximum observ chaque ann e la probabilit de non d passement F x donn e par la loi ajust e est une probabilit annuelle et on obtient directement la p riode de retour T associ e une valeur x du d bit en faisant 1 T TFG b Si on retient tous les d bits maximaux des crues ind pendantes d passant un seuil donn la valeur F x fournie par la loi ajust e n est pas la probabilit annuelle de non d passement Il faut la corriger du nombre moyen annuel de d passement du seuil r 1 A 1 F x avec hay nombre moyen annuel de d passements n nombre de d passements du seuil N nombre d ann es d
37. bl es dans le fichier r sultat g n r apr s ajustement Seul ALED par cons quent pr sente ces caract ristiques 18 l cran avant le menu des diff rentes lois th oriques trait es par le logiciel ce qui peut guider l utilisateur dans le choix de l ajustement r aliser Proposition Puisqu on s int resse la population il semble logique que ce soit ses caract ristiques statistiques qu on cherche estimer partir de l chantillon L id e de traiter aussi les valeurs apr s transformation en logarithmes est int ressante Elle permet d avoir rapidement une id e de l efficacit de cette transformation Il convient de se limiter des caract ristiques calculables sans ambiguit ce n est pas le cas du mode que nous liminerons donc Sur les valeurs naturelles et transform es en logarithmes on pourrait calculer lamoyenne arithm tique la moyenne harmonique la moyenne g om trique lam diane l cart type et le coefficient de variation correspondant si la moyenne est significativement diff rente de z ro le coefficient de dissym trie lecoefficient d aplatissement Pour avoir une id e des dispersions d chantillonnage on pourrait calculer comme le fait le logiciel STATGRAPHICS Statistical graphics system dans son menu Statistiques El mentaires un certain nombre d erreurs standards L erreur standard d un estimateur sans biais est l cart type de la distribution l chantillo
38. des ajustements pour chaque loi ajust e le rappel de l expression analytique de la fonction densit de probabilit et la d finition des param tres Ja m thode d ajustement utilis e les param tres estim s le calcul des quantiles et des intervalles de confiance correspondants pour des probabilit s de non d passement pr alablement d finies les r sultats des tests d ad quation des ajustements Une option doit permettre d obtenir l cran la valeur de la variable correspondant n importe quelle probabilit de non d passement et r ciproquement 51 10 DOCUMENTS D ACCOMPAGNEMENT DES LOGICIELS Ces documents d accompagnement sont indispensables Dans le cas des logiciels tudi s ALED ne poss de pas de documentation sp cifique Un message cran pr cise les Objectifs et les limites du logiciel Toutefois il faut pr ciser que ce logiciel est destin des l ves ing nieurs qui en disposent pour faire des tudes hydrologiques dans le cadre de projets d tude et que les documents p dagogiques suivants sont leur disposition La loi log normale 32 pages Masson 1985 La loi de Gumbel 40 pages Masson 1983 La loi gamma incompl te 36 pages Masson 1982 La loi des fuites 21 pages Masson s d La loi de Weibull 11 pages Masson s d Le calcul des intervalles de confiance 41 pages Masson 1983 Dans ces brochures sont expos es les m thodes et d
39. e 33 Page 33 Page 34 Page 35 Page 35 Page 39 Page 40 7 LES REPRESENTATIONS GRAPHIQUES 8 LES INTERVALLES DE CONFIANCE DES QUANTILES 9 FICHIERS RESULTATS 10 DOCUMENTS D ACCOMPAGNEMENT DES LOGICIELS 11 UN LOGICIEL D AJUSTEMENT DE LOIS STATISTIQUES ENTRE LA BOITE NOIRE ET LE SYSTEME EXPERT 11 1 Les lois et leur ajustement 11 2 Estimation du risque 12 ETUDES PONCTUELLES POUR L EXTENSION ET LE DEVELOPPEMENT DU LOGICIEL 13 CONCLUSION BIBLIOGRAPHIE Page 41 Page 45 Page 49 Page 52 Page 54 Page 54 Page 57 Page 59 Page 63 Page 64 1 INTRODUCTION L tude des risques associ s un v nement hydrologique crue s cheresse passe toujours par l analyse statistique d observations L utilisation de formules empiriques r gionales ou d abaques n chappe pas cette r gle pour les tablir il a fallu proc der l analyse statistique d observations Rappelons que l analyse statistique des observations du pass a pour objectif d obtenir des informations sur la population d o elles sont tir es afin de pouvoir noncer des probabilit s concernant l avenir La d marche statistique qui suppose la stabilit de la population s effectue en trois tapes S lection d observations en rapport avec le ph nom ne tudi L chantillon ainsi constitu doit avoir certaines qualit s pour qu on puisse en tirer des informations concernant la population Ajustement d une loi de probabilit th orique la
40. e non d passement sont port es en abscisse et les valeurs de la variable en ordonn e On peut ou non faire apparaitre un quadrillage pour faciliter la lecture et choisir une graduation fonctionnelle parmi trois pour les probabilit s arithm tique gaussienne et Gumbelienne Remarquons toutefois que la graduation gaussienne des probabilit s ne suffit pas pour rendre lin aire la loi log normale On peut ajouter du texte au titre et en principe ajouter une l gende aux axes et faire apparaitre les valeurs des param tres des lois ajust es Un cartouche que l on peut d placer en n importe quel endroit de l cran ou faire disparaitre indique la loi ajust e la m thode d ajustement et rappelle les principales caract ristiques de l chantillon moyenne cart type nombre de points Le trac des intervalles de confiance n est pas op rationnel Trois courbes au plus peuvent figurer sur le m me graphique Une copie d cran n est pas possible Une option du menu g n ral pr voit le trac des graphiques sur table tragante HFA permet certaines repr sentations graphiques li es la mise en oeuvre des tests de v rification de la qualit des chantillons test d homog n it de Mann Whitney et test de Grubbs et Beck de d tection des outliers cf 3 3 2 Les graphiques des fonctions de r partition ont des graduations fonctionnelles qui lin arisent les lois deux param tres Les deux graduations de probabilit propo
41. ement devraient appara tre un titre minimum pour identifier le graphique le nom de la loi ou des lois et des m thodes d ajustement mais on devrait pouvoir les d placer sur le graphique rajouter du texte au titre pr ciser les l gendes des axes donner ventuellement les caract ristiques de l chantillon ou les param tres de la loi Enfin il devrait tre possible de mani re simple de faire sortir les graphiques sur une imprimante matricielle jet d encre ou laser et sur table tra ante 8 LES INTERVALLES DE CONFIANCE DES QUANTILES Un quantile Xp est une valeur de la variable al atoire X telle que F xp Prob X Sxp p Pour une valeur de p fix e la forme analytique de la fonction de r partition F x et de sa d riv e par rapport x la fonction densit de probabilit f x ainsi que les valeurs des param tres a B y qu elles font intervenir permettent le calcul de xp xp est tel que xp ff o B dx p 00 Les valeurs de D y sont estim es partir d un chantillon d observations Si on pouvait disposer de plusieurs chantillons tir s de la m me population on verrait que chacun d entre eux donne un jeu de param tres diff rents donc une valeur diff rente de xp qui n est en d finitive qu un estimateur de la vraie valeur inconnue du quantile 45 On tient compte des fluctuations d chantillonnage en associant p non plus une valeur ponctuelle xp mais un intervalle xp d1 xp d2
42. es param tres avec les algorithmes d taill s du calcul num rique quand il n y a pas de solution explicite Unrappel des expressions math matiques utilis es pour calculer les quantiles et les intervalles de confiance Un guide des principales m thodes qui permettent de passer des r sultats d un ajustement l estimation du risque Ce document nous semble indispensable parce qu il permet de savoir ce que fait pr cis ment le logiciel sans d crypter le programme source Il pourrait se pr senter sous forme d un ensemble de fascicules d tachables En effet 11 11 1 Les m thodes sont susceptibles d voluer et une m thode de calcul plus performante pourra remplacer la m thode de calcul retenue lors de la fabrication du logiciel De nouvelles m thodes d ajustement des param tres de nouveaux tests d ajustement sont susceptibles d apparaitre De nouvelles lois peuvent tre ajout es au logiciel L estimation du risque partir des r sultats d un ajustement d pend du probl me pos et de l chantillon des donn es Il n est gu re possible de faire un inventaire exhaustif de tous les cas possibles au d part Le document pourrait tre compl t au fur et mesure des probl mes pos s par les hydrologues UN LOGICIEL D AJUSTEMENT DE LOIS STATISTIQUES ENTRE LA BOITE NOIRE ET LE SYSTEME EXPERT LES LOIS ET LEUR AJUSTEMENT On peut penser que l utilisateur averti des logiciels qui viennent d tre tudi
43. et donc destin une large diffusion TROPHEE a t d velopp la demande de la Direction D partementale de l Equipement de l Ile de la R union dans un cadre bien d termin Notre int r t s est port sur la fa on dont ces logiciels abordent et traitent chacune des tapes de l ajustement de lois statistiques sur des variables hydrologiques Nous avons orient notre analyse du point de vue du chercheur hydrologue plus ou moins initi la pratique statistique et confront des questions parfois tr s complexes Nous avons donc examin un certain nombre de probl mes g n raux li s l ajustement de lois de probabilit th oriques un chantillon de donn es et plus globalement l estimation des risques en hydrologie Pour chaque probl me soulev nous avons pris des positions tay es par des raisonnements statistiques et ou hydrologiques ou par des r f rences bibliographiques Ces positions sont assorties de propositions qui examin es par un groupe de travail comprenant des statisticiens des informaticiens et des utilisateurs devraient d boucher sur un cahier des charges d finissant un nouveau produit 63 BIBLIOGRAPHIE AHMAD M I SINCLAIR C D WERRITTY A 1988 Log logistic flood frequency analysis Journal of Hydrology vol 98 pp 205 224 BOBEE B ASHKAR F 1991 The Gamma family and derived distributions applied in hydrology Water Resources Publications 203 pages BRUNET MO
44. formations du premier et des compl ments particuliers Les informations communes aux deux fichiers sont les caract ristiques de l chantillon pour chaque loi ajust e les valeurs des param tres estim s les caract ristiques de la population les fr quences th oriques de non d passement associ es aux valeurs observ es les r sultats des tests d ad quation des ajustements r alis s 49 Le fichier complet contient en outre le tableau des donn es observ es par ordre d apparition la fonction de r partition empirique pour chaque loi ajust e les quantiles et intervalles de confiance relatifs des valeurs de fr quence de non d passement choisies au moment de la d finition des conditions de l ajustement Les p riodes de retour correspondantes sont donn es galement HFA Les valeurs des param tres des lois ajust es la m thode d ajustement tant pr cis e sont visualis es l cran Des touches de fonction permettent alors d imprimer les r sultats ou de les sauvegarder dans un fichier Celui ci contient lafonction de r partition empirique avec le rappel de la formule de plotting position utilis e les caract ristiques essentielles de l chantillon sur les valeurs brutes et sur les logarithmes d cimaux des valeurs brutes pour chaque loi ajust e les param tres estim s et la m thode d ajustement utilis e lescaract ristiques th oriques de la population lesqu
45. i de Fr chet loi log gamma on peut estimer les param tres soit partir des moments de X et on parle alors de m thode des moments directe Soit partir des moments de Y et on parle de m thode des moments indirecte Avec plus de 2 param tres la m thode des moments n cessite l estimation des moments d ordre sup rieur deux qui ont une tr s grande dispersion d chantillonnage Pour viter de les utiliser des auteurs ont propos des m thodes m langeant des moments ne d passant pas l ordre 2 method of mixed moments m thode des moments m lang s utilisant par exemple la moyenne arithm tique la variance et la moyenne g om trique et ou la moyenne harmonique Ces estimateurs ont les m mes propri t s que les estimateurs de la m thode des moments classique avec peut tre une variance d chantillonnage plus faible METHODE UTILISANT LE MODE etlou LES QUANTILES Ces m thodes d velopp es surtout pour les lois de valeurs extr mes n cessitent qu on associe chaque valeur de l chantillon une fr quence de non d passement en utilisant une expression li e au rang r des valeurs class es 6 1 1 par exemple r 0 5 n dont on reparlera plus loin Cette fr quence de non d passement permet d estimer par interpolation sur l chantillon certains quantiles ou le mode quand celui ci correspond une valeur pr cise de la fonction de r partition comme dans la loi de Gumbel Des expressions lient les
46. i n a pas t d velopp e pour beaucoup de lois METHODE DES MOMENTS DE PROBABILITE PONDERES Cette m thode a t introduite par Greenwood Landwehr Matalas et Wallis 1979 et s est rapidement g n ralis e aux lois faciles inverser Par exemple la loi de Gumbel dont la fonction de r partition est F x ee XO S est facile inverser En effet on peut facilement exprimer x en fonction de F x On obtient x 2 x0 s Ln Ln F x Sous leur forme g n rale les moments de probabilit pond r s s noncent 1 Myy E per a m f xal F 1 Pa F Mais dans la plupart des applications pratiques on utilise soit M k Mg z soit Lub s et Masson 1991 ont expos l utilisation de cette m thode propos de la loi de Jenkinson Cette m thode est int ressante sous plusieurs aspects Lapossibilit d obtenir des estimateurs non biais s des moments de probabilit pond r s Une distribution d chantillonnage des estimateurs qui est asymptotiquement normale Une grande simplicit de mise en oeuvre quand la loi est facile inverser Raynal et Salas 1986 recommandent cette m thode pour la loi de Gumbel et r cemment des auteurs chinois ont d velopp l utilisation de cette m thode pour des lois difficiles inverser Song et Ding 1986 Jing Song Yang et Hou 1989 31 5 2 METHODES PROPOSEES PAR LES LOGICIELS DIXLOI et TROPHEE ne proposent que deux m thodes maximum de vraisemblance e
47. impos e par le logiciel est simple Cette simplicit est li e la nature des donn es sauvegard es ALED stocke le titre de l chantillon s il existe et les valeurs observ es avec ventuellement leur nombre d occurences La structure est la suivante soit l re ligne titre 60 caract res puis une donn e par ligne sans format impos soit 1l re ligne titre 60 caract res puis par ligne donn e nombre d occurences ex 41 1 seul le s parateur est impos 11 Cette structure simple permet facilement d apporter des modifications l aide d un diteur ASCII ou de cr er un tel fichier par programme informatique DIXLOI la structure des fichiers de donn es est rigoureusement sp cifi e par un ensemble de formats qui rendent relativement lourde une manipulation sous diteur La structure des fichiers HFA est l mentaire l re ligne titre caract res puis soit une donn e par ligne soit par ligne donn e et date de r f rence sans aucun s parateur ex 41 0019910124 pour 41 mm le 24 janvier 1991 Il est simple de manipuler ce fichier sous diteur ASCII ou de constituer un programme d criture pour le g n rer TROPHEE le fichier comprend une premiere s rie de lignes o sont not es les informations du type titre type de donn es p riode seuil ventuel puis une deuxi me s rie o figurent les valeurs num riques des observations Toutes ces donn es so
48. intervalles de confiance et des p riodes de retour Le recours au code FORTRAN est n cessaire pour recueillir ces informations Seuls les tests d ajustement m ritent des compl ments m thodologiques en annexe Les r f rences sont pratiquement inexistantes Propositions Les logiciels d ajustement devraient tre accompagn s de 2 types de documents 1 Un document fourni syst matiquement avec le logiciel et qui serait un mode d emploi d taill Il ne rentrerait pas dans le d tail des m thodes mais expliquerait comment acc der aux diff rentes fonctions du logiciel Il serait illustr par un ou plusieurs chantillons tests fournis avec le logiciel avec des exemples d utilisation et de r sultats On pourrait s inspirer de logiciels travaillant dans d autres domaines dont on aurait appr cier la documentation particuli rement bien faite 2 Un document beaucoup plus important et fourni seulement en option o figureraient Des rappels statistiques sommaires mais clairs et rigoureux concernant les grandeurs statistiques calcul es les m thodes d estimation de param tres et de calcul des intervalles de confiance Pour chaque loi ajust e Unrappel de la formulation et des param tres calcul s par le logiciel Si s est un param tre a zest aussi un param tre et il n est pas inutile de pr ciser lequel des deux utilise le logiciel 53 Unrappel des expressions math matiques utilis es pour estimer l
49. ion th orique constituent une suite Si tous les points sont d un seul c t il n y a qu une suite Si les points successifs sont alternativement d un c t de la courbe puis de l autre il y autant de suites que de points D apr s Kendall et Stuart 1943 ce test est sans int r t quand les param tres sont estim s sur l chantillon des observations 6 2 2 Tests d ajustement propos s par les logiciels ALED propose syst matiquement le test du x 2 calcul sur des classes quiprobables le nombre de classes tant d termin de mani re ce que leur effectif th orique soit sup rieur 5 Pour les lois normale log normale exponentielle de Weibull de Gumbel et de Jenkinson il propose aussi les tests W2 U et A2 Les r sultats sont clairement affich s ainsi que la r ponse au seuil de signification 1046 retenu loi accept e ou rejet e 39 DIXLOI dans un premier affichage avant les sorties graphiques indique les valeurs prises par les tests de Brunet Moret et du X 2 ainsi que le nombre de classes ayant servi a construire ce dernier D apr s le document qui accompagne le logiciel le test x 2 est calcul comme dans ALED HFA ne propose aucun test Dans la documentation il est dit que les tests existants sont rarement suffisamment puissants pour permettre de choisir entre les lois th oriques Les tests d ajustement r alis s par TROPHEE sont gt letestdu x2 le test d Anderson Darling mis en oeuvre selon
50. ionnelle On devrait pouvoir sortir lachronologie des valeurs observ es quand celles ci sont associ es une date la distribution de fr quence en fonction du mois quand les dates sont indiqu es l histogramme dans tous les cas Les graphiques des fonctions de r partition devraient avoir les probabilit s de non d passement en abscisse et les valeurs de la variable en ordonn e En outre Lechoix des graduations fonctionnelles devrait se faire automatiquement de mani re lin ariser les lois 1 param tre exponentielle et g om trique lin arisables en 1 F x et la plupart des lois 2 param tres la m thode est mettre au point pour la loi des fuites La loi binomiale n gative tronqu e serait port e dans les m mes rep res que la loi g om trique et la loi de Weibull dans les m mes rep res que la loi exponentielle 44 Les lois plus de 2 param tres seraient port es dans le syst me qui lin arise la loi 2 param tres correspondante de mani re juger visuellement de l int r t d un 3 me param tre Quand plusieurs lois sont port es sur le m me graphique possibilit qui doit tre pr vue une seule graduation fonctionnelle sera retenue par exemple celle de la loi qui a le meilleur r sultat aux tests d ajustement On devra pouvoir faire appara tre ou non un quadrillage pour faciliter la lecture et tracer ou non les intervalles de confiance Automatiquement et syst matiqu
51. ipitations journali res Actes de SEMINFOR 5 Statistique Impliqu e 2 3 4 Septembre 1991 Montpellier Colloques et S minaires ORSTOM Paris 14 p sous presse MASSON J M s d La loi des fuites Document p dagogique ISIM STE 21 pages MASSON J M s d La loi de Weibull Document p dagogique ISIM STE 11 pages MASSON J M 1982 La loi gamma incompl te Document p dagogique ISIM STE 36 pages MASSON J M 1983 M thode g n rale approch e pour calculer l intervalle de confiance d un quantile Application quelques lois de probabilit utilis es en Hydrologie Document p dagogique ISIM STE 41 pages MASSON J M 1983 La loi de Gumbel Document p dagogique ISIM STE 40 pages MASSON J M 1985 La loi log normale Document p dagogique ISIM STE 32 pages MASSON J M 1992 Un probl me parmi d autres dans l analyse des distributions des variables hydrologiques les horsains outliers Actes de SEMINFOR 5 Statistique Impliqu e 2 3 4 Septembre 1991 Montpellier Colloques et S minaires ORSTOM Paris 10 p Sous presse 67 MERCIER B 1991 Ajustement des principales lois statistiques utilis es en hydrologie Rapport d ing niorat ISIM STE 56 pages MICHEL C 1989 Hydrologie appliqu e aux petits bassins ruraux CEMAGREF Antony 528 pages Natural Environment Research Council N E R C 1975 Flood studies Report Hydrological Studies vol I 549 pages RAYNAL J A SALAS J D
52. justement utilis es sont not es sur le graphique de m me que la p riode que recouvrent les observations Trois courbes au maximum sont repr sent es sur le m me graphique Si une seule courbe est repr sent e les valeurs des param tres figurent sur le graphique Le programme calcule automatiquement l chelle de l axe des ordonn es de mani re ce que le trac occupe le maximum de place Des options permettent de modifier le trac propos par d faut une chelle manuelle pour l axe des ordonn es et son intitul peut tre d finie 43 le trac des points observ s peut tre d sactiv si une loi est repr sent e par graphique il y a possibilit de tracer l intervalle de confiance 90 des tableaux des quantiles principaux en ann e humide et ou en ann e s che p riodes de retour 5 10 20 50 100 ans peuvent figurer droite du graphique La derni re option concerne la repr sentation de l estimation de la p riode de retour d une valeur donn e Les graphiques peuvent tre imprim s ou trac s sur table tra ante Les p riph riques de sortie utilis s sont d clar s dans un fichier Remarque nous n avons pas tudi les diff rents modes de gestion ventuels de fichiers graphiques retenus par les logiciels qui rel vent de consid rations d ordre strictement informatique Propositions Les graphiques concernant l chantillon des observations sont int ressants de mani re opt
53. la m thode de Michel 1989 letest de Kolmogorov Smirnov pour trois valeurs de risque de l re esp ce 196 5 10 Le nombre de classes sur lesquelles est effectu le test du X 2 est calcul par une m thode diff rente de celle de DIXLOI et ALED Ce test n est utilis qu partir d un nombre de valeurs sup rieur 20 6 2 3 Propositions Bien que peu puissant le test du X 2 doit tre maintenu mais il faut afficher les r sultats de mani re claire comme le fait ALED o il manque encore l affichage du nombre de classes et la possibilit de choisir le seuil de rejet au d but du travail Des trois tests W2 U2 et A qui donnent des r sultats probablement redondants on pourrait ne retenir que le test A2 d Anderson Darling au moins pour les m mes lois qu ALED Il faudrait voir dans les publications sp cialis es si des m thodes n ont pas t d velopp es pour utiliser ce test quelle que soit la loi th orique quand les param tres sont estim s sur les observations On pourrait tester la transformation propos e par Michel 1989 pour calculer la fonction de r partition de A2 sous l hypoth se Ho dans ces conditions par simulation des diff rentes lois A priori il est tonnant qu une transformation qui ne fait pas intervenir le nombre de param tres des lois comme le nombre de degr s de libert s de la distribution 2 puisse convenir dans tous les cas Enfin comme le souligne clairement le document d accompagne
54. le 2 param tres en passant par la loi normale La loi de Fr chet par l interm diaire de la loi de Gumbel la loi de Fr chet est galement accessible par la loi de Jenkinson La loi log gamma 2 param tres en passant par la loi gamma 2 param tres x permettrait d ajuster la loi de Pearson V en passant par la loi gamma 2 param tres Y NX donnerait satisfaction ceux certaines Agences de Bassin qui ajustent sur des hauteurs pr cipit es mensuelles ou annuelles la loi racine carr e normale M thode du maximum de vraisemblance uniquement Pour cette premi re tape toutes les lois sauf peut tre la loi de Weibull 3 param tres existent dans l un ou l autre des logiciels Il conviendrait toutefois de v rifier par un travail sp cial stagiaire par exemple avant de les introduire dans le logiciel Laloilog gamma 3 param tres par comparaison avec les r sultats de HFA Laloi de Weibull 3 param tres avec ajustement du param tre de position Dans un second temps on pourrait ajouter d autres lois mais toujours apr s une tude v rifiant a la fois leur int r t et les techniques de calcul Sans aller jusqu tudier toutes les lois qui sont propos es dans la litt rature et dont certaines ne semblent utilis es que par leurs auteurs comme Kumaraswamy 1980 ni sans remonter des syst mes de lois d origine fran aise comme les lois de Halphen Halphen 1949 on pourrait examiner
55. leurs nulles et l interpr tation des r sultats obtenus constituent un sujet d licat L exclusion des valeurs nulles dans de tels chantillons implique en toute rigueur d en tenir compte dans la m thode d ajustement ce qui n est pas simple Cf 11 1 et 12 Seul HFA d finit rigoureusement sa position sur le sujet en interdisant la saisie une observation nulle et en proc dant un ajustement classique ignorant l existence ventuelle d observations nulles non prises en compte dans l chantillon ALED et DIXLOI acceptent un chantillon contenant des valeurs nulles la saisie et le traitent statistiquement moins qu une impossibilit math matique fonction logarithme ne survienne TROPHEE accepte la saisie une observation nulle mais la remplace par la valeur minimale non nulle de l chantillon pour proc der aux calculs statistiques sans que l utilisateur en soit inform DIXLOI HFA et TROPHEE imposent un nombre maximal de chiffres apr s le point d cimal DIXLOI 2 HFA 2 TROPHEE 3 qui r sulte vraisemblablement de la d finition des grilles de saisie 3 1 2 Modalit s de saisie ALED La saisie a lieu ligne ligne Les r ponses erron es sont signal es le message vous n avez pas tap un caract re correct apparait et doivent tre corrig es pour progresser dans le d roulement du logiciel En fin de saisie les observations peuvent tre revisualis es l cran ou sur imprimante Il est
56. leurs sup rieures 0 Doit on en toute rigueur tronquer la loi de distribution au seuil xo en de duquel aucune valeur n a t observ e sur l chantillon Cette facon de proc der a t elle une influence notable sur l estimation des param tres des probabilit s et des risques par rapport un ajustement classique Doit on ajuster des lois 3 param tres en fixant le param tre de position au seuil xo Par ailleurs on dispose parfois d chantillons o les faibles ou fortes valeurs ne sont pas mesur es quantitativement Il s agit par exemple de pr cipitations inf rieures au seuil de d tection de 0 1 mm des pluviom tres ou des chutes de pluie sup rieures la capacit du pluviom tre Un probl me int ressant est de savoir comment estimer au mieux la loi de probabilit d une variable dont on poss de un tel chantillon dit censur Kendall et Stuart 1943 par exemple n ann es d observations de d bits et des informations concernant les crues historiques au cours des 150 derni res ann es 59 Si on s int resse aux probabilit s d occurence de valeurs du domaine censur les techniques d ajustement doivent tre adapt es cette situation En particulier la fonction de vraisemblance maximiser s exprime de mani re tenir compte des valeurs censur es en nombre connu Par contre si seules les valeurs situ es loin du point de censure font v ritablement l objet de l tude statistique est il importan
57. lles de confiance pose encore quelques probl mes 3 LES ECHANTILLONS D OBSERVATIONS SAISIE TESTS EVENTUELS DE LEUR QUALITE ET CARACTERISTIQUES PRINCIPALES Pour les quatre logiciels tudi s les chantillons trait s sont soit saisis au clavier soit contenus dans un fichier dont le format est impos par le logiciel Le plus souvent ces fichiers sont cr s l issu d une saisie au clavier 3 1 SAISIE AU CLAVIER Il faut distinguer le contenu de la saisie qui ne se limite pas aux seules valeurs num riques sur lesquelles portent les traitements statistiques et que nous d signerons par observations et les modalit s de la saisie qui d terminent la plus ou moins grande facilit avec laquelle l utilisateur cr e son chantillon d observations 3 1 1 Contenu de la saisie Le tableau I ci apr s indique pour chaque logiciel les donn es saisir Tableau I Nom de Identificateur Type de Coordonn es Altitude de la Type de Nombre Unit des Effectif de P riode Date de Nom du Code l chantillon de station coordonn es g ographiques station donn es d observations observations chaque d observations r f rence de fichier o de titre g ographiques de la station valeurs observation et ou nombre chaque sont fichier par lesquelles la maximales d ann es observation stock es les donn es 9 10 11 12 TET LIE EE pote fe Stati
58. loi de Pearson V loi gamma en 1 x nous proposons donc de la supprimer Il suffit de proposer la transformation de variable y pour pouvoir quand m me l ajuster en cas de besoin La loi binomiale n gative n est pas utilisable directement pour d crire les dur es des pisodes secs ou pluvieux Cette loi donne en effet une certaine probabilit la valeur z ro alors que par d finition partir du moment o il existe un pisode pluvieux ou sec ne peut avoir une dur e nulle Nous proposons donc de la remplacer par la loi binomiale n gative tronqu e LBNT qui s applique des variables enti res strictement sup rieures z ro La panoplie des lois propos es dans un premier temps pourrait tre Laloi normale Laloilog normale 3 param tres La loi gamma incompl te 2 param tres La loi gamma incompl te 3 param tres La loi exponentielle 1 ou 2 param tres La loi de Weibull 2 ou 3 param tres La loi de Gumbel La loi de Jenkinson La loi des fuites La loi log gamma 3 param tres La loi g om trique Laloi binomiale n gative tronqu e Nous maintenons la loi de Jenkinson parce qu elle est recommand e pour l tude des crues au Royaume Uni ainsi que la loi log gamma qui joue le m me r le aux Etats Unis d Am rique La possibilit de transformer la variable origine X en une variable Y telle que Y Ln X 23 permettrait d ajuster directement La loi log norma
59. ment du logiciel TROPHEE les tests d ajustement ne sauraient eux seuls permettre de trancher entre les 40 ajustements r alis s par plusieurs lois Tout au plus servent ils 4 donner des indications suppl mentaires sur la qualit des ajustements Pour juger de la qualit d un ajustement il ne faut donc pas oublier de regarder les graphiques o en m me temps que la fonction de r partition th orique de la loi ajust e sont port s les points correspondants aux couples valeur observ e fr quence de non d passement empirique associ e 7 LES REPRESENTATIONS GRAPHIQUES Elles sont de deux sortes Lhistogramme des valeurs observ es La fonction de r partition de la loi th orique repr sent e par une courbe continue en m me temps que les points correspondant aux couples valeur observ e fr quence empirique de non d passement et associ e ventuellement aux courbes continues correspondant un intervalle de confiance pour les quantiles ALED propose un histogramme des valeurs observ es cf 3 4 Il propose toujours une repr sentation arithm tique de la fonction de r partition de la loi th orique et des points exp rimentaux Sur cette r partition arithm tique la variable est en abscisse et la probabilit ou fr quence de non d passement en ordonn e Pour les lois normale log normale de Gumbel et de Jenkinson une repr sentation avec des graduations fonctionnelles permet la lin arisation
60. n obtient les limites de confiance de Xp qui sont u Xp U 2 o Xp La seule estimation possible de u Xp est la valeur xp qu on calcule L expression des limites de l intervalle de confiance est en d finitive xp t o Xp U o2 Estimation de la variance du quantile La technique d estimation d pend des m thodes qui ont t utilis es pour estimer les param tres de la loi th orique Si c est la m thode des moments alors le quantile xp peut s exprimer en d finitive comme une fonction de ces moments xp g H1 2 p3 p Hl estimateur de la moyenne de la population estimateur de la variance de la population 113 estimateur du moment centr d ordre 3 de la population A partir d un d veloppement en s rie de Taylor autour des valeurs moyennes des moments en ne retenant que les premiers termes du d veloppement on obtient une relation lin aire qui permet un calcul facile mais approximatif de la variance de xp Le calcul fait intervenir Les d riv es de la fonction g par rapport aux diff rents moments Ces d riv es sont sp cifiques d une loi de probabilit th orique donn e Les variances et covariances des estimateurs des diff rents moments dont on trouve les expressions dans Kendall et Stuart 1943 47 En ce qui concerne la m thode du maximum de vraisemblance la technique de calcul de la variance du quantile est tr s voisine Le quantile s exprime cette fois en fonction des par
61. ndique NERC 1975 les fr quences empiriques sont un guide pour juger de l ad quation d une loi th orique et si on ne porte pas une attention sp ciale aux valeurs extr mes il y a peu de diff rences entre elles 6 1 2 Les expressions utilis es par les logiciels ALED et DIXLOI proposent uniquement l expression de Hazen HFA donne le choix entre les quatre expressions cit es Chegodayev Weibull Hazen et Cunnane TROPHEE propose les expressions de Weibull et de Hazen 34 6 2 LES TESTS D ADEQUATION DES LOIS AUX DISTRIBUTIONS EMPIRIQUES 6 2 1 Rappels th oriques On ne peut gu re utiliser en hydrologie les tests dits param triques qui font une hypoth se sur la loi th orique presque toujours la loi normale Les tests d ad quation utilisables quelles que soient les lois utilis es sont donc non param triques gt Le plus connu des tests d ad quation est le test X2 d ajustement Bien que peu puissant il offre l avantage de fournir une r ponse interpr table en terme de probabilit Le principal reproche qu on peut lui faire est qu il n cessite un d coupage en classes et que selon la mani re de faire ces classes les r sultats peuvent se situer de part et d autre d un seuil de signification gt Brunet Moret 1978 propose un test dont le principe est le suivant Pour une observation class e xr de l chantillon la loi th orique ajust e permet de calculer une fr quence th orique de non d passement E xr
62. ne comporte que 3 param tres aurait toutes les qualit s requises et serait sup rieure toutes les lois de valeurs extr mes utilis es jusqu ici Cela m riterait d tre v rifi 5 METHODES D ESTIMATION DES PARAMETRES DES LOIS 5 1 APERCU THEORIQUE Les lois statistiques poss dent un ou plusieurs param tres qui dans la population d o est tir l chantillon ont une valeur donn e vraie mais inconnue Il s agit d estimer cette valeur partir des observations de l chantillon Les estimations qu on va faire donnent des r sultats diff rents d un chantillon l autre 25 Le r sultat des estimations est donc une variable al atoire sur laquelle on peut calculer une moyenne une variance Les r sultats varient aussi avec les m thodes d estimation Selon les m thodes les estimateurs n auront pas la m me moyenne pas la m me variance RAPPEL SUR LES QUALITES DES ESTIMATEURS La qualit des estimateurs s value Si G est l estimateur d un param tre y on dira que G est non biais si en moyenne on retrouve la vraie valeur du param tre c est dire si E G Y La pr cision d un estimateur se mesure par son moment d ordre 2 par rapport la vraie valeur c est dire par la quantit E G y 2 qui est la variance de l estimateur si celui ci est non biais On d montre que cette pr cision ne peut tre inf rieure une valeur minimale in galit de Cramer Rao Un estimateur non biais
63. nir pr cis ment la nature du probl me r soudre et de la variable tudi e Devant un cas de figure non r pertori le logiciel donnerait un message pr cisant que l estimation du risque n cessite une tude particuli re Ce type de d veloppement fait peut tre appel une approche type syst me expert 58 12 ETUDES PONCTUELLES POUR L EXTENSION ET LE DEVELOPPEMENT DU LOGICIEL Un logiciel n est pas un produit fig On lui donne m me un num ro qui augmente avec le degr de perfectionnement version 6 0 de TURBO PASCAL par exemple De nouvelles m thodes de calcul de nouvelles lois sont susceptibles d tre ajout es au logiciel d ajustement Ces ajouts ne doivent pas tre faits l impulsion mais apr s avoir t test s par des tudes ponctuelles Beaucoup d entre elles pourraient tre faites par des stagiaires bien encadr s Par ailleurs des probl mes restent en suspens et m ritent d tre abord s Parmi les tudes que la r daction de ce rapport nous a amen s envisager nous avons not Echantillons censur s et lois tronqu es Pour d crire la distribution d une variable hydrologique il n est pas rare d utiliser une loi th orique d finie sur un domaine plus large que celui des observations Un exemple est donn par la loi normale d finie sur le domaine que l on ajuste sur des totaux annuels de pr cipitations qui ont une probabilit nulle en 0 et le plus souvent pour des va
64. nnage de cet estimateur amp va Erreur standard de la moyenne arithm tique x amp qui permettrait de voir si la moyenne est significativement diff rente de z ro avant de calculer le coefficient de variation 19 Erreur standard des coefficients de dissym trie et d aplatissement dans le cas d un distribution normale des variables 6 Oy 7 Nn 24 oj T Quand les variables suivent une loi normale on a aussi Y 0 et y 3 et les estimateurs de ces quantit s suivent une distribution normale autour de ces valeurs On peut donc construire les variables normales r duites y 0 Yn G 3 Vn et V6 424 qui doivent tre inf rieures 2 en valeur absolue dans 98 des cas si la distribution des variables est normale Le trac d un histogramme de fr quences des valeurs brutes parait int ressant malgr le caract re subjectif de la r partition en classes en tant que graphique de synth se des principales caract ristiques de l chantillon 20 4 LES LOIS AJUSTEES L inventaire donne les r sultats bruts suivants Pr sence ou absence dans le logiciel Nom des Lois ALED DIXLOI Loi binomiale n gative tronqu e Loi exponentielle 1 et 2 param tres Loi de Fr chet o h Loi des fuites Loi gamma incompl te 2 param tres et 3 param tres Pearson III Loi gamma g n ralis e EE Loi g om trique um HEN Loi de Gumbel E e lp j TROPHEE
65. ns sont issues d une banque de donn es mais les logiciels ne proc dent pas eux m mes l extraction de ces informations ces pr cisions sont requises par TROPHEE Les observations trait es par TROPHEE sont des valeurs maximales L utilisateur doit pr ciser s il s agit des maxima annuels ou de valeurs sup rieures un seuil Le choix de l une ou l autre de ces caract ristiques permet de fixer ou non le param tre de position des lois th oriques 3 param tres la valeur du seuil Ce choix est li la d finition des conditions de l ajustement il semble donc pr f rable de le faire au moment de l ajustement 7 8 9 10 11 12 Par ailleurs TROPHEE distingue deux types de donn es observ es valeurs instantan es ou valeurs moyennes sur des dur es variables puisqu un module d laboration de courbes intensit dur e fr quence pour des donn es de pluie a t d velopp il peut tre utile de rentrer le nombre des observations qui constituent l chantillon pour tester si ce nombre est sup rieur une limite inf rieure en de de laquelle il n est pas raisonnable de proc der un ajustement statistique Un test analogue peut tre fait par rapport un effectif maximum d observations 200 dans ALED 500 dans DIXLOI l unit des observations figure l impression ou la visualisation des graphiques et r sultats statistiques issus des traitements statistiques Cette donn e doit
66. nt enregistr es en format libre Il est donc possible de manipuler ou de g n rer un tel fichier l ext rieur de TROPHEE sans trop de difficult s sous r serve toutefois de s informer aupr s des concepteurs des conventions minimales respecter 3 3 VERIFICATION DELA QUALITE DES ECHANTILLONS 3 3 1 Qualit s des chantillons Pour tre repr sentatif de la population d o il est tir l chantillon des observations doit pr senter un certain nombre de qualit s qui ont t bien pr cis es par Bob e et Ashkar 1991 Les observations contenues dans l chantillon doivent tre Al atoires c est dire en hydrologie tre le r sultat de fluctuations naturelles et non la cons quence d influences anthropiques 12 Ind pendantes la valeur d une observation ne doit pas tre influenc e par la valeur de l observation pr c dente au sens chronologique Les s ries chronologiques de d bits journaliers par exemple sont souvent al atoires mais jamais ind pendantes Les logiciels ne sont pas pr vus pour traiter les s ries chronologiques de variables d pendantes Homog nes c est dire provenant d une m me population Il est souvent difficile de trancher dans ce domaine peut on m langer les crues pluviales et celles de fonte des neiges Les valeurs extr mes telle la pluie de Nimes le 3 octobre 1988 ne constituent elles pas une population part Certains pays Italie les traitent comme telles Masson
67. on est d observations rep r e 1 2 UT UE HILL 13 Remarque Le terme facultatif d signe des donn es qui sont demand es l utilisateur soit sous forme d une question soit d un champ compl ter mais dont la r ponse est optionnelle dans le sens o un simple retour chariot permet d ignorer la demande sans que la validation ult rieure de la saisie soit remise en cause Les X d signent des donn es pour lesquelles l utilisateur doit obligatoirement apporter une r ponse Commentaires relatifs chacune de ces donn es Certaines remarques peuvent tre retenues comme des propositions ou des points de r flexion en vue de la r alisation d un nouveau logiciel Le nombre entre parenth ses renvoie la colonne du tableau I 1 2 3 4 5 6 il est souhaitable d avoir la possibilit de d signer l chantillon par un titre qui apparait l impression ou la visualisation des r sultats ou graphiques issus des traitements statistiques Cette donn e doit tre facultative l identificateur de station nom ou num ro figure l impression ou la visualisation des graphiques et r sultats statistiques issus des traitements statistiques Cette donn e doit tre facultative le rep rage g ographique et l altitude de la station concern e par les observations ne s imposent pas En effet ces donn es ne sont pas toujours facilement disponibles sauf si les observatio
68. pluie ou de d bit constituent une s rie chronologique ou chronique Quels sont les processus stochastiques les mieux adapt s leur mod lisation L utilisation des mod les ARMA ARIMA voir SARIMA des logiciels am ricains n est vraiment pas la solution Comment traiter ensuite la mod lisation d un ensemble de chroniques tout un r seau de stations La d sagr gation Les hauteurs de pluie journali res sont mesur es depuis longtemps 1767 Montpellier on a donc une bonne id e de leur distribution Les hauteurs de pluie sur des intervalles courts de une heure ou moins sont mesur es depuis peu de temps par des pluviographes Comment construire des hy togrammes horaires qui respectent la distribution des pluies journali res 62 13 CONCLUSION L objet de la mission d valuation qui nous a t confi e n tait pas de comparer les quatre logiciels tudi s pour d cerner des prix de bonne ou de mauvaise conduite Les objectifs pour lesquels ils ont t con us sont tr s diff rents les moyens mis en oeuvre pour les d velopper galement ALED est un outil vocation p dagogique r alis par des l ves ing nieurs en Sciences de l Eau DIXLOI a r pondu la volont de mettre la disposition des chercheurs hydrologues de l ORSTOM une aide au traitement statistique HFA est un produit con u par une quipe d hydrologues de statisticiens de math maticiens num riciens et d informaticiens
69. r c demment loi des fuites par exemple Plus g n ralement c est de l tude des chantillons censur s et de l application des lois tronqu es terminologie d finie par Kendall et Stuart 1943 dont il est question Il y aurait peut tre toute une reflexion mener sur ce th me autour duquel r gne une certaine confusion Lub s 1992 60 Comment traiter les valeurs extr mes inf rieures tiages Comment faire pour adapter aux valeurs inf rieures les lois habituellement utilis es pour les valeurs extr mes sup rieures Y a t il des lois sp cifiques aux valeurs extr mes inf rieures Loi des valeurs extr mes 2 composantes Recensement des cas o elle est susceptible de s appliquer r gions avec des pluies de nature diff rente cyclones tropicaux fleuves avec des crues d bordantes ou non Niger etc Quelles valeurs initiales prendre pour estimer les param tres par la m thode du maximum de vraisemblance Quel algorithme assure la convergence vers la solution quelles sont les conditions pour qu il y ait convergence Que penser de quelques lois utilis es par d autres organismes La loi somme de 2 exponentielles utilis e par EDF pour tudier la distribution des hauteurs de pluie sur des dur es comprises entre 2 heures et 5 jours est elle valable hors du contexte alpin voir en Afrique Que penser de la loi log logistique pour tudier la distribution d v nements extr mes quels sont ses a
70. s es sont celle relative la loi normale celle relative la loi gamma 42 Des transformations simples permettent partir de ces deux seules graduations de probabilit la lin arisation de toutes les lois deux param tres La probabilit cumul e au non d passement est port e en abscisse la variable ou son logarithme en ordonn e La nature de la graduation utilis e est pr cis e Quatre courbes au maximum sont port es sur le m me graphique Toute courbe isol e peut tre repr sent e avec son intervalle de confiance pour un seuil de confiance au choix de 50 80 ou 95 La clart des graphiques est remarquable Un quadrillage facilite la lisibilit des courbes L gende et titre y figurent tr s clairement Tous les graphiques sont construits partir de la carte graphique incorpor e dans le micro ordinateur L impression sur imprimante IBM EPSON HP compatible ou table tra ante Plotter HP et compatible est op rationnelle TROPHEE propose les repr sentations graphiques des fonctions de r partition empirique et th orique En abscisse deux chelles sont repr sent es L une porte les fr quences cumul es au non d passement suivant une graduation fonctionnelle l autre les p riodes de retour correspondantes La variable tudi e est repr sent e sur l axe des ordonn es L chelle est arithm tique Les titres du graphique sont modifiables Le nom des lois ajust es et les m thodes d a
71. several distributions expressable in inverse form Water Resources Research vol 15 n 5 pp 1049 1054 GRUBBS F BECK G 1972 Extension of sample size and percentage points for significance tests of outlying Observations Technometrics vol 14 n 4 pp 847 854 HAAN C T 1977 Statistical Methods in Hydrology Iowa State University Press Ames 378 pages HALPHEN E 1949 Les lois des d bits des rivi res Frangaises La Houille Blanche num ro sp cial B 1949 HOSKING J R M WALLIS J R WOOD E F 1985 Estimation of the generalized extreme value distribution by the method of probability weighted moments Technometrics vol 27 n 3 251 261 HOUGHTON J C 1978 Birth of a parent The Wakeby distribution for modelling flood flows Water Resources Research vol 14 n 6 pp 1105 1109 HUYNH N P 1986 Sampling properties of the maximum entropy estimators for the extreme value type 1 distribution Journal of Hydrology vol 86 pp 391 398 HUYNH N P 1987 A review of methods of parameter estimation for the extreme value type 1 distribution Journal of Hydrology vol 90 pp 251 268 65 JING D SONG D YANG R HOU Y 1989 Expressions relating probability weighted moments to parameters of several distributions inexpressible in inverse form Journal of Hydrology vol 101 pp 259 270 JOWITT P W 1979 The extreme value type 1 distribution and the principle of maximum entropy Journal of
72. t moments classiques ALED propose aussi ces deux m thodes pour le plus grand nombre de lois mais dans certains cas impose d autres m thodes Ainsi pour la loi des fuites la seule m thode propos e est une m thode des moments modifi e tenant compte de la proportion de valeurs nulles De m me pour la loi de Jenkinson la seule m thode propos e est la m thode des moments de probabilit pond r s HFA qui ne traite que les lois gamma propose par contre presque toutes les m thodes possibles d ajustement sauf la m thode des moments de probabilit pond r s 5 3 PROPOSITIONS L objectif d un logiciel d ajustement de lois n est pas de proposer toutes les m thodes d ajustement mais de fournir les meilleurs r sultats Il doit donc tre un peu directif La m thode du maximum de vraisemblance qui asymptotiquement donne les estimateurs de variance minimale devrait toujours tre propos e On lui associerait obligatoirement une autre m thode pour les raisons suivantes Hosking et al 1985 ont montr par simulation sur de petits chantillons que cette m thode peut donner des estimateurs plus variables que d autres m thodes Avec 3 param tres ou plus la m thode du maximum de vraisemblance conduit une solution num rique par it ration partir de valeurs initiales qu il faut bien fournir par une autre m thode Avec 3 param tres ou plus la m thode du maximum de vraisemblance ne converge pas to
73. t de connaitre la proportion de valeurs gales ou inf rieures au seuil de censure En d autres termes la connaissance de cette proportion permet elle de pr ciser la distribution des valeurs loign es de xj Dans ce cas les r sultats obtenus partir d un ajustement par une m thode habituelle d une loi th orique toutes les valeurs d passant un seuil donn ne sont ils pas tout fait valables Ainsi est il important de connaitre avec pr cision les proportions de pluies gales ou inf rieures un seuil de l ordre de quelques millim tres pour d terminer la distribution des pluies les plus fortes Inversement on utilise parfois une loi th orique dont le domaine de d finition est plus petit que celui de la variable par exemple une loi log normale 2 param tres sur une s rie de pluies journali res comprenant des valeurs nulles On peut envisager de traiter le probl me en enlevant de l chantillon les observations non admises par la loi puis en proc dant un ajustement classique sur les donn es restantes Les probabilit s correspondantes sont ensuite corrig es de la proportion calcul e sur l chantillon des valeurs non retenues afin de d finir une fonction de r partition comprise entre 0 et 1 sur l ensemble du domaine des observations Mais on peut aussi choisir une autre loi tol rant l ensemble des valeurs et qui donnerait donc une estimation th orique de la probabilit des valeurs non prises en compte p
74. ts class s par ordre alphab tique ALED Logiciel d velopp en QUICK BASIC par le Laboratoire d Hydrologie et Mod lisation L H M de l Universit Montpellier 2 DIXLOI Logiciel d velopp pour l essentiel en FORTRAN 77 par le Laboratoire d Hydrologie de l ORSTOM Montpellier HFA Hydrologic Frequency Analysis Logiciel d velopp par B Bob e Universit de Qu bec Canada et F Ashkar Universit de Moncton Canada pour l analyse fr quentielle des v nements extr mes TROPHEE Traitement des Observations Pluviom triques et Hydrom triques des Ev nements Extr mes Logiciel d velopp par le BCEOM Soci t Frangaise d Ing ni rie Grande Motte France et dont le module Traitements statistiques sur fichier hors base de donn es a t mis notre disposition Nous disposions par ailleurs de LOIS d velopp au CEMAGREF Groupement d Antony et CANTIL programme d ajustement de lois du CEMAGREF accompagnant le document Hydrologie appliqu e aux petits bassins ruraux de C Michel 1989 Nous ne faisons pas tat ici des comparaisons effectu es avec LOIS Mercier 1991 En effet LOIS n a pas t totalement op rationnel sur le micro ordinateur utilis Il en est de m me pour CANTIL qui est un petit programme d application d un chapitre d un livre d hydrologie il ne concerne que quelques lois ne fait aucune sortie graphique et la justification des expressions utilis es pour le calcul des interva
75. tte codification est sp cifique au Laboratoire d Hydrologie de l ORSTOM qui d veloppe des standards pour les fichiers de donn es parmi lesquels les fichiers dits de type 21 Il n est pas utile de pr voir ainsi une codification particuli re propre chaque utilisateur une totale libert existant au niveau du nom de fichier lui m me Compl ments DIXLOI permet de saisir plusieurs chantillons dans un m me fichier Cette possibilit est int ressante pour un travail la chaine sur les observations d un grand nombre de stations d une m me r gion ou d un m me pays par exemple ALED et HFA affectent un num ro d ordre aux observations ce qui peut tre une commodit de saisie Leslogiciels ont d fini un nombre maximal d observations constituant un chantillon 200 valeurs au plus pour ALED et HFA 500 valeurs pour DIXLOI 200 pour TROPHEE Il est n cessaire d essayer de s affranchir de cette contrainte l analyse statistique d chantillons sup rieurs aux limites donn es doit tre possible notamment dans le cadre d tudes r gionales Ence qui concerne la valeur num rique X de l observation elle m me pour DIXLOI X 104 pour HFA 0 X 10 6 pour TROPHEE X 104 pour ALED il n y a pas de contrainte La justification d une valeur limite sup rieure est discutable Les donn es hydrologiques trait es sont nulles ou strictement positives Les conditions d ajustement d chantillons comprenant des va
76. tude associ e la r alisation d un v nement Elle s crit k H P Ln e J 1 P Ez probabilit de voir appara tre l v nement Ej au cours d une preuve On constate que l entropie est maximale quand tous les v nements ont la m me probabilit d apparaitre 29 A partir d un chantillon d observations X1 X2 Xi Xn On ne peut maximiser la fonction n H V Pa Ln Pa i 1 n que si on impose des contraintes L une de ces contraintes est g n rale XPa 1 E i Pour les autres contraintes autant que de param tres dans la loi ajust e on retient en g n ral des esp rances math matiques qui d pendent donc de la loi ajust e Leur expression g n rale est E s x P x J 1 m m nombre de param tres i 1 Avec une variable continue P x est remplac par f x dx mais le principe est le m me La m thode a surtout t d velopp e par Jowitt 1979 pour la loi de Gumbel dont la fonction de r partition est F x ee C x0 Les esp rances math matiques utilis es pour les contraintes sont dans ce cas E 0 5772 constante d Euler X X Ele s 1 Pour la loi de Gumbel des distributions d chantillonnage ont t tudi es par Huynh 1986 1987 D apr s cet auteur si on considere la fois le biais et la variance d estimation cette m thode est meilleure que toutes les autres 30 Cependant il s agit d une m thode compliqu e qu
77. uence de non d passement est tr s grande rappelons qu un orage comme celui qui a frapp la ville de Nimes le 3 octobre 1988 plus de 200 mm en quelques heures a une p riode de retour ponctuelle de l ordre de 150 ans alors qu il s observe en moyenne tous les 3 ans sur la r gion Languedoc Roussillon De m me sur la r gion Parisienne on observe en moyenne tous les 8 mois une pluie journali re dont la p riode de retour ponctuelle est de 10 ans Davis et Stephens 1989 ont pr sent une batterie de tests non param triques valables dans les conditions suivantes Pour toutes les lois compl tement d finies dont les param tres sont connus a priori Pourlaloi normale quand les param tres sont estim s partir des observations Pour la loi exponentielle et donc aussi la loi de Gumbel tr s voisine quand les param tres sont estim s partir des observations Le principe de ces tests est le suivant A partir des observations class es par valeurs croissantes X Sx2 amp SXjS SXpn on calcule Z F x sila loi est compl tement d finie 37 X X Z C l feiz dt si on a affaire la loi normale o y 2T oo Z 1 e fX si on a affaire la loi exponentielle Puis les grandeurs statistiques suivantes sont calcul es variable de Kolmogorov Smirnov D D max D D D max n Zi pour 1 lt i lt n D max Z G 1 n pour 1 lt i lt n variable de Kuiper V V D 4D
78. ujours 32 L alternative propos e serait en g n ral la m thode des moments classique mais pourrait tre une m thode des moments am nag e moments m lang s ou moments de probabilit pond r s quand des tudes ont conclu la sup riorit de ces m thodes d estimation Dans le logiciel ALED ce choix a t fait pour la loi des fuites et la loi de Jenkinson Des tudes d valuation comparative des divers estimateurs concernant l une ou l autre des lois th oriques sont publi es fr quemment et on peut dans un premier temps tenir compte de leurs r sultats Ainsi pour la loi log Pearson III Kishore A et Vijay P S 1989 montrent que les meilleures m thodes sont celles des moments directs et celle des moments m lang s 6 LES DISTRIBUTIONS EMPIRIQUES ET TESTS D ADEQUATION DES LOIS AUX DISTRIBUTIONS EMPIRIQUES 6 1 CALCUL DES FREQUENCES EMPIRIQUES 6 1 1 Rappels th oriques La fr quence empirique Plotting position en Anglais de non d passement associ e chaque observation de l chantillon d coule de son rang quand on classe les observations par valeurs croissantes X Sx2 amp Xr SXrSXr4 S SXp 1 Xn La fr quence empirique ou exp rimentale de non d passement correspondant une valeur xy est une fonction de r et de n Il existe plus d une dizaine d expressions pour cette fonction On peut choisir une expression de mani re obtenir la m diane de la distribution d chantillonnage
79. vantages par rapport aux lois utilis es habituellement Ceci concerne des probl mes directement li s la mise en oeuvre du logiciel d ajustement Si l on consid re les probl mes indirects li s l utilisation des statistiques beaucoup d tudes pourraient tre effectu es Les lois plusieurs variables Il faut tellement d observations pour v rifier leur ad quation que l on se limiterait deux variables tude des couples d bit de pointe volume de la crue par exemple Un programme concernant la loi normale 2 variables et donc log normale si on travaille sur les logarithmes existe au L H M sur un support p rim Ne serait il pas int ressant de le remettre en forme et de traiter aussi par la m me occasion les lois exponentielle et gamma 2 variables 61 La r gionalisation Il est vident que les pluies ou les coulements d une r gion ont des lois de distribution voisines N a t on pas cr des Bassins Versants Repr sentatifs On peut compenser en partie la faible anciennet des observations par leur extension spatiale Quelles m thodes utiliser Quelle est l am lioration apport e dans l estimation du risque par rapport une tude ponctuelle isol e Par ailleurs l ajustement de lois de probabilit n est qu une tape dans un certain nombre de traitements hydrologiques qui font intervenir des processus stochastiques divers Les s ries chronologiques Sur une station les observations de
80. variable de Cramer Von Mises W2 i variable de Watson U2 n E _ Z U2 W2 n Z 0 5 2 avec Z il 3 8 variable d Anderson Darling A n Yan La Z Ln L Z aa bl 0 a n Des tables fournissent les valeurs de ces variables pour les 3 cas d finis pr c demment loi quelconque d finie loi normale et exponentielle pour plusieurs risques de premi re esp ce dans le cas o l hypoth se Ho est vraie l chantillon est tir de la loi test e Pour les lois normale et exponentielle sous l hypoth se Ho il est possible de calculer analytiquement avec une bonne pr cision la probabilit que la variable th orique W2 U2 ou A2 soit sup rieure aux valeurs trouv es sur l chantillon D apr s les auteurs ces tests qui ne n cessitent pas un d coupage en classes sont plus puissants que le test x 2 Michel 1989 recommande aussi le test A2 d Anderson Darling qu il utilise pour toutes les lois les param tres tant estim s sur les observations Il propose une transformation de A en variable normale r duite ce qui permet de calculer la fr quence de non d passement d une valeur calcul e sous l hypoth se Ho Le m me auteur propose aussi comme test d ajustement le test du nombre de suites runs en Anglais Les points exp rimentaux successifs valeurs observ es et fr quences de non d passement empiriques associ es situ s du m me c t de la courbe repr sentant la fonction de r partit
81. vons vu au 1 que selon les m thodes d ajustement ces param tres peuvent prendre des valeurs tr s diff rentes tout en donnant des fonctions de r partition voisines Comment dans ces conditions conclure valablement que tel param tre se rapproche de la valeur 1 ou 0 et donc qu on peut se satisfaire de telle ou telle loi plus simple On constate d autre part que les usages ont consacr l ad quation de quelques lois simples certaines variables hydrologiques loi log normale pour les d bits mensuels loi de Gumbel pour les hauteurs de pluie extr mes sur une dur e Pour ces variables il est int ressant de disposer directement de la loi ad quate Les menus propos s par ALED et DIXLOI sont dans l ensemble comparables DIXLOI ajuste la loi log gamma la loi de Fr chet et la loi de Pearson V ce que ne fait pas ALED qui propose par contre la loi de Jenkinson la loi g om trique et la loi exponentielle DIXLOI traite les lois les plus usuelles Deux d entre elles ont des appellations qui sont peut tre reprendre La loi dite de Polya est en fait la loi binomiale n gative Quant la loi de Goodrich nous n avons trouv aucune r f rence bibliographique sur une loi de ce nom hormis celle de Roche 1963 l origine de toutes les citations dans les ouvrages frangais TROPHEE propose les lois les plus commun ment utilis es en hydrologie 22 Propositions Nous n avons trouv aucune application hydrologique de la
Download Pdf Manuals
Related Search
Related Contents
Intellinet 19" Network Rack 42U 取扱説明書 ダブルカセットデッキ W-865R Unidades de Conductos - Repuestos Clima Spare Parts Saunier du 13 octobre 2013 à Villejuif - Dernières nouvelles de la région Philips Blu-ray Disc/ DVD player BDP2100 Massive Ceiling light 30012/17/10 Avaya IVR Configuration Guide LV 5800ユニット Producción y comprensión oral narrativo desde una Copyright © All rights reserved.
Failed to retrieve file