Home
Tutoriel - La Revue MODULAD
Contents
1. Inf rence sur y Probabilit pr dictive n 59 Probabilit finale Conclusion avec une garantie gt 0 95 Pr lt 0 70 ay 10 y lt 0 70 0 971 0 873 a lt 36 Pr lt 0 85 a 10 y lt 0 85 0 9999 0 9998 a lt 46 Exemple 2 n 20 et ay 18 Inf rence sur y Probabilit pr dictive n 59 Probabilit finale Conclusion avec une garantie gt 0 95 Pr gt 0 70 a 10 y gt 0 70 0 982 0 939 a gt 46 Pr gt 0 85 ai 10 yp gt 0 85 0 717 0 301 a gt 54 5 4 3 Choisir l effectif de l chantillon Les proc dures pr dictives sont aussi des outils adapt s pour aider au choix de l effectif de l chantillon Supposons qu en vue de planifier une exp rience pour d montrer l effi cacit de la m thode d enseignement nous ayons r alis une exp rience pr liminaire par exemple avec 10 sujets et que n ayons observ que des succ s Dans ce cas la distribution finale pour l exp rience pr liminaire en commen ant avec la distribution non informative B ta 1 2 1 2 est utilis e comme distribution initiale On obtient ici la probabilit finale Pr gt 0 85 0 932 LesProportions Proc dez comme pr c demment pour linf rence sur une proportion et entrez dans les champs appropri s les effectifs e pour 1 10 e pour 0 0 Entrez la distribution initiale b ta e pour 1 1 2 e pour 0 1 2 S lectionnez les boutons d option e X gt e
2. value donc la modification de la vraisemblance relative de l hypoth se nulle qui est due aux observations Robert 1992 page 166 Mais ceci n est videmment qu un r sum incomplet qui ne peut remplacer l information fournie par les probabilit s finales Le facteur de Bayes s applique de la m me mani re des hypoth ses Ho et H non compl mentaires par exemple ici y lt 0 70 et y gt 0 85 mais l interpr tation est encore plus probl matique puisqu on ignore la zone de non conclusion 0 70 lt y lt 0 85 Dans le cas particulier o Ho et H sont des hypotheses simples y 40 et y y le facteur de Bayes est simplement le classique rapport de vraisemblance Hire p pola p y1 _ pla yo P yila p yo plal yr puisque p yo a x p a po pipo et ply a x pla p1 p p1 On notera encore que dans le cas o Ho et H sont des hypoth ses compl mentaires donc p 1 po comme dans l exemple pr c dent on peut retrouver leurs probabilit s finales partir des probabilit s initiales 7 1 7o et du rapport de Bayes puisqu on v rifie facilement que ds tem Po o mB a Pour une discussion de l utilisation du facteur de Bayes en liaison avec la probl matique des tests d hypoth ses on pourra consulter Robert 1992 pages 166 168 6 Comparaison de deux proportions Conceptuellement les solutions pr c dentes pour une proportion s tendent imm
3. Revue MODULAD 2006 218 Num ro 35 Rouanet H amp Lecoutre B 1983 Specific inference in ANOVA From significance tests to Bayesian procedures British Journal of Mathematical and Statistical Psychology 36 252 268 Routledge R D 1994 Practicing safe statistics with the mid p The Canadian Journal of Statistics 22 103 110 Rozeboom W W 1960 The fallacy of the null hypothesis significance test Psychological Bulletin 57 416 428 Savage L 1954 The Foundations of Statistical Inference John Wiley amp Sons New York Smith A 1995 A conversation with Dennis Lindley Statistical Science 10 305 319 Spiegelhalter D J Freedman L S amp Parmar M K B 1994 Bayesian approaches to randomized trials Journal of the Royal Statistical Society Series A 157 357 416 Student 1908 The probable error of a mean Biometrika 6 1 25 Sweeting T J 2005 On the implementation of local probability matching priors for interest parameters Biometrika 92 47 57 Tan S B Chung Y F A Tai B C Cheung Y B amp Machin D 2003 Elicitation of prior distributions for a phase II randomized controlled trial of adjuvant therapy with surgery for hepatocellular carcinoma Controlled Clinical Trials 24 110 21 Tierney L 1994 Markov chains for exploring posterior distributions with discussion The Annals of Statistics 21 1701 1762 Toecher K D 1950 Extension of the Neyman Pearson the
4. wpa plpa dpz dont on d duit le rere ai 1 1 Din l n2 1 ae je P nl l j I j a2 n2 a2 1 1 ni j ld gt j u T a2 T n2 ay 4 Po p2 ugp2 p2 a 1 f P az j T n m n 5 oy F 1 f f La Lots D USE h Fagg Erat j 0 Voir par exemple http functions wolfram com HypergeometricFunctions Hypergeometric2F1 pour la d finition et les propri t s de la fonction hyperg om trique Revue MODULAD 2006 194 Num ro 35 15 M thodes num riques Si les m thodes bay siennes reposent sur le principe g n ral selon lequel la densit finale est proportionnelle au produit de la densit initiale et de la vraisemblance p 0 donn es cu 0 donn es p 0 il n y a videmment pas de moyen la fois simple et universel de normaliser ce produit c est dire de trouver la constante c telle que f p donn es d0 1 En dehors des cas o l on peut identifier une distribution connue et conduisant des calculs faciles 8 il faut donc recourir des techniques d int gration num rique m thodes d terministes classiques ou m thodes de Monte Carlo Ce sont surtout ces derni res qui ont re u l attention des statisticiens bay siens en raison de leur possibilit de traiter les probl mes les plus complexes m me et surtout quand le probl me n cessite de calculer une int grale de dimension lev e I s agit de simuler la d
5. Pr d lt 0 donn es puni 0 0014 et Pr gt 0 donn es 1 puni 0 9986 Si nonc de Student la probabilit est 9985 que 2 est le meilleur somnif re est interdit dans le cadre fr quentiste il est donc parfaitement justifi dans le cadre fiducio bay sien LesMoyennes Dans la situation de la figure pr c dente cliquez sur la courbe de l effet 6 ce qui affiche la fen tre des nonc s S lectionnez le bouton d option e limite Entrez dans le champ limite 0 et appuyez sur touche Entr e du clavier ou cliquez sur le bouton Calculer pour obtenir la figure ci apr s avec 4 d cimales pour les proba bilit s Notez que l on peut d sactiver les cases cocher intervalle et n gligeable qui ne sont pas pertinentes ici F4 distribution fiducio bay sienne interValle HE d ciMales QE s000 probabilit s deUx limites p 3 af I gt eXprimer les limites en fonction de effet 8 f9 1 580 0 3897 Pr amp lt 0 0 0014 Pr 8 gt 0 0 9986 Proc dures fr quentistes effet n gligeable notable X Test de Signification usuel et interpr tation bay sienne A t 4 062 F 16 501 p 0 0028 9 di FX noT able garantie 0 9986 P1 8 gt 0 1 p 2 0 9986 ane 1 580 0 389 e R sum De plus cette interpr tation met clairement en vidence les insuffisances m thodologiques des tests de signification Il devient manife
6. et les probabilit s d chantillonnage sont donn es par une distribution Hyperg om trique Le tableau ci apr s donne ces probabilit s ainsi que les fr quences obtenues par deux simulations l une de 10 000 tirages et l autre de 1 000 000 de tirages p 15 20 0 75 Nombre de Nombres Probabilit s Fr quences succ s d chantillons d chantillonnage 104 tirages 10 tirages f 0 5 1 15504 0 00006 0 0 00006 f 1 5 75 15504 0 0048 0 0054 0 0049 F29 1050 15 504 0 0677 0 066 0 068 f 3 5 4550 15 504 0 2935 0 294 0 293 f 4 5 6 825 15 504 0 4402 0 447 0 441 F 5 5 3003 15 504 0 1937 0 187 0 194 2 1 1 Test de signification Ces probabilit s d chantillonnage sont utilis es pour d finir un test de significa tion La valeur du param tre est fix e par l hypoth se nulle par exemple Ho p 0 75 Si y 0 75 on trouve dans seulement 0 49 des r p titions soit la proportion 0 0049 0 00006 0 0049 une valeur inf rieure ou gale l observation f lt 1 5 Le r sultat est dit significatif p 0 0049 sur la base des donn es observ es l hypoth se nulle est rejet e je n entre pas ici dans la discussion test unilat ral bilat ral ni dans le choix du risque a qui ne sont pas pertinents pour mon propos A hypothesis that may be true may be rejected because it has not predicted observable results that have not occurred Jeffreys 1961
7. Pour obtenir une probabilit pr dictive 0 90 que la limite d passe une demi heure il faudrait un effectif n 29 On notera qu un calcul de puissance traditionnel utilisant pour les param tres les donn es de l chantillon initial soit 6 1 580 et o 1 230 qui seraient suppos es des valeurs connues ne tiendrait pas compte de l incertitude sur ces valeurs on trouverait donc sans surprise que sous ces hypoth ses un effectif n 13 serait suffisant pour obtenir une probabilit pr dictive 0 90 que la limite d passe une demi heure LesEffectifs Dans la situation de la figure pr c dente fermez la fen tre des nonc s pour revenir la fen tre principale Cliquez sur le bouton LesEffectifs pour afficher la fen tre de ce programme L information initiale est automatiquement affich e S lectionnez le bouton d option effet notable L gt x c est l option par d faut et entrez la limite x 1 2 Entrez pour l effectif n 2 activez la case cocher et entrez l effectif 50 puis cliquez sur le bouton calculer P pour obtenir la figure ci apr s Les probabilit s pour chaque n sont affich es dans la liste d roulante n P Par exemple pour un effectif futur de n 27 on a une probabilit 0 894 d obtenir avec une garantie 0 95 la conclusion d un effet notable sup rieur une demi heure soit Lo 95 gt 1 2 Revue MODULAD 2006 183 Num ro 35 FA Le
8. et une proportion y de succes qui est le param tre inconnu Un chantillon de n 5 observa tions dont on supposera qu il a t tir au sort sans remise a t observ d o les donn es connues oJofolilO ln 5 f Le raisonnement inductif est fondamentalement une g n ralisation d une quantit connue les donn es une quantit inconnue ici le param tre y Revue MODULAD 2006 134 Num ro 35 2 1 Solution fr quentiste Dans le cadre fr quentiste nous n avons pas de probabilit s et par cons quent pas d inf rence inductive possible De l inconnu vers le connu Aussi l inf rence fr quentiste doit retourner la situation Mais nous n avons pas davan tage de probabilit s moins que nous ne fixions une valeur du param tre Supposons par exemple y 15 20 0 75 Nous obtenons alors des probabilit s d chantillonnage qui peuvent tre d finies comme des fr quences mettant en jeu un tr s grand nombre de r p titions imaginaires des observations Nous pouvons obtenir ces fr quences en simulant un grand nombre de tirages sans remise de 5 boules dans une urne contenant 20 boules dont 15 d une couleur et 5 d une autre couleur Mais il n est pas n cessaire de recourir une d finition fr quentiste pour obtenir les probabilit s d chantillonnage Ici il y a 15504 chantillons diff rents possibles dont un particulier a t observ
9. 4 Entrez les donn es pour le groupe exponentiel que vous trouverez dans le tableau suivant 0 8625 0 7900 0 7200 0 5850 etc en les s parant par des espaces ou un passage la ligne Cliquez ensuite sur le bouton calculer vous pouvez enregistrer les donn es si vous le souhaitez pour afficher la fen tre correspondant la structure Sx0 avec les ststistiques Revue MODULAD 2006 186 Num ro 35 pertinentes moyennes carts types covariances Cliquez sur le bouton R gression ot sont affich es les moyennes observ es Entrez les abscisses z pour la r gression respectivement 0 03 0 05 0 07 0 10 pour ol a 04 S lectionnez le bouton d option e lin aire quadratique et cliquez sur le bouton calculer pour obtenir la figure ci apr s FA lin aire quadratique moyennes observ es moyennes ajust es f carts 0 009 0 024 0 020 0 005 comParaison cOndition de circularit moyenne C lin aire proportionnelle quadratique cubique C degr 4 gt gt 1 di lin aire quadratique C lin aire quadratique cubique lin aire degr gt avec utiliser la liste des composantes 1 2 3 ordonn e origine r gression effet grandeur 0 155 Fa d ciMales 3 4 cart type 0 093 I effet cal grandeur 1 665 F 27 707 p 3 2021E 06 r siduelle effet 0 016 effet cal 0 696 en En cliquant sur le bouton ok r siduelle vous
10. A amp Min Y 2005 Frequentist performance of Bayesian confidence intervals for comparing proportions in 2 x 2 contingency tables Biometrics 61 515 523 Albert J 1996 Bayesian Computation Using Minitab Wadsworth Publishing Company Belmont American Psychological Association 2001 Publication Manual of the American Psycho logical Association 5 me dition Author Washington DC Baum M Houghton J amp Abrams K R 1989 Early stopping rules clinical pers pectives and ethical considerations Statistics in Medicine 13 1459 1469 Bayarri M J amp Berger J O 2004 The interplay of Bayesian and frequentist analysis Statistical Science 19 58 80 Bayes 1763 Essay towards solving a problem in the doctrine of chances Philosophical Transactions of the Royal Society of London 53 370 418 Reproduit dans Biometrika 45 293 315 1958 Berger J O 2003 Could Fisher Jeffreys and Neyman have agreed on testing with discussion Statistical Science 18 1 32 Berger J 2004 The case for objective Bayesian analysis Bayesian Analysis 1 1 17 Berger J O amp Bernardo J M 1992 On the development of reference priors with discussion In J M Bernardo J O Berger A P Dawid amp A F M Smith Eds Bayesian statistics 4 Proceedings of the Fourth Valencia International Meeting 35 60 Oxford Univ Press Oxford England Bernard J M 1996 Bayesian interpretation of frequentist pr
11. Il ao bo j cette formule tant valide pour tout r r el tel que r gt ao La densit de la distribution finale est proportionnelle au produit v 4 a p s soit ply a xy Par comparaison avec les termes en y de la densit initiale on voit qu il s agit encore d une distribution B ta obtenue en rempla ant simplement ag par ao a et b par bo b soit j 0 ao a 1 1 mn ae a B ta ai b1 avec ay ao a et b bo b On peut voir que cette d rivation est valide m me si la densit initiale est impropre ao 0 ou bp 0 La densit finale n est impropre que si a 0 ou b 0 11 1 2 Distribution initiale m lange de densit s B ta Soit la distribution initiale A B ta af b9 A9 B ta a4 b9 de densit j J do j J eo 10 plp 2 Bad 1 9 2 La densit de la distribution finale est proportionnelle au produit u y a p y soit Revue MODULAD 2006 190 Num ro 35 J a a OLD p y a De 0 a pat ee yee 1 j l aj 05 Pour chaque j les termes en y sont ceux de la distribution B ta a a bs b qui a pour densit 1 B a a b b On en d duit donc que la distribution finale est le m lange a a 1 1 5 p bo b 1 p Xi B ta af a b b A B ta a5 a bS b avec AY Ba a b b B a b j T Blat a b Blad b 0 11 2 Echantillonnage de Pascal Pour le mod le binomial n gat
12. Mais comme le soulignait ironiquement Jeffreys cette conclusion est bas e sur la proba bilit des chantillons qui n ont pas t observ s Consid rons un autre exemple d hypoth se nulle Ho y 0 50 Revue MODULAD 2006 135 Num ro 35 p 10 20 0 50 Probabilit s d chantillonnage Nombre de Nombres succes d chantillons f 0 5 252 15 504 f 1 5 2 100 15 504 f 2 5 5400 15 504 f 3 5 5400 15 504 f 4 5 2 100 15 504 f 55 252 15 504 0 016 0 135 0 348 0 348 0 135 0 016 Dans ce cas si y 0 50 on trouve dans 15 2 des r p titions soit la proportion 0 0152 0 016 0 135 une valeur inf rieure ou gale l observation f lt 1 5 Le r sultat est dit non significatif p 0 152 sur la base des donn es observ es l hypoth se nulle n est pas rejet e A l vidence cela ne prouve pas que y 0 50 2 1 2 Intervalle de confiance Un intervalle de confiance peut tre construit comme l ensemble des valeurs possibles du param tre qui ne sont pas rejet es par les donn es un seuil a fix Par exemple pour a 0 05 nous obtenons ici l intervalle de confiance 95 0 05 0 60 Comment interpr ter la confiance L interpr tation est bas e sur l nonc universel Quelle que soit la valeur fix e du param tre dans 95 au moins des r p titions l intervalle qui serait calcul contiendrait cette valeur Cette propri t peut
13. X Y Si R gt U alors P P 1 M1 M1 R M2 M2 R R I 1 Jusqu ce que I gt N P P N M1 M1 N M2 M2 N Pour N 100 000 tirages j ai trouv P 0 523 la valeur exacte avec 3 d cimales tant 0 521 Pour donner une id e de la variabilit les valeurs obtenues par tranches successives de 10000 tirages taient les suivantes 0 524 0 523 0 518 0 519 0 524 0 529 0 529 0 514 0 521 0 531 Par comparaison en effectuant 9 fois 100 000 autres tirages j ai obtenu successivement 0 520 0 521 0 522 0 519 0 521 0 522 0 520 0 520 0 518 On peut de cette mani re obtenir les percentiles de la distribution Par exemple pour calculer u tel que ENG gt u 0 95 la m thode la plus simple consiste garder les valeurs R calcul es chaque tirage dans un tableau puis d ordonner ce tableau et de prendre comme valeur approch e la 0 05xN i me valeur la 50 me pour N 10000 Si N est grand ordonner le tableau peut tre tr s long mais on peut alors trouver des proc dures plus efficaces On peut videmment obtenir une figuration approch e de la densit de la distribution de sa fonction de r partition etc Cette figuration sera utile pour appr cier la plausibilit des r sultats et d tecter une anomalie ventuelle Il est galement utile quand cela est possible de calculer des quantit s qui peuvent tre v rifi es ind pendamment Ainsi dans le programme ci dessus j ai inclus le calcul approch des moments
14. diatement a deux chantillons binomiaux ind pendants pourvu que les distributions initiales soient galement ind pendantes Lecoutre Grouin amp Derzko 1995 Nous illustrerons ces so lutions a partir d un mod le plus complexe qui conduit au m mes proc dures pour les param tres et permet d illustrer la souplesse de l approche bay sienne Revue MODULAD 2006 162 Num ro 35 6 1 Le probl me R gle d exp rimentation rejouez le gagnant Pour comparer deux traitements dans le plan d exp rience usuel en groupes ind pen dants les sujets sont affect s par tirage au sort chacun des deux traitements Ceci conduit deux groupes d effectifs gaux en contraignant un peu le tirage au sort Pour des consid rations thiques on peut pr f rer un plan permettant d attribuer le meilleur traitement un plus grand nombre de fois Comme on ne sait pas a priori de quel traite ment il s agit ou qu on ne veut pas faire intervenir une ventuelle connaissance dans la planification de l exp rience on peut utiliser une r gle appropri e bas e sur un processus s quentiel Ainsi la r gle rejouez le gagnant play the winner d crite ci apr s r pond cet objectif Zelen 1969 Le premier sujet re oit l un des deux traitements t ou avec des probabilit s gales Ensuite si le sujet k 1 a re u un traitement t dont le r sultat est un succ s le sujet suivant k re
15. e la probabilit cumul e correspondante B f e la probabilit bay sienne finale Pr gt 0 20 f pour les quatre distributions initiales B ta 1 0 B ta 0 0 B ta 0 1 2 B ta 0 1 soit les distributions finales respectives B ta a 1 n a B ta a n a B ta a n a 4 B ta a n a 1 Notons maintenant les probabilit s finales Initiale B ta 0 0 B ta 0 1 2 B ta 0 1 Pr py lt 0 50 f LPr elf Prvlf Pr el Bien entendu Pel gt Pre he Pr els yp 0 20 Revue MODULAD 2006 202 Num ro 35 f al pflg 020 BU Pryl _Prlf Pr El 3 3 0 00800000 0 00800000 1 00000000 1 00000000 0 99728632 0 99200000 3 4 0 01920000 0 02720000 0 99840000 0 99200000 0 98386991 0 97280000 3 5 0 03072000 0 05792000 0 99328000 0 97280000 0 95882595 0 94208000 3 6 0 04096000 0 09888000 0 98304000 0 94208000 0 92276264 0 90112000 3 7 0 04915200 0 14803200 0 96665600 0 90112000 0 87742592 0 85196800 3 8 0 05505024 0 20308224 0 94371840 0 85196800 0 82503681 0 79691776 3 9 0 05872026 0 26180250 0 91435827 0 79691776 0 76788506 0 73819750 3 10 0 06039798 0 32220047 0 87912612 0 73819750 0 70809554 0 67779953 3 11 0 06039798 0 38259845 0 83886080 0 67779953 0 64750882 0 61740155 3 12 0 05905580 0 44165425 0 79456895 0 61740155 0 58763489 0 55834575 3 13 0 05669357 0 49834782 0 74732431 0 55834575 0 52965171 0 50165218 3 14 0 05360119 0 55194901 0 69
16. elles apparaissent en fait la fois partiellement redondantes et conceptuellement incoh rentes Ces recommandations ne peuvent en effet qu aboutir perp tuer des recettes et des rituels calcul de puissance pour d terminer les effectifs utilisation des p values on n abandonne pas les tests intervalles de confiance en plus des tests qui seraient combin s sans fournir une r elle pens e statistique On peut craindre dans ces conditions que les utilisateurs de la statistique continuent se focaliser sur la signification statistique du r sultat notamment en se demandant seule ment si l intervalle de confiance contient la valeur de l hypoth se nulle sans consid rer r ellement l information suppl mentaire apport e par cet intervalle Consequently we automatically ask ourselves won t the Bayesian choice be unavoidable Lecoutre et al 2001 Dans ces conditions on ne peut que remettre en question le cadre conceptuel des proc dures d inf rence traditionnelles c est dire l approche fr quentiste et nous de mander si l approche bay sienne ne sera pas tot ou tard incontournable Plan de l expos La pr sentation est organis e en quatre parties Partie I Les aspects conceptuels Inf rence fr quentiste ou bay sienne La premi re partie de ce tutoriel traitera des aspects conceptuels de base concernant les Revue MODULAD 2006 131 Num ro 35 diff rences
17. es dans le tableau suivant nombre de effectif succes erreurs Donn es interm diaires n1 20 on bi n a1 Donn es futures N 39 a2 by N ag Donn es compl tes n 59 a a a b n a 5 2 2 Le test d interruption stochastique et la puissance conditionnelle Le cadre traditionnel de Neyman Pearson n cessitant la sp cification de toutes les possibilit s avant le recueil des donn es il pr voit d effectuer un test d interruption sto chastique stochastically curtailed test L interruption stochastique sugg re de stopper une exp rience une tape interm diaire quand l information disponible d termine le r sultat de l exp rience avec une probabilit lev e soit sous Ho soit sous Ha La puissance conditionnelle l analyse interm diaire est d finie comme la probabi lit tant donn y et les donn es disponibles que le test rejette Ho au terme pr vu de l exp rience 1 A l analyse interm diaire l exp rience est interrompue et on rejette Ho si la puissance conditionnelle la valeur sp cifi e par l hypoth se nulle est lev e disons sup rieure 0 80 Dans notre exemple m me si apr s 20 observations on n a observ que des succ s a 20 nous n arr tons pas l exp rience car la probabilit de rejeter Ho au terme pr vu donn e par la distribution Bin 0 70 39 est inf rieure 0 80 Pr a gt 47 Ho y 0 70 and a 20 Pr az gt
18. lange une troisi me distribution B ta de moyenne 1 2 etc 5 5 4 Remarques Interpr tation des poids du m lange partir des probabilit s pr dictives Le poid associ une distribution B ta du m lange final est proportionnel au produit du poids initial par la probabilit pr dictive associ e la distribution initiale B ta cor respondante Reprenons l exemple pr c dent d une distribution initiale 1 B ta 10 20 1 B ta 20 10 avec les observations n 10 et a 3 Les probabilit s pr dictives d ob server a 3 sont respectivement Pr a 3 0 227632 pour la distribution initiale B ta 10 20 Pr a 3 0 027712 pour la distribution initiale B ta 20 10 Les poids du m lange finale sont proportionnels 1 2 x 0 227632 et 1 2 x 0 027712 et on v rifie que 0 227632 115 t 0 027712 14 0 227632 0 027712 129 0 227632 0 027712 129 Mod le binomial n gatif Les m mes proc dures pour les param tres faisant intervenir des distributions B ta ou des m langes s appliquent au mod le binomial n gatif dans lequel on arr te l exp rience quand on a observ un nombre fix l avance de succ s ou d checs chantillonnage de Pascal l effectif n tant une variable al atoire On notera toutefois que la distribution initiale de Jeffreys est diff rente voir l annexe A La distribution d chantillonnage tant diff rente la distribution pr dictive est donc galement di
19. lectionnez le bouton d option e donn es futures Entrez dans le champ effectif suppl mentaire 39 et s lectionnez la garantie vou lue dans la liste d roulante 0 95 Cliquez sur le bouton Calculer et vous obtenez la probabilit pr dictive 0 798 et la figure ci apr s kl pr diction p 0 85 0932 ensemble des valeurs pour les donn es futures remplissant les conditions 65 70 i pr diction sur Er Ensemble Q donn es Futures probabilit pr dictive 0 798 effectif Suppl mentaire 70 a f gt Ainsi sur la base des r sultats pr liminaires il faut donc un effectif de l ordre de 70 pour avoir peu pr s 80 de chances de d montrer l efficacit On ne s tonnera pas du fait que les probabilit s puissent ne pas tre croissantes cela r sulte du caract re discret de la variable il en est de m me pour la puissance 5 5 Commentaires sur le choix de la distribution initiale non informative Beaucoup d utilisateurs potentiels des m thodes bay siennes continuent de penser qu elles sont trop subjectives pour tre scientifiquement acceptables Pourtant les m thodes fr quentistes sont pleines de conventions plus ou moins ad hoc Ainsi le traditionnel seuil Revue MODULAD 2006 151 Num ro 35 observ p p value du test est bas sur les chantillons qui sont plus extr mes que les donn es observ es sous l hypoth se nulle Mais pour des donn es discr tes cela d p
20. rente de 4 2 Cette propri t appara t ind sirable pour l analyse de donn es exp rimentales o la plupart des questions sont comme dans le pr sent exemple unilat rales De plus un tel intervalle n est pas invariant par transformation except pour une transformation lin aire ce qui peut tre consid r avec Agresti et Min 2005 page 3 comme a fatal disadvantage Ainsi pour les donn es n 59 a 32 et la distribution initiale B ta 1 1 2 nous obtenons les intervalles de plus haute densit finale 0 4167 0 6658 pour y et 0 7481 2 1594 pour i z avec les probabilit s correspondantes Pr p lt 0 4167 0 026 et Pr p lt 0 7481 0 039 gt 2 1594 0 011 Pr gt 0 6658 0 024 et Pr Pour ces raisons nous n avons pas retenu ces intervalles de plus haute densit finale dans nos programmes On remarquera en passant propos de cet exemple qu il est tout aussi facile d obtenir la distribution finale de rears qui est une distribution F de Fisher Snedecor On trouve l intervalle de cr dibilit 95 queues gales 0 712 1 984 LesProportions Revue MODULAD 2006 155 Num ro 35 Proc dez comme pr c demment pour l inf rence surune proportion mais activez le bouton d option w 1 4 Entrez dans les champs appropri s les effectifs e pour 1 32 e pour 0 27 Entrez la distribution initiale b ta e pour 1 1 2 e p
21. ta C t cela i L C 1 q2 p1 1 92 2 P1 P2 P1 2 2 al 74 20 34 at 172 142 C 171 91 p1 91 Vig2 1 92 g2 35 21 56 192 1 2 122 C 2 i 2 v 1 1 0 Q Yule 109 i 41 150 Co 12 1 n001 C 6 p0 p0p1 p0p1 1 p0 p2 nonc d ciMales Limites 0013 imi ef s 9 BE inte ral J C X C X lt X gt Probabilit 095 CR of C Kb Coube peme plx 5 ol p 74 500 20 500 42 35 500 21 500 To Prfk lt x nu PrfX gt x iT moyenne Il 0 161 cart type D 006 0 0 161 ag Prf 0 013 lt amp 0 312 0 95 On a bien entendu p p U v1 Pre ve gt 0 Pr E gt 1 Pr dre 1 Pr y1 gt p2 0 984 Par sa souplesse l approche bay sienne est aussi bien appropri e pour un objectif clai rement d cisionnel notamment s lectionner le meilleur traitement que pour l estimation par exemple appr cier la diff rence d efficacit entre les deux traitements Comme dans le cas d une proportion pour la distribution initiale de Jeffreys les m thodes bay siennes ont de tr s bonnes propri t s fr quentistes de couverture Lecoutre amp ElQasyr 2005 Comme pour une proportion les proc dures pr dictives fournissent des solutions pour choisir les effectifs ou prendre une d cision d arr ter l exp rience avant son terme Dans le cas de deux chantillons binomiaux ind p
22. tre v rifi e par exemple pour y 0 50 R p titions imaginaires des observations Valeur Intervalle Probabilit observ e de confiance d chantillonnage f 0 0 5 0 0 45 0 016 f 0 20 1 5 0 05 0 60 0 135 f 0 40 2 5 0 10 0 75 0 348 f 0 60 3 5 0 15 0 90 0 348 f 0 80 4 5 0 20 0 95 0 135 Pl 5 5 111025 1 0 016 contient y 0 50 Ici dans 98 4 des r p tions l intervalle contient la valeur fix e y 0 50 Mais cette interpr tation est pour le moins trange puisqu elle ne fait pas intervenir les donn es observ es 2 2 Solution bay sienne Du connu vers l inconnu Revue MODULAD 2006 136 Num ro 35 Revenons au raisonnement inductif en partant des donn es connues et en adoptant le point de vue bay sien Nous pouvons utiliser en plus des probabilit s d chantillonnage des probabilit s qui expriment notre incertitude sur toutes les valeurs possibles du pa rametre Dans l inf rence bay sienne nous consid rons les probabilit s fr quentistes non pas d chantillons imaginaires mais des donn es observ es ceci pour toutes les valeurs possibles du param tre C est la fonction de vraisemblance Pr f 1 5 y que l on notera encore u y donn es Pr f 1 5 vy v y donn es Fonction de vraisemblance w 0 20 0 p 10 20 0 135 w 1 20 0 250 w 11 20 0 089 p 2 20 0 395 yp 12 2
23. 0 5507 TIRE On trouve ici pour la diff rence de l chantillon futur une probabilit pr dictive 0 991 qu elle soit positive et une probabilit 0 959 qu elle d passe une demi heure LesMoyennes Dans la situation de la figure pr c dente cliquez sur la courbe de l effet donn es futures d ce qui affiche la fen tre des nonc s S lectionnez le bouton d option e limite et activez la case cocher deux limites Entrez dans les champs limite et deux limites 0 et 0 5 pour obtenir la figure ci apr s avec 1 d cimale pour les limites et 3 pour les probabilit s La case cocher n gligeable qui n est pas pertinentes ici peut tre d sactiv e Revue MODULAD 2006 182 Num ro 35 F4 distribution fiducio bay sienne X interValle garantie 0 031 Eg garantie 0 031 effet donn es futures d 1 580 0 5507 d Z 1 580 0 550 d ciMales garAntie 0 950 1 probabilit s Sate p aif of X deUx limites 0 5 fr ll gt eXprimer les limites en fonction de 1 580 0 lt d lt 0 5 n Gligeable Pr d lt 0 0 009 EISE Pr 0 lt d lt 0 5 0 031 Pr d gt 0 5 0 959 x noTable garantie 0 959 BIDEN garantie 0 959 d 1 580 0 5507 R sum v On trouverait de m me pour la limite de cr dibilit inf rieure 0 95 une probabilit pr dictive 0 893 qu elle soit positive et une probabilit 0 715 qu elle d passe une demi heure
24. 17 no 40 a 1 Pour la m thode bay sienne objective Jeffreys on obtient les distributions finales ind pendantes Po P p2 B ta 7 5 23 5 B ta 17 5 3 5 B ta 1 5 39 5 Revue MODULAD 2006 167 Num ro 35 Conditionnellement yo en remarquant que 1 1 oe P 1 po p2 po y on voit que le probl me se ram ne l inf rence trait e sur le rapport de deux proportions binomiales ind pendantes trait e dans la section pr c dente On a par exemple 1 1 Pr 0 lt u Yo Pr 2 gt A p Po u On obtient ainsi les intervalles pour diff rentes valeurs fix es de y par exemple po 0 15 yo 0 20 y 025 po 0 30 0 569 0 982 0 647 0 987 0 710 0 990 0 759 0 992 LesProportions Dans LePAC activez le menu LesBay siens et le sous menu LesProportions ce qui af fiche la fen tre pour l inf rence sur des proportions Activez le bouton d option 2 groupes ind pendants Entrez dans les champs appropri s les effectifs e pour g1 17 et 3 e pour g2 1 et 39 Entrez s il y a lieu les param tres de la distribution initiale b ta soit dans chaque cas 1 2 mais c est en principe inutile car c est option par d faut S lectionnez les boutons d option e 0100 p0y1 p0 1 1 p02 et entrez la valeur pour y0 0 20 e lt X lt e probabilit Entrez dans le champ probabilit 0 95 pour obtenir la figure ci
25. 20 et f 1 5 0 010 Pr p 3 20 et f 1 5 0 00002 Pr y 13 20 et f 1 5 0 005 Pr 4 20 et f 1 5 0 0001 Pr y 14 20 et f 1 5 0 002 Pr p 5 20 et f 1 5 0 0004 Pr y 15 20 et f 1 5 0 0004 Pr p 6 20 et f 1 5 0 002 Pr 16 20 et f 1 5 00003 Pr p 7 20 et f 1 5 0 005 Pr y 17 20 et f 1 5 Pr 8 20 et f 1 5 0 009 Pr y 18 20 et f 1 5 Prl 9 20 et f 1 5 0 014 Pro 19 20 et f 1 5 Pro 20 20 et f 1 5 2 2 3 Probabilit s pr dictives La somme des probabilit s conjointes donne la probabilit pr dictive marginale des donn es avant les observations Pr f 1 5 Pr y et f 1 5 0 078 Somme des probabilit s conjointes Probabilit pr dictive Ce r sultat est tr s intuitif puisque la probabilit pr dictive est une moyenne pond r e de la fonction de vraisemblance les poids tant les probabilit s initiales 2 2 4 Probabilit s finales Bayesian statistics is difficult in the sense that thinking is difficult Berry 1997 Enfin nous calculons les probabilit s finales apres les observations par une simple application de la d finition des probabilit s conditionnelles Pr t Pr g f 1 5 PERLE Rapport probabilit conjointe probabilit pr dictive Probabilit s finales apr s les ee Pr w 0 f 1 5 0 Pr p 0 50 f 2 o Pr y 0 05 f 1 5 0 000001 Pr y 0 55 f 1 5 0 180 Pr y 0 10
26. 22 apres un infarctus et 0 07 sans infarctus de sorte que l effectif 72 dans la case oui non est en rapport lev En cons quence des valeurs relativement faibles de l indice sont ici cliniquement signifiantes Nous avons ici les valeurs observ es de l indice pour l implication Infarctus D c s case oui non vide Hi u1 0 12 pour l implication D c s Infarctus case non oui vide Hi 0 37 La m thode bay sienne objective avec la distribution initiale de Jeffreys Dirichlet 1 2 1 2 1 2 1 2 donne la distribution finale 11 10 Yo1 Yoo donn es Dirichlet 20 5 72 5 17 5 231 5 ce qui conduit aux intervalles de cr dibilit suivants Infarctus D c s Pr 0 06 lt muicwi lt 0 19 0 90 D c s Infarctus Pr 0 20 lt Mwivi lt 0 54 0 90 Ces intervalles permettent de conclure l existence d une implication d importance limit e et indiquent qu en fait ici le d c s est un meilleur pronostic de l infarctus que l inverse LesProportions Dans LePAC activez le menu LesBay siens et le sous menu LesProportions ce qui affiche la fen tre pour l inf rence sur des proportions Activez le bouton d option LesIm plications Entrez dans les champs appropri s les effectifs e pour v1 20 w1 et 72 w0 e pour vO 17 w1 et 231 w0 Entrez s il y a lieu les param tres de la distribution initiale b ta soit dans chaq
27. 27 Ho 0 70 0 482 lt 0 80 2 De mani re similaire l analyse interm diaire l exp rience est interrompue et on accepte Ho si la puissance conditionnelle la valeur sp cifi e par l hypoth se alternative donn e par la distribution Bin 0 85 39 est faible disons inf rieure 0 20 Par exemple si 12 succ s sont observ es apr s 20 observations cette r gle sugg re d arr ter l exp rience et d accepter l hypoth se nulle Pr a gt 47 Ha 0 85 and a 12 Pr az gt 35 Ha 0 85 0 143 lt 0 20 Revue MODULAD 2006 144 Num ro 35 Une critique a l adresse de cette proc dure est qu il ne semble gu re pertinent de consid rer une pr diction qui est bas e sur des hypoth ses qui peuvent ne plus tre plau sibles tant donn les donn es disponibles En fait la proc dure ignore purement et sim plement la connaissance sur le param tre obtenue au moment de l analyse interm diaire 5 3 Une solution hybride la puissance pr dictive Pour r pondre cette critique de nombreux auteurs ont d fendu l id e de calculer la puissance pr dictive c est dire de moyenner la puissance conditionnelle sur toutes les valeurs du param tre par un calcul bay sien Cela nous conduit une approche bay sienne mais en gardant la proc dure de test fr quentiste pour l analyse des donn es Formellement on utilise les donn es disponibles l analyse interm diaire e
28. G 2007 A supplement to A new confidence interval for the difference between two binomial proportions of paired data Journal of Statistical Planning and Inference 137 357 358 Revue MODULAD 2006 219 Num ro 35
29. M Smith Eds Bayesian Statistics 2 133 156 North Holland Amsterdam Dumouchel W 1990 Bayesian meta analysis In D Berry Ed Statistical Methodology in Pharmaceutical Science 509 529 Marcel Dekker New York Efron B 1998 R A Fisher in the 21st century with discussion Statistical Science 13 95 122 ElQasyr K 2006 TH se de doctorat de math matiques en cours Universit de Rouen FDA 2006 Guidance for the use of Bayesian statistics in medical device draft guidance for industry and FDA staff U S Department of Health and Human Services Food Revue MODULAD 2006 215 Num ro 35 and Drug Administration Center for Devices and Radiological Health Rockville MD http www fda gov cdrh osb guidance 1601 html de Finetti B 1972 Probability Induction and Statistics The art of guessing John Wiley amp Sons Londres de Finetti B 1974 Theory of probability vol 1 John Wiley amp Sons New York Fisher R A 1922 On the mathematical foundations of theoretical statistics Philoso phical Transactions of the Royal Society Series A 222 309 368 Fisher R A 1925 Theory of statistical estimation Proceedings of the Cambridge Phi losophic Society 22 700 725 Fleiss J L 1981 Statistical Methods for Rates and Proportions 2 me dition John Wiley amp Sons New York Fraser D A S Reid N Wong A amp Yi G Y 2003 Direct Bayes for interest para meters In J
30. approche fr quentiste La r ponse des bay siens ne devrait donc pas tre de m sestimer l impact du choix d une distribution non informative particuli re comme cela est souvent le cas Revue MODULAD 2006 153 Num ro 35 In fact the different non informative priors do not differ enough to make much difference with even a fairly small amount of data Lee 2004 page 81 mais au contraire de l accepter 5 5 2 Intervalles de cr dibilit bay sien et taux de couverture fr quentistes Dans d autres situations o nous ne nous int ressons pas des valeurs particuli res nous pouvons consid rer un intervalle ou plus g n ralement une r gion d estimation pour y Dans le cadre bay sien un tel intervalle est habituellement appel un intervalle de cr dibilit pour souligner la diff rence d interpr tation avec l intervalle de confiance fr quentiste Intervalles queues gales LesProportions Proc dez comme pr c demment pour l inf rence surune proportion et entrez dans les champs appropri s les effectifs e pour 1 19 e pour 0 1 Entrez la distribution initiale b ta e pour 1 1 2 e pour 0 1 2 S lectionnez les boutons d option e lt X lt e probabilit Entrez dans le champ probabilit 0 95 pour obtenir la figure ci apr s avec 4 d cimales pour la limite 8 19 50 1 50 0 7224 0 9418 1 Prf 0 7892 lt 0 9946 0 95 On trouve ici pour les diff
31. apr s avec 3 d cimales pour la limite Revue MODULAD 2006 168 Num ro 35 a LesProportions 1 DA C 1 groupe 2 groupes ee Cc Lesimplications ee Cq C 8 l 2 Initiale b ta le g2 C t pl g2 i C 1 2 pl p1 p2 g2 C p1 p2 p1 p2 2 1 a1 17 3 20 at 172 172 Le g1za 91 l 1 7192 0192 21 39 40 92 1 1 2 172 C 2 U 2 v 1 1 0 Q Yule 18 42 60 Ne z 020 Co 172 1 10 011 6 p01 p0p1 p0p1 1 p0 P2 p0 0 20 Enonc Fire loss m d ciMales j imites 9o E saa Calculer limite oa J i 4 C xX lt X lt Statistiques XX e Probabilit 0 95 pr dicTion gl B 17 500 3 500 92 B 1 500 39 500 J CourBe pix 60 oi B 17 500 3 500 42 1 500 39 500 C PrfX lt x C PrfX gt x tirer un cHantillon moyenne 4 cart type 1 0 0 876 za Prf0 647 lt 6R0 lt 0 9871 0 95 La distribution finale de 0 est un m lange des distributions conditionnelles yo On peut l obtenir par simulation En simulant un chantillon de 100000 valeurs du triplet Yo 1 P2 et par suite de 0 jai obtenu l intervalle de cr dibilit 95 Mossman et Berger avaient trouv 0 633 0 990 0 632 0 990 Rempla ons maintenant la distribution finale de yp par la distribution uniforme sur l intervalle 0 111 0 404 qui est l intervalle de cr dibilit 95 pour yo obtenu pour la distribution finale pr c d
32. attribuer une probabilit un v nement unique Les probabilit s bay siennes sont consid r es par certains comme le r sultat d une appr ciation subjective d une situation par un observateur Savage 1954 de Finetti 1974 Mais elle peuvent tout aussi bien servir d crire une connaissance objective en particulier bas e sur des arguments de sym trie ou sur des fr quences On remarquera que la d finition bay sienne est en accord avec le sens du mot proba bilit dans le langage de tous les jours la conception bay sienne appara t donc beaucoup plus proche de la fa on dont les gens raisonnent intuitivement en pr sence d incertitude 3 1 1 Les termes du d bat whether the probabilities should only refer to data and be based on frequency or whether they should also apply to hypotheses and be regarded as measures of beliefs Lindley 1993 Dans une d finition plus pr cise la probabilit est la valeur limite de la fr quence dans une suite infinie d essais mais c est ici un point mineur 3Pour ne prendre qu un exemple comment interpr tez vous l indice de confiance par exemple 4 5 figurant dans les bulletins m t orologiques fournis par m t o France Tous ceux que jai interrog s l interpr tent comme une probabilit bay sienne il y a 4 chances sur 5 que la pr vision se r alise alors que cet indice n est pas du tout d fini comme une telle probabi lit voir http
33. d expliciter les moments des distributions finales ce qui fournira en particulier des ap proximations de ces distributions Quand on doit recourir des m thodes d int gration num rique il sera utile de contr ler les r sultats l aide de ces approximations 13 1 Exemple 1 Moments de la distribution pr dictive Pour le mod le binomial on a la moyenne de la distribution d chantillonnage condi tionnelle y Moy a p ny d o la moyenne de la distribution pr dictive Moy a nMoy y 2 ao bo On peut calculer de la m me mani re les autres moments par exemple Moy a p ny ny 1 p d o n n l ao ao 1 nao ao bo ao bo 1 ao bo Moy a Etc 13 2 Exemple 2 Moments de la distribution du rapport r p1 p2 Dans le cas de deux chantillons binomiaux ind pendants ou dans la r gle rejouez le gagnant on est amen consid rer deux distributions B ta ind pendantes y B ta a1 b1 et y2 B ta az bz Cherchons par exemple les moments du rapport T p1 p2 On a la distribution conditionnelle yo 1 1 PL oy B ta ai br ere p2 p2 p2 T p d o les moments conditionnels qui se d duisent des moments de la distribution B ta a1 b1 Bla r b Moy 1 po Bre Vi Revue MODULAD 2006 192 Num ro 35 et les moments voulus qui se d duisent des moments de la distribution B ta az b2 Bla T b
34. exp rience et de rejeter Ho LesDistributions Dans LePAC activez le menu LesDistributions et le sous menu B ta Binomiale ce qui affiche la fen tre pour la distribution B ta Binomiale ou si la fen tre est d j ou verte pour une autre distribution cliquez sur le bouton correspondant cette distribution pour la changer Entrez dans les champs appropri s les param tres de la distribution 4La distribution B ta ao bo n est en toute rigueur d finie que si ap et b sont strictement positifs Lorque ao ou bo est nul la densit est impropre to p y dp 00 mais cela n emp che pas le calcul de la densit finale qui sera sauf cas particuliers une densit propre En tout tat de cause il ne s agit que d un probl me th orique car en pratique une distribution propre obtenue en rempla ant 0 par une valeur tr s petite ne fera aucune diff rence Revue MODULAD 2006 145 Num ro 35 e pour a 20 e pour 0 1 e pour n 59 S lectionnez les boutons d option e Pr X gt x e limite Entrez dans le champ limite 27 et appuyez sur touche Entr e du clavier ou cliquez sur le bouton Calculer Vous obtenez la figure ci apr s Cette probabilit pr dictive est une moyenne pond r e des probabilit s conditionnelles y les poids tant donn s par la distribution finale Pr a gt 47 ay 20 et p Pro gt 27 ay 20 et dont quelques exemples sont
35. experts qui sont g n ralement sujettes controverses Cependant mon opinion est que l utilisation de ces techniques doit tre plus syst matiquement explor e avant de pouvoir appr cier ce que devrait tre leur contribution pr cise l analyse des donn es exp rimentales 18 3 3 Les probabilit s pr dictives Un outil tr s s duisant An essential aspect of the process of evaluating design strategies is the ability to calculate predictive probabilities of potential results Berry 1991 page 81 Un apport majeur du paradigme bay sienne est la facilit de faire des pr dictions sur des observations futures L id e pr dictive est centrale dans les tudes exp rimentales car the essence of science is replication a scientist should always be concer ned about what would happen if he or another scientist were to repeat his experiment Guttman 1983 Les proc dures bay siennes pr dictives permettent aux utilisateurs de r pondre a des questions essentielles telles que quel doit tre l effectif de l exp rience pour avoir des chances raisonnables de d montrer la conclusion recherch e partir des donn es ac tuellement disponibles quelles sont les chances que le r sultat final permette de conclure ou au contraire ne le permette pas Ces questions sont non conditionnelles en ce qu elles n cessitent de consid rer toutes les valeurs possibles des parametres Tandis que la pra tiqu
36. f 1 5 0 0006 Pr y 0 60 f 1 5 0 128 Pro 0 15 f 1 5 0 0003 Pr p 0 65 1 5 0 064 Pr 0 20 f 1 5 0 001 Pr 0 70 f 1 5 0 026 Pro 0 25 f 1 5 0 005 Pro 0 75 f 1 5 0 005 Pr y 0 30 f 1 5 0 026 Pr y 0 80 f 1 5 i 0004 Pro 0 35 f 1 5 0 064 Pre 0 85 f 1 5 Pr y 0 40 f 1 5 0 115 Pr y 0 90 f 1 5 Pr y 0 45 f 1 5 0 179 Pr y 0 95 f 1 5 Prig 1 f 1 5 Revue MODULAD 2006 138 Num ro 35 Les probabilit s finales sont donc simplement proportionnelles au produit des proba bilit s initiales et de la vraisemblance Pr y donn es x v y donn es x Pr y Leur somme devant tre gale 1 par d finition de la probabilit ce produit est nor malis en divisant par la somme Pr donn es X oly donn es x Pr y 77 Dans le cas continu les probabilit s discr tes sont remplac es par des densit s par exemple si y peut prendre toutes les valeurs r elles dans l intervalle 0 1 p y donn es x v y donn es x p y et la somme par une int grale 1 p donn es f u y donn es x p y dp 0 Ceci se g n ralise directement au cas de plusieurs param tres 3 Nouvelles difficult s avec les intervalles de confiance Comme r sultat d un processus d j bien engag les intervalles de confiance pour raient rapidement devenir une norme obligatoire dans les publications ex
37. facile de consid rer les principaux crit res classiques pour comparer deux proportions diff rence rapport etc Dans le cadre fr quentiste chacun de ces crit res n cessite des proc dures diff rentes On sait en outre que dans le cas de deux chantillons binomiaux ind pendants il existe pour chacun d eux une pl thore de proc duresf 6De nouvelles proc dures sont en outre r guli rement propos es Certaines d entre elles r servent d ailleurs des surprises C est par exemple le cas des new confidence intervals d velopp s par Zhou et Qin 2004 2005 Pour l exemple d effectifs observ s pour deux groupoes ind pendants 2 8 et 1 35 les auteurs Zhou amp Qin 2004 pages 108 109 donnent pour la diff rence 41 w2 avec les notations Revue MODULAD 2006 164 Num ro 35 De m me qu il existe une correspondance entre le seuil observ du test binomial et la probabilit bay sienne finale pour une distribution initiale appropri e on trouve galement dans ce cas un lien avec les tests conditionnels de Fisher Ceci sera illustr plus loin a propos d une autre situation Mais bien entendu ces proc dures fr quentistes ne seraient pas applicables ici puisque la distribution d chantillonnage n est pas la m me Au contraire la solution bay sienne est conceptuellement imm diate En effet la dis tribution de n importe quel param tre d riv peut tre obtenue a partir de la distribution
38. finale conjointe Le probl me est seulement technique il faut en g n ral recourir des m thodes d int gration num rique Par exemple nous trouvons les intervalles de credibilit 95 a queues gales 0 013 0 312 pour yi p2 1 02 1 62 pour 2 Ja 07 464 pour eu LesProportions Dans LePAC activez le menu LesBay siens et le sous menu LesProportions ce qui af fiche la fen tre pour l inf rence sur des proportions Activez le bouton d option 2 groupes ind pendants Entrez dans les champs appropri s les effectifs e pour gl 74 et 20 e pour g2 35 et 21 Entrez s il y a lieu les param tres de la distribution initiale b ta soit dans chaque cas 1 2 mais c est en principe inutile car c est option par d faut S lectionnez les boutons d option e yl y2 e lt X lt e probabilit Entrez dans le champ probabilit 0 95 pour obtenir la figure ci apr s avec 3 d cimales pour la limite utilis es ici les intervalles de confiance 95 0 005 0 516 pour leur direct Edgeworth expansion method et 0 024 0 544 pour leur transformation method Si on a la curiosit de calculer ces m mes intervalles pour la diff rence oppos e 42 1 on a la surprise de ne pas trouver des intervalles sym triques mais au contraire des intervalles largement diff rents respectivement 0 373 0 138 et 0 401 0 171 Lecoutre amp Faure 20
39. futurs doivent tre suppos s changeables avec les sujets qui ont d j t ob serv s pour rendre les probabilit s pr dictives raisonnables De m me des exp riences semblables doivent tre suppos s changeables pour une int gration coh rente des infor mations La notion d changeabilit est tr s importante et utile dans le cadre bay sien En utilisant la sp cification de distribution initiales diff rents niveaux elle permet une mod lisation souple de dispositifs exp rimentaux li s au moyen de mod les hi rarchiques Bernardo 1996 If a sequence of observations is judged to be exchangeable then any subset of them must be regarded as a random sample from some model and there Revue MODULAD 2006 213 Num ro 35 exist a prior distribution on the parameter of such model hence requiring a Bayesian approach Bernardo 1996 page 5 Les mod les hi rarchiques sont importants pour utiliser de mani re appropri e les donn es d exp riences multicentriques Ils ont aussi particuli rement adapt s pour les m ta analyses o nous avons des donn es d un certain nombre d tudes pertinentes qui peuvent tre changeables certains niveaux mais pas d autres Dumouchel 1990 Dans tous les cas le probl me peut tre d compos en une s rie de mod les conditionnels plus simples en utilisant la m thodologie bay sienne hi rarchique Good 1980 R F RENCES References Agresti
40. le cadre de ce que nous appelons l Analyse Bay sienne des Comparaisons et on pourra notamment se rapporter pour compl ter le pr sent expos aux r f rences suivantes Lecoutre 1984 1996a Lecoutre et Poitevineau 2005 Lecoutre 2006 Partie III Les aspects techniques Quelques outils de base La troisi me partie sera technique Il s agira d abord d illustrer les principes des calculs formels n cessaires l inf rence bay sienne et de fournir quelques outils utiles pour ces calculs On abordera galement bri vement des techniques de base d int gration num rique d terministe ou par simulation Ces derni res techniques rev tent une importance de plus en plus grande dans l inf rence bay sienne m me si elles ne sont pas limit es celle ci elles permettent en effet de r soudre relativement facilement les probl mes pratiques de calcul li s aux situations les plus complexes Une pr sentation plus approfondie d borderait le cadre du pr sent expos et serait plut t l objet d un autre tutoriel Partie IV Retour sur les aspects conceptuels L interface de l inf rence fr quentiste et de l inf rence bay sienne La quatri me partie s adressera ceux qui souhaitent approfondir les liens conceptuels et techniques entre les deux approches qui auront t mis en avant dans les diff rents exemples d application En conclusion Je reviendrai bri vement sur les avantages de l appro
41. les r sultats de l chantillon futur quand 6 est connue refl t e par e Par exemple partir des donn es de Student la distribution pr dictive pour Revue MODULAD 2006 180 Num ro 35 une unit exp rimentale future n 1 est d tg 1 580 1 2907 Ainsi pour une unit exp rimentale suppl mentaire il y a une probabilit 87 4 que la diff rence soit positive et une probabilit 78 8 que la diff rence d passe une demi heure LesMoyennes Dans la situation de la figure pr c dente fermez la fen tre des nonc s pour revenir la fen tre principale S lectionnez le bouton d option e 1 b n ce qui affiche l effectif 10 au lieu de la constante b 1 10 Activez la case cocher donn es futures et entrez dans le champ 1 b n pour les donn es futures l effectif 1 Cliquez sur le bouton calculer pour obtenir la figure ci apr s ra LesMoyennes 1 Inf rence sur une moyenne DR variance connUe i LesEffectifs X observalions distribution Initiale x donn es Futures distribution pr dictive Effet d is i 1 580 Cb Ob 14b nfip it 0 909 Os 1 22999548327987 1 230 degR s de libert q 9 e i 9 Cees d ciMales 3 se PrfX gt x Enonc s cliquer sur la distribution d sC t d bsC Linf Lsup 0 95 E effet donn es futures d 1 580 1 290 Pour un chantillon futur de taille 10 soit une r plique avec le m
42. limite Entrez dans le champ limite 0 85 pour obtenir la figure ci apr s avec les d cimales appropri es 8 10 50 0 50 0 68 0 98 1 Pri 0 851 0 932 Revue MODULAD 2006 150 Num ro 35 Si on int gre les donn es pr liminaires dans l analyse de l exp rience la proc dure est exactement la m me que dans le cas de l analyse interm diaire on parle dans ce cas d ap proche bay sienne compl te full Bayesian Mais la plupart temps dans l exp rimentation on ne souhaite pas prendre en compte les donn es pr liminaires dans l analyse de l exp rience et celle ci sera donc effectu e elle aussi avec la distribution initiale B ta 1 2 1 2 La proc dure reste analogue nous calculons la probabilit pr dictive que dans l chantillon futur d effectif n et non pour l ensemble des donn es la conclusion d efficacit p gt 0 85 soit atteinte avec une garantie donn e y d o par exemple les probabilit s pr dictives sui vantes pour y 0 95 avec entre parenth ses les valeurs de a qui remplissent la condition n 20 0 582 a gt 19 n 30 0 696 a gt 28 n 40 0 744 a gt 37 n 50 0 770 a gt 46 n 60 0 787 a gt 55 n 70 0 798 a gt 64 n 71 0 795 a gt 65 n 72 0 829 a gt 65 Etc LesProportions Effectuez s il y a lieu les op rations d crites pour la figure pr c dente puis cliquez sur le bouton prediction S
43. logique d une implication absolue qui pr dit que la case ul w0 est vide Un indice d cart peut tre d fini partir des proportions des diff rentes cases wl w0 VI Gui Pro P1 v0 Yor Yoo Po Pi Po 1 comme 10 P1 9 0 En fait il est plus usuel de consid rer le compl ment 1 de cet indice qui sera not Miw1i et qui est donc proprement parler un indice d ajustement du mod le qui varie de 0 oo 10 oo lt Nulowl lt 1 P1 9 0 Mol wi l Cet indice a t utilis dans des contextes vari s avec diff rentes approches Il peut tre vu notamment comme une mesure d efficacit pr dictive du mod le pour pr dire l issue de W tant donn vy La pr diction est parfaite il y a une implication absolue quand ici 1 La pr diction est d autant plus efficace que 711 est plus proche de 1 En cas d ind pendance on a My1 w1 0 Une valeur nulle ou n gative signifie que le mod le est rejet En cons quence pour pouvoir conclure l efficacit pr dictive du mod le nous de vons d montrer que My1ew1 une valeur proche de 1 On peut d finir de la m me mani re les indices My1ew0 Nwiccvt Et Nwoe v0 OU encore caract riser l quivalence entre deux modalit s Il y a quivalence absolue entre v1 et wl par exemple si ii 1 et Nwicvi 1 les cases v1 w0 et v0 w1 sont vides et on pourra prendre comme indice d ajustement au mod le
44. mais pas une unification phi losophique Philosophical unification of the Bayesian and frequentist positions is not li kely nor desirable since each illuminates a different aspect of statistical infe rence We can hope however that we will eventually have a general methodo logical unification with both Bayesians and frequentists agreeing on a body of standard statistical procedures for general use Bayarri and Berger 2004 page 78 Dans cette perspective un domaine de recherche actif a pour objectif de trouver des probability matching priors pour lequels les probabilit s finales de certains ensembles sp cifi s sont gales au moins approximatevement leur probabilit s de couverture voir Fraser et al 2003 Sweeting 2005 On notera encore qu en relevant le d fi d une unification m thodologique Berger 2003 discute the conditional frequentist approach to testing dont il argue qu elle four nit pr cis ment du moins en ce qui concerne les tests d hypoth ses la base d une unifi cation m thodologique des approches de Fisher Jeffreys et Neyman 18 5 2 Echangeabilit et mod les hi rarchiques Sans entrer dans le d tail des v nements al atoires sont changeables si nous attri buons la m me probabilit une assertion sur n importe quel nombre donn d entre eux de Finetti 1972 page 213 C est une notion cl de l inf rence statistique Par exemple des sujets
45. math matiques Universit de Rouen Bunouf P amp Lecoutre B 2006 Bayesian priors in sequential binomial design Comptes Rendus de L Acad mie des Sciences Paris S rie I 343 339 344 Cai T 2005 One sided confidence intervals in discrete distributions Journal of Statis tical Planning and Inference 131 63 88 Chib S amp Greenberg E 1995 Understanding the Metropolis Hastings algorithm Ame rican Statistician 49 327 335 Copas J B amp Loeber R 1990 Relative improvement over chance RIOC for 2 x 2 tables British Journal of Mathematical and Statistical Psychology 43 293 307 Cox D R 1970 The Analysis of Binary Data Methuen Londres de Cristofaro R 1996 L influence du plan d chantillonnage dans l inf rence statistique Journal de la Soci t Statistique de Paris 137 23 34 de Cristofaro R 2004 On the foundations of likelihood principle Journal of Statistical Planning and Inference 126 401 411 de Cristofaro R 2006 Foundations of the Objective Bayesian Inference First Sympo sium on Philosophy History and Methodology of ERROR Virginia Tech Blacksburg VA Dickey J M 1986 Discussion of Racine A Grieve A P Fl hler H amp Smith A F M Bayesian methods in practice Experiences in the pharmaceutical industry Applied Statistics 35 93 150 Diaconis P amp Ylvisaker D 1985 Quantifying prior opinion In J M Bernardo D V Lindley amp A F
46. me effectif e e la distribution pr dictive est d tg 1 580 0 5507 On notera que l on peut de m me obtenir la distribution pr dictive relative la statis tique de test ou aux limites de cr dibilit fiducio bay siennes soit encore les limites de confiance fr quentistes Ceci met en jeu une nouvelle distribution appel e K prime voir Lecoutre 1996a 1999 2001 Ces distributions permettent notamment de d terminer l effectif n cessaire pour obtenir une conclusion voulue par exemple gt 0 5 avec une garantie fix e LesMoyennes Dans la situation de la figure pr c dente entrez maintenant pour les donn es futures leffectif n 10 Revue MODULAD 2006 181 Num ro 35 les degr s de libert q 9 ce que vous pouvez afficher directement en cliquant sur le bouton r plique S lectionnez le bouton d option e Linf et cliquez sur le bouton calculer pour obtenir la figure ci apr s LesMoyennes 1 Inf rence sur une moyenne F variance connUe x observaTions distribution Initiale x donn es Futures benne ire Effet d hss E Cb Ob 1 b n HoA 5 000 Gs Os 1 22399548327987 miz degR s de libert q i pfx PrfX lt x PrfX gt x Enonc s cliquer sur la dis C d sC t d bs Linf Lsup 0 95 effet donn es futures E cart type donn es futures t aa Lis donn es futures i d 1 580 0 550 s 1 230F 3 Losas 1 580 5 9 0 713
47. moyenne 0 980 pour laquelle Pr y gt 0 85 0 999998 Les distributions finales correspondantes sont respectivement p 52 107 de moyenne 0 327 pour laquelle Pr lt 0 70 amp 1 p 130 29 de moyenne 0 818 pour laquelle Pr y gt 0 85 0 143 La premi re renforce bien entendu la conclusion d inefficacit On peut le voir sur la figure ci apr s qui montre la distribution initiale en noir et la distribution finale en rouge celle ci peut tre compar e la distribution finale objective pour l initiale B ta 1 2 1 2 en bleu LeB A Bay sien Dans LePAC activez le menu LeB A Bay sien et le sous menu chantillonnage Bi nomial ce qui affiche la fen tre correspondante Activez la case donn es et entrez les valeurs e pour 1 32 e pour 0 27 Entrez les param tres de la distribution initiale par d faut c est l option une seule distribution qui est active e pour 1 20 e pour 0 80 Activez la case finale initiale B ta 1 2 1 2 pour obtenir la figure ci apr s Les courbes sont mises jour automatiquement chaque nouvelle entr e au besoin cliquez sur le bouton calculer Revue MODULAD 2006 157 Num ro 35 Leb a bay sien Echantillonnage binomial C m Lange de densit s B ta une Seule distribution D a z a A x z 2 tracer Initiale x CO PX lt g 2 3 C PrfX gt x finale 7 initiale B ta 1 2 172 X B ta 52 000 107 000 m
48. oit le m me traitement si au contraire le r sultat est un chec le sujet k re oit l autre traitement La r gle pr suppose que le r sultat du sujet k 1 est connu quand le sujet k est inclus mais elle pourrait tre tendue pour tenir compte du cas o la r ponse est diff r e En d pit de son d terminisme apparent cette r gle est un processus stochastique puisqu elle d pend des probabilit s de succ s y et yo de chacun des traitements Pour un total suppos fix l avance de n sujets la s quence des traitement attribu s ti to te teyi tn41 contient toute l information des donn es En effet tk 1 tk implique qu on a observ un succ s tg tandis que ty11 tx implique qu on a observ un chec tg La fonction de vraisemblance est donc simplement V p1 P2 E1 tra pr pi 1 po o ny i 1 2 est le nombre de paires tp 411 gales t t de sorte que ny et no sont les nombres respectifs de succ s aux traitements t et t Njo est le nombre de paires tk tk 1 gales a tf ti avec j i de sorte que n10 et n sont les nombres d checs 1 2 est la probabilit de t On peut voir que la fonction de vraisemblance est proportionnelle au produit des fonctions de vraisemblance associ es chacun de deux chantillons binomiaux d effectifs respectifs n11 Nip et N21 Noo et de param tres y et Yo Elle est donc identique une constante
49. pour les ap plications en inf rence statistique Walley 1996 comme cons quence du caract re discret de la distribution d chantillonnage Ceci sugg re encore que si l on veut retenir une seule distribution non informative celle ci doit tre choisie comme interm diaire entre B ta 1 0 et B ta 0 1 Un choix privil gi est alors B ta 4 2 qui est la solution de Jeffreys C est effectivement la distribution initiale qui para t donner sur l ensemble des valeurs de et de n le meilleur taux de couverture fr quentiste meilleur que celui obtenu pour la plupart des m thodes fr quentistes d intervalles de confiance Cai 2005 16 2 Mod le binomial n gatif On consid re toujours l inf rence sur une proportion mais partir d un chantillon dont le nombre de succ s a est fix avant l exp rience on s arr te d s que ce nombre est atteint On a dans ce cas pour le nombre total d observations n gt a la distribution d chantillonnage Bin Neg y a Remarque la distribution d chantillonnage Binomiale n gative est souvent d finie comme la distribution de b n a le nombre d checs observ s quand a est atteint 16 2 1 Un exemple typique Le tableau ci apr s donne un exemple typique avec y 0 20 et a 3 Pour chaque r sultat possible f a n n gt 3 le tableau donne e la probabilit d chantillonnage p f p 0 20 donn e par la distribution Bin Neg 0 20 3
50. rentes distributions initiales consid r es les intervalles a 95 pour les deux exemples suivants n 20 a 19 B ta 0 1 B ta 1 1 B ta 1 2 1 2 B ta 0 0 B ta 1 0 0 7513 0 9877 0 7618 0 9883 0 7892 0 9946 0 8235 0 9987 0 8316 0 9987 n 99 a 32 B ta 0 1 B ta 1 1 B ta 1 2 1 2 B ta 0 0 B ta 1 0 0 4075 0 6570 0 4161 0 6633 0 4158 0 6649 0 4240 0 6728 0 4240 0 6728 Parmi ces distributions initiales B ta 1 0 donne les plus grandes limites et a les propri t s fr quentistes suivantes la proportion des chantillons pour lesquels la limite sup rieure est inf rieure y est plus petite que 2 et la proportion des chantillons pour Revue MODULAD 2006 154 Num ro 35 pour pour lesquels la limite inf rieure est sup rieure y est plus grande que La distri bution B ta 0 1 donne les plus petites limites et les propri t s inverses Par cons quent consid rer simultan ment les limites de ces deux intervalles protege l utilisateur la fois d une acceptation et d un rejet erron s des hypoth ses sur y au seuil unilat ral 4 Si l on souhaite un seul intervalle pour r sumer les r sultats ces propri t s conduisent privil gier celui associ la distribution interm diaire B ta 1 2 1 2 qui est la distri bution de Jeffreys Effectivement cet intervalle a de tr s bonnes propr
51. trials models for adaptative designs and Bayesian methods In J Janssen amp P Lenca Eds Applied Stochastic Models and Data Analysis Conference 2005 Proceedings Part X Health 1039 1050 ENST Bretagne Brest Lecoutre B amp Faure S 2007 A note on new confidence intervals for the difference between two proportions based on an Edgeworth expansion Journal of Statistical Planning and Inference 137 355 356 Lecoutre B Lecoutre M P amp Poitevineau J 2001 Uses abuses and misuses of signi ficance tests in the scientific community won t the Bayesian choice be unavoidable International Statistical Review 69 399 418 Lecoutre B Mabika B Derzko G 2002 Assessment and monitoring in clinical trials when survival curves have distinct shapes in two groups a Bayesian approach with Weibull modeling Statistics in Medicine 21 663 674 Lecoutre B amp Poitevineau J 1992 PAC Programme d Analyse des Comparaisons Guide d utilisation et manuel de r f rence CISIA CERESTA Montreuil Lecoutre B amp Poitevineau J 2005 Le logiciel LePAC La Revue de Modulad 33 Revue MODULAD 2006 217 Num ro 35 Lecoutre B Poitevineau J Derzko G amp Grouin J M 2000 D sirabilit et faisabilit des m thodes bay siennes en analyse de variance application a des plans d exp rience complexes utilis s dans les essais cliniques In I Albert amp B Asselain Eds Biom
52. une des premi res exp riences sur l interpr tation du seuil observ d un test de signification Rosenthal amp Gaito 1963 1964 Poitevineau amp Lecoutre 2001 ont effectu une r plique de cette exp rience aupr s de 18 chercheurs en psychologie On demandait au chercheur de se placer dans la situation suivante il avait r alis une exp rience pour tester l efficacit d un traitement et avait effectu un test t de Student pour groupes appari s avec un chantillon de n sujets On lui demandait en fonction du seuil observ p d indiquer son degr de confiance en l hypoth se alternative selon laquelle le traitement a r ellement un effet Chaque sujet r pondait sur une chelle de 0 1 pour 24 cas pr sent s dans un ordre al atoire et correspondant douze valeurs de p 0 001 0 01 0 03 0 05 0 07 0 10 0 15 0 20 0 30 0 50 0 70 0 90 et deux valeurs de n 10 100 Revue MODULAD 2006 185 Num ro 35 Dans l exp rience initiale Rosenthal amp Gaito rapportaient une chute de confiance cliff effect c est dire une forte diminution de la confiance d s que p tait sup rieur au seuil fatidique 0 05 10 2 R sultats num riques Les courbes moyennes de la confiance en fonction du seuil p obtenues dans la r plique sont semblables celles de l exp rience de Rosenthal et Gaito confiance O 01 O2 03 O OF 068 OF OF of A Cependant les donn es individuelles sont h t rog n
53. une fen tre inf rence sur une moyenne cliquez ensuite sur le bouton ok Activez la case cocher distribution initiale sur la m me ligne que observations et entrez les valeurs appropri es e pour l effet d 1 2 e pour 1 b n activez s il y a lieu cette option 1 2 e pour l s 1 97 e pour les degr s de libert q 9 Activez les cases cocher distribution initiale au dessus des courbes et distribution fiducio bay sienne et cliquez sur le bouton calculer pour obtenir la figure ci apr s Revue MODULAD 2006 184 Num ro 35 ra LesMoyennes 1 Inf rence sur une moyenne DR T _ a ose variance connUe _____LesEffectifs_ initiale lt finale X observaTions X distribution Initiale donn es Futures distribution finale Effet d fass 2 1 04000 Cb Cb i4b nfio Mm gt 20 000 s Os 1 22999548327987 haz o I 1 692 degR s de libert q 9 19 pfx Prf X lt x X distribution initiale Pr X gt x X distribution fiducio bay sienne 0 615 0 2242 4 487 0 581 10 Inf rence sur une combinaison lin aire de moyennes Cet exemple tend de mani re imm diate les solutions pr c dentes l inf rence sur une combinaison lin aire de moyennes On examine ici la compatibilit d un mod le d ajuste ment polynomial avec les donn es en analyse de variance 10 1 Le probl me Evaluation du 0 05 cliff effect Rosenthal et Gaito ont r alis
54. 0 0 054 yp 3 20 0 461 yp 13 20 0 029 p 4 20 0 470 p 14 20 0 014 p 5 20 0 440 p 15 20 0 005 yp 6 20 0 387 w 16 20 0 001 p 7 20 0 323 p 17 20 0 p 8 20 0 255 p 18 20 0 p 9 20 0 192 w 19 20 0 yp 20 20 0 2 2 1 Probabilit s initiales Nous choisissons des probabilit s initiales avant les observations par exemple Pr e Probabilit s initiales avant les observations Pr p 0 20 0 00000001 Pr y 10 20 0 117 Pr 1 20 0 0000003 Pr y 11 20 0 160 Pr 2 20 0 000005 Pr 12 20 0 180 Pr 3 20 0 00004 Pr 13 20 0 166 Pr 4 20 0 0003 Pr 14 20 0 124 Pr 5 20 0 001 Pr 15 20 0 075 Pr 6 20 0 005 Pr 16 20 0 035 Pr 7 20 0 015 Pr 17 20 0 012 Pr p 8 20 0 035 Pr 18 20 0 003 Pr 9 20 0 071 Pr 19 20 0 0005 Pr 20 20 0 00004 2 2 2 Probabilit s conjointes Par un simple produit de la vraisemblance et des probabilit s initiales nous obtenons les probabilit s conjointes des valeurs du param tre et des donn es Revue MODULAD 2006 137 Num ro 35 Pr y et f 1 5 Pr f 1 5 y x Pr y Produit vraisemblance x probabilit s initiales ER conjointes Pr 0 20 et f 1 5 Pr y 10 20 et f 1 5 0 016 Pr y 1 20 et f 1 5 i 00000008 p 11 20 et f 1 5 0 014 Pr y 2 20 et f 1 5 0 000005 Pr y 12
55. 0 0 20507812 0 37695312 0 82812500 0 73517267 0 62304688 5 10 0 24609375 0 62304687 0 62304688 0 50000000 0 37695312 6 10 0 20507812 0 82812500 0 37695312 0 26482733 0 17187500 7 10 0 11718750 0 94531250 0 17187500 0 10201548 0 05468750 8 10 0 04394531 0 98925781 0 05468750 0 02603661 0 01074219 9 10 0 00976562 0 99902344 0 01074219 0 00368989 0 00097656 10 10 0 00097656 1 00000000 0 00097656 0 00016146 0 B ta 0 1 B tal2 B ta 1 0 On peut observer dans ce tableau les r sultats remarquables et g n raux suivants pif lp Prp f Prel 1 est la cons quence de la relation fondamentale entre les fonctions de r partition des dis tributions B ta et Binomiale voir Section pr c dente 1 Prt g f Pr elf P r sulte du fait qu il s agit dans les deux cas de la m me distribution finale Revue MODULAD 2006 200 Num ro 35 Consid rons maintenant le taux de couverture fr quentiste pour y 0 50 associ la limite sup rieure de l intervalle unilat ral de cr dibilit 1 a Il y a couverture si la limite est sup rieure ou gale 0 50 donc si Pr y lt 0 50 f lt 1 a Dans le tableau les erreurs non couverture pour a 0 05 sont indiqu es par Notons F7 la plus grande valeur de f telle que Pr y f gt 1 a cette valeur est donc telle que Pr y f 1 Pr y f gt 1 a On a ici F 1 10 En raison de 2 F F7 2
56. 05 Les auteurs r pondent que leur proc dure peut tre modifi e pour r soudre ce probl me Zhou amp Qin 2007 mais cela ne fait que renforcer l impression d ad hocquerie des m thodes fr quentistes T Reference priors Bernardo 1979 et Berger et Bernardo 1992 ont d velopp sous cette appella tion des distributions initiales qui visent fournir la distribution objective optimale pour un param tre d riv 0 quand celui ci est le param tre d int r t Elles peuvent tre regard es comme un raffinement de la r gle de Jeffreys Cette solution pr sente cependant un certain nombre d inconv nients outre Vintroduction de calculs plus complexes elle n cessite d utiliser des distributions initiales diff rentes pour chaque param tre auquel on peut s int resser et surtout en cherchant retrouver certaines propri t s des proc dures fr quentistes elles peuvent conf rer aux proc dures bay siennes des pro pri t s ind sirables de ces proc dures fr quentistes On notera d ailleurs que bien que pr conisant ces reference priors Berger 2004 dans une illustration pratique des m thodes bay siennes subjectives diagnostic m dical qui est trait dans la section suivante s en tient la solution de Jeffreys Revue MODULAD 2006 165 Num ro 35 a LesProportions 1 DER C41 groupe 2 groupes ind pendants Lesimplications LE UE De Donn es o w 10 effectifs Initiale b
57. 1 580 0 3897 d ciMales CgarAntie 09500 7 probabilit s Cle fe Calculer fs CL 0 X deUx limites 1 0 iS all gt eXprimer les limites en fonction de n Gligeable Pr 8 lt 0 0 0014 EAA Pr 0 lt 5 lt 1 0 0836 Pr 8 gt 1 0 9149 Proc dures fr quentistes effet n gligeable notable Fal X Test de Signification usuel et interpr tation bay sienne t 4 062 F 16 501 p 0 0028 9 di x noTable garantie 0 9149 Pr 8 gt 0 1 p 2 0 9986 EA garantie 0 9149 1 580 0 389 e R sum bd 9 7 La question de la r plication des observations Etant donn l exp rience r alis e la distribution pr dictive exprime notre tat de connaissance sur des donn es futures Par exemple que pouvons nous dire de la valeur de la diff rence d que nous observerions pour de nouvelles donn es La distribution pr dictive pour d dans un chantillon futur d effectif n est naturellement plus dispers e que la distribution de 6 relative la population ceci d autant plus que l effectif du nouvel chantillon est plus petit Ainsi la distribution fiducio bay sienne finale pr dictive pour d tant donn la valeur d observ e dans les donn es disponibles est encore une distribution t g n ralis e naturellement centr e sur d d ty d e e o e s Vn En fait l incertitude sur 6 conditionnellement aux donn es disponibles refl t e par e s ajoute l incertitude sur
58. 1h Revue MODULAD 2006 207 Num ro 35 17 2 2 Echantillonnage de Pascal distribution Binomiale n gative n 1 a 1 n a gt v p y u y n SEC mas l y n gt a et 1 E n y a On d duit en proc dant de la m me mani re I g n n p donc pate x p7 1 4 soit p B ta 0 1b 18 Une n cessit pour les analyses interm diaires concilier l approche bay sienne avec les desiderata fr quentistes La plupart des exp rimentateurs consid rent que la possibilit dans un plan d exp rience de s arr ter avant le terme pr vu en effectuant une analyse interm diaire ne doit pas tre ignor e La raison est que l arr t peut induire un biais sur l inf rence qu ils souhaitent ex plicitement corriger Les proc dures fr quentistes introduisent pr cis ment une telle cor rection C est pourquoi de nombreux exp rimentateurs sont d sappoint s par le fait que les m thodes bay siennes contrairement la pratique fr quentiste ignorent g n ralement ce desiderata au nom du principe de vraisemblance En cons quence ceci constitue un frein s rieux l utilisation des m thodes bay siennes dans l analyse des donn es exp rimentales 18 1 Les principes de vraisemblance et des r gles d arr t If the experiment is changed then the expression of relative ignorance can be expected to change correspondingly Box amp Tiao 1992 page 46 Box et
59. 5 Lecoutre B 1999 Two useful distributions for Bayesian predictive procedures under normal models Journal of Statistical Planning and Inference 77 93 105 Lecoutre B 2000 From significance tests to fiducial Bayesian inference In H Rouanet J M Bernard M C Bert B Lecoutre M P Lecoutre amp amp B Le Roux New ways in statistical methodology From significance tests to Bayesian inference 2 me dition 123 157 Peter Lang Bern SW Lecoutre B 2001 Bayesian predictive procedure for designing and monitoring expe riments In Bayesian Methods with Applications to Science Policy and Official Sta tistics Office for Official Publications of the European Communities Luxembourg 301 310 Lecoutre B 2005 Former les tudiants et les chercheurs aux m thodes bay siennes pour l analyse des donn es exp rimentales La Revue de Modulad 33 85 107 Lecoutre B 2006 Training students and researchers in Bayesian methods for experi mental data analysis Journal of Data Science 4 207 232 Lecoutre B amp Charron C 2000 Bayesian procedures for prediction analysis of impli cation hypotheses in 2 x 2 contingency tables Journal of Educational and Behavioral Statistics 25 185 201 Lecoutre B Derzko G amp Grouin J M 1995 Bayesian predictive approach for infe rence about proportions Statistics in Medicine 14 1057 1063 Lecoutre B amp ElQasyr K 2005 Play the winner rule in clinical
60. 818988 0 50165218 0 47442964 0 44805099 3 15 0 05002778 0 60197679 0 64816210 0 44805099 0 42256891 0 39802321 3 16 0 04617949 0 64815628 0 59813433 0 39802321 0 37444215 0 35184372 3 17 0 04222125 0 69037753 0 54887620 0 35184372 0 33023683 0 30962247 3 18 0 03828060 0 72865812 0 50102546 0 30962247 0 28999475 0 27134188 3 19 0 03445254 0 76311066 0 45508874 0 27134188 0 25364706 0 23688934 3 20 0 03080462 0 79391528 0 41144886 0 23688934 0 22104429 0 20608472 3 21 0 02738189 0 82129717 0 37037603 0 20608472 0 19198125 0 17870283 3 22 0 02421135 0 84550852 0 33204139 0 17870283 0 16621725 0 15449148 etc B ta 1 0 B ta 0 0 B ta 0 1 2 B ta 0 1 Consid rons maintenant le taux de couverture fr quentiste pour y 0 20 associ la limite inf rieure de l intervalle unilat ral de cr dibilit 1 a Il y a couverture si la limite est inf rieure ou gale 0 20 donc si Pr y gt 0 20 f lt 1 a Dans le tableau les erreurs non couverture pour a 0 05 sont indiqu es par 16 2 2 En conclusion On a clairement des r sultats analogues ceux nonc s pour le mod le binomial La famille de distributions initiales B ta ao b avec 0 lt ag lt 1 et 0 lt bo lt 1 correspond une zone d ignorance Les deux distributions extr mes B ta 1 0 et B ta 0 1 assurent encore l une que le taux d erreur fr quentiste est toujours plus petit que a et l aut
61. L INF RENCE BAYESIENNE Revue MODULAD 2006 199 Num ro 35 16 Propri t s fr quentistes de l inf rence bay sienne sur une proportion c est simple 16 1 Mod le binomial 16 1 1 Un exemple typique Le tableau ci apr s donne un exemple typique avec y 0 50 et n 10 Pour chaque r sultat possible f a n 0 lt a lt 10 le tableau donne e la probabilit d chantillonnage p f p 0 50 donn e par la distribution Bin 0 50 10 e la probabilit cumul e correspondante B f e la probabilit bay sienne finale Pr p lt 0 50 f pour les trois distributions initiales B ta 0 1 B ta 1 2 1 2 B ta 1 0 d o les distributions finale respectives B ta a n a 1 B ta at4h n a t1 Notons respectivement ces trois probabilit s finales B ta a 1 n a Initiale Pr lt 0 50 f B ta 0 1 Pr y f B ta 1 2 1 2 Pro f B ta 1 0 Pr plf Bien entendu Pr p f gt Prip f gt Pr ylf Remarque on consid re ici que les distribution B ta a 0 et B ta 0 a sont les distributions ponctuelles aux points 0 et 1 p 0 50 f a n p fle Bf Preg kere Pr elf 0 10 0 00097656 0 00097656 1 00000000 0 99983854 0 99902344 F 1 10 0 00976562 0 01074219 0 99902344 0 99631011 0 98925781 F 2 10 0 04394531 0 05468750 0 98925781 0 97396339 0 94531250 3 10 0 11718750 0 17187500 0 94531250 0 89798452 0 82812500 4 1
62. M Bernardo M J Bayarri J O Berger A P Dawid D Heckerman A F M Smith amp M West Eds Bayesian Statistics 7 529 534 Oxford University Press Oxford England Gamerman D 1997 Markov chain Monte Carlo Stochastic simulation for Bayesian inference Chapman amp Hall Londres Gilks W R Richardson S amp Spiegelhalter D J 1996 Markov Chain Monte Carlo in Practice Chapman amp Hall Londres Good I J 1980 Some history of the hierarchical Bayesian methodology In J M Ber nardo M H DeGroot D V Lindley amp A F M Smith Eds Bayesian Statistics 489 519 Valencia University Press Valencia Oxford University Press Oxford En gland Guttman L 1983 What is not what in statistics The Statistician 26 81 107 Haldane J B S 1948 The precision of observed values of small frequencies Biometrika 35 297 300 Inoue L Y T Berry D A amp Parmigiani G 2005 Relationship between Bayesian and frequentist sample size determination The American Statistician 59 79 87 Irony T Z amp Pennello G A 2001 Choosing an appropriate prior for Bayesian medical device trials in the regulatory setting In American Statistical Association 2001 Procee dings of the Biopharmaceutical Section American Statistical Association Alexandria VA Jaynes E T 2003 Probability Theory The Logic of Science Edited by G L Bret thorst Cambridge University Press Cambridge Je
63. M1 Moy r et M2 Moy r Pour N 100 000 tirages les valeurs obtenues Moy r 1 2726 et ety r 0 1523 sont tr s proches des valeurs exactes avec 4 d cimales 1 2729 et 0 1525 calcul es pr c demment C est notamment dans les cas particuliers o la densit des distributions en jeu n est pas born e par exemple une distribution du type B ta 0 5 b que la m thode doit tre utilis e avec pr caution et que de telles v rifications seront utiles La g n ralisation aux situations consid r es dans les sections une g n ralisation du mod le binomial avec trois proportions et un mod le multinomial pour le tableau 2 x 2 est imm diate Revue MODULAD 2006 196 Num ro 35 15 2 Une m thode simple pour calculer certaines probabilit s Novick et Jackson 1974 pages 338 342 dans un livre malheureusement maintenant difficile trouver d crivent une m thode simple pour calculer la probabilit Pr yi y2 gt u avec les notations utilis es ici Cette m thode est facilement g n ralisable reprenons ainsi l exemple pr c dent du calcul de Pr gt 1 25 La situation est repr sent e dans la figure ci apr s il s agit de calculer la probabilit du triangle sup rieur d limit par la droite bleue d quation y 1 254 q2 On voit que cette probabilit peut tre encadr e e pour une majoration par la somme des probabilit s associ es aux rectangles rouges e pour une min
64. TUTORIEL L inf rence bay sienne pour l analyse des donn es exp rimentales Bruno Lecoutre ERIS Laboratoire de Math matiques Rapha l Salem UMR 6085 C N R S et Universit de Rouen Avenue de l Universit BP 12 76801 Saint Etienne du Rouvray bruno lecoutre univ rouen fr Internet http www univ rouen fr LMRS Persopage Lecoutre Eris R sum Ce tutoriel se situe dans la ligne des articles pr c demment publi s dans la Revue de Modulad Lecoutre 1996b 2005 1997 2005 Lecoutre Poitevineau amp Lecoutre 2005 Il s appuie sur l utilisation de programmes informatiques qui ont galement fait l objet d une pr sentation dans un num ro pr c dent Lecoutre amp Poitevineau 2005 La motivation de ce tutoriel est avant tout m thodologique et le choix du cadre bay sien ne devrait pas paraitre id ologique Plus pr cis ment Vobjectif est d apporter aux questions essentielles soulev es par l analyse des donn es exp rimentales des r ponses mieux adapt es que les tests de signification de l hy poth se nulle Bas es sur des d finitions op rationnelles plus utiles que les proc dures traditionnelles tests intervalles de confiance les m thodes bay siennes offrent une souplesse consid rable en rendant tous les choix explicites De plus la philosophie bay sienne met en avant la n cessit de r fl chir sur l information fournie par les donn es disponibles qu est ce que les donn es on
65. Tiao 1992 ont discut le fait mis en vidence dans la section pr c dente que la r gle de Jeffreys aboutit deux distributions initiales diff rentes pour les chantillonnages binomial et de Pascal bien que ces deux types d exp riences conduisent la m me vraisemblance Ils ont mis en avant l id e que l ignorance avant l exp rience est re lative au plan d exp rience et qu une distribution non informative appropri e doit donc d pendre du mod le d chantillonnage Mais cela est contraire au principe de vraisem blance consid r comme une cons quence du th or me de Bayes auquel la plupart des bay siens vouent une stricte ob issance Principe de vraisemblance Si x et x2 sont tels qu il existe une constante c telle que pour tout vy v wlx1 cv y x2 ils apportent la m me information sur et doivent conduire la m me inf rence adapt de Robert 1992 page 23 Une cons quence du principe de vraisemblance est le principe des r gles d arr t Revue MODULAD 2006 208 Num ro 35 Principe des r gles d arr t once the data have been obtained the reasons for stopping experimentation should have no bearing on the evidence reported about unknown model parameters Bayarri amp Berger 2004 page 77 Ce principe affirme que l on devrait faire la m me inf rence si l on s arr te en ayant observ a succ s apr s n fix observations chantillonn
66. aditionnellement les tests t F ou y ces m thodes sont tr s faciles mettre en uvre Elles peuvent maintenant tre utilis es aussi ais ment que ces tests tout en procurant des avantages conceptuels et m thodologiques consid rables A widely accepted objective Bayes theory which fiducial inference was inten ded to be would be of immense theoretical and practical importance Efron 1998 Dans le but de les promouvoir il nous a sembl important de leur donner un nom plus explicite que standard non informatives de r f rence conventionnelles etc Lecoutre Lecoutre amp Poitevineau 2001 Nous les appelons fiducio bay siennes The statistics profession in general hurts itself by not using attractive names for its methodologies and we should start systematically accepting the ob jective Bayes name before it is co opted by others Berger 2004 page 3 Avec une motivation similaire Berger 2004 d fend l appellation bay siennes objectives Revue MODULAD 2006 141 Num ro 35 Dans ce qui suit j utiliserai ces deux appellations en vitant toutefois l appellation fiducio bay siennes dans le cas de l inf rence sur les proportions pour lequel elle n cessite une discussion particuli re qui est abord e dans la partie IV PARTIE II LA PRATIQUE QUELQUES SITUATIONS DE BASE Programmes informatiques Les programmes informatiques utilis s pour la mise en uvre des m th
67. age binomial ou si l on s arr te apr s avoir effectu n observations pour obtenir a fix succ s chantillonnage de Pascal Ce sont l deux exemples simples de r gles d arr t mais des r gles plus complexes qui ont une grande importance en pratique sont fournies pas les analyses interm diaires voir exemple Inf rence sur une proportion Au nom de ces principes les tentatives pr c dentes pour incorporer ces r gles dans une distribution initiale objective Ye 1993 ont t plus ou moins abandonn es ignorant les arguments avanc s par Box amp Tiao 18 2 Une nouvelle approche prometteuse La plupart des exp rimentateurs ne sont pas convaincus par ces principes La situation ne devrait cependant pas rester bloqu e puique de Cristofaro 1996 2004 2006 a ouvert la possibilit de concilier l approche bay sienne avec les desiderata fr quentistes Il argu mente que le plan exp rimental incluant la r gle d arr t est ant rieur l information de l chantillon et que l information sur le plan constitue une partie de l vidence Il en d duit que la formule de Bayes doit int grer cette information et que par suite les principes de vraisemblance et des r gles d arr t n en sont plus une cons quence automatique Une id e de base est de consid rer que l information du plan ignor e dans la vraisemblance peut tre recouvr e dans l information de Fisher et par suite dans la distributio
68. babilit ou garantie donn e s lectionnez le bouton d option probabilit peuvent tre calcul es 5 4 2 Evaluer l aptitude d un chantillon futur corroborer les r sultats d j obtenus Pour r sumer l information obtenue quant la d cision d interrompre ou non l exp rience nous pouvons calculer la probabilit pr dictive de confirmer la conclusion d ineffica cit Si on souhaite une garantie d au moins 0 95 pour la conclusion finale c est dire Pr y lt 0 70 a gt 0 95 il faut que le nombre total de succ s a soit inf rieur 36 sur 59 Il s agit donc puisque l on a d j observ a 10 succ s de calculer la probabilit pr dictive d observer dans les donn es futures un nombre de succ s az compris entre 0 et 25 sur 39 Ici sur la base des donn es disponibles il y a 87 3 de chances que cette conclusion soit obtenue si l exp rience est men e a son terme LesProportions Effectuez s il y a lieu les op rations d crites pour la figure pr c dente puis cliquez sur le bouton prediction S lectionnez le bouton d option e ensemble Entrez dans le champ effectif suppl mentaire 39 et s lectionnez la garantie vou lue dans la liste d roulante 0 95 Cliquez sur le bouton Calculer et vous obtenez la probabilit pr dictive 0 873 Cliquez sur le bouton d tail pour obtenir la figure ci apr s Revue MODULAD 2006 148 Num ro 35 2 pr diction
69. champ limite 0 pour obtenir la figure ci apr s avec 3 d cimales pour la probabilit amp Dirichlet 2 78 13 266 0 75 0 Prin lt 01 0 145 Revue MODULAD 2006 174 Num ro 35 8 3 3 Avantages de l inf rence bay sienne Dans toutes les situations l inf rence bay sienne traite de mani re explicite et per formante le probl me des param tres parasites Elle prend explicitement en compte les probl mes li s au caract re discret de la distribution et la possibilit d observer des effectifs nuls gr ce la distribution initiale Comme pour le cas d une seule proportion le choix d une distribution initiale non informative n est ni plus ni moins arbitraire ou subjective que les conventions de l approche fr quentiste En outre les probabilit s de couverture des intervalles de cr dibilit bay siens se com parent favorablement a celles des intervalles de confiance fr quentistes Ainsi une tude de simulation Lecoutre amp Charron 2000 montre que les deux taux d erreurs fr quentistes associ s aux deux distributions initiales non informatives extr mes encadrent toujours le taux d erreur recherch La m thode bay sienne objective correspondant la distribu tion initiale sym trique interm diaire entre ces deux extr mes a des propri t s de cou verture remarquables Naturellement l cart entre ces diff rentes distributions initiales se r duit jusqu dispara tre quand la taille d
70. che bay sienne et aborderai quelques th mes pour aller plus loin et pr parer d autres lectures PARTIE I LES ASPECTS CONCEPTUELS INFERENCE FREQUENTISTE OU BAYESIENNE Revue MODULAD 2006 132 Num ro 35 1 La probabilit et l inf rence statistique De nos jours la probabilit a au moins deux d finitions principales d j pr sentes chez Bernoulli 1713 1 La probabilit est la fr quence sur le long terme de l occurrence d un v nement soit dans une suite d essais r p t s soit dans un ensemble de syst mes identiquement pr par s C est la conception fr quentiste qui semble faire de la probabilit une propri t observable objective existant dans la nature ind pendamment de nous 2 La probabilit est une mesure du degr de croyance ou de confiance dans l occurrence d un v nement ou dans la v racit d une proposition C est la conception bay sienne Il n est souvent pas vident d attribuer une probabilit fr quentiste un v nement unique puisque cela n cessite d imaginer un ensemble de r f rence d v nements ou une s rie d exp riences r p t es afin d obtenir des fr quences empiriques Malheureusement de tels ensembles sont rarement disponibles pour l attribu tion des probabilit s dans les probl mes r els Par contraste la d finition bay sienne est plus g n rale il n est pas conceptuellement probl matique d
71. constitue une extension des r sultats pr c dents pour une proportion On a la m me r interpr tation dans le cas de deux groupes ind pendants avec chacun une distribution d chantillonnage Binomiale ou chacun une distribution Binomiale n gative ou encore pour un mod le multinomial n gatif Illustrons la dans les deux premiers cas Consid rons l exemple du tableau de donn es suivant avec respectivement 3 et 2 observations et un succ s observ dans chaque groupe 1 0 gl nun 1 M0 2 m4 3 g2 No 1 no 1 rg 2 ny 2 no 3 n 5 16 4 Le test conditionnel aux marges test de permutation 16 4 1 Cas binomial Dans le cas binomial on retient l un des effectifs par exemple n11 comme statistique de test et on calcule la proportion de tableaux possibles avec les m mes marges qui sont plus extr mes que le tableau observ Il y a trois types de tableaux de donn es possibles 0135313 11213 2 113 210 2 LILAS 01212 2 3 5 2 3 5 2 3 5 1KE 1 3x2 6 3x1 3 la derni re ligne indiquant le nombre de tableaux du type Par exemple pour le tableau du milieu avec 3 sujets dans le groupe 1 il y a 3 fa ons possibles d avoir n11 1 et nyo 2 et avec 2 sujets dans le groupe 2 il y a 2 fa ons possibles d avoir n21 1 et n s 1 donc 3 x 2 6 tableaux de ce type Si on veut montrer que Y lt Y2 le seuil observ du test unilat
72. ction de azu Kep 2 844 UK 4 9 6 R ponses bay siennes directes aux questions sur la grandeur des effets Au dela des r interpr tations des proc dures fr quentistes usuelles d autres nonc s bay siens fournissent des r ponses directes aux questions sur la grandeur des effets Nous pouvons calculer la probabilit que 6 d passe un temps de sommeil suppl mentaire fix plus ais interpr ter par exemple une heure Pr gt 1 donn es 0 915 Il y a une probabilit 91 5 que 6 d passe une heure Puisque l unit de mesure est ici signifiante il est ais d appr cier la signification pratique de la grandeur de Pour r sumer les r sultats on peut rapporter il y a une probabilit finale 91 5 que la diff rence soit positive et grande gt 1 une probabilit 8 4 qu elle soit positive mais limit e 0 lt 6 lt 1 et une probabilit 0 14 qu elle soit n gative Un tel nonc n a pas d quivalent fr quentiste Revue MODULAD 2006 179 Num ro 35 LesMoyennes Dans la situation de la figure pr c dente s lectionnez le bouton d option e limite et activez la case a cocher deux limites Entrez dans les champs limite et deux limites 0 et 1 pour obtenir la figure ci apr s avec 1 d cimale pour les limites et 4 pour les probabilit s Fa distribution fiducio bay sienne X inter alle garantie 0 0836 garantie 0 0836 effet aa b A eee 8 f9
73. d quivalence le minimum de ces deux indices Nous supposons ici un mod le d chantillonnage multinomial soit pour un chantillon d effectif n la probabilit d observer les effectifs n n M11 710 N01 00 1711 P10 Por Poo noo Pr n11 n10 N01 Roo P11 P10 P01 Yoo EE N11710 701 8 2 Solutions fr quentistes Pour construire un intervalle de confiance on a propos des solutions asymptotiques par exemple Fleiss 1981 qui sont manifestement inappropri es pour les petits chantillons On a galement d velopp des solutions bas es sur le test conditionnel de Fisher Copas et Revue MODULAD 2006 170 Num ro 35 Loeber 1990 Lecoutre et Charron 2000 Ce test utilise la distribution d chantillonnage de n11 par exemple Un r sultat classique est que cette distribution n11 tant donn les marges observ es fix es d pend seulement du produit crois p ee voir Cox 1970 page 4 On peut ainsi partir de cette distribution tester l hypoth se nulle p po contre l hypoth se alternative p lt po ou contre p gt po en utilisant la probabilit que n11 d passe la valeur observ e dans la direction appropri e On a donc une proc dure analogue au test binomial consid r dans le cas de l inf rence sur une proportion avec de la m me mani re la possibilit de d finir une solution incluante et une solution excluante On obtient comme cas particulier le
74. donne une probabilit proche du p moyen Revue MODULAD 2006 152 Num ro 35 Pr p lt 0 70 a 47 0 000 Pine pour la distribution initiale y B ta 0 1 la plus d favorable Ho soit la distribution finale y B ta 47 13 Pr p lt 0 70 a 47 0 035 pare pour la distribution initiale y B ta 1 0 la plus favorable Ho soit la distribution finale y B ta 48 12 Pr gt lt 0 70 a 47 0 049 Pmoyen pour la distribution initiale y B ta 1 2 1 2 soit la distribution finale y B ta 47 5 12 5 LesProportions Proc dez comme pr c demment pour l inf rence surune proportion et entrez dans les champs appropri s les effectifs e pour 1 47 e pour 0 12 Entrez la distribution initiale b ta epour 1 0 epour 0 1 Remarque ces valeurs peuvent tre affich es en cliquant sur le bouton O 1 S lectionnez les boutons d option e X lt e limite Entrez dans le champ limite 0 70 pour obtenir la premi re figure ci apr s avec les d cimales appropri es La seconde figure est obtenue pour la distribution initiale b ta e pour 1 1 e pour 0 0 8 47 00 1 3 00 0 63 0 73 0 9 Pri amp 0 701 0 066 8 48 00 1 2 00 oe Pr 0 70 0 035 S La critique facile l gard de approche bay sienne concernant l existence de diver gences quant au choix de la distribution non informative se retourne donc l encontre de l
75. e Entrez dans le champ limite 0 70 et s lectionnez les d cimales appropri es 2 pour la limite et 3 pour la probabilit Cliquez sur le bouton Calculer et vous obtenez la figure ci apr s 5Dans ce cas l inf rence bay sienne sur 4 effectu e l analyse interm diaire ne prend pas explicite ment en compte la r gle d arr t qui est cependant prise en compte dans le calcul de la probabilit pr dictive Dans le cadre fr quentiste il est habituel que les inf rences interm diaires soient modifi es pour tenir compte de la r gle d arr t Ce point qui pourrait appara tre comme un sujet de discorde entre les deux approches est abord dans la partie IV Revue MODULAD 2006 147 Num ro 35 x LesProportions 1 DEK _Fermer 1 groupe 2 groupes ind pendants Leslmplications fx Donn es Ci BF effectifs Initiale b ta 1 0 1 0 Cale fi 0 Fi 0 20 1 2 fi 42 m Lange de densit s B ta o 1 10 01 Enonc mm d ciMales X 6 Limite EE Calculer 2 ims os limite C XxX aaaeeeaei C lt x probabilit 3 gt C X lt X gt C Probabilit 0 971 pr diction distibution 2 4f f 10 50 10 50 CourBe z z G plx B 10 50 10 50 Fo C Prex PrfX gt x moyenne 0 50 cart type 0 11 0 50 Pri amp 0 701 0 971 La probabilit associ e a une limite fix e ou inversement les limites associ es a une pro
76. e fr quentiste traditionnelles ne traite pas ces questions les probabilit s predictives leur donnent des r ponses directes et naturelles En particulier partir d une tude pilote les probabilit s pr dictives sur les limites de cr dibilit sont un r sum particul rement utiles pour aider au choix de la taille de l chantillon d une exp rience pour un parall le entre les m thodes bay siennes et fr quentistes voir Inoue Berry amp Parmigiani 2005 L approche pr dictive est une m thode tr s s duisante Baum Houghton amp Abrams 1989 pour aider la d cision d interrompre une exp rience une tape interm diaire D une part une probabilit pr dictive faible que l exp rience soit une r ussite peut tre utilis e comme une r gle pour abandonner l exp rience pour futilit D autre part une probabilit pr dictive suffisamment lev e sugg re d interrompre l exp rience avant son terme pour succ s Revue MODULAD 2006 211 Num ro 35 Les probabilit s pr dictives sont aussi un outil important pour traiter les donn es manquantes Les analyses interm diaires reviennent d ailleurs valuer des donn es man quantes Le cas de donn es de survie censur es est particuli rement illustratif Au mo ment d une analyse interm diaire les donn es disponibles sont divis es en trois cat gories 1 les patients inclus pour lesquels l v nement auquel on s in
77. e l chantillon augmente En ce qui concerne les proc dures fr quentistes il appara t que les intervalles bas s sur l approche conditionnelle avec les solutions incluante excluante et moyenne sont moins performants que leurs analogues bay siens En particulier les deux taux d erreurs associ s aux deux solutions extr mes n encadrent pas toujours le taux recherch Il n y a aucune difficult tendre de mani re imm diate les proc dures bay siennes toute autre situation faisant intervenir le mod le multinomial En particulier ici on obtient tr s facilement par simulation la distribution du minimum de deux indices pour tablir l quivalence entre deux modalit s on peut aussi ais ment effectuer une inf rence pour comparer les indices associ s deux groupes ind pendants par exemple ici les patients trait s et non trait s etc 9 Inf rence sur une moyenne Reprenons l exemple m dical utilis par Student 1908 dans son article originel sur la proc dure qui a t ensuite appel e le test t de Student 9 1 Le probl me L exemple historique de Student Etant donn pour chacun des n 10 patients les heures de sommeil suppl mentaires procur es par l utilisation de chacun des deux somnif res soporific 1 et soporific 2 Student effectuait une inf rence sur la diff rence des moyennes entre les deux somnif res en construisant une nouvelle s rie de donn es obten
78. emple Moy t y y d o Moy t Moy y L q gt 2 q On trouvera des d monstrations d taill es et des applications d autres distributions dans Lecoutre 1996a 2000 Revue MODULAD 2006 193 Num ro 35 14 2 Exemple 2 Inf rence sur le rapport de deux distributions B ta de param tres entiers Soit y et w2 ind pendamment distribu es B ta a1 n a1 et Beta az no a2 On suppose a et n gt a entiers positifs On veut calculer P PE gt u Pour0 lt u lt 1 on peut utiliser le r sultat suivant ai Ln a i T n2 C Ps DR et OG ge aia O lt u lt l ZT Plna 7 y w 2F1 n j az j n u u o 2F a b c u est la fonction hyperg om trique Pour u gt 1 on peut calculer de la m me mani re P 1 PR gt Preuve Conditionnellement 42 me gt u p2 Pr B ta ai n a1 gt upa Pr Bin upz n 1 lt a 2 ou on utilise la relation fondamentale entre la fonction de r partition de la distribution B ta et celle de la distribution Binomiale Pr B ta a b lt y Pr Bin y a b 1 gt a 1 Johnson Kotz amp Kemp 1992 On en d duit ai 1 ai 1 nl 1 tk Pr 21 gt u Ye Pr Bin m 1 up j y l Juell up I p2 j 0 j 0 4 La probabilit marginale P Prl gt u s obtient par le m lange par la densit p p2 de la distribution B ta a2 no az a 1 E 20 CF ju f Pll
79. ence statistique semblent sou vent r ticents mettre en pratique les proc dures bay siennes Dans un papier parti culi rement lucide Winkler crivait il y a plus de 30 ans this state of affairs appears to be due to a combination of factors including philosophical conviction tradition statistical training lack of availability computational difficulties reporting difficulties and perceived resistance by journal editors Winkler 1974 page 129 ajoutant que si on laissait de c t les aspects philosophiques aucun de ces arguments n tait r ellement d terminant Cette analyse n en reste pas moins d actualit on peut simplement ajouter qu un nouvel obstacle important en pratique est que les logiciels statis tiques standard qui sont de nos jours largement utilis s continuent ignorer les m thodes bay siennnes We statisticians will all be Bayesians in 2020 and then we can be a united profession Lindley in Smith 1995 page 317 En fait nous sommes vraisemblablement dans une p riode cruciale car la masse des travaux th oriques sur l inf rence bay siennes qui ont t effectu s donne lieu un nombre sans cesse croissant d applications L un des facteurs d cisifs pourrait tre le r cent draft guidance document de l US Food and Drug Administration FDA 2006 Ce document qui discute the least burdensome way of addressing the relevant issues related to the use of Bay
80. end du fait que l on inclut ou non les donn es observ es Supposons qu l analyse finale on observe 47 succ s n 59 et a 47 soit la valeur au del de laquelle le test binomial rejette l hypoth se nulle Ho y 0 70 On peut alors calculer le seuil observ p suivant une des trois possibilit s suivantes Pine Pr a gt 47 Ho 0 70 0 066 solution usuelle incluante Ho n est pas rejet e au seuil a 0 05 test conservateur Pexe Pr a gt 47 Ho 0 70 0 035 solution excluante Ho est rejet e au seuil a 0 05 test lib ral Pmoyen 2 Pine Pinc 0 051 p moyen Dans la solutions usuelle la valeur observ e est inclue et le test est conservateur la probabilit de rejeter Ho si elle est vraie est inf rieure a Mais si la valeur observ e est exclue le test devient lib ral la probabilit de rejeter Ho si elle est vraie est sup rieure a Une solution typique pour surmonter ce probl me consiste consid rer un p moyen mid p value Routledge 1994 Berry amp Armitage 1995 mais dans le cadre fr quentiste cette pratique a seulement des justifications ad hoc A l vidence dans ce cas le choix d une distribution initiale non informative implique aussi des conventions Mais le choix particulier d une telle distribution initiale n est ni plus ni moins qu une contrepartie exacte de l arbitraire en
81. endants les solutions sont une extension imm diate les distributions pr dictives pour deux chantillons futurs tant des distribu tions B ta Binomiales ind pendantes elles sont illustr e dans Lecoutre Derzko et Grouin 1995 Dans le cas de la r gle rejouez le gagnant les techniques sont les m mes mais les distributions d chantillonnage tant diff rentes les distributions pr dictives sont bien entendu diff rentes ElQasyr 2006 7 Une g n ralisation du mod le binomial avec trois proportions 7 1 Le probl me Diagnostic m dical Mossman amp Berger 2001 donnent l exemple du diagnostic d une maladie M Revue MODULAD 2006 166 Num ro 35 On consid re une population pour laquelle la probabilit de la maladie est yo On utilise un test de diagnostic qui est positif avec une probabilit g si le patient a la maladie et avec une probabilit y si le patient n a pas la maladie Pr M o Pr M 91 Pr t M On en d duit par le th or me de Bayes la probabilit 6 que le patient ait la maladie sachant que le test est positif Pr M Pr M P1P0 _9 Pr M Pr M Pr t gt M Pr 4M ipo 2 1 Po Pr M G n ralisant encore la situation de l inf rence sur une proportion binomiale on sup pose que l on dispose de donn es ind pendantes a i 0 1 2 ayant chacune une distribu tion Binomiale dl Bin yi ni 7 2 Solutions fr quentistes Une des moti
82. endendamment de toute information ext rieure Cependant des a priori informa tifs ont aussi un r le important jouer Ils peuvent aider a raffiner l inf rence et appr cier la sensibilit des conclusions vis vis d informations suppl mentaires Revue MODULAD 2006 210 Num ro 35 an objective scientific report is a report of the whole prior to posterior map ping of a relevant range of prior probability distributions keyed to meaningful uncertainty interpretations Dickey page 135 En regard du besoin d objectivit des scientifiques on pourrait m me argumenter sur la n cessit d explorer l impact de diff rentes distributions initiales pertinentes Les techniques bay siennes informatives sont id alement adapt es pour combiner les informations des donn es d une exp rience avec celles d autres tudes et par suite pour planifier une s rie d exp riences Des utilisations plus ou moins convaincantes ont t propos es Par exemple Irony et Pennello 2001 discutent la mani re d introduire ces techniques dans les essais cliniques en m decine De fa on id ale quand une bonne information initiale est disponible elle peut doit tre utilis e pour obtenir la m me conclusion qu une analyse bay sienne ob jective mais avec un plus petit chantillon de donn es Naturellement cela supppose une connaissance r elle bas e sur des donn es plut t que des opinions d
83. ente B ta 7 5 23 5 On obtient alors toujours pour 100 000 simulations l intervalle r ellement tr s proche 0 632 0 991 On peut galement constater que conditionnellement yo 0 20 qui est approxi mativement la moyenne 0 1974 de la distribution B ta 7 5 23 5 l intervalle obtenu 0 647 0 987 est encore proche des pr c dents 8 Un mod le multinomial pour un tableau 2 x 2 8 1 Le probl me Etude d un mod le logique Consid rons un groupe de n sujets avec deux ensembles d attributs ou variables binaires respectivement not s V vl v0 et W wl w0 Pour fixer les id es supposons que W soit le fait qu un individu soit d c d d une maladie cardiaque et que V soit le fait qu il ait eu ou non au pr alable un infarctus du myocarde Consid rons l exemple suivant de mod le logique Lecoutre et Charron 2000 Revue MODULAD 2006 169 Num ro 35 Il existe une implication absolue ou logique vl w1 par exemple si tous les individus ayant la modalit v1 ont aussi la modalit w1 alors que l inverse n est pas n cessairement vrai Mais l hypoth se d une implication absolue est de peu d int ret en pratique puisqu il suffit d observer une seule fois l v nement v1 w0 pour la r futer En cons quence nous devons consid rer l hypoth se plus faible v1 implique dans la plupart des cas w1 v1 w1 Le probl me est d valuer l cart au mod le
84. entre les approches fr quentistes et bay siennes Je conclurai que pour l ana lyse des donn es exp rimentales une approche bay sienne objective est la fois d sirable et faisable Dans ce cadre je n envisagerai donc qu avec beaucoup de r serves une ap proche subjectiviste j carterai galement une conception prioritairement d cisionnelle de l inf rence statistique Partie II La pratique Quelques situations de base L objectif de la seconde partie sera de d montrer la faisabilit des m thodes bay siennes a partir d un certain nombre de situations de base La pr sentation sera essentiellement illustrative et le moins possible technique Il s agira d introduire des proc dures de routine partir de probl mes relativement simples d inf rence sur des proportions et des moyennes On traitera a la fois la mise en uvre pratique de ces proc dures l aide de programmes informatiques et leurs apports conceptuels et m thodologiques tant pour l analyse de donn es que pour la planification et la conduite des exp riences Dans chaque situation les solutions bay siennnes seront mises en parall le avec les proc dures fr quentistes Je d velopperai plus particuli rement l inf rence sur des proportions Les probl mes de comparaisons de moyennes qui se pr sentent traditionnellement en analyse de variance ont en effet t largement trait s par ailleurs notamment dans
85. es On peut facilement identifier trois cat gories distinctes de courbes 1 des courbes exponentielles d croissantes 2 des courbes lin aires n gatives 3 des courbes en tout ou rien et les 18 chercheurs peuvent en cons quence tre class s en trois groupes clairement dis tincts Le probl me consid r ici est celui de l valuation de la chute de confiance Nous de vons d abord nous donner une d finition explicite de l absence de chute Nous adopterons la d finition utilis e par Nelson Rosenthal et Rosnow 1986 The patterns of the parent means associated with the four consecutive p values 03 05 07 and 10 and the predicted means based on a second degree poly nomial equation are the same Suivant cette d finition on consid re le polyn me du second degr qui ajuste le mieux les donn es pour les quatre seuils consid r s 0 03 0 05 0 07 et 0 10 La moyenne quadra tique des r sidus donne un indice d ajustement goodness of fit pour valuer la chute de confiance On obtient par exemple pour le groupe exponentiel les r sultats suivants LesMoyennes Dans LePAC activez le menu LesBay siens et le sous menu LesMoyennes ce qui affiche la fen tre pour l inf rence sur des moyennes Cliquez sur le bouton Donn es pour afficher l diteur de donn es S lectionnez le nombre de groupes 1 et le nombre d occasions nombre de r p titions pour chaque sujet
86. esian statistics in medical device clinical trials ouvre la possibilit pour les exp rimentateurs au moins dans le domaine des essais cliniques d tre r ellement bay siens en pratique 18 3 Quelques avantages de l inf rence bay sienne 18 3 1 Une meilleure compr hension des proc dures fr quentistes Students exposed to a Bayesian approach come to understand the frequen tist concepts of confidence intervals and P values better than do students exposed only to a frequentist approach Berry 1997 Les m thodes bay siennes objectives permettent aux utilisateurs de surmonter des dif ficult s usuelles rencontr es avec approche fr quentiste En particulier il est tr s naturel pour eux d utiliser les interpr tations bay siennes des tests de signification et des inter valles de confiance dans le langage des probabilit s sur les param tres inconnus En retour les mauvais usages et les abus des tests de signification de l hypoth se nulle sont beau coup mieux compris En particulier les utilisateurs des m thodes bay siennes deviennent tr s vite avertis du fait que les r sultats non significatifs ne peuvent pas tre interpr t s comme preuve d absence d effet 18 3 2 Combiner diff rentes sources d information Une analyse de donn es exp rimentales devraient toujours inclure une analyse bay sienne objective pour exprimer l apport propre des donn es ce que les donn es ont dire ind p
87. est la plus grande valeur de f telle que Prt p f gt 1 a On a ici Fr 2 10 En cons quence le taux de couverture associ la distribution initiale B ta 1 0 est 1 B F et en raison de 1 et 2 on a simplement BU Sire Or ele er lee d ot le taux de couverture 1 B F Pr p F gt 1 a avec ici 1 B 1 10 0 98925781 De m me le taux de couverture associ la distribution initiale B ta 0 1 est 1 B F 1 B Ft Pr y Ft lt 1 a avec ici 1 B 2 10 0 94531250 En cons quence le taux de couverture associ la distribution initiale B ta 1 2 1 2 ne peut tre que B F ou B F De plus ce r sultat est vrai aussi pour toute distribution initiale Beta ao bo avec 0 lt ao lt 1 et 0 lt bo lt 1 On a bien entendu des r sultats analogues pour la limite inf rieure les r les des dis tributions B ta 0 1 et B ta 1 0 tant invers s 16 1 2 En conclusion La famille de distributions initiales B ta ao bo avec O lt ao lt 1 et 0 lt b lt 1 correspond une zone d ignorance Bernard 1996 Il y a deux distributions extr mes B ta 1 0 et B ta 0 1 l une assurant que le taux d erreur fr quentiste est toujours plus petit que a et l autre qu il est toujours plus grand que a le sens de l in galit d pendant du fait que l on consid re la limite inf rieure ou sup rieure Le taux de couverture associ aux autres distributions de la famille
88. et P2 N B ta Var V9 Les distributions finales marginales sont encore deux distributions B ta ind pendantes p ti ry tn41 B ta vi 11 Vig 10 et p2 ti P tn 1 B ta va n V0 199 6 3 1 Exemple num rique Consid rons titre d illustration les r sultats suivants pour une exp rience avec n 150 sujets On remarquera que par d finition de la r gle les nombres d checs ici 20 et 21 ne peuvent diff rer que d au plus une unit succ s checs traitement t 21 74 nio 20 94 traitement t no 35 Nea 21 56 109 41 150 6 3 2 La simplicit conceptuelle des m thodes bay siennes objectives Un nonc de probabilit conjoint est dans un sens le meilleur r sum de la distri bution finale Si nous adoptons la distribution initiale de Jeffreys v Vio Vo V 1 nous obtenons par exemple la probabilit finale conjointe en omettant le conditionnement par les donn es pour simplifier l criture Pr 1 gt 0 697 et p2 lt 0 743 0 95 qui se d duit de Pr y gt 0 697 Pr p2 gt 0 743 V0 95 0 974679 obtenues comme dans le cas de l inf rence sur une proportion en utilisant l ind pendance des deux distributions finales p B ta 74 5 20 5 et 2 B ta 35 5 21 5 Cependant nous pouvons pr f rer un nonc qui permet de comparer directement les deux traitements Ainsi nous avons Pr p1 gt p2 0 984 De plus il est
89. ff rente il s agit dans ce cas d une distribution B ta Pascal 5 6 Le facteur de Bayes Pour compl ter la pr sentation de cet exemple j introduirai le facteur de Bayes m me si l utilisation de celui ci rel ve davantage d une approche d cisionnelle et pourra donc appara tre plus appropri e dans d autres contextes Reprenons encore pour l exp rience sur la m thode d enseignement exemple des donn es n 59 a 32 avec la distribution initiale enthousiaste p 98 2 et les probabilit s a priori Pr p gt 0 85 0 99999810 qu on notera m et donc Pr y lt 0 85 0 00000190 mo Les notations 7 et 7 sont usuelles car le facteur de Bayes est g n ralement pr sent comme une approche bay sienne au tests d hypoth ses classiques Revue MODULAD 2006 161 Num ro 35 dans ce cadre mo et m sont les probabilit s de l hypoth se nulle Hp et de l hypoth se alternative H Il appara t alors assez naturel de consid rer e le rapport de ces deux probabilit s a priori soit P mo _ Pre lt 0 85 _ 4 5000019 m Pr p gt 0 85 qui est videmment ici tres faible e et leur rapport a posteriori soit po Pr p lt 0 85 a 32 0 8570 p Pr y gt 0 85 a 32 0 1430 qui est maintenant nettement sup rieur a 1 On d finira alors le facteur de Bayes associ l observation a comme le rapport de ces deux rapports 5 99 B a ZPL PT _ 3154986 T T PiTo ce qui
90. ffreys H 1961 Theory of Probability 3 me dition Clarendon Oxford 1st edition 1939 Johnson Kotz amp Kemp 1992 Univariate Discrete Distributions 2 me dition John Wiley and Sons Kirk R E 1982 Experimental Design Procedures for the Behavioral Sciences Brooks Cole Pacific Grove CA Laplace P S 1774 M moire sur la probabilit des causes par les v nements Savants Etranges 6 621 656 publi en anglais Memoir on the probability of the causes of events Statistical Science 1 364 378 1986 Laplace P S 1812 Th orie Analytique des Probabilit s Courcier Paris Revue MODULAD 2006 216 Num ro 35 Laplace P S 1986 1825 Essai Philosophique sur les Probabilit s Reproduction de la 5 me dition 1825 Christian Bourgois Paris Lecoutre B 1984 L Analyse Bay sienne des Comparaisons Presses Universitaires de Lille Lille Lecoutre B 1996 Traitement statistique des donn es exp rimentales des pratiques traditionnelles aux pratiques bay siennes Avec programmes Windows par B Lecoutre et J Poitevineau DECISIA Editions Levallois Perret Lecoutre B 1996 Au dela du test de signification ou l inf rence statistique sans tables a la suite d Alain Morineau La Revue de Modulad 17 98 100 Lecoutre B 1997 2005 Et si vous tiez un bay sien qui s ignore La Revue de Mo dulad 18 81 87 R dition compl t e La Revue de Modulad 32 92 10
91. hlet dans laquelle les poids initiaux sont simplement ajout s aux effectifs observ s P11 Pio Yo1 Poo donn es Dirichlet n11 211 N10 Vio Nor Vor Noo voo En utilisant les propri t s fondamentales de la distribution de Dirichlet voir par exemple Bernardo amp Smith 1994 page 135 la distribution finale du param tre d riv Mu peut tre caract ris e comme une fonction de trois distributions B ta ind pendantes X pw donn es B ta nio vio nii Vir Nor Voi Noo voo Poo Poo J A Y donn es B ta noo Voo M11 V11 N01 vor Fig L xX Pil Pil x donn es B ta n11 v11 Roi vor 1 10 Yoo 1 Y 1 xX Revue MODULAD 2006 171 Num ro 35 puisque X X Z0 Y 1 X X Y 1 X nous sommes ramen s au m me probl me technique que dans la situation pr c dente du diagnostic m dical Twi wl 1 8 3 1 Exemple num rique Etude de mortalit Consid rons l implication Infarctus du myocarde D c s cardiaque avant deux ans Pour des patients qui n ont subi aucun traitement m dical on dispose des donn es sui vantes relatives 340 patients risque Patients non trait s D c s oui non Infarctus oui 20 72 92 20 92 0 22 du myocarde non 17 231 248 17 248 0 07 37 303 340 On remarquera que les proportions de d c s sont assez faibles heureusement res pectivement 0
92. i t s fr quentistes qui justifient pleinement le nom de m thode bay sienne objective La probabilit de couverture de cet intervalle est tr s proche du seuil nominal m me pour des chantillons d effectifs tr s faibles Il se compare favorablement la plupart des intervalles fr quentistes disponibles et est recommandable m me d un point de vue fr quentiste comme l ont montr Brown Cai et DasGupta 2001 voir aussi Agresti amp Min 2005 We revisit the problem of interval estimation of a binomial proportion We begin by showing that the chaotic coverage properties of the Wald interval are far more persistent than is appreciated We recommend the Wilson interval or the equal tailed Jeffreys prior interval for small n Brown Cai amp DasGupta 2001 page 101 Intervalles de plus haute densit finale Une approche qui a t souvent recommand e par les bay siens est de consid rer l in tervalle de plus haute densit finale highest posterior density en bref HPD Pour un tel intervalle qui peut en fait si la distribution n est pas unimodale tre une r union d inter valles disjoints la densit de probabilit est plus lev e pour toute valeur l int rieur de V intervalle que pour toute valeur ext rieure Ceci r pond a l objectif d obtenir l intervalle le plus court possible Mais sauf pour une distribution sym trique chacune des probabi lit s lat rales sera diff
93. iable de distribution B ta A B soit inf rieure X L encadrement cherch est P1 P2 Revue MODULAD 2006 198 Num ro 35 N 1000 A 74 5 B 20 5 C 35 5 D 21 5 U 1 25 X 0 32 Y 0 80 L Y X N P1 0 P2 0 PY 1 Beta U X A B Faire XX X4 L PX Beta XX C D Beta X C D P2 P2 PX x PY PY 1 Beta U XX A B P1 Pl PX x PY X XX Jusqu a ce que X gt Y Un raffinement utile consiste diviser l ensemble des valeurs y en un certain nombre de zones en fonction de la forme de la densit et a utiliser des intervalles de largeur variable selon la zone On peut galement envisager un autre type d interpolation que l interpolation lin aire Il peut tre galement pr f rable dans certains cas d inverser le r le de y et de y2 Etc Comme pour les simulations ce sont notamment les cas particuliers o la densit de la distribution marginale n est pas born e qui peuvent n cessiter de tels raffinements Cette m thode peut tre ais ment g n ralis e Elle peut encore tre utilis e pour une fonction de trois param tres comme dans les probl mes diagnostic m dical et tude d un mod le logique qui conduit calculer les probabilit s de parall l pip des rectangles avec des temps de calcul qui restent tr s raisonnables PARTIE IV RETOUR SUR LES ASPECTS CONCEPTUELS L INTERFACE DE L INF RENCE FR QUENTISTE ET DE
94. if chantillonnage de Pascal dans lequel on arr te Vexp rience quand on a observ un nombre fix l avance a de succ s c est le nombre observations n qui est une variable al atoire Sa distribution d chantillonnage s crit et eee a 1 NC LR et la vraisemblance est encore Je n gt a v pla x y 1 y d o la m me proc dure 12 D rivation de la distribution pr dictive 12 1 Echantillonnage binomial Pour la distribution initiale p B ta ao bo la distribution pr dictive du nombre de succ s a pour un chantillon de taille n est Pr a Pr aly ply de lt p odo d o en utilisant l int grale B ta d finie pr c demmment la distribution n Bao a bo b al n a B ao bo qui est la distribution B ta binomiale ou distribution de Polya O lt a lt n Pr a 12 2 Echantillonnage binomial n gatif La distribution pr dictive du nombre d observations n pour un chantillon avec a succ s s obtient de la m me mani re On a dans ce cas n 1 B ao a bo n a a 1 n a B ao bo qui est la distribution B ta Pascal Pr n n gt a Revue MODULAD 2006 191 Num ro 35 13 Calcul des moments par m lange Esp rance condi tionnelle Les calculs par m lange sont caract ristiques de l inf rence bay sienne et fournissent des principes g n raux de d monstration En particulier il est souvent possible ainsi
95. ilier la th orie bay sienne avec la conception fr quentiste Dans cette perspective l approche d velopp e par Jef freys dans les ann es trente Jeffreys 1961 1939 a un statut privilegi Dans la ligne de Laplace 1986 1825 la philosophie de cette approche est de choisir les probabilit s ini tiales en cartant toute connaissance ventuelle sur la valeur du param tre En pratique ces probabilit s initiales non informatives sont des distributions vagues qui a priori ne favorisent aucune valeur aucune hypoth se particuli re En cons quence elles laissent les donn es parler pour elles m mes 1 A major goal of statistics indeed science is to find a completely coherent objective Bayesian methodology for learning from data This is exemplified by the attitudes of Jeffreys 1961 and Jaynes 1999 2003 2 Objective Bayesian analysis is the best method for objectively synthesizing and communicating the uncertainties that arise in a specific scenario but is not necessarily coherent in a more general sense My general view is that 1 is not attainable 2 is often attainable and should be done if possible Berger 2004 page 2 Sous cette forme le paradigme bay sien fournit sinon des m thodes objectives et compl tement coh rentes au moins des m thodes de r f rence pleinement justifi es et appropri es pour la communication scientifique En outre dans les situations courantes o l on utilise tr
96. ion du seuil Revue MODULAD 2006 206 Num ro 35 Pre gt p2 ni Pine 0 50 si V11 Va Vio 0 et V20 1 Pr s gt P2 nij Peze 0 25 si Vii V21 V20 0 et Vio 1 et si l on veut retenir une seule distribution non informative ceci sugg re comme choix privil gi la solution interm diaire 11 V21 0 et Vig V 1 2 qui est la solution de Jeffreys 17 R gle de Jeffreys 17 1 Information de Fisher et distribution non informative de Jeffreys Les consid rations pr c dentes fournissent une justification intuitive de la distribu tion non informative de Jeffreys La justification formelle est que celle ci est bas e sur l information de Fisher 1922 1925 Dans le cas d un seul param tre typiquement la proportion y l information de Fisher 4 apport e par un chantillon y est d finie partir de la vraisemblance v y y comme o 2 o I e1y E srsvtl Eo zzz evll et la densit de la distribution de Jeffreys est proportionnelle sa racine carr e paly x v Ilp 17 2 Deux distributions initiales pour les chantillonnages bino mial et de Pascal 17 2 1 Echantillonnage binomial n v ply v yla y 1 y 4 al n a et E alw nv On en d duit log u y a alogy n a log 1 y k o k est une constante et 1 a n a n n I E po 1 pla Fe Ge np 1 4 donc pyle x pTO p soit p B ta ih
97. ise ici pour la probabilit PR gt 1 25 un encadrement tr s large 0 3197 0 7113 mais si on retient la moyenne de ces deux probabilit s soit une interpolation lin aire on trouve une estimation de la probabilit 0 3197 0 7113 2 0 516 qui est tonnamment proche de la valeur exacte avec 3 d cimales 0 521 Cette m thode est donc efficace et reste rapide m me si on augmente sensiblement le nombre d intervalles Bien entendu comme toute m thode d int gration num rique elle peut tre raffin e A partir de l exemple pr c dent on voit imm diatement une am lioration tr s simple a apporter On tronquera l ensemble des valeurs possibles de ya de mani re liminer celles qui ne modifient pas la probabilit conjointe pour une pr cision donn e que l on peut contr ler Ainsi ici si on se limite l ensemble 0 32 0 80 on sait que l erreur sur la probabilit conjointe est inf rieure Pr ye 0 0 32 0 000001 En d coupant l ensemble 0 32 0 80 en 1000 intervalles on obtient l encadrement 0 5194 0 5221 d o la moyenne exacte avec 3 d cimales 0 521 si on n avait pas tronqu l ensemble on aurait obtenu pour le m me nombre d intervalles un encadrement moins pr cis 0 5185 0 5229 On trouvera ci apr s un exemple de programme effectuant le calcul pr c dent crit dans un pseudo langage Il suffit de disposer d une fonction Beta X A B qui retourne la probabilit qu une var
98. istribution de proba bilit voulue donc de programmer un algorithme qui g n re pseudo al atoirement des valeurs distribu es selon cette distribution L appellation de Monte Carlo provient natu rellement de la roulette de son casino consid r e comme un m canisme type pour g n rer des nombres au hasard Ces m thodes sont de plus en plus r pandues et de nombreuses variantes plus ou moins sophistiqu es selon la nature du probl me ont t mises au point voir notamment Tierney 1994 Chib amp Greenberg 1995 Gilks Richardson amp Spiegelhalter 1996 Gamerman 1997 Robert amp Casella 2004 Elles peuvent tre vir tuellement appliqu es a n importe quelle analyse bay sienne L int r t croissant pour ces techniques et leur r le de plus en plus important est par exemple attest par la place le chapitre 9 qui leur est maintenant consacr e dans la troisi me dition du livre de Lee 2004 Pour le lecteur int ress ce chapitre pourra constituer un tutoriel de base Ici je donnerai simplement des exemples de techniques de simulations l mentaires Je d crirai aussi une m thode d terministe simple et efficace mais souvent m connue 15 1 Des simulations l mentaires Consid rons titre d illustration le calcul de Pr gt u dans l exemple de la r gle d exp rimentation rejouez le gagnant On a les deux distributions finales ind pendantes p B ta 74 5 20 5 et y
99. itiale lt finale __ X observaTions distribution Initiale donn es Futures distribution finale Effet d ECO 1 580 b Cb C1 b n 0316227766016838 0 316 Os 1 22999548327987 1 230 degR s de libert q E 3 5 Ciel d ciMales 3 gt PrlX gt x Enonc s cliquer sur la distribution 5 CGl dl io COC o b dl o Ej effet ty cart a E effet calibr 5 1 580 0 3892 8 0 A5 1 285 0 3162 0 760 1 230 Le facteur d chelle e est le d nominateur de la statistique de test t usuelle puisque t d e en supposant d 0 Ae 5 donn es d t ta d 5 Par cons quent la distribution fiducio bay sienne de 6 peut tre directement d riv e de d et de t 4 062 Ce r sultat met en vidence la propri t fondamentale de la statistique de test t d tre un estimateur de la pr cision exp rimentale conditionnellement la valeur observ e d Plus pr cis ment d t estime la variance d erreur d chantillonnage e bo de d Revue MODULAD 2006 177 Num ro 35 9 4 Interpr tation fiducio bay sienne du seuil unilat ral Le seuil unilat ral Puni du test t est exactement la probabilit fiducio bay sienne que la vraie diff rence 6 soit de signe oppos a celui de la diff rence observ e Pour les donn es de Student Puni 0 0014 il y a une probabilit finale 0 14 que la diff rence soit n gative et la probabilit compl mentaire 99 86 qu elle soit positive
100. itiale noninformative B ta 1 2 1 2 qui donnera la m thode bay sienne objective je reviendrai galement sur ce choix plus loin Dans ce cas la distribution finale est B ta 10 5 10 5 et on obtient une probabilit lev e 0 971 que la m thode d enseignement soit inefficace p lt 0 70 Pr lt 0 70 a 10 Pr 0 70 lt y lt 0 85 a 10 Pry gt 0 85 ai 10 0 971 0 029 0 0001 L utilisation de l ordinateur r soud les calculs n cessaires pour l utilisation des distri butions bay siennes Cela donne l utilisateur un moyen la fois intuitif et attrayant pour comprendre les r les de la taille de l chantillon des donn es et de la distribution initiale En particulier la distribution finale peut tre visualis e et explor e interactivement LesProportions Dans LePAC activez le menu LesBay siens et le sous menu LesProportions ce qui affiche la fen tre pour l inf rence sur des proportions par d faut c est l option 1 groupe qui est active Entrez dans les champs appropri s les effectifs e pour 1 10 e pour 0 10 Entrez s il y a lieu les param tres de la distribution initiale b ta mais c est en principe inutile car c est l option par d faut e pour 1 0 5 que vous pouvez entrer comme 1 2 e pour 0 0 5 Remarque ces valeurs peuvent tre affich es en cliquant sur le bouton 1 2 S lectionnez les boutons d option e X lt e limit
101. jeu dans l approche fr quentiste Bernard 1996 Ainsi dans notre situation diff rentes distributions ont t propos es pour une analyse bay sienne objective pour une discussion voir par exemple Lee 2004 pages 79 81 La plupart appartiennent la famille des distributions B ta ao bo avec des valeurs de a et bo comprises entre 0 et 1 en particulier e B ta 1 1 qui est la distribution uniforme sur 0 1 Laplace 1774 e B ta 0 0 qui est une distribution impropre mais qui correspond la distribution uniforme pour log Lhoste 1923 Haldane 1948 e D ta 1 2 1 2 qui correspond la distribution uniforme pour arcsinus 7 Jeffreys 1961 Perks 1947 et qui est d riv e en utilisant la r gle de Jeffreys dont on trouvera la justification dans la partie IV 5 5 1 Interpr tation bay sienne du seuil observ Pour notre probl me il existe dans cette famille deux distributions initiales extr mes B ta 0 1 et B ta 1 0 qui sont respectivement la plus d favorable et la plus favorable par rapport l hypoth se nulle Les seuils de signification observ s associ s aux solutions incluante et excluante sont exactement les probabilit s bay siennes finales que soit plus petit que 0 70 la valeur sp cifi e par Ho respectivement associ es ces deux distributions initiales extr mes La distribution initiale de Jeffreys B ta 1 2 1 2 avec des poids gaux 1 2 est interm daire et
102. l rent et m me les utilisent Par exemple Pagano 1990 page 288 dans un ouvrage dont le titre affiche l objectif de faire comprendre la statistique understanding statistics d crit un intervalle de confiance 95 comme un intervalle such that the probability is 0 95 that the interval contains the population value Sous une autre forme on voit tr s couramment des interpr tations telles que avec 5 de risque de se tromper on peut dire que 7 est dans l intervalle 0 27 0 42 Revue MODULAD 2006 139 Num ro 35 D autre auteurs affirment que l interpr tation fr quentiste correcte qu ils d fendent peut tre exprim e comme nous pouvons tre confiants 95 que le param tre est contenu dans l intervalle par exemple Kirk 1982 page 43 nonce we can be 95 confident that the population mean is between 114 06 and 119 94 Il est difficile d imaginer que les lecteurs puissent comprendre que confiant renvoie une conception fr quentiste de la probabilit We statisticians will all be Bayesians in 2020 and then we can be a united profession Lindley in Smith 1995 page 317 La litt rature est remplie d interpr tations bay siennes des intervalles de confiance et des tests de signification Toutes les tentatives des fr quentistes pour corriger ces erre ments se sont r v l es vaines c est un combat perdu d avance En fait la plupart utili sateu
103. le et des donn es La moyenne finale peut tre crite sous la forme ag ta No ao n a x x No R notn N Ntn n Elle est donc gale poids relatif de l initiale x moyenne initiale poids relatif des donn es x moyenne observ e soit ici les moyenne finales 100 159 x 0 200 59 159 x 0 542 0 327 pour la distribution initiale y 3 20 80 100 159 x 0 980 59 159 x 0 542 0 818 pour la distribution initiale y 3 98 2 M langes de densit s B ta Une technique qui reste simple de mise en uvre est d utiliser une distribution initiale dont la densit est un m lange de densit s de distributions B ta la distribution finale tant encore un tel m lange Ceci peut avoir deux int r ts d une part approcher une distribution initiale com plexe quelconque qui n cessiterait le recours des m thodes d int gration num rique d autre part combiner diff rentes sources d informations ou diff rentes opinions A titre d illustration consid rons pour les m mes donn es un m lange des deux distributions pr c dentes avec des poids gaux soit yp 1 B ta 20 80 1 2B ta 98 2 o signifie que c est la densit de y qui est un m lange soit symboliquement p y bp Beta 20 80 pp B ta 98 2 Cette distribution ne doit pas tre confondue avec celle d une combinaison lin aire de deux variables ayant des distributions B ta ind pendantes qui aurait une densit beaucoup p
104. lent particuli rement importants pour le d veloppement m thodologique de l analyse bay sienne objective pour l analyse des donn es exp rimentales Revue MODULAD 2006 212 Num ro 35 18 5 1 L interface des inf rences fr quentiste et bay sienne M me si ce tutoriel d fend l id e que l approche bay sienne doit tre privil gi e cela devrait nous inviter ne pas radicaliser l opposition entre les inf rences bay sienne et fr quentiste mais plut t consid rer leur interface Bayarri et Berger 2004 font une pr sentation particuli rement int ressante de cette interface Ils mettent en avant le fait que l argument fr quentiste traditionnel qui met en jeu des r p titions du m me probl me avec diff rentes donn es ne correspond pas ce qui est fait en pratique En cons quence c est un principe fr quentiste bay sien conjoint qui est pertinent une proc dure donn e par exemple un intervalle de confiance 95 pour une moyenne sous le mod le Normal est en pratique utilis sur une s rie de diff rents probl mes met tant en jeu une s rie de diff rentes moyennes de distributions Normales avec une s rie correspondante de donn es page 60 Plus g n ralement ils passent en revue les questions actuelles pour une synth se bay sienne fr quentiste dans une perspective m thodologique Leur conclusion qui semble raisonnable est d esp rer une unification m thodologique
105. lus complexe La figure ci apr s montre la distribution initiale correspondante en noir qui est bimodale et la distribution finale en rouge celle ci peut tre compar e a la distribution finale objective en bleu LeB A Bay sien Dans la configuration de la figure pr c dente activez maintenant le bouton d option m lange de densit s B ta pour obtenir la figure ci apres 0 0 327 1 Revue MODULAD 2006 159 Num ro 35 En fait dans ce cas les donn es n 59 a 32 permettent en quelque sorte de trancher entre les deux distributions du m lange puisque la distribution finale est 0 999999903 B ta 52 107 amp 0 000000097 B ta 130 29 de sorte qu elle est virtuellement confondue avec la distribution B ta 52 107 associ e la distribution initiale B ta 20 80 consid r e pr c demment Avec 10 fois plus de donn es et la m me proportion observ e de succ s n 590 a 320 la distribution finale que l on peut voir sur la figure suivante serait prati quement indiscernable de la distribution B ta 340 350 associ e la distribution initiale B ta 20 80 mais elle se rapprocherait bien entendu de la solution objective LeB A Bay sien Dans la configuration de la figure pr c dente modifiez les donn es e pour 1 320 e pour 0 270 0 0493 1 Un autre exemple de m langes Lee 2004 page 59 donne un exemple sans doute plus r aliste d utili
106. multiplicative pr s celle associ e la comparaison de deux proportions binomiales ind pendantes Cependant ici seul n n11 Nio 721 Na est fix alors que pour deux chantillons binomiaux n11 Nio et Nn21 N20 sont tous les deux fix s 6 2 Solutions fr quentistes Alors que comme nous le verrons les proc dures bay siennes sont les m mes que pour deux chantillons binomiaux ind pendantes les proc dures fr quentistes sont diff rentes En effet m me si les fonctions de vraisemblance sont proportionnelles les probabilit s d obtenir n11 succ s au traitement t et na succ s au traitement ty avec la r gle rejouez le gagnant sont donn es par des distributions beaucoup plus complexes que la distribution Binomiale qui en outre ne sont bien entendu pas ind pendantes En raison de cette complexification seules des proc dures asymptotiques ont t propos es elles ne sont guere satisfaisantes en dehors d chantillons d effectif lev Revue MODULAD 2006 163 Num ro 35 6 3 Solution bay sienne Dans le cadre bay sien au contraire puisque leurs fonctions de vraisemblance sont proportionnelles les proc dures sur les param tres sont les m mes pour les deux mod les bien que les probabilit s d chantillonnage soient tres diff rentes Une solution simple et usuelle suppose deux distributions initiales B ta ind pendantes pour y et 42 respecti vement g B ta vir V10
107. n initiale de Jeffreys celle ci trouve ainsi une l gitimit nouvelle et apporte une r ponse au probl me de l vidence implicitement contenue dans le plan d exp rience Dans ce cadre nous pou vons obtenir une r ponse bay sienne coh rente et pleinement justifi e au probl me des analyses interm diaires Cette approche nouvelle a t d velopp e par Bunouf 2006 dans le cas de l inf rence sur une proportion avec analyses interm diaires Elle appara t prometteuse et offre des avantages d cisifs la fois d un point de vue bay sien et d un point de vue fr quentiste Bunouf amp Lecoutre 2006 REMARQUES FINALES ET QUELQUES TH MES POUR ALLER PLUS LOIN Le moment semble venu de parvenir des proc dures d analyse des donn es exp rimentales qui permettent de rem dier de mani re constructive aux mauvais usages des tests de si gnification usuels Il y a ind niablement une reconnaissance grandissante que l inf rence bay sienne peut tre id alement adapt e cet objectif Elle satisfait les demandes des scientifiques proc dures objectives incluant les seuils p traditionnels proc dures sur les grandeurs des effets allant au del des seuils p proc dures pour planifier et conduire les exp riences Revue MODULAD 2006 209 Num ro 35 Alors pourquoi les scientifiques et en particulier les exp rimentateurs alors qu ils apparaissent r ellement souhaiter un autre type d inf r
108. ns LePAC activez le menu LesDistributions et le sous menu Binomiale Stan dard ce qui affiche la fen tre pour la distribution Binomiale Entrez dans les champs appropri s les param tres de la distribution e pour y 0 70 ou simplement 7 e pour n 59 S lectionnez les boutons d option e Pr X gt x e probabilit Entrez dans le champ probabilit 0 05 et appuyez sur touche Entr e du clavier ou cliquez sur le bouton Calculer Vous obtenez la premi re figure ci apr s Pour la seconde figure recommencez avec 0 85 pour y et 0 80 pour la probabilit Vous pouvez s lectionner le nombre de d cimales voulues Pour obtenir une probabilit associ e une valeur donn e s lectionnez le bouton d option e Limite et entrez dans le champ limite la valeur dont vous voulez la probabilit Revue MODULAD 2006 143 Num ro 35 Il convient de noter qu en raison du caract re discret de la distribution le taux d erreur et la puissance r els ne peuvent pas tre gaux a et 1 8 mais leur sont respectivement inf rieur et sup rieur Je r ussis convaincre mon coll gue qu il serait pr f rable d arr ter l exp rimentation avant son terme si sa m thode se r v le inefficace compte tenu du fait que celle ci n cessite une enseignement individuel et est lourde mettre en uvre En cons quence il planifie une analyse interm diaire apr s l inclusion de 20 sujets Les notations sont r sum
109. nt donn s par la distribution d chantillonnage de n1 sous l hypoth se nulle Ho 1 Y2 conditionnellement n n11 et N21 qui est une distribution Hyperg om trique n gative ni n N11 noi Ho HypNEG n ni na soit ici HypNEG 5 1 1 d o Pine Pr HypNEG n nu na gt na 0 50 et Pere Pr HypNEG n nu na gt ni 0 25 16 5 R interpr tation bay sienne 16 5 1 Cas binomial Soit la distribution initiale y B ta 111 v10 et Yo B ta V21 V20 avec p et Yo ind pendantes On suppose que les 1 sont des entiers positifs ou nuls On a le r sultat suivant Pr 1 gt p2 m Pr Hyp n Vy My ot V21 l29 2 nir tva 1 tmo 1l lt nutvn soit si Vii Vio 1 Vii Var 1 et Va Vo 1 Pre gt go ns Pr Hyp n na ni lt ni vu Revue MODULAD 2006 205 Num ro 35 Par cons quent pour le cas binomial on a la r interpr tation du seuil Pre gt p2 nij Pine 0 70 S114 V20 1 et Vio V21 0 Pre gt P2 nij Pere 0 10 S114 V20 0 et Vio 21 1 et si l on veut retenir une seule distribution non informative ceci sugg re comme choix privil gi la solution interm diaire v11 Vio V Vo 1 2 qui est la solution de Jeffreys Le lien entre le seuil du test conditionnel et la probabilit bay sienne finale Pr y gt pa Niz r sulte encore de la relation fondamentale entre les fonctions de r partiti
110. nte relative aux trois groupes Cela pourrait notamment tre appropri si l on objectait que ces groupes ont t constitu s au vu des donn es et que cela impose donc d utiliser une m thode de comparaison multiple Cela ne soul ve pas de probl me conceptuel mais n cessite le recours une m thode d int gration num rique facile mettre en uvre par simulation Ici encore d autres analyses sont faciles envisager PARTIE III LES ASPECTS TECHNIQUES QUELQUES OUTILS DE BASE Revue MODULAD 2006 189 Num ro 35 11 D rivation de la distribution finale 11 1 Echantillonnage binomial Pour le mod le binomial de param tre y pour un chantillon de taille n avec a succ s et b n a checs la distribution d chantillonnage est n Pr aly ab Y 1 y 0 lt a lt n et la vraisemblance est u p a x 1 p 11 1 1 Distribution initiale B ta La distribution initiale a pour densit 1 ao 1 bo 1 Ae sn p L vi l B ao bo l o la fonction B ta compl te B ao bo est d finie partir de la fonction Gamma T T b B ao bo ao 0 T ao bo De T plp dy 1 on d duit l int grale B ta qui servira pour d river la distribution pr dictive 1 f 1 tde Blu v 0 Cette int grale permet galement de d river les moments de la distribution B ta j 1 B ao r bo rE o g j Mo Tj ao r 1 1 _ bo 1 gq as 0 370 a 0 7 i B ao bo l a B ao bo
111. ntif Patients trait s D c s oui non Infarctus oui 1 78 79 1 79 0 01 du myocarde non 13 265 278 13 278 0 05 14 343 357 Dans ce cas on esp re videmment que le traitement va r duire le nombre de d c s apr s infarctus Id alement s il n y avait aucun d c s cardiaque chez les patients trait s apr s un infarctus case ouioui vide on aurait l implication absolue Infarctus Non d c s On obtient les r sultats suivants pour cette implication Infarctus Non d c s H 1ewo 0 68 et Pr 0 10 lt mic wo lt 0 94 0 90 qui montrent qu ici en d pit d une valeur observ e nettement plus lev e de l indice on ne peut pas conclure l existence d une implication La grande largeur de l intervalle de cr dibilit indique que la pr cision est mauvaise ce qui est une cons quence des tr s faibles proportions de d c s observ es Bien entendu on ne peut pas non plus conclure qu il n a pas d implication ou que l implication est faible On voit ici le danger qu il y aurait interpr ter le r sultat non significatif des tests d ind pendance usuels le khi deux par exemple en faveur de l hypoth se d ind pendance Revue MODULAD 2006 173 Num ro 35 8 3 2 Interpr tation du seuil observ du test de permutation de Fisher Profitons en pour illustrer la r interpr tation bay sienne du test de permutation conditionnel aux marges Po
112. o B ta 35 5 21 5 Supposons que l on veuille calculer Pr gt 1 25 Il suffit de simuler un chantillon de taille N du couple 1 42 donc d effectuer N tirages selon la distribution conjointe On en d duira un chantillon de n importe quel param tre d riv auquel on s int resse par exemple la diff rence le rap port la moyenne le maximum etc permettant de calculer une probabilit relative ce param tre et bien d autres quantit s On trouvera ci apr s un exemple de programme crit dans un pseudo langage ef fectuant le calcul de Pi gt 1 25 Il suffit de disposer d une fonction rBeta A B qui retourne une valeur al atoire pour la distribution B ta A B P est une approximation de la probabilit cherch e 8Obtenir des formules explicites comme dans l exemple pr c dent du rapport deux distributions B ta ne r soud pas n cessairement tous les probl mes de calcul Ainsi le calcul de la fonction hy perg om trique 2F n cessite lui m me des m thodes num riques En outre ces formules ne sont valables que pour des entiers dans le cas de r els on peut encore obtenir des formules explicites pour les densit s mais le calcul de la fonction de r partition n cessite encore le calcul d une int grale Revue MODULAD 2006 195 Num ro 35 N 100000 A 74 5 B 20 5 C 35 5 D 21 5 U 1 25 I 0 M1 0 M2 0 Faire X rBeta A B Y rBeta C D R
113. obabilit s sont conditionnelles aux param tres qui sont suppos s connus Cela conduit en particulier e aux tests de signification dans lesquels la valeur d au moins un param tre est fix e par hypoth se e aux intervalles de confiance Mais les param tres ne peuvent pas et ne doivent pas tre probabilis s des fr quences empiriques ne sont pas disponibles 1 1 2 L inf rence bay sienne Dans l inf rence bay sienne au contraire les param tres peuvent aussi tre probabi lis s I en r sulte des distributions de probabilit qui expriment notre incertitude e avant les observations elle ne d pendent pas des donn es ce sont les probabilit s initiales ou a priori e apr s les observations conditionnelles aux donn es ce sont les probabilit s r vis es finales ou a posteriori e relatives des donn es futures ce sont les probabilit s pr dictives avant ou apr s les observations Remarque sur la terminologie Les appellations initiales et finales seront pr f r es ici a priori et a posteriori qui renvoient davantage une conception subjective De m me l appellation distribution de probabilit sera pr f r e loi qui voque une conception particuli re du hasard et de la probabilit 2 Une illustration simple Comme illustration simple consid rons la situation suivante On suppose une po pulation finie d effectif N 20 avec une variable dichotomique succ s chec
114. obtenez les inf rences sur l effet pr sent es plus loin Les tableaux ci apr s fournissent les donn es individuelles moyenn es pour chaque p sur les deux valeurs de n ainsi que les moyennes observ es et ajust es et les r sidus pour les trois groupes de sujets Revue MODULAD 2006 187 Num ro 35 groupe exponentiel 10 sujets pI 0 03 0 05 0 07 0 10 contraste pertinent 0 8625 0 7900 0 7200 0 5850 0 0024 0 9450 0 9250 0 9325 0 8725 0 0086 0 4850 0 4500 0 1775 0 0400 0 0501 0 6475 0 6400 0 4925 0 4400 0 0301 d 0 016 0 1900 0 1850 0 1400 0 1500 0 0107 s 0 023 0 4875 0 5000 0 2775 0 2225 0 0503 e 5 10 0 0074 0 4100 0 4850 0 4900 0 1400 0 0158 t d e 2 202 0 6500 0 5925 0 4200 0 3300 0 0269 0 7300 0 7150 0 6675 0 5300 0 0037 0 7200 0 7275 0 5900 0 4325 0 0224 moyenne observ e 0 613 0 601 0 491 0 374 moyenne ajust e 0 621 0 577 0 511 0 370 cart r sidu 0 009 0 024 0 020 0 005 groupe lin aire 4 sujets p 0 03 0 05 0 07 0 10 contraste pertinent 0 9025 0 8475 0 9125 0 7925 0 0235 d 0 007 0 8500 0 7950 0 6250 0 7150 0 0073 s 0 032 0 8500 0 7800 0 7800 0 6825 0 0427 e s V4 0 016 0 9350 0 8725 0 9050 0 8300 0 0256 t d e 0 457 moyenne observ e 0 884 0 824 0 806 0 755 moyenne ajust e 0 881 0 834 0 797 0 757 cart r sidu 0 004 0 011 0 009 0 002 g
115. ocedures for a Bernoulli process The American Statistician 50 7 13 Bernardo J M 1979 Reference posterior distributions for Bayesian inference with discussion Journal of the Royal Statistical Society Series B Methodological 41 113 147 Bernardo J M 1996 The concept of exchangeability and its applications Far East Journal of Mathematical Sciences 4 111 121 Bernardo J amp Smith A F M 1994 Bayesian Theory John Wiley amp Sons New York Revue MODULAD 2006 214 Num ro 35 Bernoulli J 1713 Ars Conjectandi English translation by Bing Sung as Technical report No 2 of the Department of Statistics of Harvard University February 12 1966 Basel Switzerland Berry D A 1991 Experimental design for drug development a Bayesian approach Journal of Biopharmaceutical Statististics 1 81 101 Berry D A 1997 Teaching elementary Bayesian statistics with real applications in science The American Statistician 51 241 246 Berry G amp Armitage P 1995 Mid P confidence intervals a brief review The Statis tician 44 417 423 Box G E P amp Tiao G C 1973 Bayesian Inference in Statistical Analysis Reading Addison Wesley MA Brown L D Cai T amp DasGupta A 2001 Interval estimation for a binomial propor tion with discussion Statistical Science 16 101 133 Bunouf P 2006 Lois Bay siennes a Priori dans un Plan Binomial S quentiel These de doctorat en
116. odes sont regroup s dans le logiciel LePAC qui peut tre t l charg l adresse http www univ rouen fr LMRS Persopage Lecoutre Eris On en trouvera une pr sentation dans un num ro pr c dent de la Revue de Modulad Lecoutre amp Poitevineau 2005 Dans ce qui suit sont fournis des crans ou plus souvent des extraits d crans des programmes utilis s Ceux ci sont pr c d s du nom du programme utilis LesDistributions LesProportions LeB A Bay sien LesMoyennes LesEffectifs ainsi que d un mode d emploi pour obtenir les r sultats pr sent s 5 Inf rence sur une proportion L objectif de ce premier exemple est de pr senter une transition en douceur des proc dures fr quentistes traditionnelles vers les proc dures bay siennes Techniquement simple il permettra d illustrer en d tail la m thodologie bay sienne 5 1 Le probl me Planification et conduite d une exp rimentation Supposons la situation suivante Un coll gue enseignant fr quentiste m affirme avoir d velopp une m thode d enseignement individuel de l intervalle de confiance conduisant un taux lev d interpr tations correctes Nous convenons que sa m thode est efficace si le taux d interpr tations correctes succ s y apr s l enseignement est sup rieur 0 85 et qu elle est inefficace si ce taux est inf rieur 0 70 Ma probabilit a priori
117. on des distributions B ta et Binomiale Il se d montre par m lange Conditionnellement yo on a Pr 1 gt ye P2 ns Pr B ta nii v11 Mio vio gt 2 Pr Bin P2 Ma Vir Mio vio 1 lt Nu vn Pr Bin Yo Ni vi Vio 1 lt N11 vu La probabilit marginale m lange de la probabilit binomiale par la distribution B ta 121 V20 est une distribution B ta Binomiale voir la section d rivation de la distribution pr dictive Pr ei gt pi ni Pr B ta Bin nai Va N20 V20 Na Var V0 1 lt ny 111 et en utilisant une autre relation remarquable entre la distribution B ta Binomiale et la distribution hyperg om trique Johnson Kotz amp Kemp 1992 Pr B ta Bin a b n lt u Pr Hyp a b n 1 a u 1 n lt u on d duit le r sultat nonc 16 5 2 Cas binomial n gatif Avec la m me distribution initiale que dans le cas pr c dent en utilisant une autre relation entre la distribution B ta Binomiale et la distribution hyperg om trique n gative Johnson Kotz amp Kemp 1992 Pr B ta Bin a b n lt u Pr HypNEG a b n u a gt n on obtient Pro gt pal ny Pr HypNEG n Hu tota 29 1 Nuit Na1 V21 gt na 1 01 soit si V11 Vo 0 et Vio V20 1 Pr er gt Yo nij Pr HupNEG n Nu Na gt na vio 1 Par cons quent pour le cas binomial n gatif on a la r interpr tat
118. oration par la somme des probabilit s associ es aux rectangles limit s a la base par les traits blancs La probabilit d un rectangle est simplement le produit des probabilit s marginales donn es par les distributions finales B ta ind pendantes On peut donc th oriquement approximer la probabilit cherch e avec une pr cision fix e l avance Comme illustration grossi re supposons que l on d coupe l ensemble des valeurs possibles de 42 l axe des abcisses soit 0 0 80 0 80 1 1 25 en 10 intervalles gaux x y sur la figure il y en a 25 On calcule les probabilit s des rectangles correspondants d o les r sultats suivants Revue MODULAD 2006 197 Num ro 35 majoration minoration z y Pr w x yl xPr p gt 1 252 x Pr y gt 1 25y 0 0 08 0 0000 x 1 0000 0 0000 x 1 0000 0 0000 0 08 0 16 0 0000 x 1 0000 0 0000 x 1 0000 0 0000 0 16 0 24 0 0000 x 1 0000 0 0000 x 1 0000 0 0000 0 24 0 32 0 0000 x 1 0000 0 0000 x 1 0000 0 0000 0 32 0 40 0 0003 x 1 0000 0 0003 x 1 0000 0 0003 0 40 0 48 0 0144 x 1 0000 0 0144 x 0 9999 0 0144 0 48 0 56 0 1489 x 0 9999 0 1489 x 0 9706 0 1445 0 56 0 64 0 4335 x 0 9706 0 4207 x 0 3697 0 1603 0 64 0 72 0 3431 x 0 3697 0 1269 x 0 0006 0 0002 0 72 0 80 0 0586 x 0 0006 0 00003 x 0 0000 0 0000 somme 0 7113 0 3197 Compte tenu du tr s petit nombre d intervalles on obtient sans surpr
119. ory of tests to discontinuous variables Biometrika 37 130 144 Walley P 1996 Inferences from multinomial data learning about a bag of marbles with discussion Journal of the Royal Statistical Society B 58 3 57 Wilkinson L and Task Force on Statistical Inference APA Board of Scientific Affairs 1999 Statistical Methods in Psychology Journals Guidelines and Explanations American Psychologist 54 594 604 Winkler R L 1974 Statistical analysis theory versus practice In The Concept of Probability in Psychological Experiments Ed C A S Sta l Von Holstein 127 140 D Reidel Dordrecht Pays Bas Ye K 1993 Reference priors when the stopping rule depends on the parameter of interest Journal of the American Statistical Association 88 360 363 Zaykin D V Meng Z amp Ghosh S K 2004 Interval estimation of genetic susceptibility for retrospective case control studies BMC Genetics 5 9 1 11 Zelen M 1969 Play the winner rule and the controlled clinical trial Journal of the American Statistical Association 64 131 146 1969 Zhou X H amp Qin G 2004 New intervals for the difference between two independent binomial proportions Journal of Statistical Planning and Inference 123 97 115 Zhou X H amp Qin G 2005 A new confidence interval for the difference between two binomial proportions of paired data Journal of Statistical Planning and Inference 128 527 542 Zhou X H amp Qin
120. our 0 1 2 S lectionnez les boutons d option e lt X lt e probabilit Entrez dans le champ probabilit 0 95 pour obtenir la figure ci apr s avec 3 d cimales pour la limite 1 9 1 18F 55 0 606 2 344 1 184 Pr0 712 lt 1 p lt 1 9841 0 950 5 5 3 Distributions initiales informatives L utilisation de distributions initiales non informatives a manifestement un statut privil gi pour obtenir des nonc s usage public Cependant d autres techniques bay siennes peuvent aussi avoir un r le important jouer dans la recherche exp rimentale En particulier elles sont id alement adapt es pour combiner des informations provenant de plusieurs sources et par suite pour planifier une s rie d exp riences Des utilisations plus ou moins r alistes et plus ou moins convaincantes de ces techniques ont t propos es Quand une analyse bay sienne objective sugg re une conclusion donn e diff rentes dis tributions a priori traduisant les r sultats d autres exp riences ou des opinions plus ou moins subjectives d experts soit sceptiques soit enthousiastes peuvent tre utilis es pour prouver la robustesse des conclusions voir en particulier Spiegelhalter Freedman amp Parmar 1994 On peut aussi consid rer que la construction d une distribution initiale partir d opi nions d experts du domaine peut tre utile dans certaines tudes mais cela n cessite des techniques a
121. oyenne 0 327 cart type 0 037 assym trie 0 116 aplatissement 2 983 m diane 0 326 quartiles 0 302 0 352 intervalle 95 0 Mais cette distribution initiale ne laissait aucune chance aux donn es d infirmer l opinion a priori puisque m me si on observait 59 succ s et 0 erreur on aurait quand meme Pr lt 0 70 a 59 0 99999995 La seconde permet une conclusion beaucoup moins d favorable la m thode d ensei gnement comme le montre la figure suivante LeB A Bay sien Dans la configuration de la figure pr c dente activez le deuxi me bouton d option de la colonne une seule distribution et entrez les les parametres de la distribution initiale voir la figure ci dessus e pour 1 98 e pour 0 2 tracer Initiale X PrfX lt x amp os A C PH finale 7 initiale B ta 1 2 1 2 x B ta 130 000 29 000 moyenne 0 818 cart type 0 031 assym trie 0 258 aplatissement 3 063 m diane 0 819 quartiles 0 798 0 839 intervalle 95 0 754 0 873 mais les donn es ne permettent cependant pas de conclure a son efficacit Pr gt 0 70 a 32 0 997 mais Pr gt 0 85 a 32 0 143 Revue MODULAD 2006 158 Num ro 35 Il est clairant d examiner l effet de la distribution initiale B ta ao bo sur la moyenne de la distribution finale En posant no ao bo les rapports no no n et n no n repr sentent les poids relatifs de la distribution initia
122. p Rosnow R L 1986 Interpretation of significance levels and effect sizes by psychological researchers American Psychologist 41 1299 1301 Novick M R amp Jackson P H 1974 Statistical Methods for Educational and Psycho logical Research McGraw Hill New York O Hagan A 1996 First Bayes Teaching package for elementary Bayesian Statistics http www tonyohagan co uk 1b Pagano R R 1990 Understanding statistics in the behavioral sciences 3 me dition West St Paul MN Perks W 1947 Some observations on inverse probability including a new indifference rule Journal of the Institute of Actuaries 73 285 312 Poitevineau J amp Lecoutre B 2001 The interpretation of significance levels by psy chological researchers The 05 cliff effect may be overstated Psychonomic Bulletin and Review 8 847 850 Rice W R 1988 A new probability model for determining exact P value for 2 x 2 contingency tables Biometrics 44 1 22 Robert C P 1992 L Analyse Statistique Bay sienne Economica Paris Robert C P amp Casella G 2004 Monte Carlo Statistical Methods Springer New York Rosenthal R amp Gaito J 1963 The interpretation of levels of significance by psycholo gical researchers Journal of Psychology 55 33 38 Rosenthal R amp Gaito J 1964 Further evidence for the cliff effect in the interpretation of levels of significance Psychological Reports 15 570
123. p rimentales En pratique deux probabilit s peuvent tre associ es de mani re routini re un intervalle d estimation pour un param tre calcul partir des donn es observ es e La premi re probabilit est la proportion des intervalles qui contiennent le param tre pour un grand nombre de r p titions elle est usuellement appel e la probabilit de couverture ou de recouvrement fr quentiste e La seconde probabilit est la probabilit bay sienne que cet intervalle contienne le param tre pour une certaine distribution initiale Dans l approche fr quentiste il est interdit d utiliser la seconde probabilit tandis que dans l approche bay sienne les deux probabilit s sont valides Pour de nombreuses raisons dues leur conception fr quentiste les intervalles de confiance peuvent difficilement appara tre comme LA m thode ultime En effet la raison qui les rend attrayants r sulte d une incompr hension fondamentale Il est si trange de traiter les donn es comme al atoires m me apr s avoir recueilli les observations que l interpr tation fr quentiste orthodoxe des intervalles de confiance n a pas de sens pour la plupart des utilisateurs C est indiscutablement l interpr tation bay sienne naturelle des intervalles de confiance qui les rend attrayants Ironiquement cette interpr tation h r tique est encourag e par la duplicit de la plupart des formateurs en statistique qui les to
124. p Pr a gt 47 a 20 et 1 1 0 95 0 9999997 0 85 0 990 0 70 0 482 Cette approche de la puissance pr dictive tant une approche hybride n est pas tr s satisfaisante En particulier elle ne nous donne pas une information bay sienne directe sur la distribution finale n est utilis e que comme interm diaire de calcul Ce qui est troublant est qu une d cision accepter Ho ou accepter Ha est prise l analyse terminale ou ventuellement l analyse interm diaire m me si la proportion observ e est situ e dans la r gion de non conclusion 0 70 0 85 auquel cas on n a videmment rien prouv pour ces hypoth ses Ce dont on a r ellement besoin c est de pouvoir valuer toute tape de l exp rience la probabilit des r gions sp cifi es auxquelles on s int resse et l aptitude d un chantillon futur corroborer les r sultats d j obtenus L analyse bay sienne traite directement ces questions 5 4 Solution bay sienne La m thodologie bay sienne nous permet d obtenir les probabilit s des r gions sp cifi es ce qui apporte des r ponses directes aux questions sur la grandeur des effets et n a pas de contrepartie fr quentiste Consid rons un nouvel exemple d analyse interm diaire avec 10 succ s observ es n 20 et a 10 Revue MODULAD 2006 146 Num ro 35 5 4 1 Evaluer la probabilit des r gions sp cifi es Choisissons la distribution in
125. ppropri e voir pour un exemple dans les essais cliniques Tan et al 2003 Il convient encore de mentionner le fait que les distributions pr dictives sont galement un outil utile pour construire une distribution initiale subjective car il est souvent plus facile d exprimer une opinion relativement des donn es attendues plut t qu des pa ram tres L utilisation de ces techniques pour l analyse des donn es exp rimentales n a cependant pas assez t explor e pour pouvoir r ellement appr cier leur apport notamment dans le cas o information a priori refl te d avantage une opinion qu un connaissance r elle Les exemples donn s ci apr s doivent tre vus comme des exercices pour mieux com prendre comment l inf rence bay sienne permet de combiner des informations Je laisse au lecteur le soin d exercer son esprit critique quant l apport de ces m thodes pour l analyse de donn es exp rimentales Distributions sceptiques et enthousiastes Revue MODULAD 2006 156 Num ro 35 Reprenons l exemple des donn es n 59 a 32 pour laquelle la proc dure bay sienne objective conduisait conclure que la m thode d enseignement tait inefficace 4 lt 0 70 Consid rons titre d illustration les deux distributions initiales respectivement a priori tr s sceptique et tr s enthousiaste envers la m thode p 20 80 de moyenne 0 200 pour laquelle Pr y lt 0 70 1 p B 98 2 de
126. pr diction sur Ensemble donn es Futures ensemble des valeurs pour les donn es futures remplissant les conditions 0 25 effectif Suppl mentaire 39 4 0 95 valeurs observ es possibles pour les donn es futures et probabilit s correspondantes Garantie voulue effectifs 10 garantie associ e l nonc sur le param tre probabilit pr dictive et probabilit cumul e 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 0 999 0 998 0 995 0 989 0 379 DISET 0 931 0 888 0 826 1 3417E 06 1 1329E 05 2111E 05 1 7277E 04 4 6136E 04 0 001 0 002 0 004 0 007 0 010 0 015 0 021 0 029 0 037 0 045 0 053 0 061 0 067 0 072 0 074 0 074 0 072 0 067 0 061 0 053 0 045 0 037 0 029 0 021 1 3417E 06 1 2670E 05 6 4782E 05 2 375SE 04 6 9891E 04 0 002 0 004 0 008 0 014 0 025 0 040 0 061 0 090 0 127 0 172 0 225 0 287 0 354 0 426 0 500 0 574 0 646 0 713 0 775 0 828 0 873 0 910 0 939 0 960 probabilit pr dictive 0 873 Le tableau ci apr s donne un r sum des analyses pour l exemple pr c dent ainsi que pour un autre exemple plus favorable a la m thode d enseignement Revue MODULAD 2006 149 Num ro 35 Distribution initiale B ta 1 2 1 2 Exemple 1 n 20 et a 10
127. priate adjustment in the degree to which one accepts or believes the hypothesis or hypotheses being tested Rozeboom 1960 in Morrison amp Henkel 1970 page 221 Une autre difficult vient de l insistance de certains th oriciens bay siens vouloir faire d pendre l inf rence statistique de la Th orie de la D cision S il peut tre difficile et sujet critique d assigner les probabilit s initiales il est encore bien plus probl matique de choisir une fonction de co t La cons quence de cette mise en avant des aspects subjectifs de l inf rence bay sienne et d une approche d cisionnelle a t d obscurcir sa contribution l analyse des donn es exp rimentales En fait la d finition bay sienne peut parfaitement tre utilis e pour d crire une connaissance objective en particulier bas e sur des arguments de sym trie ou sur des donn es de fr quences Il ne s agit pas d affirmer qu une analyse statistique peut tre Revue MODULAD 2006 140 Num ro 35 enti rement objective elle met n cessairement en jeu des l ments subjectifs notam ment le choix du mod le et comporte en fait une part de conventions Mais l inf rence statistique bay sienne n est pas moins objective que l inf rence fr quentiste C est m me le contraire dans de nombreux contextes 4 2 L inf rence fiducio bay siennne Il existe une voie de plus en plus reconnue qui vise conc
128. que la m thode soit inefficace est si lev e que je pense qu il n est pas n cessaire de recueillir des donn es Bien entendu mon coll gue ne peut pas tre convaincu par ce subjectivisme flagrant et il propose de planifier une exp rimentation dans le cadre fr quentiste traditionnel de Neyman Pearson Revue MODULAD 2006 142 Num ro 35 5 2 Une solution fr quentiste Test binomial et test d interrup tion stochastique 5 2 1 La planification de l exp rience Consid rant l hypoth se nulle Ho y 0 70 il d cide d utiliser un test binomial unilat ral pour un chantillon de taille fix avec des probabilit s d erreurs de Types I et IT respectivement gales a 0 05 et 0 20 soit une puissance 1 8 0 80 pour Vhypoth se alternative H y 0 85 celle qu il souhaite accepter Il correspond ces conditions un effectif de l chantillon n 59 pour lequel le test binomial rejette Hp au seuil 0 05 si le nombre de succ s observ a est plus grand que 47 En effet pour un chantillon de taille n la probabilit d observer a succes est donn e par la distribution Binomiale aly Bin y n Pr aly QG U 6 soit la fonction de vraisemblance u y donn es x y 1 vy Pour n 59 que l on trouve par it rations successives on obtient Pr a gt 47 Ho p 0 70 0 035 lt 0 05 a Pr a gt 47 Ha p 0 85 0 834 gt 0 80 1 8 LesDistributions Da
129. ral incluant est la proportion des tableaux pour lesquels n11 lt 1 soit Pine 1 6 10 0 70 Si on exclut la valeur observ e soit n11 lt 1 on obtient le seuil excluant Pere 1 10 0 10 Formellement ces seuils sont donn s par la distribution d chantillonnage de n11 sous l hypoth se nulle Ho yi y2 conditionnellement aux marges qui est une distribution Hyperg om trique Revue MODULAD 2006 204 Num ro 35 nil N1 N1 N2 N2 Ho Hyp n ni n soit ici Hyp 5 2 3 d o Pine Pr Hyp n na ni lt nu 0 70 et Pere Pr Hyp n na ni lt nu 0 10 16 4 2 Cas binomial n gatif Dans le cas binomial n gatif on retient par exemple n comme statistique de test et on calcule la proportion de tableaux possibles avec les m mes valeurs n n11 et nai et donc n et no qui sont plus extr mes que le tableau observ Il y a quatre types de tableaux de donn es possibles 110 1 11112 11213 113l 1 314 1 23 11112 110 1 2 3 5 2 3 5 2 3 5 2 3 5 1x4 4 2x3 6 3x2 6 4x1 4 la derni re ligne indiquant le nombre de tableaux du type Dans ce cas si on veut montrer que y lt p2 le seuil observ du test unilat ral incluant est la proportion des tableaux pour lesquels n gt 3 soit Si on exclut la valeur observ e soit n gt 3 on obtient le seuil excluant Perce 4 20 0 25 Formellement ces seuils so
130. re qu il est toujours plus grand que a le sens de l in galit d pendant du fait que l on consid re la limite inf rieure ou sup rieure On a encore pour le mod le binomial n gatif une galit du type Pr p f Pr v1f p fle mais dans ce cas Prt correspond la distribution initiale B ta 0 0 et Pra la distri bution initiale B ta 0 1 Ceci sugg re que si l on veut retenir une seule distribution non informative celle ci doit tre choisie comme interm diaire entre B ta 0 0 et B ta 0 1 Un choix natu rel est alors B ta 0 1 2 qui est la solution de Jeffreys C est effectivement la distribution initiale qui para t donner sur l ensemble des valeurs de a et de le meilleur taux de cou verture fr quentiste meilleur que celui obtenu pour la plupart des m thodes fr quentistes d intervalles de confiance Cai 2005 Revue MODULAD 2006 203 Num ro 35 Notons encore que le taux de couverture associ la distribution B ta 0 1 2 est toujours gal l un des deux taux associ s aux distributions B ta 0 0 et B ta 0 1 d pendant de y et a et non comme pour le mod le binomial ceux associ s aux deux distributions extr mes 16 3 G n ralisation aux tableaux 2x2 et tests conditionnels a la Fisher L exemple un mod le multinomial pour le tableau 2 x 2 a permis d illustrer la r interpr tation bay sienne du test de permutation de Fisher Ceci
131. roupe tout ou rien 4 sujets pI 0 03 0 05 0 07 0 10 contraste pertinent 0 8275 0 8800 0 2475 0 0800 0 1443 d 0 159 0 2075 0 4050 0 1800 0 0200 0 0677 s 0 071 0 8625 0 8200 0 0 0 1878 e 5 V4 0 036 1 1 0 0 0 2358 t d e 4 455 moyenne observ e 0 724 0 776 0 107 0 025 moyenne ajust e 0 808 0 543 0 301 0 019 cart r sidu 0 083 0 233 0 194 0 044 L analyse de la comparaison r siduelle conduit consid rer le contraste cubique avec des coefficients appropri s 0 1310 0 3668 0 3057 0 0699 Nous avons par exemple pour le groupe tout ou rien l effet observ associ au contraste pr c dent d 0 1310 x 0 724 3668 x 0 776 3057 x 0 107 0699 x 0 025 0 159 Par construction 0 159 est la moyenne quadratique des r sidus oo 0 233 0 194 0 044 _ i 0 159 d Revue MODULAD 2006 188 Num ro 35 On notera que les signes des coefficients ont t arbitrairement choisis de sorte qu une valeur de d n gative repr sente une chute de confiance une valeur positive traduisant au contraire une augmentation La situation g n rale trait e ici est l inf rence sur une combinaison lin aire de moyennes Nous avons deux objectifs distincts selon les groupes pour les groupes exponentiel et lin aire d montrer que l effet de chute est petit n gligeable et donc montrer que 6 est proche de
132. rs de l inf rence statistique sont des bay siens sans le savoir Lecoutre 1997 2005 4 L approche bay sienne objective 4 1 O est l objectivit A common misconception is that Bayesian analysis is a subjective theory this is neither true historically nor in practice The first Bayesians Bayes see Bayes 1763 and Laplace see Laplace 1812 performed Bayesian analysis using a constant prior distribution for unknown parameters Berger 2004 page 3 L inf rence statistique fr quentiste s auto proclame objective contrairement l inf rence bay sienne qui serait n cessairement subjective Cette affirmation se trouve renforc e par certaines conceptions bay siennes extr mistes dans lesquelles les opinions et non seulement les connaissances a priori pourraient devraient tre int gr es dans l inf rence scientifique Il n est donc pas tonnant que la critique la plus commune adress e par les fr quentistes l approche bay sienne soit la n cessit de probabilit s initiales Il est videmment facile dans l exemple pr c dent de choisir des probabilit s initiales quel conques ce que j ai fait titre d illustration des calculs Quelqu un de mal intentionn pourra alors dire juste titre que l on peut dans ce cas obtenir ce que l on veut But the primary aim of a scientific experiment is not to precipitate decisions but to make an appro
133. s 6 07 077 La traduction bay sienne de l exhaustivit est que la distribution finale ne d pend que de ces statistiques En particulier la distribution finale fiducio bay sienne ou bay sienne objective marginale de 6 est une distribution t g n ralis e Elle est centr e sur la diff rence moyenne observ e d 1 580 et a pour facteur d chelle e bs s yn 0 389 Cette distribution a le m me nombre de degr s de libert q n 1 9 que le test t Revue MODULAD 2006 176 Num ro 35 Elle s crit d et ou encore par analogie avec la distribution normale 6 donn es t d e soit ici 8 donn es 6 d s to 1 580 0 3897 Il faut noter que cette distribution ne doit pas tre confondue avec la distribution t noncentr e famili re aux utilisateurs de l analyse de la puissance LesMoyennes Dans LePAC activez le menu LesBay siens et le sous menu LesMoyennes ce qui affiche la fen tre pour l inf rence sur des moyennes Cliquez sur le bouton Exemples et cliquez sur Student ce qui affiche les valeurs pertinentes pour cet exemple dans une fen tre inf rence sur une moyenne Cliquez sur le bouton calculer pour obtenir le test de signification et diff rentes statistiques descriptives voir le d tail dans la liste d roulante t degr s de libert q 9 Puis cliquez sur le bouton ok pour obtenir la figure ci apr s raq LesMoyennes 1 Inf rence sur une moyenne DR in
134. sEffectifs 1 Inf rence sur Conclusion ar x Limite s effet notable L gt x OLT lt x 1 2 effet n gligeable proc dure fiducio bay sienne LT lt x y Garantie O slo effet n gligeabie proc dure fr quentiste O LEs lt x 0 95 it Information pans a tYpe de comparaison dy a 1 580 Effet connu zv nombre de groUpes b Ob CO 14b8 n9 0316 fe i a gt so O s pn Variance connue _n eFfectif par groupe P pRobabilit pr dictive ef fol foo _ i a 50 we i probabilit pr dictive P Ne effectif par groupe n J n 29 P 0 901 _ d ciMales ermer probabilit s ER af IL 9 8 Autres analyses On peut aussi facilement effectuer des inf rences sur l cart type o ou sur la variance et sur la diff rence calibr e ou standardis e 2 voir Lecoutre 1996a ou encore une pr diction sur l analyse finale une tape interm diaire Lecoutre 2001 etc Les m mes techniques peuvent tre utilis es avec une distribution initiale conjugu e puisque la distribution finale est du m me type que la distribution fiducio bay sienne LesMoyennes Dans la situation de la figure pr c dente fermez le programme LesEffectifs pour revenir la fen tre principale du programme LesMoyennes si besoin activez ce programme cliquez sur le bouton Exemples puis s lectionnez Student ce qui affiche les valeurs pertinentes pour cet exemple dans
135. sation de m langes Cet exemple est emprunt Diaconis et Ylvisaker 1985 On part de la constatation sui vante quand on lance en l air un grand nombre de fois une pi ce de monnaie on obtient approximativement une proportion 1 2 de Face mais lorsqu on la fait tourner sur elle m me on obtient des proportions telles que 1 3 ou 2 3 Admettant ce r sultat on peut consid rer qu un m lange de deux densit s de distributions B ta de moyennes respectives 1 3 et 2 3 est un choix appropri pour la distribution initiale de la proportion 4 de Face soit par exemple yp 1 B ta 10 20 1 2B ta 20 10 Si pour une pi ce donn e on fait n 10 essais et si on observe a 3 Face la distribution finale est 115 14 B ta 13 2 B ta 23 17 E ta 13 DS 5 ta 23 17 Elle a pour moyenne 0 352 et donne un intervalle de cr dibilit 95 0 194 0 633 Pour comparaison la distribution finale objective a pour moyenne 0 318 avec un intervalle de cr dibilit 95 0 093 0 606 Si on fait n 100 essais et si on observe a 30 Face la distribution finale de moyenne 0 308 est Revue MODULAD 2006 160 Num ro 35 p 0 9984 B ta 40 90 amp 0 0016 B ta 50 80 L intervalle de cr dibilit 95 est 0 232 0 390 qui est bien entendu dans ce cas beaucoup plus proche de celui obtenu pour la solution objective 0 217 0 395 On peut choisir des poids diff rents ou encore faire intervenir dans le m
136. ste que le seuil observ en lui m me ne dit rien Revue MODULAD 2006 178 Num ro 35 sur la grandeur de D une part un r sultat m me hautement significatif Puniu tr s petit permet seulement de conclure que 6 a le m me signe que la diff rence observ e d D autre part un r sultat non significatif n est en toute rigueur qu un constat d igno rance comme cela est illustr par l interpr tation fiducio bay sienne Pr lt 0 Pr gt 0 1 2 d un test parfaitement non significatif soit d 0 9 5 Interpr tation fiducio bay sienne de l intervalle de confiance fr quentiste Il y a une probabilit ou garantie 95 que soit compris entre les limites fix es de l intervalle de confiance fr quentiste conditionnellement aux donn es soit ici entre 0 70 et 2 46 heures Pr 0 70 lt 6 lt 2 46 donn es 0 95 LesMoyennes Dans la situation de la figure pr c dente s lectionnez le bouton d option e garantie et entrez dans le champ garantie 0 95 que vous pouvez s lectionner dans la liste d roulante pour obtenir la figure ci apr s avec 2 d cimales pour les limites Activez si besoin la case a cocher intervalle X interValle garantie 0 9500 E garantie 0 9500 effet HQE 6 7 4f1 500 0 389 6 5 1 580 0 3897 d ciMales garAntie os probabilit s deUx limites J 2 aff gt eXprimer les limites en fon
137. t dire au lieu d appliquer des proc dures rituelles Des proc dures bay siennes de routine sont d sormais faciles mettre en uvre pour toutes les situations courantes Leurs r sultats peuvent tre pr sent s sous une forme intuitivement s duisante et facilement interpr table Elles ouvrent une nouvelle voie prometteuse dans la m thodologie statistique INTRODUCTION La motivation m thodologique The test provides neither the necessary nor the sufficient scope or type of knowledge that basic scientific social research requires Morrison amp Henkel 1969 La motivation m thodologique r sulte de l examen de l tat actuel de l utilisation de l inf rence statistique dans la recherche exp rimentale Celle ci est confront e une situation paradoxale 1Je remercie Jacques Poitevineau pour son aide dans la t che ingrate de relecture de ce texte J assume l enti re responsabilit des fautes et erreurs qui peuvent subsister Revue MODULAD 2006 130 Num ro 35 Les tests ne r pondent pas aux bonnes questions D une part les tests de signification de l hypoth se nulle en anglais Null Hypothesis Significance Tests NHST sont consid r s dans la plupart des publications scientifiques comme une norme incontournable et apparaissent souvent comme une garantie de scienti ficit Mais d autre part ces tests conduisent d innombrables erreurs d interpr tations et mau
138. t resse a d j t observ 2 les patients inclus d finitivement censur s 3 les patients inclus pour lesquels la p riode d observation maximale n est pas encore atteinte En cons quence les donn es manquantes pr dire concernent respectivement les patients de cette derni re cat gorie pour lesquels nous avont une information partielle et les futurs patients dont l inclusion est planifi e pour lesquels nous n avons pas d information directe L approche bay sienne traite cette situation de mani re directe et efficace Lecoutre Mabika amp Derzko 2002 On peut encore souligner le fait que les distributions pr dictives sont galement un outil utile pour construire une distribution initiale subjective du fait qu il est g n ralement plus facile d exprimer une opinion relative des donn es 18 4 Calculs bay siens et logiciels statistiques Il y a actuellement de plus en plus d applications de l inf rence bay sienne g n raux l analyse des donn es exp rimentales Mais un obstacle une utilisation routini re des m thodes bay siennes objectives est l absence de logiciels g n raux faciles d utilisation et conviviaux qui seraient une contrepartie des logiciels fr quentistes standard On peut esp rer que cet obstacle sera lev dans le futur Quelques programmes ont t d velopp s dans le but d enseigner l inf rence bay sienne l mentaire voir notamment First Bayes O Hagan 1996 e
139. t la distribu tion finale de qui en r sulte La solution la plus simple est de choisir comme distribution initiale une distribution conjugu e PT B ta ao bo L avantage est que la distribution finale est galement une distribution B ta ce qui explique l appellation conjugu e Les poids initiaux ao et bo s ajoutent aux effectifs observ s a et b soit p da B ta ay ao bi bo et la distribution pr dictive qui est un m lange de distributions Binomiales s appelle tout naturellement une distribution B ta Binomiale az ai B ta Bin a ao b bo no Pour obtenir la puissance pr dictive on choisit une distribution initiale non informa tive Celle ci correspond des poids ao et bo faibles compris entre 0 et 1 Ici je retiendrai la distribution initiale p B ta 0 1 un choix qui est coh rent avec la proc dure de test utilis e j y reviendrai plus loin Reprenons l exemple trait ci dessus en 1 soit ny 20 et ai 20 La probabilit pr dictive de rejeter Hy au terme pr vu n 59 prend explicitement en compte les donn es disponibles aucune erreur n a t observ e Elle est donn e par la distribution B ta Bin 20 1 39 et est sans surprise largement sup rieure la probabilit conditionnelle la valeur sp cifi e par l hypoth se nulle p 0 70 Pr a gt 47 a 20 Pr ay gt 27 a 20 0 997 gt 0 80 d o la d cision d interrompre l
140. t un ensemble de macros pour Minitab Albert 1996 Les logiciels que nous avons d velopp s et illustr s en partie ici ont une perspective plus ambitieuse En particulier PAC est une programme g n ral d analyse de variance qui inclut la fois les pratiques fr quentistes traditionnelles tests de signification intervalles de confiance et des proc dures bay siennes de routine initiales non informatives et conjugu es Ces proc dures sont applicables des plans d exp rience g neraux en particulier plans mesures r p t es quilibr s ou d s quilibr s avec des donn es univari es ou multivari es et des covariables A un niveau plus avanc et plus g n ral WinBUGS une partie du BUGS project est un logiciel g n ral souple et efficace Son objectif d clar et de rendre la pratique des m thodes MCMC Monte Carlo par Cha nes de Markov disponibles aux statisticiens Il contribue ind niablement l utilisation croissante de l inf rence bay sienne pour des appli cations r elles Il peut tre gratuitement t l charg l adresse Internet http www mrc bsu cam ac uk bugs welcome shtml Cependant il peut tre difficilement recommand des d butants s ils ne sont pas fortement motiv s 18 5 Quelques th mes pour aller plus loin Il n est pas dans mon intention de donner ici une liste de th mes exhaustive mais seulement de pr senter quelques domaines de recherche qui me semb
141. tant toujours gal l un des deux taux associ s ces distributions extr mes d pendant de y et n Comparons cette situation ce qui se passe dans le cas continu par exemple pour l inf rence sur la moyenne p d une distribution Normale N u 1 partir d un chantillon de taille n On a pour la moyenne observ e la distribution d chantillonnage Normale N u 1 n On remarque que l on a dans ce cas pour une distribution initiale uniforme la distribution finale N m 1 n d o l galit des densit s plu m p m u En fait dans le cas de l inf rence sur une moyenne la densit de la distribution d chantillonnage de la statistique m est une fonction sym trique de m et du param tre u ce que l on peut voir intuitivement comme un argument de type fiduciaire justifiant le choix de la distribution initiale uniforme Dans le cas de l inf rence sur une proportion on ne peut pas avoir directement un tel argument de sym trie puisque la statistique est discr te et le param tre continu mais l galit pr c dente est remplac e par Pr e f Pr lel f p fle qui en constitue une extension naturelle Revue MODULAD 2006 201 Num ro 35 Ceci conduit a consid rer ici comme probabilit fiducio bay sienne non pas une seule valeur mais un intervalle constitu par les deux probabilit s associ es aux deux distributions extr mes On rejoint ici la notion de probabilit impr cise voir
142. test de permutation de Fisher pour Vhypoth se nulle p 1 c est dire 11 0 En inversant ce test conditionnel on peut construire un intervalle de confiance pour le produit crois p On en d duit un intervalle pour 711 en rempla ant p par ses limites de confiance dans l expression suivante qui donne 711 en fonction de p 1 0 11 pa 41 91 1 1 palp 1 4 1 9 10 p 1 2 p gt 1 91 1 g Malheureusement ces limites d pendent des vraies marges y et y1 La procedure la plus courante consiste simplement remplacer ces param tres parasites par leurs esti mateurs f et f Elle est nettement plus performante que les solutions asymptotiques mais n est pas satisfaisante pour des valeurs extr mes des param tres M me si on peut trouver des principes plus efficaces pour traiter les param tres parasites par exemple Toecher 1950 Rice 1988 on se trouve ici confront un ternel probl me qui est bien entendu compl tement vit par l approche bay sienne 711 8 3 Solution bay sienne La solution bay sienne pour un mod le d chantillonnage multinomial est une g n ralisation imm diate du cas binomial Choisissons une distribution initiale conjugu e de Dirichlet qui est une g n ralisation multidimensionnelle de la distribution B ta p11 P10 Por Poo Dirichlet v11 Vio Vor Voo La distribution finale est galement une distribution de Diric
143. trie et M thodes bay siennes 14 Soci t Fran aise de Biom trie Paris 1 23 Lecoutre B Poitevineau J amp Lecoutre M P 2005 Une raison pour ne pas aban donner les tests de signification de l hypoth se nulle A reason why not to ban Null Hypothesis S ignificance Tests La Revue de Modulad 33 243 253 Lecoutre M P 2000 And What about the researcher s point of view In H Rouanet J M Bernard M C Bert B Lecoutre M P Lecoutre amp B Le Roux New ways in statistical methodology From significance tests to Bayesian inference 2 me dition 65 95 Peter Lang Bern SW Lecoutre M P Poitevineau J amp Lecoutre B 2003 Even statisticians are not immune to misinterpretations of Null Hypothesis Significance Tests International Journal of Psychology 38 37 45 Lee P 2004 Bayesian Statistics An Introduction 3rd edition Oxford University Press New York Lhoste E 1923 Le Calcul des probabilit s appliqu l artillerie lois de probabilit a priori Revue d artillerie 91 Lindley D V 1993 The analysis of experimental data The appreciation of tea and wine Teaching Statistics 15 22 25 Morrison D E amp Henkel R E 1969 Significance tests reconsidered The American Sociologist 4 131 140 Mossman D amp Berger J 2001 Intervals for post test probabilities a comparison of five methods Medical Decision Making 21 498 507 Nelson N Rosenthal R am
144. ue en soustrayant 1 de 2 Les dix diff rences individuelles ainsi obtenues sont donn es dans le tableau suivant 1 2 2 4 13 13 0 1 0 1 8 0 8 4 6 1 4 n 10 Revue MODULAD 2006 175 Num ro 35 9 2 Solutions fr quentistes le test t usuel et l intervalle de confiance Student calculait alors la moyenne 1 580 d et l cart type non corrig standard 1 167 soit s 1 230 corrig pour les degr s de libert de cette s rie Il concluait alors a partir de sa table de la distribution t the probability is 9985 or the odds are about 666 to 1 that 2 is the better soporific ce qui n est certainement pas une formulation fr quentiste orthodoxe En termes modernes nous calculons la statistique de test t pour l inf rence sur une moyenne sous le mod le normal t 1 580 1 230 10 4 062 et nous trouvons le seuil unilat ral Pun 0 0014 9 dl soit 1 Puni 0 9986 qui correspond la valeur 9985 calcul e par Student les calculs tant effectu s ici partir des donn es avec la pr cision maximale Pour les g n ralisations ult rieures il est commode d introduire la notation b 1 n Nous obtenons alors l intervalle de confiance 1 a partir du 100 1 4 me percentile de la distribution de Student q n 1 degr s de libert d pe 2 soit ici pour a 0 05 l intervalle 0 70 2 46 1 a
145. ue cas 1 2 mais c est en principe inutile car c est l option par d faut S lectionnez les boutons d option e pour l implication v1 wl c est loption par d faut e pour l nonc lt 7 lt e pour la courbe Pr X gt x Revue MODULAD 2006 172 Num ro 35 e probabilit Entrez dans le champ probabilit 0 90 pour obtenir la figure ci apr s avec 3 d cimales pour la limite a LesProportions 1 BAR 1 groupe 2 groupes ind pendants Leslmplications Fermer Donn es v1 v0 w1 w0 initiale lt finale _ implicAtion effectifs Initiale b ta Cv ml Cv w0 Cwlovi Cw v1 n v1 w1 ci Pawo P vivo w w0 w w0 v1 20 72 92 vi fizz 172 v0 17 231 248 x0 f172 172 37 303 340 7 Cot1211 10 01 H vl gt w1 1 fo f f wifwo 0 122 e Proc dures fr quentistes x inclusif 1 000 Enonc Ei C Lim 0 063 normal 0 058 0 186 Cue Limites log normal 0 056 0 183 C wp 0 190 conditionnel exclusif 0 071 0 1 70 6 onc conditionnel inclusif 0 060 0 181 c conditionnel mid 0 065 0 176 nen Probabilit 0 90 C amp L De Dirichlet 20 5 72 5 17 5 231 5 CourBe C pfx amp Dirichlet 20 5 72 5 17 5 231 5 C PrfX lt x KO Prfx gt x tirer un cHantillon 10000 EG Prf0 063 lt n lt 0 190 0 90 On dispose galement des donn es suivantes relatives 357 patients ayant re u un traitement m dical titre pr ve
146. ur le test unilat ral usuel solution incluante l hypoth se nulle Ho Nyieswo 0 n est pas rejet e le seuil observ tant Pine 0 145 On sait que ce test est conservateur mais si on adopte la solution excluante on obtient un seuil nettement plus petit Pere 0 028 ceci tant du la mauvaise pr cision exp rimentale G n ralisant le cas d une proportion il existe deux distributions initiales non informatives extr mes qui donnent une interpr tation clairante de ces seuils Pretest lt 0 0 145 Pine pour la distribution initiale Dirichlet 1 0 0 1 la plus d favorable Ho soit la distribution finale Dirichlet 2 78 13 266 PU Gye lt 0 0 028 Pere pour la distribution initiale Dirichlet 0 1 1 0 la plus favorable Ho soit la distribution finale Dirichlet 1 79 14 265 Pr Miccwo lt 0 0 072 amp PineEPexe 0 086 pour la distribution initiale Dirichlet 1 2 1 2 1 2 1 2 soit la distribution finale Dirichlet 1 5 78 5 13 5 265 5 LesProportions Dans la configuration de la figure pr c dente entrez maintenant les donn es e pour v1 1 w1 et 78 w0 e pour v0 13 w1 et 265 w0 Entrez la distribution initiale b ta e pour v1 1 w1 et 0 w0 e pour vO O w1 et 1 w0 S lectionnez les boutons d option e pour l implication v1 w0 e pour l nonc 7 lt e pour la courbe Pr X gt x e limite Entrez dans le
147. vais usages Leur utilisation a d ailleurs t explicitement proscrite par les scienti fiques les plus minents et les plus avertis tant sur des arguments th oriques que sur de consid rations m thodologiques Pour interpr ter leurs donn es les utilisateurs doivent recourir une synth se na ve des r sultats des tests de signification avec d autres informations d o un malaise qui va grandissant Pour r pondre ce malaise un processus de d finition de nouvelles normes de publication pour la recherche exp rimentale a t engag C est pourquoi l poque actuelle est une charni re cruciale Vers de nouvelles normes de publications Des changements dans la fa on de rapporter les r sultats exp rimentaux sont de fait de plus en plus exig s par les revues exp rimentales ceci dans tous les domaines Ces changements concernent tout particuli rement la pr sentation et l interpr tation de la grandeur des effets les effect sizes Il s agit de fournir des indicateurs de ces effets ainsi que leurs estimations par intervalle interval estimates en plus ou la place des tests En Psychologie par exemple cette n cessit de changements a t rendue officielle par l American Psychological Association APA 2001 Les recommandations faites cette oc casion voir Wilkinson et al 1999 sont r v latrices de ce que pourrait tre l volution des pratiques Mais si on les examine en d tail
148. vations des auteurs tait que les approches fr quentistes pr c demment d velopp es taient soit difficiles appliquer soit relativement peu performantes 7 3 Solution bay sienne Au contraire la solution bay sienne utilisant trois distribution initiales B ta ind pendantes pour les y est conceptuellement tr s simple C est une g n ralisation imm diate de l inf rence sur deux proportions binomiales En particulier pour la solution non infor mative de Jeffreys trois distributions y B ta 1 2 1 2 ind pendantes la proc dure est tres performante d un point de vue fr quentiste A great frequentist confidence procedure Berger 2004 On peut ainsi conclure ironiquement avec Berger que cette proc dure est une grande proc dure de confiance fr quentiste De la distribution finale conjointe encore trois dis tributions B ta ind pendantes on d duit facilement par une m thode num rique un intervalle de cr dibilit pour 0 Ce probl me a galement t trait dans un contexte diff rent par Zaykin Meng et Ghosh 2004 Ceux ci consid rent outre la solution pr c dente le cas le plus simple o po est une valeur donn e ainsi que le cas o la distribution de yo est une distribution uniforme sur un intervalle fix a priori non r vis e par les donn es 7 3 1 Exemple num rique Consid rons les donn es suivantes Mosmann et Berger 2001 page 505 no 30 ao 7 n 20 ai
149. vec b 0 316 q n 1 9 t 42 262 Jn 9 3 Solution fiducio bay sienne Cet exemple historique de Student est une application typique de l approche que nous appelons l analyse sp cifique Rouanet amp lecoutre 1983 Lecoutre 1984 2005 2006 Le coutre et al 2000 Les donn es de base sont pour chacun des n 10 patients la diff rence entre les heures de sommeil suppl mentaires obtenues par l usage d un somnif re hyos cyamine hydobromide les heures de sommeil tant mesur es avant et apr s traitement avec soit 1 dextro hyoscyamine hydobromide soit 2 l vo hyoscyamine hydobromide on notera que ces donn es de base sont elles m mes d j des donn es d riv es L analyse de Student est un exemple typique d inf rence sp cifique elle est effectu e directement partir des donn es d riv es pertinentes et ne met en jeu que l inf rence sur la moyenne d une distribution normale Nous pouvons appliquer aux donn es pr c dentes l inf rence bay sienne l mentaire sur la moyenne avec seulement deux param tres la diff rence moyenne de la population 6 et la variance o Ici d et s sont des statistiques conjointement exhaustives pour le couple 5 07 elles ont les distributions d chantillonnage ind pendantes respectives avec les notations b 1 n et q n 1 introduites pr c demment d 6 07 N 6 b 0 x s 8 o One que l on notera plus simplement
150. www meteofrance com FR glossaire designation 1036_curieux_view jsp On no tera que cette d finition est r serv e aux curieux ce qui favorise plus ou moins volontai rement l interpr tation bay sienne Il est int ressant ce propos de constater que le service m t orologique d Environnement Canada donne au contraire explicitement une d finition bay sienne de la probabilit de pr cipitations d finie comme une estimation num rique subjective des risques de pr cipitations mesurables tout point du secteur vis Par exemple si la probabi lit de pluie est de 40 p 100 pour aujourd hui il existe quatre chances sur 10 pour qu il pleu ve http www smc ec gc ca cd brochures probability_f cfm Cela n implique videmment pas que cette estimation soit moins objective que l indice de m t o France Revue MODULAD 2006 133 Num ro 35 L inf rence statistique fait typiquement intervenir la fois des quantit s connues les donn es observ es et des quantit s inconnues les param tres et les donn es qui n ont pas t observ es Le d bat se pose alors en ces termes est ce que les probabilit s devraient seulement tre relatives aux donn es et tre bas es sur des fr quences ou est ce qu elles doivent aussi d appliquer aux param tres et tre consid r es comme des mesures de croyance 1 1 1 L inf rence fr quentiste Dans l inf rence fr quentiste toutes les pr
151. y B ay b1 B a T b B a if by B a1 b1 B a2 b2 Moy p2 Moy r ag gt r Ainsi dans l exemple consid r pour la r gle d exp rimentation rejouez le gagnant on a les deux distributions finales ind pendantes y B ta 74 5 20 5 et 2 B ta 35 5 21 5 d o notamment at a2 bo 1 1 2729 a by ag 1 Moy r a 1 a2 bo 2 N M 2 M 1 6436 d o et 0 1525 Der 0 MU o ety 7 14 Calcul des densit s et fonctions de r partitions par m lange Le m me principe de m lange s applique aux densit s et aux fonctions de r partition 14 1 Exemple 1 D rivation de la distribution du t de Student Ainsi la distribution du t de Student est classiquement d finie comme le rapport t x y o x et y ont des distributions ind pendantes respectivement N 0 1 et xa Plut t que d expliciter la distribution conjointe du couple X Y et d effectuer un chan gement de variable crivons t y N 0 3 Nous en d duisons directement p t J i y p y dy On peut ainsi m me si le calcul est formellement quivalent viter le calcul du Jacobien li un changement de variable et obtenir plus facilement des formules appropri es En outre la d finition de la distribution de Student comme m lange est celle qui intervient naturellement dans l inf rence bay sienne Bien entendu les moments s obtiennent encore par m lange par ex
152. z ro 6 lt pour le groupe tout ou rien d montrer que l effet de chute est grand notable et donc montrer que est sup rieur une valeur positive jug e suffisante gt 10 3 Solution fiducio bay sienne partir des donn es individuelles constitu es par le contraste pertinent voir ta bleau 1 nous sommes ramen s l inf rence sur une moyenne trait e pr c demment Nous en d duisons les distributions fiducio bay siennes pour Groupe exponentiel t t9 0 016 0 0077 Groupe lin aire t t4 0 007 0 0167 Groupe tout ou rien t t4 0 159 0 0367 et les nonc s pertinents sur l effet de chute de confiance e pour d montrer que l effet de chute est n gligeable Groupe exponentiel n 10 Pr d lt 0 030 0 95 Groupe lin aire n 4 Pr d lt 0 052 0 95 e pour d montrer que l effet de chute est notable Groupe tout ou rien n 4 Pr d lt 0 075 0 95 Il est manifeste que le groupe minoritaire tout ou rien est largement responsable de l effet de chute moyen La m thodologie bay sienne offre une grande souplesse en permet tant de choisir le type d nonc le plus appropri au vu des donn es Un nonc particulier sur un param tre n est qu une des fa ons possibles de r sumer la distribution finale Cela la rend id alement adapt e pour tendre une analyse de donn es exploratoire Bien entendu on pourrait calculer une probabilit conjoi
Download Pdf Manuals
Related Search
Related Contents
QC5580 AVRIL 2012 Sur un air de juin, 1ère édition User Manual - B&H Photo Video Digital Cameras, Photography Dunkin Donuts Trainer Booklet.fm Copyright © All rights reserved.
Failed to retrieve file