Home
Version pdf de ce document - Le Cermics
Contents
1. 9 ici m 9 X grand 1 n uin 0 m Ensuite on compte le nombre d occurences des chiffres 0 9 dans X function N l occurences X m X est une matrice dont chaque ligne est la r alisation de variables al atoires valeurs dans 0 m mx size X r taille de l chantillon N zeros mx m 1 for i 1 m 1 N i sum X i 1 c end endfunction Puis on utilise la fonction on teste K fois le g n rateur avec n tirages de la loi uniforme sur 0 m chaque test function nb_rejets test_generateur n K m K fois n r alisations de la loi uniforme sur 0 m X grand K n uin 0 m calcul des nombres d occurences de 1 m dans X No occurences X m calcul des p valeurs alpha chi2 No ones K m 1 m 1 nombre de rejets 5 nb_rejets sum alpha lt 0 05 endfunction et on obtient pour une simulation K n Nombre de rejets obtenus 1000 100 53 Question 2 Quelle est la loi asymptotique quand K du pourcentage de rejets Donner pour n et K grands un intervalle auquel appartient le nombre de rejets avec probabilit de 99 quand le g n rateur de nombres al atoires est parfait On r alise la m me exp rience mais avec une loi p un peu diff rente de la loi p uniforme sur 0 9 Remarquons que la loi des occurences lors de n simulations suivant la loi p1 est exactement la loi multin miale de pa
2. c nombre de degr s de libert nombre de classes dans N 1 d size N c 1 on calcule la proba pour un chi 2 d 1 degr s d tre sup rieur zeta p ql cdfchi PQ zeta_n d ones zeta_n proba q endfunction On calcule ainsi Cn 85210 et an P x 6 gt 85210 0 Comme on sait que P x 6 gt 23 0 001 on rejette cette hypoth se au niveau 0 1 Les naissances ne se r partissent pas de mani re uniforme sur les jours de la semaine ex cution du test alpha chi2 N p0 Mode d emploi Taper ce qui pr c de dans un fichier script progl sce x cuter dans la fen tre Scilab en tapant la commande exec progi sce Pour r cup rer le r sultat tapez dans la fen tre alpha 0 12 0 10 0 08 0 06 a valeurs improbables 0 04 g zone de rejet 0 02 At E on critique GRAPH 1 Densit de x 6 2 Test d un g n rateur de nombres al atoires On veut tester la validit d un g n rateur de nombres al atoires valeurs dans 0 m et de loi uniforme On g n re n nombres suivant cette loi On applique le test du x et on rejette 5 On effectue cette op ration K fois et on compte le nombre de rejets En th orie on devrait obtenir en premi re approximation 0 05 x K rejets puisque on simule suivant une loi uniforme et que l on rejette 5 On g n re un vecteur ligne de n r alisations d une loi uniforme sur 0
3. la r partition des nais sances par rapport 1996 l aide d un test du X pouvez vous accepter ou rejeter l hypoth se p Po o po correspond aux donn es de 1996 On donne les valeurs suivantes pour po Naissances Naturelles C sariennes J O 60 5 17 0 W E 18 9 3 6 p0 60 5 18 9 17 3 6 100 10
4. On calcule les occurences N de l entier i partir des zi On calcule la valeur de n Zn On calcule ay P x m 1 gt zn Si a prend des valeurs faibles inf rieures a 5 typiquement alors on rejette l hypoth se Ho sinon on l accepte a repr sente le niveau de confiance du test Ce risque a incontournable d pend du contexte et est fix par le d cisionnaire Traditionnelle ment 5 mais on peut choisir des valeurs bien plus faibles pour des domaines sensibles La mise en uvre On revient au probl me initial On dispose pour cela des nombres des naissances pr sent s dans le tableau 1 les occurences des naissances N 564772 629408 609596 604812 605280 450840 404456 la loi uniforme sur 1 7 p0 ones 1 7 7 On d finit la fonction qui calcule la p valeur cette fonction renvoie P chi2 gt zeta_n N est une matrice des effectifs observ s pO est une matrice dont chaque ligne est une probabilit chaque ligne de N est le vecteur des occurences et la ligne correspondante de p0 est la loi par rapport laquelle on teste function proba l chi2 N p0 n sum N c cardinal de l chantillon observ on v rifie que tous les chantillons ont m me taille if norm n 1 xones n n gt eps then error chantillons de tailles diff rentes return end n n 1 calcul de zeta_ n zeta_n n xsum N n p0 2 p0
5. Puissance du test du y 4 Les d s de Weldon Weldon a r alis n 26306 lancers de 12 d s 6 faces On note X le nombre de faces com portant un cinq ou un six lors du i me lancer Ces variables al atoires prennent leurs valeurs dans 0 12 Les fr quences empiriques observ es sont f o Nj est le nombre de lancers o l v nement on a observ j faces comportant un 5 ou un 6 se realise Nj D Lost Les r sultats sont les suivants source FELLER Tome 1 pp 148 149 An introduction to probability theory and its applications 1968 fo f f2 f3 fa fs fe 0 007033 0 043678 0 124116 0 208127 0 232418 0 197445 0 116589 fr s Jo fio fu fiz 0 050597 0 015320 0 003991 0 000532 0 000152 0 000000 Quand les d s ne sont pas biais s la probabilit d observer les faces 5 ou 6 dans un lancer est 1 3 Les X suivent donc une loi binomiale po B 12 1 3 Le vecteur N repr sente les occurrences correspondant aux fr quences empiriques N 185 1149 3265 5475 6114 5194 3067 1331 403 105 14 4 0 p0O binomial 1 3 12 Question 4 Les d s sont ils biais s Question 5 Dans les cas o les d s sont biais s avec tous le m me biais calculer la probabilit d obtenir un 5 ou un 6 lors d un lancer V rifier en utilisant un test du x dont on justifiera le nombre de degr s de libert que les 12 d s ont le m me biais i e le
6. SCILAB l Ecole nationale des ponts et chauss es http www enpc fr scilab Statistique Le test du x Jean Fran ois BERGEZ Jean Fran ois DELMAS derni re date de mise jour 23 avril 2003 Table des mati res 1 A t on autant de chance de na tre pour chacun des jours de la semaine 1 2 Test d un g n rateur de nombres al atoires 4 3 Puissance d un test FACULTATIF 7 4 Les d s de Weldon 8 5 Un autre probl me de naissance 9 1 A t on autant de chance de na tre pour chacun des jours de la semaine Un h pital am ricain veut attribuer les cong s de ses obst triciens pour l ann e 1998 Il dispose de l observation des naissances de l ann e 1997 source NVSR 1999 Jour L M M J V S D Naissances 564772 629408 609596 604812 605280 450840 404456 TAB 1 R partition des naissances suivant les jours de la semaine Question 1 les naissances se r partissent elles quitablement sur les jours de la semaine Un peu de th orie On suppose qu il s agit de la r alisation des n variables al atoires ind pendantes et de m me loi X1 X valeurs dans 1 m Ici m 7 puisque les variables al atoires prennent leurs valeurs dans l ensemble des jours de la semaine On cherche donc conna tre p p1 Pm o pi P X1 i Plus exactement on d sire savoir si la loi p p1 Pm est gale une loi donn e p p p Da
7. ndfunction Le programme qui r alise ceci est similaire celui du test des g n rateurs On effectue K fois n simulations suivant la loi p1 et on obtient la probabilit de rejet comme fonction de la distance function nb_rejets D test n K m d pO ones 1 m 1 m 1 loi uniforme sur 0 m pi p0 avant de modifier p0 on v rifie que d est une valeur possible if max p1 1 p1 1 gt d d gt min 1 p1 1 p1 then error d est incompatible end pi p1 d pi 1 p1 1 d calcul de la pseudo distance du chi2 entre pO et p1 D Dist p1 p0 pi_tilde p1 1 1 X grand K mul n pi_tilde simule K fois les occurences de n simulations selon pi r chi2 X ones K 1 xp0 nb_rejets sum r lt 0 05 endfunction Les r sultats sont r capitul s dans le tableau suivant pour d 0 0 01 0 09 pour la courbe de puissance du test function D r df k n 1000 K 1000 m 9 r ones 1 k D ones 1 k for i 1 k d i 1 k m 1 r1 D1 l test n K m d r i r1 K D i D1 end plot24 D r endfunction D p1 po 0 000 0 002 0 008 0 018 0 032 0 050 0 072 0 098 0 128 0 162 Tpi 0 042 0 127 0 455 0 873 0 993 1 1 1 1 1 La courbe est obtenue en tapant df 10 T T r T r T T T T T r T r T r T r 0 0 02 0 04 0 06 0 08 0 10 0 12 0 14 0 16 0 18 GRAPH 3
8. ns l exemple ci dessus on d sire savoir si les naissances sont quidistribu es sur les jours de la semaine soit po G es la loi uniforme sur 1 7 On veut donc savoir si l hypoth se les naissances sont quidistribu es dite hypoth se nulle not e Ho p p est r aliste ou non On utilise pour cela le test d ad quation du x On d finit la statistique M tA 0 2 E Pi Pi i Pi i 1 Pi o D 1 m est le vecteur des fr quences empiriques n Ni D n N tant le nombre d occurences de dans l chantillon de taille n Si Ho est vrai alors C converge en loi vers un x m 1 degr de libert En particulier Cn prend les valeurs typiques du x m 1 degr de libert En revanche si Ho n est pas vraie i e p po alors Cn o quand n 00 Ainsi Cn prend de grandes valeurs On rejette donc Ho si on observe des valeurs anormalement grandes pour n par exemple sup rieures un z donn Toutefois comme la loi du x est port e par R toutes les valeurs de 0 o sont possibles Il existe donc une probabilit a de rejeter tort Ho risque de premi re esp ce La valeur de a d pend de z PG gt 2 P X m 1 gt 2 a La pratique Utilisation de ce r sultat On dispose de l observation de l chantillon X1 x1 Xn Zn On dispose de la loi p p p pr sum e des variables al atoires ind pendantes Are Xn
9. ram tre n p1 Cette derni re loi est directement simulable l aide de grand On choisit une probabilit p qui diff re de po seulement pour les probabilit s d apparition de 8 et 9 loi uniforme sur 0 m p0O ones 1 m 1 m 1 pi p0 d signe la derni re coordonn e du vecteur pi 0 15 pi 1 0 05 11111111111111111111111111111 ON LIMINE LA DERNI RE COORDONN E DE P1 POUR UTILISER LE G N RATEUR grand mul AI III LILI ELLE pi tilde p1 1 11 on g n re une variable de loi multin miale de param tre n p1 grand 1 mul n pi_tilde On simule K fois suivant cette loi p et on compte le nombre de rejets Pour cela on utilise la forme vectorielle suivante simule K fois les occurences de n simulations selon p1 pi _tilde se d duit de p1 en supprimant la derni re valeur de pi X grand K mul n pi_tilde on calcule les p valeurs pour les K simulations r chi2 X ones K 1 xp0 on d termine le nombre de rejets nb_rejets sum r lt 0 05 On obtient alors le r sultat suivant pour une simulation particuli re K n Nombre de rejets obtenus 1000 100 281 Le nombre de rejets est plus important et juste titre puisqu on n a pas simul selon une loi uniforme Cependant on ne rejette pas syst matiquement car la loi simul e ressemble une loi uniforme Cette fois ci on remplace la loi
10. s donn es proviennent bien de la loi binomiale B 12 p o p est inconnu 5 Un autre probl me de naissance On d sire tudier la r partition des naissances suivant le type du jour de semaine jours ou vrables ou week end et suivant le mode d accouchement naturel ou par c sarienne Les donn es proviennent du National Vital Statistics Report et concernent les naissances aux USA en 1997 Naissances Naturelles C sar Total Naissances Naturelles C sar Total J O 2331536 663540 2995076 J O 60 6 17 3 77 9 W E 715085 135493 850578 W E 18 6 3 5 22 1 Total 3046621 799033 3845654 Total 79 2 20 8 100 0 N 2331536 715085 663540 135493 On note pzy la probabilit qu un b b naisse un jour ouvrable et sans c sarienne pw y la probabilit qu un b b naisse un week end et sans c sarienne pj la probabilit qu un b b naisse un jour ouvrable et par c sarienne pw c la probabilit qu un b b naisse un week end et par c sarienne Question 6 Donner l estimateur des fr quences empiriques de p PJ N PW N PJ C PwC Question 7 l aide d un test du x pouvez vous accepter ou rejeter l hypoth se d ind pendance entre le type du jour de naissance jour ouvrable ou week end et le mode d accouchement naturel ou c sarienne Question 8 On d sire savoir s il existe une volution significative dans
11. uniforme par une loi bin miale B 9 1 2 pi binomial 1 2 9 Question 3 Simuler le nombre de rejets pour K 1000 simulations et n 100 Que remarquez vous Les histogrammes ci dessous permettent de visualiser la diff rence entre la loi uniforme sur 0 9 et la loi bin miale B 9 1 2 0 28 0 12 0 24 0 10 0 20 0 08 0 16 0 06 0 12 0 04 0 08 0 02 0 04 GRAPH 2 Simulation de 1000 variables de loi bin miale B 9 1 2 et loi uniforme sur 0 9 3 Puissance d un test FACULTATIF On d termine la puissance du test du x sur l exemple suivant on simule n tirages suivant une loi p de la forme 1 1 1 1 1 1 1 1 1 1 P d td 10 10 10 10 10 10 10 10 10 10 On calcule alors la valeur de puis on rejette Ho 5 On effectue K fois cette op ration et on l f Pe nombre de rejets en d duit une estimation de la probabilit rp JS de rejeter Ho quand on simule p c est la puissance du test Enfin on trace rp en fonction de la pseudo distance du x entre po et p 9 ET D p1 po Z y p1 i mu f i 0 P Elle est calcul e gr ce la fonction pseudo distance du chi2 p1 est la loi tester p0 est la loi de r f rence function d Dist p1 p0 d sum p1 p0 2 p0 e
Download Pdf Manuals
Related Search
Related Contents
L`Interculturel Références bibliographiques Cette ProteinLynx Global SERVER Version 2.2.5 User's Guide ROSCAMATIC-2 Owners Manual Samsung 770P Uživatelská přiručka Copyright © All rights reserved.
Failed to retrieve file