Home
de Working Paper
Contents
1. 6 1 LA QUALITE DE LA DOCUMENTATION RELATIVE A G CALIB 2 6 2 LES METHODES DE CALAGE intranet 7 3 LES NIVEAUX DE CALAGE si kia snistsns kisnasssas anaana aara anana anaiei ania 8 3 1 Les niveaux de calage r alis s par g Calib 2 ssososssoessssoessssoessssoossssessssoessssseses 8 3 2 Les niveaux de calage r alis s par Calmar 2 sssoeosssoessssoessssocsessoossssossssoessssoesse 9 3 3 Les niveaux de calage r alis s par Bascula 4 0 ssscccssssssccssssseccsssseesssssesess 9 3 4 Evaluation de g Calib usisks sssinoi sosssososnsssss snssnk usssas iussssa ikosssn ikss ss sksksn isks ksks s 9 4 D AUTRES POSSIBILITES SPECIFIQUES A G CALIB 2 10 5 CONCEUSION ins ass saesivces tates tats tas iiees cs esieta tans lees tues nia taes ives A ass Kas is si 11 TESTS ET EVALUATION DES TROIS LOGICIELS DU CALAGE ETUDE PRATIQUE saints awieasacisactentaus antes a a a a a S a i i a at 14 6 EVALUATION DE G CALIB 2 cccccccccceeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeees 16 6 1 Aspects g n raux de g Calib 2 soeosssoeoessssoessssoossssoocssssocssssoessssoesssssoessssoessssoes 16 6 1 1 Installation du logiciel Rr 16 6 1 2 Facilit d utilisation aaa a asa ai aka si aaa 17 6 1 3 ao E eae ence rere eae ane rere ea ene rere re error ere ee 18 6 1 4 Ponetionnalit Si ss aa ai aa aa aaa E a aetna 19 6 1 5 OULDUC sa aria a ia i IIS I eee nine a rime a 20 6 1
2. Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 8 1 2 Input Pour pouvoir ex cuter une session de pond ration avec Bascula 4 0 on doit disposer des fichiers suivants La table des donn es qui contient pour chaque individu de l chantillon la valeur correspondante de chaque variable auxiliaire et le poids de sondage initial la variable identifiant des grappes pour le calage par grappe De pr f rence la base de donn es doit contenir au moins deux variables servant 4 sauvegarder les poids finaux et les rapports de poids La table des marges contenant les totaux sur la population des variables auxiliaires utilis es pour le calage Ces totaux peuvent tre galement saisis manuellement sans recourir a cette table de marges Une phase de pr paration des donn es est n cessaire Si la base de donn es n est pas sous format Blaise il faut red finir les libell s type et format des variables de la base de donn es L identifiant des grappes doit tre de type num rique integer ayant des valeurs enti res Les variables de calage quantitatives doivent tre d clar es sous le format integer ou real Les variables de calage cat gorielles doivent tre d clar es sous le format enumerated La variable contenant les valeurs des probabilit s d inclusion doit tre de type integer ou real Cette variable ne doit pas comporter de valeurs manquantes ou n gatives sic est le cas la session de pond ratio
3. Lors de l installation faite par le service informatique il est apparu qu il semblait impossible d avoir une utilisation partag e de g Calib 2 c est pourquoi on a renonc l implanter de fa on unique sur le serveur du r seau local On a rencontr les difficult s suivantes le nom du r pertoire dans lequel est implant le programme g Calib 2 Installation Directory doit obligatoirement comprendre la racine C program files ce qui n est pas clairement sp cifi dans la documentation Lorsqu on modifie le nom propos par d faut a Pinstallation l ex cution ult rieure d une requ te entra ne sa r initialisation automatique une valeur par d faut et provoque un bug le programme est adapt la version en langue anglaise du logiciel SPSS Dans la version fran aise certains param tres renseign s par Yes doivent tre modifi s en Oui C est pourquoi il a t plus rapide d utiliser les fichiers de production SPSS de pr f rence l interface Visual Basic pour ex cuter successivement un grand nombre de requ tes g Calib 2 Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 6 1 2 Facilit d utilisation g Calib 2 est crit en SPSS II est compatible avec la version 12 de ce logiciel L appel de g Calib 2 peut se faire sous Windows en cliquant sur une ic ne si l on a cr un raccourci 6 1 2 1 Logiciel L interface de saisie des param tres n cessaires
4. echant sas sur les variables auxiliaires disponibles au niveau individu en imposant l galit des poids pour les individus d un m me m nage Avec la fonction lin aire on obtient une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire Les rapports de poids sont compris entre 0 87 et 1 37 Avec la fonction exponentielle le calage est r alis en 3 it rations On obtient une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire Les rapports de poids sont compris entre 0 88 et 1 42 Avec la fonction logit pour des rapports de poids compris entre O O 0 88 1 42 le calage est r alis en 4 it rations On observe une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire 0 90 1 10 le calage est r alis en 15 secondes et 4 it rations On observe des diff rences de l ordre du centi me entre les marges r elles et estim es des variables cat gorielles et une diff rence sup rieure l unit pour la variable Salaire 0 96 1 06 le calage est r alis en 11 it rations On observe une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire 0 97 1 05 le calage ne peut tre r alis Avec la fonction lin aire tronqu e pour des rapports de poids compris entre O 0 87 1 37 le calage est r alis en 2 it rations On
5. o 0 96 1 05 le calage ne peut tre r alis e Avec la fonction lin aire tronqu e pour des rapports de poids compris entre o 0 96 1 30 le calage est r alis en 3 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire o 0 96 1 10 le calage est r alis en 4 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire o 0 96 1 05 le calage ne peut tre r alis e Avec la fonction sinus hyperbolique pour un coefficient gal o 10 le calage est r alis en 4 it rations On observe une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire On obtient des rapports de poids compris entre 0 96 et 1 18 o 100 le calage est r alis en 9 it rations On observe une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire On obtient des rapports de poids compris entre 0 96 et 1 06 o 200 le calage ne peut tre r alis l algorithme ne converge pas Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 7 2 2 Calage simple au niveau m nage On va caler la table echup sas l aide des variables auxiliaires disponibles au niveau des m nages Avec la fonction lin aire le calage est r alis exactement Les rapports de poids sont compris entre 0 96 et 1 08 Avec la fonction exponentielle le
6. Calmar 2 qui permet de r aliser un calage jusqu trois niveaux d observation g Calib 2 se limite au calage deux niveaux d observation Cependant on note que le calage trois niveaux d observation peut tre r alis en utilisant g Calib 2 mais pas d une mani re automatique De plus contrairement aux deux autres softwares g Calib 2 dispose galement de quelques options de plus calage sur des strates technique de collapsing possibilit de pond rer les quations de calage possibilit de normer les variables de calage dont l objectif est de perfectionner les m thodes de calage On peut donc conclure que m me si certaines op rations ne peuvent pas tre r alis es de mani re automatique calage plus de deux niveaux d observation Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 g Calib 2 peut tre consid r comme un software complet de calage qui permet de r pondre a presque tous les probl mes de calage rencontr s en pratique Notons que toutes les conclusions mises dans ce rapport interm diaire ne se basent que sur une valuation th orique et qui restent toujours sous r serve de v rification Pendant la deuxi me partie de cette tude l valuation de g Calib 2 va se faire sur le plan pratique en utilisant des bases de donn es r elles et simul es Tests et valuation des trois logiciels du calage Tests et valuation des trois logiciels du calage tude pratigue D
7. Strate 6 o 0 88 1 10 le calage converge en 7 it rations et 31 4 secondes Il ne signale aucun cart entre le total et son estimateur par calage 0 88 1 09 le calage ne converge pas Message LN out of range 0 90 1 10 le calage converge en 8 it rations et 32 5 secondes Il ne signale aucun cart entre le total et son estimateur par calage o 0 91 1 10 le calage ne converge pas Message LN out of range Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 e Fonction lin aire tronqu e et calage unique sur toutes les strates avec les bornes 0 77 1 28 le calage converge en minute 32 secondes Strate Nombre d it rations Ecart entre total vrai et total estim 1 3 aucun aucun aucun Aucun 2 2 3 3 4 2 aucun 5 2 6 3 Aucun 0 77 1 27 le calage converge en 1 minute 34 secondes imparfaitement en strate 1 Strate Nombre d it rations Ecart entre total vrai et total estim 1 5 0 2 sur la variable j3 aucun aucun aucun 2 2 3 3 4 2 aucun D 2 6 3 aucun 0 80 1 28 le calage converge en 1 minute 32 secondes environ Strate Nombre d it rations Ecart entre total vrai et total estim 1 4 aucun aucun aucun aucun 2 2 3 3 4 2 aucun 5 2 6 3 aucun Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 e Fonction lin aire tronqu e
8. e Pond ration finale associ e aux unit s secondaires chantillonn es au second degr e Identifiant de chaque unit secondaire e Identifiant de la grappe associ e chaque unit secondaire Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 Si le param tre MISAJOUR vaut NON la macro r initialise chacune de ces tables chaque it ration Si ce param tre vaut OUI les variables de pond ration sont ajout es dans les diff rentes tables ce qui permet d empiler des jeux de pond ration obtenus selon des m thodes diff rentes et de les comparer plus facilement 7 1 4 3 Editions Elle donne galement un bilan des diff rentes tapes du calage L affichage des sorties suivantes est modul par le param tre EDITION Tableau contenant les valeurs des param tres donn s a la macro Tableau comparant les marges dans la population a leurs estimations avec les pond rations initiales Tableau comparant les marges dans la population leurs estimations avec les pond rations apr s calage Tableau donnant la valeur du crit re d arr t de l algorithme it ratif et le nombre de poids n gatifs apr s chaque it ration Tableau donnant le vecteur de Lagrange apr s chaque it ration Un bilan du calage nom de la table en entr e nombre d observations et nombre d observations limin es D autres sorties peuvent tre ajout es Si EDITPOI OUI un tableau donne les valeurs des diff
9. est pas possible avec Calmar2 et g Calib 2 Le manuel pr cise quels plans de sondages permettent une estimation de la variance Cependant il n est pas indiqu comment cette estimation prend en compte la non r ponse et ventuellement plusieurs degr s de tirage D autre part une des m thodes d estimation de variance se base sur des r plications d chantillons et le nombre maximum de simulations possibles est faible gal 200 Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 plus r cemment celle du sinus hyperbolique Roy et Vanheuverzwyn 2001 g Calib 2 permet de mettre en ceuvre la technique de collapsing permettant de regrouper les unit s identiques au sens des variables de calage afin de limiter les calculs cette m thode est surtout int ressante dans le cas d un calage sur des variables cat gorielles uniquement g Calib 2 permet de r aliser un calage par strates Calmar 2 permet d utiliser la technique de calage g n ralis Deville 2000 pour redresser la non r ponse La phase d installation de g Calib 2 a t d licate En particulier nous avons rencontr des probl mes de compatibilit avec la version frangaise de SPSS D autre part il ne parait pas possible d utiliser g Calib 2 en r seau Une fois ces probl mes r solus la prise en main du logiciel est facilit e par une interface conviviale Trois principaux points de vigilance nous paraissent importants e Il n existe pas
10. En effet on note que pour les unit s de la population ayant des vecteurs Ca Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 identigues c est a dire avec des valeurs relatives aux variables de calage qui sont gales les rapports de poids w d q F x a sont galement identiques La technique de collapsing permet de ne consid rer dans le calcul des rapports de poids w d que les unit s ayant des vecteurs x 4 diff rents et d attribuer par la suite le rapport de poids calcul w d toutes les unit s restantes ayant le m me vecteur x g ce qui permet de r duire le temps du calcul de ces poids e Possibilit de normaliser les variables de calage ce qui permet de ramener toutes les variables de calage une m me chelle Bascula 4 0 choisit automatiquement les chelles des variables de calage ceci dans le souci d obtenir un meilleur comportement num rique 5 Conclusion Apr s avoir consult la documentation relative g Calib 2 qui a l avantage d tre tr s d taill e g Calib 2 para t tre un software qui tient compte de presque tous les aspects th oriques et pratiques de la th orie de calage Ainsi l exception de la m thode de sinus hyperbolique g Calib 2 permet de r aliser des calages en utilisant toutes les autres m thodes de calage usuelles Le software permet galement de r aliser des calages sur diff rents niveaux d observation Malheureusement contrairement
11. RAPPORTS DE POIDS OBTENUS AVEC LES TROIS LOGICIELS nn nn a ao a i 70 TABLEAU SYNOPTIQB D ES DIFFERENCES ENTRE LES TROIS LOGICIEL Since muiisisdcvenatiadsddecandeesuiaadsiswstadcanesstactiestaintinttadedeestadetneidaistdertaliadstrs 73 10 CONCLUSION GENERALE nn rrsnrrerrrssnnneneeeenneeneeeennnenee 78 11 BIBLIOGRAPHIE Introduction Introduction Pour pouvoir am liorer la pr cision des estimations des parametres de la population le calage est parmi les m thodes les plus utilis es en pratique En partant d un estimateur classique ne tenant pas compte d une information auxiliaire le calage consiste 4 modifier les poids de cet estimateur de telle sorte a respecter une propri t voulue mettant profit l information auxiliaire disponible L objectif de cette tude est l valuation de g Calib 2 qui est un software sp cialis dans les m thodes de calage tout en le comparant avec deux autres softwares de calage Calmar 2 et Bascula 4 0 Cette tude est le r sultat d une commande faite par l Institut National de Statistique INS Belgique dont l objectif est de faire une expertise du software de calage g Calib 2 d velopp PINS L tude est r alis e par une quipe de chercheurs de l Universit Libre de Bruxelles Belgique et de l Ecole nationale de la statistique et de l analyse de l information France Notons que les trois softwares g Calib 2 Calmar 2 et Bascula 4 0 sont d velo
12. pour un plan de sondage a deux degr s un chantillon d unit s primaires est s lectionn et dans chaque unit primaire s lectionn e on s lectionne des unit s secondaires Si on dispose d une information auxiliaire sp cifique a chaque type d unit s s lectionn es on peut effectuer galement un calage des diff rentes unit s observ es produisant des pond rations identiques pour les unit s secondaires incluses dans la m me unit primaire Un tel calage peut inclure galement plusieurs niveaux d observation a condition qu on dispose d une information auxiliaire sp cifique a chaque type d unit s s lectionn es 3 1 Les niveaux de calage r alis s par g Calib 2 Comme pour la plupart des softwares de calage g Calib 2 permet de r aliser des calages sur plusieurs niveaux d observation Ainsi les possibilit s offertes par g Calib 2 sont e Un calage simple sur une table d enqu te ne comprenant qu un seul niveau d observation II s agit d un calage au niveau des unit s de la population C est le calage le plus classique o le programme permet de r aliser un calage sur le total dans la population de l information auxiliaire disponible e Calage au niveau des unit s de la population tout en fournissant des poids identiques pour les unit s appartenant d une m me grappe lorsque l information auxiliaire est disponible sur les unit s de la population et l objectif est de produire des no
13. rale Statistique et Information conomique met la disposition du public Des annuaires et des publications sp cialis es ainsi qu une s lection de disquettes et de c d roms 0 Une salle de lecture o il est possible de consulter nos publications ainsi que celles d autres minist res ou d institutions belges et internationales Toutes nos biblioth ques sont accessibles les jours ouvrables de 8h30 16h30 Bxl ou de 9h 12h et de 13h 16h autres Bruxelles City Atrium C D a Rue du Progr s 50 1210 Bruxelles t l 02 277 55 03 02 277 55 04 fax 02 277 55 19 Rue du Progr s e mail info statbel economie fgov be BEBE Train B Gare du Nord is ki M tro M ligne 2 station Rogier Rus Matheus Trams 3 52 55 56 81 90 arr ts Rogier ou Nord Rue des Croisades Bus STIB 38 58 61 arr ts Rogier ou Nord Mace ASIE Bus De Lijn 318 351 358 410 526 554 R20 arr t Nord Anvers oe a Lee Itali lei 124 bus 85 2000 Antwerpen TE ne t l 03 229 07 00 fax 03 233 28 30 Be _ e mail info antwerpen statbel economie fgov be J e Train B Centraal Station M tro M arr t Opera lt T Tram Bus acc s facile Fr Rooseveltplaats lt Charleroi Tour Biarent Bd Audent 14 5 6000 Charleroi t l 071 27 44 14 fax 071 27 44 19 e mail info charleroi statbel economie fgov be PETITE CEINTURE DE CHARLEROI Train B Charleroi Sud 20 min depuis
14. rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire 0 89 1 08 le calage ne peut tre r alis Avec la fonction lin aire tronqu e pour des rapports de poids compris entre O O 0 89 1 10 le calage est r alis en 3 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire 0 89 1 09 le calage est r alis en 3 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire 0 89 1 08 le calage ne peut tre r alis Avec la fonction du sinus hyperbolique pour un coefficient gal O O 10 le calage est r alis en 5 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire On obtient des rapports de poids compris entre 0 90 et 1 10 50 le calage est r alis en 9 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire On obtient des rapports de poids compris entre 0 90 et 1 09 100 le calage ne peut tre r alis Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 Strate 5 Avec la fonction lin aire on obtient une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire Les rapports de poids sont compris entre 0 82 et 1 11 Avec la fonct
15. s d une m me grappe pour un sondage par grappe On note que contrairement Calmar et g Calib 2 Bascula permet de calculer une estimation de la variance en utilisant deux m thodes d estimation de la variance la m thode par lin arisation de Taylor et la m thode connue sous le nom de demi chantillons quilibr s Balanced repeated replication Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 8 1 4 Output Avant de lancer une requ te de calage Bascula permet d effectuer certains contr les de coh rence sur les tables et les variables en entr e voir page 41 du manuel Le bilan des diff rentes tapes avec quelques statistiques sur les pond rations page 69 de Nieuwenbroek et Boonstra 2002 sont sauvegard s dans un fichier dont l extension est blg Les valeurs des poids finaux et celles des rapports de poids sont sauvegard s dans un fichier dont l extension est wga Si ce fichier existe d ja le nouveau fichier de pond ration calcul par Bascula crase l ancien ce qui ne permet pas d empiler des jeux de pond ration obtenus selon des m thodes diff rentes Le seul moyen pour pouvoir sauvegarder les poids obtenus avec les diff rentes m thodes est de pr voir dans la base de donn es autant de variables servant sauvegarder ces pond rations que les mod les de calage envisag s 8 1 5 Probl mes Le probl me le plus s rieux qu on peut rencontrer est propre a la technique du cal
16. 1 10 le calage est r alis en 4 it rations On observe une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire 0 95 1 05 le calage ne peut tre r alis Avec la m thode du sinus hyperbolique pour un coefficient gal O O 10 le calage est r alis en 4 it rations On observe une diff rence inf rieure l unit entre le total r el et estim de la variable Salaire On obtient des rapports de poids compris entre 0 90 et 1 18 50 le calage est r alis en 8 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire On obtient des rapports de poids compris entre 0 93 et 1 09 100 le calage ne peut tre r alis l algorithme ne converge pas 7 2 6 Calage sur la population d individus dans chaque strate Avec la fonction lin aire on obtient une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire Les rapports de poids sont compris entre 0 76 et 1 28 Avec la fonction exponentielle le calage est r alis en 4 it rations On obtient une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire Les rapports de poids sont compris entre 0 77 et 1 29 Avec la m thode logit pour des rapports de poids compris entre O 0 77 1 29 le calage est r alis en 6 it rations On observe une diff rence inf rieure
17. 1 29 2 0 81 1 12 3 0 77 1 19 4 0 89 1 11 5 0 84 1 11 6 0 88 1 37 Ensemble 0 77 1 37 e Fonction logit et calage unique sur toutes les strates avec les bornes 0 77 1 27 le calage converge en 1 minute 38 secondes Strate Nombre d it rations Ecart entre total vrai et total estim 1 8 0 2 sur la variable j3 2 5 aucun 3 4 aucun 4 4 aucun 5 4 aucun 6 4 aucun 0 77 1 26 le calage ne converge pas Message LN out of range 0 78 1 27 le calage ne converge pas Message LN out of range e Fonction logit et calage s par par strate Strate 1 o 0 77 1 28 le calage converge en 7 it rations et 32 6 secondes Il ne signale aucun cart entre le total et son estimateur par calage o 0 77 1 27 le calage converge en 8 it rations et 1 minute Il ne signale aucun cart entre le total et son estimateur par calage o 0 77 1 26 le calage ne converge pas Message LN out of range o 0 78 1 27 le calage ne converge pas Message LN out of range Strate 2 o 0 81 1 11 le calage converge en 7 it rations et 39 2 secondes Il ne signale aucun cart entre le total et son estimateur par calage o 0 81 1 10 le calage converge imparfaitement en 8 it rations et 41 1 secondes Il y a un cart de 3 entre le total de la variable ad4 et son estimateur par calage Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 o 0 81 1 09 le calage ne converge
18. 1 32 le calage est r alis en 3 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire 0 88 1 20 le calage est r alis en 5 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire 0 90 1 10 le calage est r alis en 7 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire 0 90 1 09 le calage ne peut tre r alis Avec la fonction du sinus hyperbolique pour un coefficient gal O O 10 le calage est r alis en 5 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire On obtient des rapports de poids compris entre 0 89 et 1 18 50 le calage est r alis en 9 it rations On observe une diff rence de l ordre de l unit entre le total r el et estim de la variable Salaire On obtient des rapports de poids compris entre 0 90 et 1 11 100 le calage ne peut tre r alis Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 8 Evaluation de Bascula 4 0 8 1 Aspects g n raux de bascula 4 0 8 1 1 Facilit d utilisation Bascula est une composante de Blaise gui est un syst me de traitement de donn es d enqu tes assist par ordinateur Bascula se pr sente sous forme d outil interactif articul sur une configuration contenant l info
19. 10 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire On obtient des rapports de poids compris entre 0 81 et 1 10 40 le calage ne peut tre r alis Avec la fonction lin aire on obtient une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire Les rapports de poids sont compris entre 0 76 et 1 18 Avec la fonction exponentielle le calage est r alis en 4 it rations On obtient une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire Les rapports de poids sont compris entre 0 77 et 1 19 Avec la fonction logit pour des rapports de poids compris entre O O 0 90 1 18 le calage est r alis en 6 it rations On observe une diff rence de l ordre du dixi me entre le total r el et estim de la variable Salaire 0 76 1 17 le calage est r alis en 6 it rations On observe une diff rence de plusieurs dizaines d unit s entre le total r el et estim de la variable Salaire 0 76 1 16 le calage ne peut tre r alis Avec la fonction lin aire tronqu e pour des rapports de poids compris entre O O 0 77 1 19 le calage est r alis en 3 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire 0 90 1 18 le calage est r alis en 5 it rations On observe une diff rence
20. SAS Calmar 2 signale une convergence imparfaite sur la variable num rique salaire de l ordre du centi me en valeur absolue Dans ses ditions Calmar 2 calcule les carts absolus entre total r el et total estim tandis que g Calib 2 ne calcule que les carts relatifs en s arr tant aux diff rences atteignant 0 1 de la valeur concern e Avec la fonction lin aire tronqu e Calmar 2 donne les m mes r sultats que g Calib 2 sur l intervalle 0 97 1 06 et sur les intervalles plus larges Calmar 2 avec l option colin non impliquant une inversion classique de matrice ne converge pas sur l intervalle 0 97 1 03 et sur tout intervalle plus strict Avec l option colin oui entra nant l inversion g n ralis e de la matrice O Calmar 2 se comporte comme g Calib 2 il poursuit les it rations en fournissant un r sultat imparfait et des rapports de poids tous gaux l une des deux bornes La r partition du nombre d unit s entre borne inf rieure et borne sup rieure varie entre les deux logiciels 6 2 2 Calage simple sur la population de m nages On cale la table chantillon echup sur les effectifs de m nages selon les crit res ci dessus Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 6 2 2 1 R sultats obtenus avec g Calib 2 selon les diff rentes fonctions de calage e Fonction lin aire le calage converge en 52 secondes ne signale pas d cart entre le total r el et le tot
21. au calage d une enqu te est claire Cependant l oubli d un param tre obligatoire ne donne pas lieu l affichage syst matique d un message d erreur ce qui peut tre tr s p nalisant pour un utilisateur d butant Le mod le de calage est d fini dans l interface de saisie Pour une quation de calage de la forme 77 X o X d signe la modalit j d une variable cat gorielle X l utilisateur doit sp cifier le nom x de la variable indicatrice qui d signera ce caract re dans la table de travail crire l quation logique d finissant le domaine correspondant dans la table chantillon puis sp cifier le total X dans la population L criture de ces contraintes n cessite de conna tre la syntaxe d une instruction d affectation dans SPSS en particulier les r gles de concordance des formats et de sp cification de la valeur d une variable caract re Chaque contrainte de calage fait l objet d une ligne de saisie Il n est pas possible de sp cifier le nom d une table contenant la liste des variables auxiliaires et leurs totaux dans la population Quant Bascula 4 0 les variables indicatrices sont cr es en interne et la mod lisation des poids peut tre d finie sous forme de tables forme pratique pour les mod les de grandes tailles 6 1 2 2 Sauvegarde Une demande peut tre sauvegard e Le programme sera obligatoirement implant dans le r pertoire de travail sp cifi conten
22. comme c est le cas dans Calmar 2 de contr les sur la saisie et la coh rence des param tres e Des probl mes se posent avec la fonction lin aire born e qui renvoie parfois des poids cal s totalement aberrants Ces probl mes semblent dus a une utilisation syst matigue des matrices g inverses e Les sorties donn es par la Macro sont difficilement lisibles et m riteraient d tre mieux classifi es et comment es Il nous parait essentiel d am liorer ces points afin de permettre une large utilisation du logiciel Les autres am liorations a envisager seraient e La possibilit de prendre en compte des poids de second degr diff rents de 1 pour un calage a deux degr s e Leredressement de la non r ponse par calage g n ralis Bibliographie Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 11 Bibliographie DEMING W E et STEPHAN F F 1940 On a least squares adjustment of a sampled frequency table when the expected marginal totals are known Annals of Mathematical Statistics 81 427 444 DEVILLE J C 2002 La correction de la non r ponse par calage g n ralis Journ es de M thodologie Statistique Insee DEVILLE J C et SARNDAL C E 1992 Calibration estimators in survey sampling Journal of the American Statistical Association 87 376 382 DEVILLE J C SARNDAL C E et SAUTORY O 1993 Generalized raking procedures in survey sampling Journal of the American Statistical Associa
23. d de l estimateur d Horvitz Thompson et v rifient les quations de calage D waa ar t pour toutj 1 J kes keU On cherche donc un estimateur qui tient compte de l information auxiliaire puisqu il cale l chantillon sur les totaux des variables auxiliaires De plus on a de fortes chances d obtenir un estimateur avec un faible biais puisque ces poids w sont en principe peu diff rents de ceux de l estimateur d Horvitz Thompson Evaluation de g Calib 2 Evaluation de g Calib 2 tude th origue Dans cette premi re partie l valuation de g Calib 2 tout en le comparant aux deux autres softwares de calage va se faire uniquement sur le plan th orique en se limitant aux aspects suivants la qualit de la documentation fournie avec g Calib 2 et la facilit d obtenir celle ci les m thodes de calage impl ment es dans g Calib 2 et les niveaux de calage que g Calib 2 permet de r aliser Les autres aspects d valuation faisant partie du cahier des charges de cette tude seront valu s dans le rapport final 1 La qualit de la documentation relative a g Calib 2 La documentation relative g Calib 2 est assez d taill e avec un manuel d utilisation tr s complet contenant toutes les informations th oriques et pratiques sur g Calib 2 En effet en plus des informations concernant l installation et les fonctionnalit s de g Calib 2 ce manuel d utilisation contient galement une par
24. de distance G ont t propos es Chaque fonction de distance permet de construire une m thode de calage II est important de noter ici que pour certaines m thodes de calage born es les fonctions de distance sont d finies diff remment dans les trois logiciels de calage Voir annexe 1 En effet pour ces fonctions le domaine de d finition des bornes diff re d un logiciel un autre Dans la partie pratique de cette tude nous allons v rifier si le fait d utiliser des domaines de d finition diff rents pour ces bornes a un effet significatif sur les r sultats obtenus avec ces diff rents softwares de calage On note que g Calib 2 et Calmar 2 utilisent pratiquement les m mes fonctions de distance Calmar 2 contient une fonction de plus sinus hyperbolique Par contre Bascula 4 0 est beaucoup plus restreint que les deux autres logiciels puisqu il n utilise que des cas particuliers de ces fonctions de distance Evaluation de g Calib 2 Apr s avoir v rifi les diff rentes m thodes de calage impl ment es dans les trois softwares on peut conclure que l exception de la m thode sinus hyperbolique impl ment e uniquement dans Calmar 2 on retrouve toutes les autres m thodes de calage usuelles dans g Calib 2 Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 3 Les niveaux de calage En th orie de calage ce dernier peut se faire galement quand on a plusieurs niveaux d observation En effet par exemple
25. et calage s par par strate Strate 1 o 0 76 1 28 le calage converge en 3 it rations et 40 6 secondes Il ne signale aucun cart entre le total et son estimateur par calage o 0 77 1 28 le calage converge en 3 it rations et 28 secondes II ne signale aucun cart entre le total et son estimateur par calage 0 77 1 27 le calage converge imparfaitement 0 76 1 27 le calage converge imparfaitement Strate 2 o 0 81 1 11 le calage converge en 3 it rations et 32 8 secondes Il ne signale aucun cart entre le total et son estimateur par calage 0 81 1 10 le calage converge imparfaitement 0 82 1 11 le calage converge imparfaitement Strate 3 o 0 77 1 18 le calage converge en 3 it rations et 31 4 secondes Il ne signale aucun cart entre le total et son estimateur par calage o 0 77 1 17 le calage converge imparfaitement 0 90 1 18 le calage converge en 5 it rations et 31 5 secondes Il ne signale aucun cart entre le total et son estimateur par calage o 0 91 1 18 le calage converge imparfaitement Strate 4 o 0 89 1 09 le calage converge en 3 it rations et 31 9 secondes Il ne signale aucun cart entre le total et son estimateur par calage 0 89 1 08 le calage converge imparfaitement 0 90 1 09 le calage converge en 4 it rations et 27 9 secondes Il ne signale aucun cart entre le total et son estimateur par calage o 0 91 1 09 le calage converge impar
26. grappes constitu par sommation des variables auxiliaires des individus composant la grappe avec les quations de calage D dF A X X X ies AEA kes Il fournit une table de poids avec une observation par individu Les poids individuels obtenus dans g Calib 2 apr s division par la taille de la grappe sont donc sensiblement diff rents de ceux fournis par Calmar 2 avec des carts absolus variant de quelques unit s 10 Pour plus de 95 des unit s les carts sont compris entre 0 1 et 0 001 Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 Avec la fonction logit Calmar 2 admet des bornes plus strictes gue g Calib 2 avant de diverger Calmar 2 converge dans l intervalle 0 97 1 08 mais pas dans 0 97 1 07 Avec la fonction lin aire tronqu e et les bornes 0 98 1 05 Calmar 2 option colin non ne converge pas g Calib 2 fournit des poids sans s interrompre pour non convergence alors que les estimateurs des variables de calage ne sont pas justes Il n y a pas de message explicite dit 6 2 4 Calage simultan sur des totaux dans la population des m nages et dans celle des individus On cale la table echup sur le nombre de m nages dans la population selon les crit res indiqu s dans l introduction la section 6 et la table echant sur les totaux dans la population d individus des m mes crit res que pr c demment Les individus d un m me m nage ont en sortie des poids ident
27. nombre de tests pr sent s dans le corps du rapport Dans la mesure du possible ces tests ont t communs tous les logiciels Les tests men s sur Bascula 4 0 ont fait apparaitre un certain nombre de probl mes Le manuel de l utilisateur est peu d taill ce qui rend sa prise en main difficile La phase de pr paration des donn es en entr e et de r cup ration des poids cal s en sortie est assez longue D autre part le logiciel est moins g n ral que ses deux concurrents car toutes les fonctionnalit s du calage propos es par Deville et S rndal 1992 ne sont pas propos es et suivant les variables de calage utilis es le choix de la m thode de redressement est impos ou tout au moins limit par le logiciel voir ce propos la remarque du point 8 1 3 Les manuels de g Calib 2 et Calmar 2 sont tous les deux tr s complets et enrichis de nombreux exemples Le manuel de g Calib 2 souffre quelque peu d un recours syst matigue au langage matriciel qui ne facilite pas forc ment la compr hension d autre part il faudrait fusionner les manuels des versions 1 et 2 pour plus de clart Les deux logiciels permettent de redresser des poids par calage l aide des fonctions de distance propos es par Deville et S rndal dans l article fondateur Calmar 2 propose galement une fonction de distance propos e Bascula 4 0 pr sente tout de m me l avantage de permettre une estimation de la variance ce qui n
28. obtient une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire Les rapports de poids sont compris entre 0 81 et 1 12 Avec la fonction logit pour des rapports de poids compris entre o 0 81 1 12 le calage est r alis en 6 it rations On observe une diff rence de l ordre du dixi me entre le total r el et estim de la variable Salaire o 0 81 1 11 le calage est r alis en 6 it rations On observe une diff rence de l ordre du dixi me entre le total r el et estim de la variable Salaire o 0 81 1 10 le calage ne peut tre r alis Avec la fonction lin aire tronqu e pour des rapports de poids compris entre o 0 81 1 12 le calage est r alis en 2 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire o 0 81 1 11 le calage est r alis en 3 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire o 0 81 1 10 le calage ne peut tre r alis Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 Strate 3 Avec la fonction du sinus hyperboligue pour un coefficient gal a O O 10 le calage est r alis en 6 it rations On observe une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire On obtient des rapports de poids compris entre 0 81 et 1 11 30 le calage est r alis en
29. pas Message LN out of range o 0 80 1 10 le calage ne converge pas Message LN out of range Strate 3 o 0 76 1 18 le calage converge en 7 it rations et 29 6 secondes Il ne signale aucun cart entre le total et son estimateur par calage 0 76 1 17 le calage ne converge pas Message LN out of range 0 90 1 18 le calage converge en 7 it rations et 30 secondes Il ne signale aucun cart entre le total et son estimateur par calage o 0 91 1 18 le calage ne converge pas Message LN out of range Strate 4 o 0 89 1 09 le calage converge en 8 it rations et 31 1 secondes Il ne signale aucun cart entre le total et son estimateur par calage o 0 89 1 08 le calage converge imparfaitement en 5 it rations et 31 secondes On a un cart de 0 86 Yo entre le total d une variable cat gorielle v2 et son estimateur par calage 0 89 1 07 le calage ne converge pas Message LN out of range 0 90 1 08 le calage ne converge pas Message LN out of range Strate 5 o 0 84 1 10 le calage converge en 7 it rations et 39 2 secondes Il ne signale aucun cart entre le total et son estimateur par calage 0 84 1 09 le calage ne converge pas Message LN out of range 0 92 1 10 le calage converge en 7 it rations et 38 secondes Il ne signale aucun cart entre le total et son estimateur par calage o 0 93 1 10 le calage ne converge pas Message LN out of range
30. pour le rapport de poids une borne inf rieure L et une borne sup rieure U avec 0 lt L lt 1 lt U mais l algorithme est diff rent de celui qui est utilis dans Calmar 2 et g Calib 2 Enfin pour la m thode par la pond ration multiplicative les poids w sont calcul s en utilisant un algorithme classique de redressement propos par Deming et Stefan 1940 appel iterative proportional fitting IPF Cet algorithme n est qu un cas particulier de la m thode de calage par raking ratio impl ment e dans g Calib 2 et Calmar 2 correspondant au calage utilisant la fonction exponentielle avec des variables auxiliaires cat gorielles Pour le calage par grappe Bascula utilise la m thode de redressement par la r gression lin aire linear consistent weighting qui permet de calculer les nouveaux w tout en contraignant l galit des poids pour les individus d une m me grappe Sous Bascula 4 0 le choix de la m thode de redressement d pend du type des variables de calage utilis es dans le redressement Souvent les possibilit s du choix offertes par Bascula sont limit es Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 e Si le mod le de pond ration comporte une seule variable de calage de type cat gorielle le choix se limite au redressement par poststratification e Si le mod le de pond ration comporte une seule variable de calage de type quantitative le programme impose de choisir entre le redressement par l
31. rations et 55 2 secondes ne signale pas d cart entre le total r el et le total estim par calage o 0 97 1 06 non convergence avec le message LN out of range e Fonction lin aire tronqu e o 0 96 1 6 le calage converge en 2 it rations et 52 3 secondes ne signale pas d cart entre le total r el et le total estim par calage o 0 97 1 06 le calage converge en 6 it rations et 53 6 secondes ne signale pas d cart entre le total r el et le total estim par calage o 0 97 1 03 le calage converge imparfaitement en 5 it rations et 50 5 secondes mais pas de message explicite dans les r sultats dit s La diff rence relative maximum entre estimateur cal et le total r el est de 2 1 Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 o 0 98 1 02 le calage converge imparfaitement en 6 it rations et 53 2 secondes mais pas de message explicite dans les r sultats dit s La diff rence relative entre l estimateur cal et le total r el est comprise entre 0 1 et 3 Yo Les rapports de poids sont tous gaux l une des deux bornes aucun n est compris entre les deux 6 2 1 2 Comparaison avec Calmar 2 Lorsque le calage converge parfaitement g Calib 2 et Calmar 2 fournissent des poids qu on peut consid rer gaux pour chaque individu Les carts maximums sont compris entre 10 et 10 qu on peut attribuer aux diff rences de pr cision de calcul entre les logiciels SPSS et
32. re variable auxiliaire sp cifi e dans la table des quations de calage X le total de cette variable dans la population et Xx D ding son estimation partir de l chantillon et des poids initiaux On peut utiliser ce param tre pour un redressement uniforme de la non r ponse condition de sp cifier en premi re contrainte de calage une constante gale 1 et la taille de la population 6 1 4 4 Fusion des individus en classes g Calib 2 cr e une table de travail contenant une observation par vecteur des variables de calage r sultat du regroupement collapsing des individus de l chantillon pr sentant les m mes modalit s des variables auxiliaires C est cette table fusionn e qui est utilis e en entr e des it rations avec une pond ration tenant compte de l effectif de la classe 6 1 5 Output 6 1 5 1 Fichier des poids de calage g Calib 2 fournit en sortie un fichier de format SPSS extension svo contenant les poids de calage Ce fichier contient deux groupes de variables Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 Variables de Vutilisateur identifiant de l observation variable identifiant la strate poids initial variable contenant la q pond ration variables de calage indicatrices des modalit s dans le cas des variables cat gorielles Variables cr es par g Calib 2 Scale valeur du facteur d chelle Scawei poids initial multipli par le facteur d chelle C
33. 08 0 97 1 07 0 97 1 07 0 96 1 08 0 96 1 08 0 97 1 06 0 97 1 06 0 96 1 08 0 96 1 08 0 97 1 08 Calage au niveau individus M thode lin aire M thode exponentielle M thode lin aire trongu e M thode logit 0 96 1 50 0 96 1 60 0 96 1 10 0 96 1 10 0 96 1 49 0 96 1 60 0 97 1 06 0 97 1 20 0 96 31 50 0 96 31 06 Calage avec galit des poids dans la grappe M thode lin aire M thode exponentielle M thode lin aire tronqu e M thode logit 0 90 1 42 0 90 1 49 0 90 1 10 0 90 1 10 Lemaitre Dufour 0 94 1 44 0 94 1 51 0 97 1 10 0 96 1 10 Lemaitre Dufour 0 94 31 50 0 95 31 06 Calage en grappes simultan M thode lin aire M thode exponentielle M thode lin aire tronqu e M thode logit 0 87 1 37 0 88 1 42 0 90 1 10 0 92 1 08 0 87 1 37 0 88 1 42 0 94 1 07 0 93 1 07 Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 M thode de calage Calmar 2 g Calib 2 Bascula 4 0 Calage stratifi Strate 1 M thode lin aire M thode exponentielle M thode lin aire trongu e M thode logit 0 76 1 28 0 77 1 29 0 76 1 28 0 77 1 28 0 76 1 28 0 77 1 29 0 77 1 28 0 77 1 27 0 76 1 30 0 84 1 31 Strate 2 M thode lin aire M thode exponentielle M thode lin aire trongu e M
34. 6 PrODIEMES La kasa i ai a send ER RE D DS 23 6 2 R sultats des tests r alis s ssccssccsssssccsccscsssssssseessssesssessssceessssessssessssseesees 24 6 2 1 Calage simple sur la population d individus ccccccceeessseceeeetteeeeeenneees 24 6 2 2 Calage simple sur la population de m nages 25 6 2 3 Calage au niveau individu avec contrainte d galit des poids dans le m nage 27 6 2 4 Calage simultan sur des totaux dans la population des m nages et dans celle des ANGIVIGUS c t5t iais Ia ie Askas iais ais Kakas aaa beset kat akiai aa adis Labai antis rt tat te 29 6 2 5 Calage sur la population d individus dans chaque strate 30 6 3 Contr le des param tres dans g Calib 2 sscccssssscssssssssccssscsccccsssseesssssesees 36 7 EVALUATION DE CALMAR 2 ccccsceseceeeeeeseceeeeeaseceeeeeseseeeenssseenennnens 39 7 1 Aspects g n raux de Calmar 2 soessssssoessssoessssoosssssocssssocssssoessssoosesssosssssoessssoes 39 7 1 1 Pacilit d tiliSatiON 754 nettes 39 7 1 2 I Nuo A 40 7 1 3 Fonctionnalil S L s sinisio kskoisio ss sp iki strates dette ap o up Kn Ua V ss 42 7 1 4 ilko cect nn ct se nent nent sets re cele setsoet lace eeeletieetlepes gid 44 TLS Problemes Sen e i D e SE a E i i TE SaaS 46 7 1 6 Ibis arealas into ak nennen ni n e e a tase tela sy 46 7 2 R sultats obtenus avec Calmar 2 eesseessseessoessoessosoessosesosesoceseoessoessosesoeesoseseoessose 46 7 2 1 Calage simple au
35. Statistics Belgium Working Paper La Direction g n rale Statistigue et Information conomigue propose des informations statistiques impartiale Les informations sont diffus es conform ment la loi notamment pour ce qui concerne leur confidentialit Nous classons les statistiques en huit domaines G n ralit s Territoire et environnement Population Soci t conomie et finances Agriculture et activit s assimil es Industrie Services commerce et transports Tous droits de traduction d adaptation de reproduction par tous proc d s y compris la photographie et le microfilm sont soumis a autorisation pr alable de la Direction g n rale Statistique et Information conomique Toutefois la citation de courts extraits a titre explicatif ou justificatif dans un article un compte rendu ou un livre est autoris e moyennant indication claire et pr cise de la source Editeur responsable N DEMEESTER 2006 SPF ECONOMIE DIRECTION GENERALE STATISTIQUE ET INFORMATION ECONOMIQUE diteur B 1000 Bruxelles 44 rue de Louvain Statistics Belgium Working Paper n 11 Evaluation de trois logiciels de calage g Calib 2 0 Calmar 2 et Bascula 4 0 ETUDE REALISEE PAR GUILLAUME CHAUVET JEAN CLAUDE DEVILLE MOHAMMED EL HAJ TIRARI JOSIANE LE GUENNEC Ann e 2005 Table des mati res INTRODUC TIO N Linas sin as i Sa a a i i a a a i i i i qu 2 EVALUATION DE G CALIB 2 ETUDE THEORIQUE
36. age Le calage ne peut pas tre r alis d une mani re parfaite dans les cas suivants e L algorithme peut ne pas converger avec le nombre d it rations maximal fix e L algorithme peut ne pas converger Ce probl me peut notamment se produire en cas d utilisation d une fonction de distance tronqu e si les bornes impos es aux rapports de poids sont trop contraignantes 8 1 6 Documentation Contrairement aux manuels d utilisation de g Calib 2 et de Calmar 2 celui de Bascula 4 0 n est pas assez clair et ne contient pas beaucoup d explications o les variables utilis es ne sont pas bien d finies C est le cas par exemple des Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 d finitions des variables Inclusion weight et correction weight voir pages 11 12 de Nieuwenbroek et Boonstra 2002 8 2 R sultats obtenus avec Bascula 4 0 selon les diff rentes fonctions de calage Les limites de Bascula sont les suivantes Une variable cat gorielle ne doit pas avoir plus de 2000 modalit s Les valeurs des probabilit s d inclusion ne doivent pas tre n gatives Lors des calculs les observations correspondantes aux probabilit s d inclusion nulles sont ignor es par Bascula Pour le calage par grappe les individus de la m me grappe doivent se suivre dans la base de donn es et leurs probabilit s d inclusion doivent tre gales Au maximum 200 chantillons peuvent tre s lectionn s pour e
37. al estim par calage Les rapports de poids sont compris entre 0 96 et 1 08 e Fonction exponentielle le calage converge en 4 it rations et 54 5 secondes ne signale pas d cart entre le total r el et le total estim par calage Les rapports de poids sont compris entre 0 96 et 1 08 e Fonction logit pour des rapports de poids compris entre o 0 97 1 07 le calage converge en 7 it rations et 37 secondes ne signale pas d cart entre le total r el et le total estim par calage o 0 97 1 06 le calage converge en 7 it rations et 33 5 secondes ne signale pas d cart entre le total r el et le total estim par calage o 0 98 1 07 non convergence avec le message LN out of range o 0 98 1 06 non convergence avec le message LN out of range e Fonction lin aire tronqu e o 0 97 1 06 le calage converge en 5 it rations et 32 secondes ne signale pas d cart entre le total r el et le total estim par calage o 0 97 1 07 le calage converge en 5 it rations et 33 7 secondes ne signale pas d cart entre le total r el et le total estim par calage o 0 98 1 06 le calage converge imparfaitement o 0 98 1 07 le calage converge imparfaitement 6 2 2 2 Comparaison avec Calmar 2 Lorsque le calage converge parfaitement g Calib 2 et Calmar 2 fournissent des poids qu on peut consid rer gaux pour chaque individu Les carts maximums sont compris entre 107 et 107 qu on peu
38. alwei poids de calage G_weig rapport entre les variables calwei et scawei Lorsque le facteur d chelle est choisi 1 c est le rapport entre poids de calage et poids initial Le fichier des poids est tri par strate et par identifiant de l unit Il peut donc se trouver dans un ordre diff rent du fichier chantillon sp cifi en entr e Chaque ex cution de g Calib 2 cr e une nouvelle table de poids Si l on sp cifie le nom d une table existante celle ci est cras e 6 1 5 2 Fichiers de programmes g Calib 2 cr e dans le r pertoire de l utilisateur deux fichiers de syntaxe SPSS Temp Design sps est g n r par chaque ex cution du programme Temp spp est g n r par chaque ex cution lanc e par l interface de saisie Il contient les param tres de la demande et les commandes d ex cution des modules du programme Il peut tre renomm sous un nom propre l utilisateur ce qui permet de le rappeler sous Windows pour une ventuelle modification des param tres et ex cution Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 6 1 5 3 Autres fichiers g Calib 2 conserve dans le r pertoire de l utilisateur des fichiers contenant les donn es de l chantillon E desmat sav pour le niveau unit secondaire C desmat sav pour le niveau grappe tri s dans le m me ordre que celui des poids de calage Il stocke aussi des fichiers contenant les totaux des variables de calage fic
39. ans cette deuxi me partie du rapport l valuation des logiciels g Calib 2 Calmar 2 et Bascula 4 0 va se faire sur le plan pratique en consid rant les aspects d valuation faisant partie du cahier des charges de cette tude Tous les tests effectu s ont t r alis s en utilisant les donn es suivantes Les r pondants l enqu te sur l emploi en France r alis e en 2001 par l Insee constituent la population de r f rence soit 114 111 individus dans 58 189 logements L chantillon simul utilis pour le calage comprend 8000 logements fichier echup et 15 696 individus de 15 ans ou plus fichier echant s lectionn s par sondage al atoire simple de grappes Les variables auxiliaires retenues sont celles habituellement utilis es pour redresser cette enqu te e Pour la population d individus o Age quinquennal de 15 70 ans puis 70 ans et plus variable cat gorielle o salaire net mensuel variable num rique e Pour la population de m nages rang du sous chantillon auquel appartient le m nage 3 modalit s lieu de r sidence Paris province o o o taille du m nage personnes seules autres o statut d occupation du logement en 6 modalit s selon la nomenclature du recensement Pour le calage par strate la population des r pondants l enqu te emploi 2001 est stratifi e l aide de la variable TZPIU Tranche de Zone de Peuplement Evaluation de g Calib 2 Ca
40. ant les fichiers de donn es table chantillon Il peut ensuite tre rappel modifi et r ex cut condition de faire appel des fichiers de donn es situ s dans le m me r pertoire Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 La table des poids de calage est galement stock e dans le r pertoire de travail sp cifi g Calib2 cr e en sortie outre la table des poids un fichier appel Temp Design sps g n r par le programme et un fichier Temp spp contenant le programme de calage Ce dernier peut ensuite tre rappel sous Windows modifi renomm pour un stockage d finitif et ex cut sans utiliser l interface de saisie condition d avoir conserv Temp Design sps Dans le contexte particulier de l ENSAI cette derni re solution s est r v l e plus rapide 6 1 3 Input La table contenant l chantillon doit tre en format SPSS Ce logiciel permet notamment la lecture des formats Excel Lotus Dbase et SAS dans diff rentes versions extensions sd2 sd7 sas7bdat xpt et version 6 sous Unix ainsi que celle de fichiers texte txt II faut avoir fait cette conversion avant d ex cuter une requ te g Calib 2 Outre les variables de calage et la variable num rique de pond ration initiale la table de donn es doit contenir de fa on obligatoire e une variable identifiant les unit s de l chantillon qui doit tre de format num rique e une variable i
41. au centi me entre le total r el et estim de la variable Salaire 0 77 1 28 le calage est r alis en 6 it rations On observe une diff rence inf rieure l unit entre le total r el et estim de la variable Salaire 0 77 1 27 le calage ne peut tre r alis Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 Avec la fonction lin aire trongu e pour des rapports de poids compris entre o 0 76 1 28 le calage est r alis en 3 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire o 0 76 1 27 le calage ne peut tre r alis Avec la fonction sinus hyperbolique pour un coefficient gal o 10 le calage est r alis en 7 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire On obtient des rapports de poids compris entre 0 82 et 1 27 o 40 le calage est r alis en 12 it rations On observe une diff rence de plusieurs dizaines d unit s entre le total r el et estim de la variable Salaire On obtient des rapports de poids compris entre 0 83 et 1 27 o 50 le calage ne peut tre r alis Strate 2 Avec la fonction lin aire on obtient une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire Les rapports de poids sont compris entre 0 81 et 1 12 Avec la fonction exponentielle le calage est r alis en 4 it rations On
42. auvegarde En format SAS Format SPSS par En format Ascii ou d faut et exportation format Blaise en format HTML sur option e Donn es individuelles Edit es partiellement sur option Fichier Log Distinct du fichier de Confondu avec le Distinct du fichier de r sultats fichier de r sultats r sultats Articulation avec d autres programmes de traitement de la table chantillon Ex cution de CALMAR 2 possible l int rieur d un programme SAS ou d une macro SAS de l utilisateur Sur option e lancement d un programme SPSS avant calage traitement des donn es e lancement d un programme SPSS apr s calage estimation d un param tre e partir de l interface de saisie Ex cution interactive de Bascula possible l int rieur Blaise et depuis Manipula Blaise script Possible aussi depuis divers programmes tournant sous Windows VBA Delphi C S Plus Conclusion g n rale Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 10 Conclusion g n rale Notre travail portait sur la comparaison de trois logiciels permettant de redresser des chantillons par calage sur une information auxiliaire Bascula 4 0 programm en langage Pascal Delphi Calmar 2 programm en langage SAS et g Calib 2 transformations des donn es et calculs programm s en langage SPSS interface programm en langage Visual Basic Nous avons pour cela effectu un certain
43. calage est r alis exactement en 3 it rations Les rapports de poids sont compris entre 0 96 et 1 08 Avec la fonction logit pour des rapports de poids compris entre O O O O 0 94 1 1 le calage est exactement r alis en 4 it rations 0 95 1 09 le calage est r alis en 4 it rations On observe une diff rence inf rieure au centi me entre un total r el et un total estim d une variable de calage 0 96 1 08 le calage est r alis en 4 it rations On observe des diff rences inf rieures au centi me entre des totaux r els et estim s de variables de calage 0 97 1 07 le calage est exactement r alis en 7 it rations 0 98 1 06 le calage ne peut tre r alis Avec la fonction lin aire tronqu e pour des rapports de poids compris entre O OF 0 O 0 94 1 1 le calage est exactement r alis en 2 it rations 0 95 1 09 le calage est exactement r alis en 2 it rations 0 96 1 08 le calage est exactement r alis en 3 it rations 0 97 1 07 le calage est exactement r alis en 5 it rations 0 98 1 06 le calage ne peut tre r alis Avec la fonction sinus hyperbolique pour un coefficient gal a O O 10 le calage est exactement r alis en 4 it rations On obtient des rapports de poids compris entre 0 96 et 1 07 100 le calage est exactement r alis en 8 it rations On observe des diff rences inf rieures au centi me ent
44. dentifiant la strate m me si le sondage n est pas stratifi Cette variable doit tre num rique et codifi e de fa on s quentielle partir de 1 sans discontinuit s e une variable de pond ration sp cifier dans le param tre gpond de l interface de saisie Dans le cas o l on ne souhaiterait pas utiliser ce param tre cette variable sera la constante 1 Dans le cas d un sondage en grappes avec calage simultan la table des unit s secondaires doit contenir l identifiant de l unit primaire laquelle elle appartient On note que SPSS ne reconna t pas le nom d une variable contenant un blanc soulign underscore _ quand elle a t cr e sous SAS Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 en plus de l identifiant de l unit secondaire Les deux param tres doivent alors tre sp cifi s Le poids initial doit tre pr sent dans les deux tables 6 1 4 Fonctionnalit s 6 1 4 1 Plan de sondage Rappelons que g Calib 2 fournit des poids redress s pour une enqu te r alis e selon l un des plans de sondage suivants voir 3 1 e Sondage un seul degr d observation calage de l chantillon sur les totaux dans la population de variables auxiliaires num riques ou cat gorielles e Sondage en grappes avec calage sur des totaux dans la population des unit s secondaires respectant l galit des poids entre unit s d une m me grappe e Sonda
45. e 0 3 et 5 2 Yo de la valeur concern e Les rapports de poids sont tous gaux l une des deux bornes 6 2 4 2 Comparaison avec Calmar 2 g Calib 2 fournit en sortie une seule table de poids de niveau grappe m nage tandis que Calmar 2 fournit deux tables l une au niveau grappe et l autre au niveau unit secondaire L algorithme est le m me dans les deux logiciels et conduit aux m mes poids lorsque le calage converge Les diff rences entre les poids individuels sont au maximum compris entre 10 et 10 Avec la m thode logit g Calib 2 refuse plus vite la convergence tandis que Calmar 2 accepte des bornes plus strictes Calmar 2 diverge partir des bornes 0 945 1 055 tandis que g Calib 2 s arr te avec les bornes 0 94 1 07 Avec la fonction lin aire tronqu e g Calib 2 continue fournir des poids m me en cas d impossibilit de calage C est le cas avec les bornes 0 95 1 05 limites partir desquelles Calmar 2 et l option colin non diverge 6 2 5 Calage sur la population d individus dans chaque strate On a tir un second chantillon d individus fichier echantstrat selon un sondage en grappes avec stratification des grappes logements par zone g ographique variable zpiu 6 modalit s et sondage al atoire simple dans les strates On a obtenu 8 001 m nages et 15 737 individus Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 L chantillon d individus est cal s
46. e est r alis en 8 it rations On observe une diff rence de l ordre de l unit entre le total r el et estim de la variable Salaire On obtient des rapports de poids compris entre 0 94 et 1 10 100 le calage ne peut tre r alis Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 Strate 6 Avec la fonction lin aire on obtient une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire Les rapports de poids sont compris entre 0 88 et 1 32 Avec la fonction exponentielle le calage est r alis en 3 it rations On obtient une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire Les rapports de poids sont compris entre 0 88 et 1 37 Avec la fonction logit pour des rapports de poids compris entre O O 0 88 1 30 le calage est r alis en 5 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire 0 88 1 10 le calage est r alis en 7 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire 0 90 1 10 le calage est r alis en 7 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire 0 90 1 09 le calage ne peut tre r alis Avec la fonction lin aire tronqu e pour des rapports de poids compris entre O O 0 88
47. ement par calage sur des variables auxiliaires selon la m thode mise au point par Jean Claude Deville et Carl Eric S rndal 1992 Elle comprend les 4 fonctions de calage propos es dans l article fondateur Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 e Fonction lin aire F u 1 u e Fonction exponentielle F u e e Fonction lin aire tronqu e F u 1 u pour L lt F u lt U L U 1 U 1 L e U L e Fonction logit F u Goan De avec OD ainsi qu une propos e plus r cemment e Fonction sinus hyperbolique 2 F u L oskai V4a u vij iloba u v4a u 4 z a a avec a gt 0 7 1 3 3 Traitement de la non r ponse Calmar 2 permet galement d utiliser la technique de calage g n ralis Deville 2002 pour faire un redressement de la non r ponse par calage l aide de variables instrumentales connues uniquement sur l chantillon de r pondants Si on souhaite utiliser cette technique e Le param tre NONREP doit tre cod OUI e Les diff rentes tables de marges MARMEN et ventuellement MARIND et MARKISH doivent contenir o comme observations les variables instrumentales en plus des variables de calage o un indicateur du type de variable variable instrumentale ou variable de calage e Les diff rentes tables de donn es DATAMEN et ventuellement DAT AIND et DATAKISH doivent contenir les variables instrumentales e Le vecteur des variables instrumenta
48. emplacement par une autre variable non d j utilis e dans le dictionnaire du fichier Les erreurs suivantes ont t test es Omission du nom de la table contenant les poids de calage si on conserve l option par d faut none de l interface de saisie la table est cr e sous le nom none Si on laisse le champ blanc le programme se plante sans message programm Omission de la borne inf rieure des rapports de poids avec la fonction logit la valeur par d faut est mise blanc le programme se plante sans message programm Poids initiaux n gatifs dans le fichier d enqu te le calage se r alise II n y a aucun message dans le fichier de r sultats en particulier aucune observation limin e du calage Avec la fonction lin aire le tableau r capitulatif des it rations ne donne aucun poids n gatif en sortie alors que dans la table des poids le poids de calage est gal au poids initial donc n gatif pour les observations poids initial n gatif Sp cification de l identifiant de la grappe au lieu de celui de l unit secondaire dans un calage simple sur la population des unit s secondaires le calage se r alise les poids sont les m mes que ceux obtenus en sp cifiant le bon identifiant aucun message Inversion des identifiants grappe et unit secondaire dans un calage en grappes sans donn es de niveau grappe le calage se r alise et donne des poids gaux celui d un calage s
49. essage LN out of range e Fonction lin aire tronqu e o 0 96 1 1 le calage converge en 48 7 secondes et 5 it rations Il ne signale pas d cart entre le total r el et le total estim par calage o 0 97 1 1 le calage converge en 52 4 secondes et 7 it rations Il ne signale pas d cart entre le total r el et le total estim par calage o 0 98 1 05 le calage converge imparfaitement en 52 secondes environ et 8 it rations mais sans message d erreur Les carts entre le total r el et le total estim par calage vont de 0 1 5 7 de la valeur concern e Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 6 2 3 2 Comparaison avec Calmar 2 g Calib 2 utilise la m thode Lemaitre Dufour pour contraindre les poids individuels l galit dans la grappe En notant 7 l indice de la grappe le m nage k celui de l unit secondaire l individu N la taille de la grappe i et d son poids de sondage les quations de calage s crivent DaF r X X Xx ies d d Nd kes LES N kas Pour d pouiller l enqu te il faut donc pr alablement diviser le poids de calage fourni par g Calib 2 par le nombre d individus dans le m nage et utiliser cette nouvelle valeur en poids d extrapolation Le fichier de poids cr par g Calib 2 contient une observation par m nage et la taille de la grappe dans une variable appel e c size Calmar 2 r alise le calage directement sur un fichier de
50. estimation par ratio et le redressement par la r gression e Si le mod le de pond ration comporte plus d une seule variable de calage qui sont toutes de type cat goriel le programme impose de choisir entre le redressement par la r gression lin aire et le redressement par raking ratio e Pour le calage par grappe le programme impose d utiliser le redressement par la r gression lin aire linear consistent weighting Pour les autres types de variables Bascula impose d utiliser le redressement par la pond ration lin aire L option qui permet de choisir pour les rapports de poids une borne inf rieure L et une borne sup rieure U avec 0 lt L lt 1 lt U n est active qu avec le redressement par la pond ration lin aire et le redressement par la pond ration lin aire consistante Remarque Ces restrictions proviennent du fait que selon le contexte certaines m thodes sont d sactiv es celles ci d bouchant sur des r sultats semblables aux m thodes impos es mais avec davantage de calculs Par exemple lorsque le mod le ne comporte qu une seule variable cat gorielle la poststratification livre un r sultat identique ZPF ou la pond ration lin aire Du point de vue du calcul num rique la poststratification est dans ce cas la m thode la plus performante Bascula ne permet d utiliser que des calages sur un seul niveau d observation avec l option de contraindre l galit de poids pour les unit
51. faitement Strate 5 o 0 82 1 10 le calage converge en 5 it rations et 39 9 secondes Il ne signale aucun cart entre le total et son estimateur par calage 0 82 1 09 le calage converge imparfaitement 0 93 1 10 le calage converge en 5 it rations et 36 4 secondes Il ne signale aucun cart entre le total et son estimateur par calage o 0 94 1 10 le calage converge imparfaitement Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 Strate 6 o 0 88 1 10 le calage converge en 5 it rations et 28 8 secondes Il ne signale aucun cart entre le total et son estimateur par calage 0 88 1 09 le calage converge imparfaitement 0 90 1 10 le calage converge en 7 it rations et 32 1 secondes Il ne signale aucun cart entre le total et son estimateur par calage o 0 91 1 10 le calage converge imparfaitement 6 3 Contr le des param tres dans g Calib 2 A condition d utiliser l interface de saisie une logique est impos e aux param tres sp cifi s par l utilisateur e on ne peut sp cifier que le nom d un fichier existant puisque celui ci est s lectionn dans l arborescence via Explorer e dans la table des variables n cessaires au calage on ne peut sp cifier que le nom d une variable existante puisque celle ci est s lectionn e dans le dictionnaire du fichier e on ne peut faire de calage simultan que si l on a sp cifi une table individus et une table grappes dans le
52. ge par rapport aux deux autres softwares d inclure quelques options de plus dont l objectif est de perfectionner les m thodes de calage impl ment es dans le programme Un bref aper u de ces options est donn dans ce qui suit e Lorsque des strates peuvent tre construites le programme permet de r aliser un calage au niveau de ces strates en utilisant l information auxiliaire disponible sur les unit s de la population c est a dire en faisant des calages sur les totaux des strates de l information auxiliaire Le calage sur des strates a l avantage de rendre g Calib 2 plus performant puisque le calcul des nouveaux poids w se fait strate apr s strate ce qui permet d am liorer la gestion de la base de donn es e Possibilit de tenir compte lors de l op ration de calage d un param tre d chelle permettant d ajuster les poids de d part d cette option est disponible galement dans Calmar 2 Si ce param tre d chelle est inconnu g Calib 2 permet aussi de produire une estimation de ce param tre dans chaque strate de calage e Possibilit de pond rer dans les quations de calage par une variable g Cette pond ration permet de retrouver en particulier l estimateur par le ratio e Dans le cas o on a affaire une grande base de donn es pour r duire le temps d ex cution des programmes calculant les nouveaux poids w une technique appel e collapsing est impl ment e dans g Calib 2
53. ge en grappes avec calage simultan sur des totaux dans la population des grappes et sur des totaux dans la population des unit s secondaires Dans tous les cas le calage peut tre r alis par strate dans la totalit ou dans une s lection de strates ou sur les seuls totaux dans la population enti re Avec une fonction de calage born e le calage appliquera les m mes bornes dans chaque strate sp cifi e 6 1 4 2 Mod le de redressement g Calib 2 propose quatre fonctions de calage e fonction lin aire F u l u u e fonction exponentielle F u e e fonction lin aire tronqu e F u l u avec L lt F u lt U e fonction logit born e F w a iv S L exp 4u Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 U L avec UN et r sout les quations de calage par la m thode it rative de Newton mais en et 0 lt L lt 1 lt U utilisant la technigue des matrices inverses g n ralis es Selon la fonction de calage et le type de variables auxiliaires utilis es les poids fournis par g Calib2 redressent l enqu te par r gression par post stratification par raking ratio par le ratio 6 1 4 3 Facteur d chelle Si l on choisit un facteur d chelle diff rent de 1 les poids initiaux sont tous multipli s par cette valeur avant le calage Par d faut le facteur d chelle est calcul automatiquement dans g Calib 2 comme le rapport entre le total X x m o X est la premi
54. hiers E totals sav et C totals sav quivalents des tables de marges dans Calmar 2 et des fichiers de travail interm diaires Survey sav Bench sav dont Putilit pour l utilisateur est hasardeuse En cas de non convergence ou de bug ils n apportent aucune information utile 6 1 5 4 Editions M me en choisissant les options limitant l apparition du log l ergonomie de SPSS ne permet pas de s parer compl tement le log et les ditions en sortie ce qui complique la lecture du fichier de r sultats On peut notamment regretter l absence de titres facilitant l interpr tation et la recherche des r sultats utiles On trouve dans le listing produit e un rappel de quelques uns des param tres du calage type et fonction de calage num ros des strates bornes mais pas le nom des tables sp cifi es e la liste des variables de calage e le nombre d observations r sultant de la fusion des individus identiques e la valeur du facteur d chelle e un tableau donnant chaque it ration o le rang de la matrice D o la valeur de la fonction de distance o la valeur du crit re d arr t change o le nombre de poids n gatifs e un tableau pr sentant les totaux des variables de calage estim s respecti vement avec les poids initiaux les poids initiaux multipli s par le facteur d chelle les poids de calage ainsi que les totaux dans la population et la diff rence relative entre l estimateur cal e
55. i me entre le total r el et estim de la variable Salaire Les rapports de poids sont compris entre 0 86 et 1 41 e Avec la fonction exponentielle le calage est r alis en 4 it rations On obtient une diff rence inf rieure au dixi me entre le total r el et estim de la variable Salaire Les rapports de poids sont compris entre 0 87 et 1 47 e Avec la fonction logit pour des rapports de poids compris entre o 0 87 1 47 le calage est r alis en 4 it rations On observe une diff rence inf rieure au dixi me entre le total r el et estim de la variable Salaire o 0 90 1 30 le calage est r alis en 4 it rations On observe une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire o 0 90 1 10 le calage est r alis en 5 it rations On observe une diff rence inf rieure au dixi me entre le total r el et estim de la variable Salaire o 0 95 1 05 le calage ne peut tre r alis Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 Strate 1 Avec la fonction lin aire trongu e pour des rapports de poids compris entre O O 0 86 1 41 le calage est r alis en 2 it rations On observe une diff rence inf rieure l unit entre le total r el et estim de la variable Salaire 0 90 1 30 le calage est r alis en 3 it rations On observe une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire 0 90
56. i revient affecter chaque unit de l chantillon un poids d gal l inverse de sa probabilit d inclusion Bien qu il s agisse d un estimateur sans biais cet estimateur a l inconv nient de ne tenir compte d aucune information auxiliaire qui pourrait am liorer la qualit des estimations obtenues En effet en pratique on peut disposer d une information auxiliaire qui peut tre la connaissance des valeurs d une ou de plusieurs variables sur toutes les unit s de la population ou en une fonction de ces valeurs Cette information auxiliaire peut tre utilis e pour am liorer la pr cision des estimations obtenues des param tres de la population Dans le cadre du calage on suppose qu on dispose de J variables auxiliaires XX X dont les valeurs sont connues sur l chantillon et dont on conna t les totaux sur la population b gt keU Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 Ces variables auxiliaires peuvent tre des variables cat gorielles calage sur marge Le calage est une m thode dont l objectif est d am liorer la pr cision des estimateurs des param tres de la population en mettant a profit cette information auxiliaire Pour cela on cherche estimer le total 7 de la variable d int r t y l aide d un estimateur de la forme fe wy gt kes ou les poids w affect s aux individus sont proches selon une fonction de distance pr ciser des poids
57. imple Les grappes sont trait es comme tant toutes de taille 1 Calage en grappes sans donn es sur les grappes avec des poids initiaux diff rents entre unit s d une m me grappe avec la fonction lin aire le Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 calage se r alise et donne des poids distincts de ceux obtenus avec une sp cification correcte Aucun message e Variable de pond ration initiale non num rique le programme se plante avec une erreur de syntaxe SPSS mais pas de message programm e Sp cification d une variable de calage qui n existe pas dans le fichier d enqu te le programme se plante avec une erreur de syntaxe SPSS mais pas de message programm Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 7 Evaluation de Calmar 2 7 1 Aspects g n raux de Calmar 2 7 1 1 Facilit d utilisation 7 1 1 1 Logiciel La macro Calmar 2 est programm e en langage SAS elle est compatible avec la version 8 de SAS L ex cution se fait depuis la fen tre Editor de SAS en appelant en d but de programme la version compil e de la macro ou de fa on automatique si la macro est int gr e la version de SAS disponible comme c est le cas V INSEE et PENSAI 7 1 1 2 Saisie des param tres La saisie des param tres se fait dans la fen tre Editor de SAS lors de l appel de la macro de la fa on suivante CALMAR 2 PARAMI valeurl PARAM2 valeur o valeur1 est la valeur
58. inf rieure au centi me entre le total r el et estim de la variable Salaire 0 77 1 17 le calage ne peut tre r alis Avec la fonction du sinus hyperbolique pour un coefficient gal O 10 le calage est r alis en 6 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire On obtient des rapports de poids compris entre 0 85 et 1 18 Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 Strate 4 50 le calage est r alis en 11 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire On obtient des rapports de poids compris entre 0 90 et 1 17 100 le calage ne peut tre r alis Avec la fonction lin aire on obtient une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire Les rapports de poids sont compris entre 0 89 et 1 10 Avec la fonction exponentielle le calage est r alis en 3 it rations On obtient une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire Les rapports de poids sont compris entre 0 89 et 1 11 Avec la fonction logit pour des rapports de poids compris entre O O 0 89 1 11 le calage est r alis en 5 it rations On observe une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire 0 89 1 09 le calage est r alis en 7 it
59. ion exponentielle le calage est r alis en 3 it rations On obtient une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire Les rapports de poids sont compris entre 0 84 et 1 11 Avec la fonction logit pour des rapports de poids compris entre O O 0 93 1 11 le calage est r alis en 5 it rations On observe une diff rence de l ordre du dixi me entre le total r el et estim de la variable Salaire 0 93 1 10 le calage est r alis en 7 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire 0 93 1 09 le calage ne peut tre r alis Avec la fonction lin aire tronqu e pour des rapports de poids compris entre O O 0 93 1 11 le calage est r alis en 4 it rations On observe une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire 0 93 1 10 le calage est r alis en 5 it rations On observe une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire 0 93 1 09 le calage ne peut tre r alis Avec la fonction du sinus hyperbolique pour un coefficient gal O O 10 le calage est r alis en 5 it rations On observe une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire On obtient des rapports de poids compris entre 0 89 et 1 10 50 le calag
60. iquement dans le cas de calage par grappe avec galit des poids dans la grappe Cette diff rence est due au fait que g Calib 2 et Bascula 4 0 utilisent la m thode Lemaitre Dufour ce qui n est pas le cas pour Calmar 2 Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 Tableau 9 2 tableau synoptigue des diff rences entre les trois logiciels Calmar 2 g Calib 2 Bascula 4 0 Mod les de calage associ s aux plans de sondage e Sondage un degr et calage OUI OUI OUI simple e Sondage en grappes calage sur la population des unit s OUI OUI OUI secondaires avec galit des poids dans la grappe e Sondage en grappes et calage simultan sur des totaux de OUI OUI NON grappes et d unit s secondaires e Sondage deux degr s calage simultan sur des totaux d unit s primaires et d unit s OUI NON NON secondaires deux niveaux d observation e Sondage deux degr s calage simultan sur des totaux d unit s primaires et d unit s OUI NON NON secondaires avec trois niveaux d observation e Sondage stratifi et calage Er NON OUI NON s par par strate Redressement de la non r ponse tilisant des variables B T OUI NON NON instrumentales relev es sur les r pondants seulement e Les 4 fonctions fondamentales Les 4 fonctions 4 m thodes de e Sinus fondamentales redressement hyperbolique Fonctions de calage Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 Cal
61. iques 6 2 4 1 R sultats obtenus avec g Calib 2 selon les diff rentes fonctions de calage e Fonction lin aire le calage converge en 1 minute 43 secondes et ne signale aucun cart entre le total et son estimateur par calage Les rapports de poids sont compris entre 0 87 et 1 37 e Fonction exponentielle le calage converge en 4 it rations et 1 minute 4 secondes Il ne signale aucun cart entre le total et son estimateur par calage Les rapports de poids sont compris entre 0 88 et 1 42 e Fonction logit o 0 90 1 08 le calage converge en 5 it rations et 1 minute 9 secondes II ne signale aucun cart entre le total et son estimateur par calage o 0 93 1 07 le calage converge en 6 it rations et 1 minute 7 secondes II ne signale aucun cart entre le total et son estimateur par calage o 0 94 1 07 non convergence avec le message LN out of range Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 e Fonction lin aire tronqu e o 0 93 1 07 le calage converge en 6 it rations et 1 minute 15 secondes Il ne signale aucun cart entre le total et son estimateur par calage o 0 94 1 07 le calage converge en 6 it rations et 1 minute 36 secondes Il ne signale aucun cart entre le total et son estimateur par calage o 0 95 1 05 le calage converge tr s imparfaitement en 21 it rations et 1 minute 36 secondes Les carts entre le total d une variable de calage et son estimateur sont compris entr
62. it primaire laquelle se rattache l unit secondaire param tre IDENT e La table des marges param tre MARIND qui sp cifie o O O les variables auxiliaires utilis es pour le calage leur nombre de modalit s 0 pour une variable num rique les valeurs des marges Dans le cas d un sondage deux degr s avec trois niveaux d observation on doit en plus des tables pr c dentes table DATAMEN des unit s primaires s lectionn es et table des marges associ es MARMEN table DATAIND des unit s secondaires correspondantes et table des marges associ es MARIND sp cifier e la table des unit s secondaires s lectionn es au 2 degr de tirage param tre DATAKISH Elle doit contenir O O les variables de calage la variable identifiant l unit secondaire variable d j pr sente dans DATAIND param tre IDENT2 la variable identifiant l unit primaire laquelle elle se rattache variable d j pr sente dans DATAIND et DATAMEN param tre IDENT la variable de pond ration de l unit secondaire dans l unit primaire i e inverse de sa probabilit conditionnelle de tirage de degr 2 Elle doit tre de type num rique e La table des marges param tre MARKISH qui sp cifie O O O les variables auxiliaires utilis es pour le calage leur nombre de modalit s 0 pour une variable num rique les valeurs des marges Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 7 1 3 Fo
63. it s primaires sur chaque unit secondaire appartenant l unit primaire de l chantillon et sur les unit s secondaires s lectionn es au deuxi me degr Par exemple sur les m nages sur tous les individus de m nage et sur les individus appartenant au champ du tirage Kish On note que ce dernier type de niveaux de calage peut tre galement r alis par g Calib 2 mais pas d une mani re automatique 3 3 Les niveaux de calage r alis s par Bascula 4 0 Un calage sur deux niveaux unit s de la population individus et grappes est pr vu dans Bascula 4 0 son fonctionnement n cessitant une variable additionnelle savoir 1 em o m est la taille de la grappe m 3 4 Evaluation de g Calib 2 Pour le calage sur plusieurs niveaux g Calib 2 est un software qui offre un large choix de possibilit s de calage correspondant aux principaux niveaux d observation qu on peut rencontrer en pratique De plus d autres types de niveaux de calage comme le calage sur plus de deux niveaux d observation Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 peuvent tre galement r alis s par g Calib2 mais pas d une mani re automatique On peut donc conclure que de point de vue niveaux de calage g Calib 2 para t un software de calage complet qui peut tre utilis dans presque toutes les situations rencontr es en pratique 4 D autres possibilit s sp cifiques a g Calib 2 On note que g Calib 2 a l avanta
64. la gare Place Buisset Rue du Coll ge Place Charles II Boulevard Tirou rue de la Montagne Bus arr t Tirou Autoroute petite ceinture de Charleroi sortie Gare du Sud Parking P payant face PINS Gand A asas Coupure rechts 620 9000 Gent t l 09 267 27 00 fax 09 267 27 29 e mail info gent statbel economie fgov be Train B Gent St Pieters Tram Bus 40 43 arr t Theresianenstraat Autoroute acc s ais par autoroute E40 sortie N 13 a A A A a A A VA AV A a a A A Q Tunanoo E r ECEE SLEE Gent West Drongen Naan station Naan E17 Parking P au long de la Coupure Rechts a r Qay Li ge S D Bd de la Sauveni re 73 75 4000 Li ge EE CE S t l 04 223 84 11 fax 04 222 49 94 4 noy TAS e mail info liege statbel economie fgov be LRA Train B Gare des Guillemins ou Gare du Palais Q Tram Bus Guillemins 1 et 4 arr t Sauveni re Parking P Neujean 20 m m me trottoir Mercure en face D BOULEVARD DE LA S Rr 2 B BOULEVARD D AVROY B VERS GARE DES GUILLEMINS Nous diffusons de nombreux produits gui donnent une image chiffr e de la r alit socio conomigue belge Ces produits repris dans notre catalogue sont disponibles aupr s de nos centres r gionaux ou aupr s de notre service de Documentation vente de Bruxelles Notre catalogue vous sera envoy sur simple demande voir adresses ci contre Vous trouverez ga
65. lement un extrait de nos donn es ainsi que la liste de nos publications sur notre site Internet http statbel fgov be Publications g n rales Communiqu hebdomadaire Chaque semaine nous vous donnons la primeur des derni res statistiques disponibles dans les domaines suivants Territoire et environnement Population Soci t Economie et finances Agriculture Industrie Services commerce et transport Chiffres cl s Cette petite publication explore notre territoire sous ses aspects les plus divers le climat l environnement la population la vie sociale l conomie les finances l agriculture l industrie le transport la soci t de l information Chiffres cl s 2004 est une brochure gratuite de 50 pages en couleurs de format r duit Vous y trouverez une s lection de la rubrique Statistiques de notre site Internet brossant une vue singuli re de l information statistique disponible en Belgique Les tableaux sont clair s par des graphiques et des cartogrammes Quelques autres publications Publications g n rales Economie et finances Annuaire de statistiques r gionales Vente de biens immobiliers Annuel rie La conjoncture Mensuel Territoire et environnement Statistique de l occupation du sol disquette Agriculture Aper u Environnement Annuel Recensement agricole et horticole au 15 mai Annuel Population Mouvement de la population Annuel Industrie Perspectives de populatio
66. les doit avoir la m me dimension que le vecteur des variables de calage et le m me nombre de variables cat gorielles Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 7 1 4 Output 7 1 4 1 Contr les effectu s La macro permet d effectuer un nombre important de contr les de coh rence sur les tables les variables en entr e et les param tres L tendue des contr les est g r e par le param tre CONT 7 1 4 2 Fichier des poids de calage La macro Calmar 2 fournit en sortie des tables SAS contenant les poids de calage Pour un calage simple correspondant a un degr d observation on obtient une table DATAPOI contenant les observations non limin es de la table DATAMEN ainsi que la les variable s e Pond ration finale e Eventuellement Identifiant de chaque unit Dans le cas d un sondage par grappes avec calage simultan on obtient en plus de la table pr c dente une table DATAPOI2 contenant en observations les unit s secondaires non limin es de la table DATAIND ainsi que les variables e Pond ration finale associ e aux unit s secondaires e Identifiant de chaque unit secondaire e Identifiant de la grappe associ e chaque unit secondaire Dans le cas d un sondage deux degr s avec trois niveaux d observation on obtient en plus des tables pr c dentes une table DATAPOI3 contenant en observations les unit s secondaires non limin es de la table DATAKISH ainsi que les variables
67. lmar 2 et Bascula 4 0 Industriel ou Urbain Comme certains effectifs dans l chantillon sont faibles pour les ZPIU rurales on op re des regroupements On obtient ainsi 6 strates o Modalit s 0 3 de TZPIU communes hors ZPIU ou de ZPIU de moins de 20 000 habitants strate 1 Modalit 4 de TZPIU ZPIU de 20 000 50 000 habitants strate 2 Modalit 5 de TZPIU ZPIU de 50 000 100 000 habitants strate 3 Modalit 6 de TZPIU ZPIU de 100 000 200 000 habitants strate 4 Modalit 7 de TZPIU ZPIU de 200 000 2 000 000 habitants strate 5 Modalit 8 de TZPIU ZPIU de paris strate 6 On dispose de la m me information auxiliaire que pr c demment On r alise un calage simple avec l information disponible au niveau individu Dans la population des r pondants on pr l ve un chantillon stratifi avec allocation proportionnelle en visant un chantillon de 8 000 m nages fichier echupstrat L ensemble des individus de 15 ans et plus appartenant ces m nages constitue l chantillon d individus fichier echup strat Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 6 Evaluation de g Calib 2 6 1 Aspects g n raux de g Calib 2 6 1 1 Installation du logiciel La version 2 du logiciel g Calib 2 a t test e dans la configuration suivante syst me d exploitation Windows NT SPSS version 12 installation individualis e sur postes fixes sans acc s partag
68. mar 2 g Calib 2 Bascula 4 0 Algorithme de calage e Inversion de matrice e Calage en grappes sans donn es de niveau grappe Inversion normale par d faut g n ra lis e optionnelle Calage des totaux de grappes Inversion g n ralis e syst matique Calage des moyennes de grappes Lema tre Dufour Inversion g n ralis e syst matique Calage des moyennes de grappes Lema tre Dufour Pr cision des calculs par d faut e Crit re d arr t 107 105 10 e Nombre maximum 15 20 15 d it rations Initialisation des param tres par d faut e PONDOK 1 non initialis 1 ECHELLE 1 X Xn X tant 17 la 1 variable de calage list e e Bornes des rapports non initialis es 0 1 5 non initialis es de poids m thodes logit et lin aire tronqu e Param tres obligatoires e PONDQK NON par d faut OUI NON e STRATE n existe pas OUI n existe pas dans un sondage en grappes e POIDS de la grappe OUI OUI OUI e POIDS de l unit NON OUI NON secondaire Mode de sp cification des contraintes de calage Table SAS de format impos Interface de saisie Interface de saisie Mode de sp cification des totaux de calage Valeur absolue ou pourcentage Valeur absolue Valeur absolue Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 Calmar 2 g Calib 2 Bascula 4 0 Table des poids de calage Avec un sondage en grappes
69. mpris entre 0 96 et 1 5 e Fonction lin aire tronqu e pour des rapports de poids compris entre o 0 96 1 06 le calage est r alis exactement Les rapports de poids sont compris entre 0 96 et 1 06 o 0 97 1 06 convergence imparfaite apr s 15 it rations Bascula fournit comme m me les poids finaux L estimateur cal des totaux des variables et les vrais totaux sont gaux Les rapports de poids sont compris entre 0 97 et 1 06 o 0 96 1 05 convergence imparfaite apr s 15 it rations Bascula fournit comme m me les poids finaux L estimateur cal des totaux des variables et les vrais totaux sont gaux Les rapports de poids sont compris entre 0 96 et 1 06 Ainsi les bornes limites sont L U 0 96 31 06 8 2 3 Calage simple au niveau individu dans un sondage en grappe e Fonction lin aire le calage est r alis exactement pas de poids n gatifs Les rapports de poids sont compris entre 0 94 et 1 5 e Fonction lin aire tronqu e pour des rapports de poids compris entre o 0 95 1 05 convergence imparfaite apr s 15 it rations L estimateur cal des totaux des variables et les vrais totaux sont gaux Les rapports de poids sont compris entre 0 94 et 1 08 o 0 95 1 06 le calage est r alis exactement Les rapports de poids sont compris entre 0 95 et 1 06 o 0 96 1 06 convergence imparfaite apr s 15 it rations Bascula fournit comme m me les poids finaux L estimateur cal des totaux de
70. n 2000 2050 Production industrielle et construction Mensuel Soci t Commerce services et transports Enqu te sur les budgets des m nages Annuel Statistiques mensuelles du transport Mensuel Causes de d c s Annuel Commerce int rieur Annuel economie SPF Economie PME Classes moyennes et Energie Achev d imprimer par l imprimerie de la Direction g n rale Statistique et Information conomique B 1000 Bruxelles Novembre 2006
71. n ne peut tre r alis e Les variables servant sauvegarder les poids finaux et les rapports de poids doivent tre de type real Les variables de calage ne doivent pas comporter de valeurs manquantes si c est le cas la session de pond ration ne peut tre r alis e Pour les variables de type real comportant des d cimales il faut utiliser au lieu de pour s parer la partie enti re des d cimaux Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 8 1 3 Fonctionnalit s Dans Bascula 4 0 le calcul des nouveaux poids w se fait en utilisant quatre m thodes de redressement la poststratification l estimation par ratio la pond ration lin aire et la pond ration multiplicative Pour la m thode de redressement par pond ration lin aire les poids w sont calcul s en utilisant l estimateur par la r gression ce qui revient utiliser la m thode de calage lin aire impl ment e dans g Calib 2 et Calmar 2 Les m thodes de redressement par la poststratification et par estimation par ratio ne sont que des cas particuliers de la m thode de calage lin aire La poststratification correspond au cas d un calage sur une seule variable cat gorielle et l estimation par le ratio correspond au cas o on redresse sur une seule variable quantitative repond r e par o 1 x Comme la m thode de redressement par la pond ration lin aire peut fournir de poids w n gatifs Bascula 4 0 permet de d finir
72. nctionnalit s 7 1 3 1 Plan de sondage La macro Calmar 2 permet de calculer des poids redress s pour une engu te r alis e selon un des plans de sondage suivants Sondage a un degr d observation on cale l chantillon sur les totaux dans la population de variables auxiliaires num riques ou cat gorielles Sondage par grappes on cale l chantillon sur o Facultatif les totaux dans la population des unit s primaires de variables auxiliaires num riques ou cat gorielles o les totaux dans la population des unit s secondaires de variables auxiliaires num riques ou cat gorielles en assurant l galit des poids pour les unit s d une m me grappe Si on n utilise pas de donn es sur les grappes il faut obligatoirement renseigner les param tres suivants o EGALPOI OUI impose l galit des poids pour les unit s secondaires d une m me grappe o POPMEN nombre d unit s primaires dans la population Sondage deux degr s on cale l chantillon sur o les totaux dans la population des unit s primaires de variables auxiliaires num riques ou cat gorielles o Facultatif les totaux dans la population des unit s secondaires de variables auxiliaires num riques ou cat gorielles o les totaux dans la population des unit s secondaires ligibles au second degr de variables auxiliaires num riques ou cat gorielles 7 1 3 2 Mod le de redressement Calmar 2 permet d effectuer un redress
73. niveau individu 46 7 2 2 Calage simple au niveau m nage 48 7 2 3 Calage au niveau individu avec contrainte d galit des poids dans le m nage 49 7 2 4 Calage simultan au niveau m nage et individu sondage par grappes 50 7 2 5 Calage simultan dans un sondage deux degr s avec deux niveaux d ODSETVATION nr a i matinale nt feet te dette A Ua tn dd UE 2 tre Ant eee t be 51 7 2 6 Calage sur la population d individus dans chaque strate 52 8 EVALUATION DE BASCULA 4 0 ett eee eeeeeeeeeeeeeeeeeeeeeeeeeeeeeeees 58 8 1 Aspects g n raux de bascula 4 0 cssccscssecssssessscecssseessssesssscesssesessseessssseesees 58 8 1 1 Facilit utilisation E 58 8 1 2 uo Renny renee ty Tener o M PEN Pet MER erE co 59 8 1 3 Fonctionnalit s ui sias o aaa koa os A aa a a sa Ga aaa 60 8 1 4 OUl eoa iaaa E EA rae ans ten teen nan antennes 62 8 1 5 PLODI MES enea rA AEEA EAR RER EEEE A nn Etre ts 62 8 1 6 Documentation 4 fess cesecseadisecasuctcadutedetads asst smened EEE EE EEEE aa es 62 8 2 R sultats obtenus avec Bascula 4 0 selon les diff rentes fonctions de calage 63 8 2 1 Calage simple au niveau m nage 63 8 2 2 Calage simple au niveau individu 64 8 2 3 Calage simple au niveau individu dans un sondage en grappe 64 8 2 4 Calage Stratifie Lisa sis hr cn saaa detecte roue aa a costa dt desde teur de dar 65 9 COMPARAISON CALMAR 2 G CALIB 2 ET BASCULA 4 0 70 TABLEAU SYNOPTIQUEDE S INTERVALLES DES
74. nombre de modalit s 0 pour une variable num rique o les valeurs des marges Une phase de pr paration des donn es est n cessaire e La table des marges contient autant d observations que de variables utilis es pour le calage pour chacune d elles sont sp cifi es son nom son nombre de modalit s 0 pour une variable num rique et les valeurs des marges de ces modalit s e Pas de contrainte sur les variables de calage cat gorielles la macro les recodifie dans un codage num rique s quentiel e Les variables de calage quantitatives doivent tre de type num rique ce point est v rifi par Calmar 2 e Les variables de pond ration doivent tre num riques ce point est v rifi par Calmar 2 sur demande avec le param tre CONT e Les variables de calage ne doivent pas comporter de valeurs manquantes si c est le cas l observation correspondante est limin e par Calmar 2 Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 e Les variables de pond ration ne doivent pas comporter de valeurs manquantes n gatives ou nulles si c est le cas l observation correspondante est limin e par Calmar 2 Dans le cas d un sondage par grappes avec calage simultan on doit galement sp cifier e la table des unit s secondaires param tre DATAIND Elle doit contenir o O O les variables de calage une variable identifiant l unit secondaire param tre IDENT2 la variable identifiant l un
75. observe une diff rence de Pordre du centi me entre le total r el et estim de la variable Salaire 0 90 1 20 le calage est r alis en 3 it rations On observe une diff rence de Pordre du centi me entre le total r el et estim de la variable Salaire Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 o 0 96 1 06 le calage est r alis en 11 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire o 0 97 1 06 le calage ne peut tre r alis e Avec la m thode du sinus hyperbolique pour un coefficient gal a o 10 le calage est r alis en 4 it rations On observe une diff rence de l ordre de l unit entre le total r el et estim de la variable Salaire On obtient des rapports de poids compris entre 0 91 et 1 17 o 50 le calage est r alis en 8 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire On obtient des rapports de poids compris entre 0 93 et 1 09 o 100 le calage ne peut tre r alis l algorithme ne converge pas 7 2 5 Calage simultan dans un sondage a deux degr s avec deux niveaux d observation On cale la table echup sas sur les variables auxiliaires disponibles au niveau m nage et la table echant2d sas sur les variables auxiliaires disponibles au niveau individu e Avec la fonction lin aire on obtient une diff rence inf rieure au dix
76. ompris entre 0 89 et 1 101 Fonction lin aire tronqu e pour des rapports de poids compris entre 0 0 91 1 11 le calage est r alis exactement Les rapports de poids sont compris entre 0 91 et 1 106 0 90 1 11 convergence imparfaite apr s 15 it rations Les poids finaux sont fournis et l estimateur cal des totaux des variables et les vrais totaux sont gaux Les rapports de poids sont compris entre 0 91 et 1 106 0 91 1 10 convergence imparfaite apr s 15 it rations Les poids finaux sont fournis et l estimateur cal des totaux des variables et les vrais totaux sont gaux Les rapports de poids sont compris entre 0 91 et 1 106 Ainsi les bornes limites sont L U 0 91 1 11 Strate 5 Fonction lin aire le calage est r alis exactement pas de poids n gatifs Les rapports de poids sont compris entre 0 82 et 1 109 Fonction lin aire tronqu e pour des rapports de poids compris entre o 0 93 1 10 le calage est r alis exactement Les rapports de poids sont compris entre 0 93 et 1 092 Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 o 0 94 1 10 convergence imparfaite apr s 15 it rations Les poids finaux sont fournis et l estimateur cal des totaux des variables et les vrais totaux sont gaux Les rapports de poids sont compris entre 0 93 et 1 094 o 0 93 1 09 convergence imparfaite apr s 15 it rations Les poids finaux sont fournis et l estimateur cal des totaux des va
77. pp s respectivement en SPSS SAS et Blaise Ces softwares sont gratuits Cadre th orique En th orie d chantillonnage on s int resse une population U compos e de N unit s ou individus not es par EEE E Demande n 2004 CU F 0047 du SPF Economie Le rapport a t soumis en mai 2005 la r vision est termin e en juin 2006 Le contenu de la pr sente tude n engage aucunement le SPF Economie la responsabilit de cette tude revenant ses seuls auteurs Dans cette population on s lectionne un chantillon s de taille n en utilisant un plan de sondage p s Pour tout keU on note par 7 la probabilit d inclusion dans l chantillon s Le but d un sondage est de d crire une variable d int r t y prenant des valeurs pour chaque unit k de la population La valeur prise par la variable d int r t y peme pour la unit d observation de la population U est not e par y En g n ral on ne cherche pas conna tre la valeur y prise par chacune des unit s de la population L int r t se porte plut t sur une fonction de ces valeurs Y k eU qui constitue l information que l on cherche acqu rir Ainsi l objectif est d estimer une fonction des valeurs de la variable d int r t y comme par exemple le total donn par ty gt Ve keU L estimateur classique qu on utilise pour estimer le total est l estimateur d Horvitz Thompson br i LAS AY kes Ty kes ce qu
78. que l on souhaite donner au param tre PARAMI Des connaissances SAS de base sont n cessaires pour l utiliser e Savoir allouer une librairie celle o vont se trouver les bases utilis es pour le calage e Savoir manipuler et visualiser des tables SAS la table des r pondants et celle des marges La macro est d un maniement simple pour un utilisateur habituel de SAS un certain nombre de param tres ont des valeurs par d faut ce qui limite les saisies a effectuer par l utilisateur De m me certains param tres ne sont renseigner que pour des op rations de calage complexes comme le calage a plusieurs niveaux ou le traitement de la non r ponse ce qui limite les pr requis n cessaires sur le calage et ses applications Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 7 1 1 3 Sauvegarde Apr s criture un programme de calage peut facilement tre enregistr et r utilis ou modifi La table des poids de calage est stock e dans le r pertoire de travail sp cifi dans les param tres de la macro 7 1 2 Input Ce sont de fa on obligatoire e La table des donn es param tre DATAMEN qui contient au moins les individus de l chantillon ainsi que pour chacun o la valeur correspondante de chaque variable auxiliaire de calage o la valeur de la pond ration initiale e La table des marges param tre MARMEN qui sp cifie o les variables auxiliaires utilis es pour le calage o leur
79. r alis Avec la fonction lin aire tronqu e pour des rapports de poids compris entre O O 0 90 1 42 le calage est r alis en 2 it rations On observe une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire 0 90 1 30 le calage est r alis en 3 it rations On observe une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire 0 90 1 10 le calage est r alis en 4 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire 0 95 1 05 le calage ne peut tre r alis Avec la m thode du sinus hyperbolique pour un coefficient gal O 10 le calage est r alis en 4 it rations On observe une diff rence inf rieure au dixi me entre le total r el et estim de la variable Salaire On obtient des rapports de poids compris entre 0 92 et 1 17 Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 50 le calage est r alis en 7 it rations On observe une diff rence inf rieure au centi me entre le total r el et estim de la variable Salaire On obtient des rapports de poids compris entre 0 94 et 1 08 100 le calage ne peut tre r alis l algorithme ne converge pas 7 2 4 Calage simultan au niveau m nage et individu sondage par grappes On cale la table echup sas sur les variables auxiliaires disponibles au niveau m nage et la table
80. re des totaux r els et estim s de variables de calage On obtient des rapports de poids compris entre 0 97 et 1 05 200 le calage ne peut tre r alis Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 7 2 3 Calage au niveau individu avec contrainte d galit des poids dans le m nage On proc de comme en section 7 2 1 mais en imposant l galit des poids pour les individus d un m me m nage Avec la fonction lin aire on obtient une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire Les rapports de poids sont compris entre 0 90 et 1 42 Avec la fonction exponentielle le calage est r alis en 4 it rations On obtient une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire Les rapports de poids sont compris entre 0 90 et 1 49 Avec la fonction logit pour des rapports de poids compris entre O O 0 90 1 49 le calage est r alis en 4 it rations On observe une diff rence de l ordre du dixi me entre le total r el et estim de la variable Salaire 0 90 1 30 le calage est r alis en 4 it rations On observe une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire 0 90 1 10 le calage est r alis en 4 it rations On observe une diff rence inf rieure l unit entre le total r el et estim de la variable Salaire 0 95 1 05 le calage ne peut tre
81. rents rapports de poids obtenus Si STAT OUI on obtient les sorties d une PROC UNIVARIATE sur les variables rapport de poids et pond ration finale ainsi qu un tableau donnant le rapport de poids moyen par modalit de chaque variable cat gorielle Si CONTPOI OUL on obtient les sorties d une PROC CONTENTS sur la table contenant les poids finaux Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 7 1 5 Probl mes Ce sont des probl mes inh rents a la technique du calage e Le calage peut ne pas tre r alis e L algorithme peut ne pas converger avec le nombre d it rations maximal fix e L algorithme peut ne pas converger Ces probl mes peuvent notamment se produire en cas de redressement pour non r ponse si les variables de calage et les variables instrumentales ne sont pas assez corr l es entre elles ou en cas d utilisation d une fonction de calage tronqu e si les bornes impos es aux rapports de poids sont trop contraignantes 7 1 6 Documentation Le manuel de Calmar 2 est tr s clair et illustr de nombreux exemples Il faudrait cependant y rajouter un manuel d utilisateur de Calmar 2 Guide la version interactive de la macro Cependant ni le logiciel ni son manuel d utilisation ne sont encore disponibles en ligne 7 2 R sultats obtenus avec Calmar 2 Les limites du logiciel sont essentiellement celles de SAS A noter qu une variable de calage cat gorielle et de type caract re ne doit pa
82. riables et les vrais totaux sont gaux Les rapports de poids sont compris entre 0 93 et 1 091 Ainsi les bornes limites sont L U 0 93 1 10 Strate 6 e Fonction lin aire le calage est r alis exactement pas de poids n gatifs Les rapports de poids sont compris entre 0 88 et 1 325 e Fonction lin aire tronqu e pour des rapports de poids compris entre o 0 90 1 11 le calage est r alis exactement Les rapports de poids sont compris entre 0 90 et 1 108 o 0 91 1 11 convergence imparfaite apr s 15 it rations Les poids finaux sont fournis et l estimateur cal des totaux des variables et les vrais totaux sont gaux Les rapports de poids sont compris entre 0 89 et 1 107 o 0 90 1 10 convergence imparfaite apr s 15 it rations Les poids finaux sont fournis et l estimateur cal des totaux des variables et les vrais totaux sont gaux Les rapports de poids sont compris entre 0 89 et 1 106 Ainsi les bornes limites sont L U 0 90 1 11 Comparaison Calmar2 g Calib 2 et Bascula 4 0 Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 9 Comparaison Calmar 2 g Calib 2 et Bascula 4 0 Tableau 9 1 tableau synoptigue des intervalles des rapports de poids obtenus avec les trois logiciels M thode de calage Calmar 2 g Calib 2 Bascula 4 0 Calage au niveau m nage M thode lin aire M thode exponentielle M thode lin aire trongu e M thode logit 0 96 1 08 0 96 1
83. rmation n cessaire pour ex cuter un calage Celle ci peut tre lanc e en partant de z ro et en entrant progressivement toutes les informations n cessaires II est galement possible de s lectionner une configuration d ja existante dans Bascula afin de poursuivre le traitement Bascula est aussi disponible sous forme de composante logicielle appel e Interface de programme d application ou API Application Programming Interface de Bascula Le fait que Bascula soit ax sur Blaise peut engendrer un travail non n gligeable au niveau de la pr paration de la base de donn es avant de pouvoir ex cuter un calage En effet Bascula ne g re que des bases de donn es g n r es par Blaise ou sous format Ascii Le probl me se pose lorsque la base de donn es n est pas sous format Blaise ce qui est souvent le cas en pratique Le seul moyen qui reste pour r cup rer une telle base de donn es est de l enregistrer sous format Ascii Cependant le format Ascii ne permet pas de sauvegarder les libell s et les formats des variables Ainsi avant de pouvoir utiliser une base de donn es sous Bascula il faut red finir les libell es et les formats des variables ce qui n est souvent pas une simple tache surtout quand on dispose d une base de donn es contenant un grand nombre de variables Ce probl me ne se pose pas avec Calmar 2 et g Calib 2 qui sont respectivement des macros de SAS et SPSS qui offrent un large choix de formats de fichiers
84. s Les poids finaux sont fournis et l estimateur cal des totaux des variables et les vrais totaux sont gaux Les rapports de poids sont compris entre 0 81 et 1 10 o 0 81 1 09 convergence imparfaite apr s 20 it rations Les poids finaux sont fournis et l estimateur cal des totaux des variables et les vrais totaux sont gaux Les rapports de poids sont compris entre 0 81 et 1 10 Ainsi les bornes limites sont L U 0 81 1 10 Strate 3 Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 Fonction lin aire le calage est r alis exactement pas de poids n gatifs Les rapports de poids sont compris entre 0 76 et 1 185 Fonction lin aire tronqu e pour des rapports de poids compris entre o 0 91 1 19 le calage est r alis exactement Les rapports de poids sont compris entre 0 9180 et 1 182 0 91 1 18 convergence imparfaite apr s 15 it rations Les poids finaux sont fournis et l estimateur cal des totaux des variables et les vrais totaux sont gaux Les rapports de poids sont compris entre 0 91 et 1 181 0 92 1 19 convergence imparfaite apr s 15 it rations Les poids finaux sont fournis et l estimateur cal des totaux des variables et les vrais totaux sont gaux Les rapports de poids sont compris entre 0 91 et 1 182 Ainsi les bornes limites sont L U 0 91 1 19 Strate 4 Fonction lin aire le calage est r alis exactement pas de poids n gatifs Les rapports de poids sont c
85. s avoir plus de 999 modalit s Les r sultats des tests effectu s sont 7 2 1 Calage simple au niveau individu On va caler la table echant sas l aide de l information disponible au niveau des individus effectifs de la population des individus pour la pyramide des ages guinguennaux et le salaire total Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 e Avec la fonction lin aire on obtient une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire Les rapports de poids sont compris entre 0 96 et 1 50 e Avec la fonction exponentielle le calage est r alis en 4 it rations On obtient une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire Les rapports de poids sont compris entre 0 96 et 1 60 e Avec la fonction logit pour des rapports de poids compris entre o 0 96 1 50 le calage est r alis en 5 it rations On observe une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire o 0 96 1 30 le calage est r alis en 5 it rations On observe une diff rence de l ordre du centi me entre le total r el et estim de la variable Salaire o 0 96 1 10 le calage est r alis en 4 it rations On observe des diff rences de l ordre du centi me entre les marges r elles et estim es des variables cat gorielles et une diff rence de l ordre de l unit pour la variable Salaire
86. s champs de saisie e en cas de calage simultan les identifiants de la grappe et de l unit secondaire sont n cessairement des variables distinctes e on ne peut pas faire de calage simultan si la variable sp cifi e en identifiant de la grappe n est pas la m me dans les deux tables chantillon e la fonction de calage est choisie dans la liste des fonctions propos es e le param tre ECHELLE est forc ment num rique tout autre caract re qu un chiffre n est pas accept e on ne peut progresser dans la saisie du mod le de calage et dans l ex cution que lorsque tous les param tres obligatoires ont t sp cifi s Il faut cependant se reporter la documentation pour savoir quels sont les param tres obligatoires le d faut de saisie n entra ne g n ralement aucun message en clair En dehors de cela g Calib 2 ne semble pas comporter de programme syst matique de contr le de la coh rence des param tres de l utilisateur Les bugs Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 r sultant d une erreur de sp cification entrainent des messages d erreur de syntaxe dans le fichier de r sultats SPSS mais il faut connaitre le programme pour les lucider L application n affiche pas de messages en clair permettant d identifier l erreur de l utilisateur Par ailleurs l interface de saisie ne permet pas la correction du nom d une variable dans la liste des special variables sauf par r
87. s variables et Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 les vrais totaux sont gaux Les rapports de poids sont compris entre 0 95 et 1 064 Ainsi les bornes limites sont L U 0 95 1 06 8 2 4 Calage stratifi Strate 1 e Fonction lin aire le calage est r alis exactement pas de poids n gatifs Les rapports de poids sont compris entre 0 76 et 1 3 e Fonction lin aire tronqu e pour des rapports de poids compris entre o 0 84 1 31 le calage est r alis exactement Les rapports de poids sont compris entre 0 85 et 1 304 o 0 84 1 30 convergence imparfaite apr s 15 it rations Les poids finaux sont fournis et l estimateur cal des totaux des variables et les vrais totaux sont gaux Les rapports de poids sont compris entre 0 85 et 1 304 o 0 85 1 31 convergence imparfaite apr s 15 it rations Les poids finaux sont fournis et l estimateur cal des totaux des variables et les vrais totaux sont gaux Les rapports de poids sont compris entre 0 85 et 1 304 Ainsi les bornes limites sont L U 0 84 1 31 Strate 2 e Fonction lin aire le calage est r alis exactement pas de poids n gatifs Les rapports de poids sont compris entre 0 81 et 1 116 e Fonction lin aire tronqu e pour des rapports de poids compris entre o 0 81 1 10 le calage est r alis exactement Les rapports de poids sont compris entre 0 81 et 1 10 o 0 82 1 10 convergence imparfaite apr s 15 it ration
88. sans donn es de niveau grappes Avec un sondage en grappes et un calage simultan Ordre de tri e Mise jour d une table existante par ajout de variable sur option e Variables identifiant et poids de calage Table de niveau unit s secondaires Deux tables de poids niveau grappes et niveau unit s secondaires Celui de la table chantillon en entr e e Table cr e chaque requ te e Variables identifiant poids de calage rapport de poids gx facteur d chelle poids initial multipli par le facteur d chelle poids initial et variables de calage Table de niveau grappes Une table de poids de niveau grappes Strate identifiant e Table cr e chaque requ te e Poids de calage rapports de poids gx poids initial Table de niveau grappes Une table de poids de niveau grappes Autre table en sortie Observations limin es sur option Editions e Etendue e Valeur des coefficients e Tableau comparatif des totaux X et des variables de calage Modulable A chaque it ration e En valeur absolue et en pour les variables cat gorielles e X X calcul en valeur absolue Fixe A la derni re it ration e En valeur absolue e X X calcul en de X Fixe e En valeur absolue e X X calcul en valeur absolue Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 Calmar 2 g Calib 2 Bascula 4 0 e S
89. stimation de la variance par r plication d chantillons Les r sultats obtenus avec Bascula 4 0 sont 8 2 1 Calage simple au niveau m nage e Avec la m thode lin aire le calage est r alis exactement pas de poids n gatifs Les rapports de poids sont compris entre 0 96 et 1 08 e Avec la m thode du raking ratio le calage est r alis exactement Les rapports de poids sont compris entre 0 96 et 1 08 e Avec la m thode lin aire tronqu e pour des rapports de poids compris entre o 0 97 1 08 le calage est r alis exactement Les rapports de poids sont compris entre 0 97 et 1 06 0 98 1 08 convergence imparfaite apr s 15 it rations message Weight restriction not succeeded within 15 iterations Bascula fournit comme m me les poids finaux Les contraintes de calage sont satisfaites L estimateur cal des totaux des variables et les vrais totaux sont gaux Les rapports de poids sont compris entre 0 97 et 1 06 Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 o 0 97 1 07 convergence imparfaite apr s 15 it rations Bascula fournit comme m me les poids finaux L estimateur cal des totaux des variables et les vrais totaux sont gaux Les rapports de poids sont compris entre 0 97 et 1 051 Ainsi les bornes limites sont L U 0 97 31 08 8 2 2 Calage simple au niveau individu e Fonction lin aire le calage est r alis exactement pas de poids n gatifs Les rapports de poids sont co
90. t attribuer aux diff rences de pr cision de calcul entre les logiciels SPSS et SAS Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 6 2 3 Calage au niveau individu avec contrainte d galit des poids dans le m nage Le mod le de calage est identique au pr c dent mais on contraint les poids des individus d un m me m nage tre gaux 6 2 3 1 R sultats obtenus avec g Calib 2 selon les diff rentes fonctions de calage e Fonction lin aire le calage converge en 1 minute 4 secondes environ ne signale pas d cart entre le total r el et le total estim par calage Les rapports de poids sont compris entre 0 94 et 1 44 e Fonction exponentielle le calage converge en 1 minute 21 secondes environ et 4 it rations II ne signale pas d cart entre le total r el et le total estim par calage Les rapports de poids sont compris entre 0 94 et 1 51 e Fonction logit pour des rapports de poids compris entre o 0 94 1 5 le calage converge en 50 secondes environ et 5 it rations II ne signale pas d cart entre le total r el et le total estim par calage o 0 95 1 4 le calage converge en 2 minutes 35 secondes et 5 it rations Il ne signale pas d cart entre le total r el et le total estim par calage o 0 96 1 1 le calage converge en 1 minute 31 secondes et 5 it rations Il ne signale pas d cart entre le total r el et le total estim par calage o 0 97 1 1 non convergence avec le m
91. t la vraie valeur Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 e la valeur des multiplicateurs de Lagrange apr s la derni re it ration e le nombre d it rations r alis es e une table des quantiles des poids de calage et des rapports de poids calcul s respectivement sur la table de contingence et sur celle des individus e les box plots de la distribution des poids de calage et des rapports de poids dans la table de contingence et dans celle des individus e la dur e d ex cution du programme Les statistiques et graphiques box plots sont fournis par strate 6 1 6 Probl mes Dans les tests r alis s voir plus loin on a rencontr des cas de non convergence totale due au choix des bornes avec une m thode de calage born e et des cas de convergence imparfaite sur une partie des variables de calage Dans le premier cas un message d erreur est dit en fin de listing LN out of range Le second cas n est identifiable que par l analyse du tableau de comparaison des totaux r els aux totaux estim s Le programme ne fournit pas de message pour attirer V attention de l utilisateur La technigue des matrices inverses g n ralis es cr e un probl me avec la fonction lin aire tronqu e Il n y a pas d arr t des it rations dans les cas de non convergence Avec cette fonction la non convergence est d tect e par la non inversibilit de la matrice O lorsque le nombre de poids gaux a
92. thode logit 0 81 1 12 0 81 1 12 0 81 1 11 0 81 1 11 0 81 1 12 0 81 1 12 0 81 1 11 0 81 1 10 0 81 31 12 0 81 1 10 Strate 3 M thode lin aire M thode exponentielle M thode lin aire tronqu e M thode logit 0 76 1 18 0 77 1 19 0 77 1 18 0 76 1 17 0 76 1 18 0 77 1 19 0 90 1 18 0 90 1 18 0 76 1 18 0 91 1 19 Strate 4 M thode lin aire M thode exponentielle M thode lin aire tronqu e M thode logit 0 89 1 10 0 89 31 11 0 89 1 09 0 89 1 09 0 89 1 10 0 89 31 11 0 90 1 09 0 89 1 08 0 89 1 10 0 91 1 11 Strate 5 M thode lin aire M thode exponentielle M thode lin aire tronqu e M thode logit 0 89 31 11 0 84 1 11 0 82 1 10 0 84 1 10 0 82 1 11 0 84 1 11 0 93 1 10 0 92 1 10 0 82 1 11 0 93 1 10 Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 Strate 6 M thode lin aire 0 88 1 32 M thode exponentielle 0 88 1 37 M thode lin aire trongu e 0 88 1 10 M thode logit 0 88 1 10 0 88 1 32 0 88 1 37 0 90 1 10 0 90 1 10 0 88 1 32 0 90 1 11 Le tableau 9 1 montre que pour ces trois logiciels de calage quels que soient le mod le et la m thode de calage consid r s les bornes des intervalles pour les rapports de poids sont gales dans presque tous les cas Ces bornes sont diff rentes un
93. tie th orique bien d taill e permettant de comprendre les principes et la th orie sur lesquels se basent les m thodes de calage impl ment es dans g Calib 2 Cependant on note que le recours syst matigue a des notations matricielles rend parfois les raisonnements assez difficiles suivre g Calib 2 dispose aussi d une base de donn es illustrative sous format MS Excel permettant de g n rer des donn es pour pouvoir faire des tudes par simulations Vanderhoeft 2002 Contrairement aux deux autres softwares l acc s la documentation relative a g Calib 2 est facilit par le d veloppement par la direction g n rale de la Statistique et Information conomique d une page Web sur le sujet du calage Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 http www statbel fgov be studies cal_en asp partir de laquelle les diff rents textes sur le calage et sur l utilisation de g Calib 2 sont rendus publics On note que Calmar 2 dispose galement d une documentation assez d taill e Sautory et Le Guennec 2003 mais l acc s celle ci n est pas facile et une grande partie de cette documentation ne peut tre accessible via internet Bascula 4 0 propose un manuel de r f rence reprenant entre autres quelques l ments th oriques sur la pond ration et un fichier d aide consultable sur cran 2 Les m thodes de calage Pour mesurer la proximit entre les poids w et d plusieurs fonctions
94. tion 88 1013 1020 NIEUWENBROEK N et BOONSTRA H J 2002 Bascula 4 0 Reference manuel Statistics Netherlands Roy G et VANHEUVERZWYN A 2001 Redressement sur la macro Calmar Applications et pistes d am lioration Traitements des fichiers d enqu te Presses universitaires de Grenoble pp 31 46 SAUTORY O et LE GUENNEC J 2003 La macro Calmar 2 Redressement d un chantillon par calage sur marges Document de travail de la direction des statistiques d mographiques et social INSEE SAUTORY O 1991 Redressement d chantillons aupr s des m nages par calage sur marges Document de travail de la direction des statistiques d mographiques et social n F9103 INSEE VANDERHOEFT C 2002 g Calib Release 1 0 Generalised Calibration under SPSS Statistics Belgium VANDERHOEFT C 2003 g Calib Release 2 0 Supplement to the Manual for Release 1 0 Statistics Belgium Informations La Direction g n rale Statistique et Information conomique rel ve du SPF Economie PME Classes moyennes et Energie Une de nos missions est de r pondre aux besoins des autorit s des entreprises et des citoyens par une information chiffr e sur la situation r elle du pays dans diff rents domaines d actualit O trouver l information statistique et conomique Sur nos sites Internet http statbel fgov be statistiques et http economie fgov be conomie Dans cinq grandes villes du pays la Direction g n
95. ur les effectifs de la population de 15 ans ou plus par ge quinquennal et sur la somme des salaires mensuels dans chaque strate 6 2 5 1 R sultats obtenus avec g Calib 2 selon les diff rentes fonctions de calage g Calib 2 permet un calage dans l ensemble des strates en une seule session ou s par ment sur une s lection de strates Dans le premier cas avec les m thodes logit et lin aire tronqu e les bornes impos es aux rapports de poids sont les m mes dans toutes les strates Le deuxi me proc d permet de faire varier les intervalles des rapports de poids d une strate l autre On a donc test un calage global sur les 6 strates puis un calage s par par strate avec les m thodes born es e Fonction lin aire le calage converge en 2 minutes 10 secondes et ne signale aucun cart entre les totaux r els et les totaux estim s Les rapports de poids sont compris entre les bornes suivantes Strate Minimum Maximum 1 0 76 1 28 2 0 81 1 12 3 0 76 1 18 4 0 89 1 10 5 0 82 1 11 6 0 88 1 32 Ensemble 0 76 1 32 e Fonction exponentielle le calage converge en 4 it rations dans chaque strate et 1 minute 52 secondes Il ne signale aucun cart entre les totaux r els et les totaux estim s Les rapports de poids sont compris entre les bornes suivantes Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 Strate Minimum Maximum 1 0 77
96. uveaux poids w pour les unit s de la population des grappes le programme permet de r aliser un calage qui produit en plus des poids w identiques pour les unit s de la population appartenant a la m me grappe U En effet apr s avoir agr g l information auxiliaire au niveau des grappes le programme cale le total sur les unit s de la population des grappes de l information auxiliaire Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 e Calage simultan au niveau des unit s de la population et au niveau des grappes lorsque qu on dispose d une information auxiliaire sur les unit s de la population et d une autre sur la population des grappes le programme permet de r aliser un calage simultan sur ces deux types d informations de telle sorte produire des poids w identiques pour les unit s de la population appartenant la m me grappe 3 2 Les niveaux de calage r alis s par Calmar 2 A l instar de g Calib 2 Calmar 2 est galement un software qui permet de r aliser des calages sur plusieurs niveaux d observation En effet tous les types de niveaux de calage impl ment s dans g Calib 2 peuvent tre r alis s par Calmar 2 Compar g Calib 2 Calmar 2 permet de r aliser d une mani re automatique un Calage simultan entre trois niveaux d observation embo t s dans un sondage deux degr s Ce dernier type de calage peut tre r alis lorsqu on dispose d une information auxiliaire sur les un
97. ux bornes devient important Les matrices g inverses passent outre au probl me et fournissent un r sultat faux Evaluation de g Calib 2 Calmar 2 et Bascula 4 0 6 2 R sultats des tests r alis s Les temps d ex cution indiqu s sont ceux fournis par l application g Calib 2 dans ses ditions Ce sont des dur es r elles Les programmes ayant t ex cut s sur un poste reli un r seau local ces dur es peuvent varier selon la charge du r seau elles ne sont donc qu approximatives 6 2 1 Calage simple sur la population d individus On cale la table chantillon echant sur les effectifs de la population de 15 ans ou plus par ge quinquennal et sur la somme des salaires mensuels 6 2 1 1 R sultats obtenus avec g Calib 2 selon les diff rentes fonctions de calage e Fonction lin aire le calage converge en 52 secondes ne signale pas d cart entre le total r el et le total estim par calage Les rapports de poids sont compris entre 0 96 et 1 49 e Fonction exponentielle le calage converge en 4 it rations et 54 5 secondes ne signale pas d cart entre le total r el et le total estim par calage Les rapports de poids sont compris entre 0 96 et 1 60 e Fonction logit pour des rapports de poids compris entre o 0 97 1 6 le calage converge en 6 it rations et 54 5 secondes ne signale pas d cart entre le total r el et le total estim par calage o 0 97 1 2 le calage converge en 6 it
Download Pdf Manuals
Related Search
Related Contents
CTMS User Manual For Clinical Trial Research Management PICDEM CAN-LIN 2 Development Kit User's Guide 循環型社会 - KDDI Operating manual - Trigon Elektronik GmbH Vigo VGT527 Installation Guide Cooler Master Wake Up Folio Assistantes « Pro » R0E330850MSRC0 User`s Manual KUDA 093490 holder Disk Station DS109 Copyright © All rights reserved.
Failed to retrieve file