Home

Bulletin de mthodologie sociologique

image

Contents

1. les valeurs pour chacune des 3 variables 10 son poids ici gal 1 pour chaque unit car il s agit d un protocole l mentaire Pour un protocole non l mentaire obtenu par exemple par moyennage ce poids correspondra un effectif ou nombre d individus ayant servi calculer chaque moyenne Remarquez que si les donn es sont structur es d finition de facteurs cette structure est extr mement souple puisque ces facteurs peuvent tre en relations tout fait quelconques Cette souplesse permet aussi bien des structures faibles comportant des lacunes comme dans les donn es d observation que des structures plus fortes comme dans l exp rimentation 2 2 Les demandes d analyse de LID Une demande d analyse de LID permet de d finir un protocole d riv les op rations pour y parvenir et les proc dures lui appliquer Une demande LID est compos e des trois l ments suivants La formule caract rise le protocole d riv d une part sa structure unit s facteurs d autre part le type de d rivation moyennage d rivations r siduelles etc Il existe deux types de formules ensemblistes ou lin aires La partie s lection de variables sp cifie quelles sont les variables du protocole de base retenues pour le protocole d riv Le mot cl sp cifie la proc dure appliquer au protocole d riv repr sentation graphique tableau calculs de statistiques etc 2 3 Protocoles d riv s Structu
2. 4 4 R utilisation du protocole d riv FILE Le protocole d riv est recopi dans un fichier pour une possible r utilisation ult rieure par le programme en tant que nouveau protocole de base 5 UTILISATION D EYELID 1 POUR LES DONN ES D ENQU TE Dans cet article le logiciel EyeLID 1 est utilis comme un outil d analyse post factoriel Il convient donc de pr ciser ici comment l analyse factorielle des correspondances et EyeLID 1 peuvent tre utilis s successivement et ou conjointement sur des donn es d enqu te En ce qui concerne des donn es d enqu te qui se pr sentent sous la forme d un tableau Individus x Questions nous d taillons Ici de fa on plus technique les tapes d j Indiqu es au chapitre I qui conduisent des donn es brutes la cr ation de 2 fichiers de donn es pour EyeLID 1 fichiers LID Questions Modalit s fichier DAT Individus I 1 gt Individus 1 CODAGE DISJONCTIF Poids Variables principales P V1 v2 Individus Fichiers Lb t 22 gt 2 AFC Poids Variables principales P V1 v2 Modalit s Fichiers J J1 et J2 Poids Variables principales Facteurs P V1 v2 T A B Individus Fichiers I LID gt 3 INTERF Poids Variables principales Facteurs P
3. appel es souvent la suite de Benz cri facteurs Comme on verra dans le langage d interrogation de donn es un facteur sera une variable explicative cat goris e c est pourquoi pour viter toute confusion nous dirons toujours dans ce texte variable principale ou variable factorielle et non pas facteur L emploi de facteur en analyse des correspondances a t discut dans la r f rence 19J Les variables principales prises en nombre suffisant fournissent un r sum des donn es et servent de base l interpr tation Pour chaque variable principale on a une valeur coordonn e par individu et galement une valeur par modalit d o deux nuages le nuage des individus et le nuage des modalit s En pratique dans l analyse des donn es sociologiques l interpr tation des axes factoriels se fait surtout partir du nuage des modalit s en termes d opposition entre modalit s Le premier axe oppose les modalit s homme et femme le deuxi me les plus jeunes aux plus g s etc Il est notoire que g n ralement cette interpr tation des axes factoriels reste intuitive et d pourvue de pr cisions quantitatives En outre surtout quand le nombre d individus est lev l interpr tation fait rarement appel au nuage des individus Le but des m thodes que nous allons pr senter est pr cis ment de fonder l interpr tation non seulement sur le nuage des modalit s mais aussi sur celui des Individus et ga
4. SENTATION G N RALE Le langage LID impl ment dans le logiciel EyeLID 1 permet l interrogation d une base de donn es statistique que nous appellerons protocole de base Une question sp cifique que l on se pose sur les donn es est traduite par une demande d analyse de LID Cette demande d analyse d clenche en premier lieu la recherche du protocole d riv du protocole de base c est dire un r sum statistique pertinent pour la question sp cifique qu exprim la demande d analyse Un mot cl de la demande d analyse d termine quant lui la ou les proc dures appliquer sur ce protocole d riv Le langage LID est pr sent Ici de fa on succincte Pour une pr sentation plus d taill e on se reportera au manuel d utilisation d EyeLID 1 30 2 LE LANGAGE D INTERROGATION DES DONN ES G N RALIT S 2 1 Protocole de base unit s facteurs variables La base de donn es statistiques que le langage LID permet d interroger est constitu e d un ensemble d unit s Chaque unit est index e par les modalit s d un certain nombre de facteurs Pour chaque unit plusieurs variables ont t mesur es Ces notions seront illustr es sur un exemple sch matique inspir de l enqu te INOP 23 voir aussi les deux interventions Rouanet H 1985 Some aspects of Bayesian multivariate analysis Communication la Multivariate section of the Royal Statistical society Bernard J M Baldy R 1986 EyeLID 1 A new pr
5. apparaissant gauche d une formule permet de s lectionner un mode de repr sentation du protocole d riv ou certaines op rations effectuer sur ce protocole d riv Nous n en d taillons ici que les plus importants pour l analyse des donn es d observation On trouvera l ensemble des mots cl s dans 5 4 1 Repr sentation du protocole d riv TABLE Le protocole d riv est repr sent sous forme de tableau des valeurs des variables s lectionn es index es par les tiquettes des unit s d riv es WEIGHTS M me chose que TABLE avec seule Impression des poids des unit s d riv es 4 2 Repr sentation graphique GRAPH Le protocole d riv est repr sent sous forme graphique avec un grand nombre d options permettant une modification Interactive du graphique en particulier s lection d attributs graphiques en fonction des tiquettes des unit s d riv es HISTOGRAM Histogramme des valeurs du protocole d riv 4 3 Calculs statistiques divers sur le protocole d riv DESC Minimum maximum moyenne m diane quartiles cart type du protocole d riv VAR Variance du protocole d riv SS Somme des carr s centr s du protocole d riv RSS Somme des carr s non centr s du protocole d riv COV Matrice des variances covariances SP Matrice des sommes des carr s et produits centr s RSP Matrice des sommes des carr s et produits non centr s CORREL Matrice des corr lations
6. de base correspondantes Pour les formules lin aires d autres d rivations que le moyennage interviennent d rivations r siduelles carts entre moyennes etc 3 LE LANGAGE D INTERROGATION DES DONN ES DESCRIPTION 3 1 Les symboles du langage LID Une demande de LID est constitu e de 5 types de symboles Op randes fact facteur d sign par une lettre majuscule par exemple A mod modalit l mentaire d un facteur du protocole de base compos e d une lettre minuscule et d un num ro de modalit par exemple al var variable d sign e par la lettre V et le num ro de la variable par exemple V2 Op rateurs ensemblistes concat nation et de modalit s par d finition ce symbole ne s crit pas dans une formule effective _ regroupement ou de modalit s s parateur de parties d une famille de parties amp composition de 2 familles de parties croisement de 2 familles de parties lt gt embo tement d un facteur dans une famille de parties Op rateurs lin aires d rivation intra d rivation d interaction d rivation par contraste Op rateur de s lection gt s lection de variables Mots cl s d taill s au 4 de ce chapitre 3 2 Formules ensemblistes Une formule ensembliste comprend comme seuls op rateurs les op rateurs ensemblistes indiqu s pr c demment Ce langage ensembliste permet la construction de parties et de familles de p
7. Bulletin de m thodologie sociologique n 23 June 1989 pp 3 46 L ANALYSE DES DONNEES MULTIDIMENSIONNELLES PAR LE LANGAGE D INTERROGATION DES DONNEES LID Au del de l analyse des correspondances par Jean Marc Bernard Brigitte Le Roux amp Henry Rouanet Groupe Math matique et Psychologie CNRS et Universit Ren Descartes 12 rue Cujas 75005 Paris et Marie Ange Schiltz Centre de Math matiques Sociale 54 boulevard Raspail 75006 Paris Summary Multidimensional data analysis with LID data interrogation language Chapter I describes the three stages which lead to the analysis of a questionnaire by the language LID correspondence analysis data structuring data exploration with LID Chapter II describes the language LID and the interface program INTERF between EyeLID 1 and ADDAD Chapter III presents two concrete examples of application the first is the reanalysis of a British survey the second is the analysis of a French survey Chapter IV in the framework of a ternary frequency table presents a study of data interaction Multivariate Data Analysis Factorial Correspondence Analysis Data Interrogation LID R sum Le Chapitre I d crit les trois tapes qui conduisent i analyser un questionnaire par le langage LID analyse des correspondances structuration des donn es explorations l aide du LID Le Chapitre II d crit le langage LID et le programme INTERF d interface entre EyeLID 1 et ADDAD Le Chapitre III
8. TRUCTUREES Nous allons maintenant d crire les trois tapes que nous proposons de mettre en oeuvre pour analyser un questionnaire 1 une analyse des correspondances 2 la structuration des donn es 3 l exploration quantitative et qualitative en particulier graphique des donn es pr alablement structur es PREMI RE TAPE ANALYSE DES CORRESPONDANCES Ici nous avons effectu les analyses des correspondances l aide du logiciel ADDAD 29 A partir des donn es de base et apr s recodage ventuel de ces donn es gr ce aux outils de l ADDAD pour les dossiers Statut et D nonciation les donn es sont mises sous forme disjonctive compl te nous disposons d une part des variables principales sur les individus lignes du tableau disjonctif d autre part des variables principales sur les modalit s colonnes du tableau disjonctif ce que r sume le sch ma ci apr s FICHIER des donn es I I FICHIER gt I gt des FICHIER param tres I I variables principales Les r sultats de l analyse des correspondances variables principales fournissent soit un r sum descriptif des donn es initiales lorsqu on retient les premi res variables principales exemples Statut et D nonciation soit un recodage sophistiqu mais puissant lorsqu on retient toutes les variables principales exemple Suicides Rappelons que les variables principales donnent les coordon
9. V1 V2 QRT Modalit s Fichiers M LID 1 A partir du tableau des r ponses de chaque individu fichier DAT on proc de au codage disjonctif complet des donn es d o le tableau Individus x Modalit s 2 On proc de ensuite l analyse factorielle des correspondances de ce tableau avec un logiciel tel que ADDAD Cette tape conduit entre autres la cr ation des deux s ries de fichiers de r sultats factoriels poids puis coordonn es selon les axes factoriels fichiers I pour les lignes ici les individus I1 pour les l ments actifs de l analyse I2 pour les l ments suppl mentaires fichiers J pour les colonnes ici les modalit s J1 pour les l ments actifs de l analyse J2 pour les l ments suppl mentaires Ces deux premi res tapes sont les tapes usuelles d une A F C 3 L tape suivante fait appel au programme INTERF qui r alise l interface entre AFC et EyeLID 1 Comme r sultats de cette tape deux fichiers analysables par EyeLID 1 sont cr s le fichier des Individus et le fichier des Modalit s Le fichier des Individus fichier I LID chaque unit statistique correspond un individu le poids de chaque unit est celui fourni par l AFC les variables au sens de LID sont les variables principales fournies par l AFC dans les fichiers I1 et I2 les facteurs au sens de LID sont des descripteurs des individus et correspondent g n ralement de
10. arties de l ensemble des unit s de base Chaque partie d finit une unit d riv e o les valeurs sont calcul es par moyennage s1 d signe une modalit d un facteur cette formule fournit la moyenne du sujet s1 sitl l op ration de concat nation permet de construire des modalit s compos es obtenues par la composition de facteurs diff rents cette formule fournit la moyenne du sujet s1 au temps t1 si_s2 l op ration permet le regroupement de modalit s l mentaires ou compos es comportant les m mes facteurs cette formule fournit la moyenne des sujets sl et s2 regroup s s1 s2_s3 l op ration permet la s paration de parties et d finit une famille de parties ici de 2 parties cette formule fournit la moyenne de s1 d une part et celle de s2 et s3 regroup s d autre part Le reste des l ments ensemblistes du langage LID permet de d finir de fa on plus concise des familles de parties A d signe la famille de parties constitu e par l num ration des modalit s du facteur A cette formule est quivalente al a2 et fournit donc les moyennes pour 12 chacune des modalit s du facteur A sl s2 amp T l op ration amp permet la composition de familles de parties cette op ration engendre une nouvelle famille de parties o chacune est obtenue en combinant une partie de la premi re famille et une partie de la seconde ainsi la formule pr c dente se r crit s1t1 s2t1 s3t1 s1t2 s2t2 s3t2
11. des donn es de base et des fichiers de l ADDAD fichiers param tres et des variables principales deux fichiers lisibles par le logiciel EyeLID 1 Le programme INTERF est donc un programme d interface entre ADDAD et EyeLID 1 FICHIER des donn es p 1 gt I LS ETICHTIER LTD 1 FICHIERS ADDAD NTERF des individus des param tres et I I des modalit s es var principales I Nous d crirons bri vement dans le cas d un questionnaire mis sous forme disjonctive compl te les deux fichiers obtenus avec INTERF puis nous pr senterons les premiers r sultats qu on peut alors facilement obtenir avec LID Le fichier des individus contient les variables principales sur I lignes du tableau disjonctif et les facteurs choisis par l utilisateur pour d crire les individus avec un facteur cr automatiquement indexant les Individus et appel I Il est usuel de fonder l interpr tation sur les individus dont les contributions relatives sont sup rieures un certain seuil on pourra alors introduire un facteur technique contribution qui sera particuli rement utile pour les repr sentations graphiques Le fichier des modalit s contient les variables principales sur les modalit s colonnes du tableau disjonctif et deux facteurs formels not s Q et R qui serviront coder l ensemble des modalit s Q indexant les questions et R les modalit s l int rieur des q
12. iqu deux volets de cette recherche conjointe Dossier Statut au chapitre III et Dossier Suicides au chapitre IV L organisation de cet article sera la suivante Au chapitre I on d crit sous une forme g n rale les trois tapes qui conduisent analyser un questionnaire par le langage LID analyse des correspondances structuration des donn es exploration l aide du LID Au chapitre II on expose un r sum du langage LID utile pour l analyse des donn es d enqu te puis on d crit bri vement le programme INTERF d interface entre EyeLID 1 30 et ADDAD 29 Au chapitre III on pr sente deux applications concr tes des apports du langage LID utilis l issue de l analyse standard La premi re de ces applications le dossier Statut prolonge la r analyse d une enqu te britannique effectu e par M A Schiltz dans le cadre de l ATP 1988 27 La deuxi me de ces applications le dossier D nonciation prolonge l analyse d une enqu te effectu e par Boltanski et al 6 Le chapitre IV pr sente le dossier Suicides lui aussi emprunt l ATP 1988 cf le chapitre de B Le Roux H Rouanet C Taylor in 18 Il illustre sur le paradigme du tableau de contingence ternaire comment on peut mener l tude descriptive d un concept cl de l analyse des comparaisons souvent n glig dans l analyse des donn es d observation celui d interaction CHAPITRE I DE L ANALYSE DES CORRESPONDANCES A L ANALYSE DES DONNEES S
13. lement de fournir une aide l interpr tation au moyen de r sultats qualitatifs et quantitatifs Pour parvenir cet objectif le Langage d interrogation de donn es est selon nous l instrument privil gi Le langage d interrogation des donn es est troitement li l analyse des comparaisons m thode d velopp e partir des ann es 1970 autour du programme d analyse de variance VAR3 de Lebeaux L pine et Rouanet voir 13 20 21 22 11 14 9 L analyse des comparaisons en tant que prolongement de l analyse de variance s est d velopp e dans le cadre de l analyse des donn es planifi es c est dire des donn es recueillies l aide d un plan d exp rience ou d enqu te d crit au moyen de facteurs Le programme VAR3 d analyse univari e ANOVA met d j en oeuvre le langage d interrogation de donn es toute demande d analyse formul e en termes des facteurs du plan conduit calculer la somme des carr s associ e Apr s le programme VAR3 l analyse des comparaisons a t g n ralis e aux donn es multidimensionnelles prolongeant ainsi l analyse de variance multivari e MANOVA voir par exemple le traitement de donn es multidimensionnelles dans 17 Il est alors apparu que l analyse des comparaisons une fois d pouill e de ses prolongements inf rentiels tests de signification etc pouvait devenir une puissante m thode d exploration des donn es d observation l id e de base tant t
14. n es sur chacun des axes factoriels retenus des points repr sentatifs des modalit s et aussi des points repr sentatifs des individus Dans tous les cas les variables principales serviront de variables de base pour les analyses ult rieures DEUXI ME TAPE STRUCTURATION DES DONN ES Parmi les variables initiales d un questionnaire on peut souhaiter faire jouer certaines sexe ge etc le r le de variable explicatives afin de cerner les traits saillants des donn es Ainsi la structuration des donn es revient fondamentalement distinguer deux types de variables les facteurs au sens du langage d interrogation de donn es qui joueront le r le de variables explicatives nous emploierons toujours facteur dans ce sens d sormais et les variables proprement parler qui sont des variables expliquer Dans toute la suite les variables expliquer seront bien entendu les variables principales les variables explicatives proviendront des variables initiales du questionnaire questions extraites du fichier des donn es de base ces questions pouvant tre ou non des variables actives de l analyse des correspondances A l aide du langage d interrogation de donn es on pourra facilement analyser les donn es pr alablement structur es et donner des r ponses des questions sp cifiques Pour structurer les donn es on utilisera le programme INTERF chapitre II qui a t con u pour construire partir du fichier
15. ogram for graphical inspection of multivariate data Seminar of the Biometrics Unit Institute of Psychiatry University of London dans lequel 20 l ves sont r partis selon la m thode d enseignement moderne ou traditionnelle et selon leur milieu social d favoris ou favoris ce qui d finit 4 groupes 5 l ves par groupe Pour chaque sujet 3 variables num riques sont mesur es ceci au cours de 2 sessions milieu et fin d ann e scolaire On pourra se repr senter ces variables d nomm es ci apr s V1 V2 et V3 soit comme des r sultats des tests avec notes num riques soit comme les coordonn es de 3 variables factorielles extraites d une analyse en composantes principales ACP La description de ce protocole consiste tout d abord dans l identification de ses facteurs et de leurs modalit s facteur sujets S 20 modalit s s1 s20 facteur m thode d enseignement A 2 modalit s moderne al traditionnel a2 facteur milieu social B 2 modalit s favoris b1 d favoris b2 facteur temps T 2 modalit s d but t1 fin t2 d ann e Chaque combinaison observ e des modalit s des facteurs du protocole d finit une unit statistique On a ici 40 unit s correspondant 20 sujets crois s avec 2 sessions A chaque unit est associ e sa description selon les modalit s des facteurs par exemple s12 al b2 t1 pour la session 1 du sujet 12 du groupe moderne et favoris
16. out simplement qu une variable initiale question d un questionnaire peut toujours en principe recevoir dans une probl matique descriptive le statut de facteur au sens de l analyse des comparaisons m me en l absence de planification pr alable Ainsi dans une enqu te partir de la question Sexe on d finira le facteur Sexe deux modalit s homme et femme de m me on d finira le facteur Age dont les modalit s sont des classes d ge etc Dans ce contexte la notion de donn es planifi es fait alors place celle de donn es structur e voir 1 16 amp 17 Signalons que l analyse statistique des donn es structur es est enseign e cours semestriel dans le cadre de la ma trise MST ISASH 2 me ann e depuis 1979 par H Rouanet et B Le Roux A l heure actuelle l analyse multidimensionnelle des comparaisons peut tre effectu e gr ce au logiciel interactif EyLID 1 de Baldy et Bernard 2 5 Ce logiciel met en oeuvre je langage d interrogation de donn es LID qui toute demande d analyse sp cifique associe le tableau des donn es pertinentes calcule inerties covariances etc et construit les graphiques pour les paires de variables s lectionn es par l utilisateur Les modules graphiques ont t labor s en vue d une exploration visuelle commode et approfondie Eye Le logiciel EveLID 1 a t d velopp dans le cadre d une recherche conjointe franco britannique 2 et il a t appl
17. pes sont obtenues par la demande TAB G gt V voir exemples Statut et D nonciation et leur repr sentation graphique dans le plan 1 2 par GRA G gt VI V2 Le logiciel EyeLID 1 permet aussi d tudier des contributions relatives non directement accessibles partir des r sultats factoriels par exemple celle d un sous groupe d individus Pour les individus du premier groupe g1 voir Statut la contribution relative du sous groupe I lt g1 gt l inertie du premier axe factoriel s obtient comme le rapport du nombre RSS I lt g1 gt gt VI par RSS I gt VI Du point de vue graphique apr s avoir choisi le plan des axes qui discriminent au mieux les groupes on peut facilement r v ler les proximit s ou les oppositions des groupes l aide des attributs graphiques voir Statut ou Suicides Fichier des modalit s Comme pr c demment on retrouve les valeurs propres et les coordonn es factorielles des modalit s et on tablit le graphique factoriel dans le plan des axes 1 2 partir des demandes d analyse suivantes VAR Q amp R gt V TAB Q amp R gt V GRA Q amp R gt VI V2 La contribution relative de la premi re modalit premi re question l inertie du premier axe sera le rapport des deux nombres r sultant des deux demandes RSS ql amp rl gt VI et RSS Q amp R gt VI De plus on obtiendra facilement la contribution relative l inertie du premier axe de l ensemble des modalit s de r ponse la
18. pr sente deux applications concr tes la premi re prolonge la r analyse d une enqu te britannique la deuxi me prolonge l analyse d une enqu te fran aise Le Chapitre IV pr sente sur le paradigme du tableau de contingence ternaire une tude de l interaction Analyse des donn es multivari es Analyse factorielle des correspondances Interrogation des donn es LID AVANT PROPOS Les donn es dont il sera question dans les chapitres qui suivent sont des donn es d observation typiquement des r sultats de questionnaires L analyse des questionnaires en sociologie est commun ment effectu e par les m thodes d analyse multidimensionnelle exploratoire en particulier en France l analyse des correspondances multiples effectu e partir du tableau Individus x Questions mis sous forme disjonctive compl te nous dirons tableau Individus x Modalit s C est ce paradigme que pour fixer les id es nous prendrons pour guider la discussion qui suit Pour une comparaison avec d autres m thodes en particulier anglo saxonnes voir le compte rendu d ATP 1988 2 et le num ro sp cial de la Revue de Statistique Appliqu e 3 Ce texte s adresse principalement ceux qui pour analyser les questionnaires utilisent l analyse des correspondances dont les bases seront ici suppos es connues 4 7 24 Comme on sait l analyse des correspondances du tableau Individus x Modalit s conduit la d termination des variables principales
19. premi re question q1 C est le rapport des deux nombres obtenus par RSS ql amp R gt VI et RSS Q amp R VI A partir de ces contributions on pourra dire par exemple la contribution du facteur Sexe au 1 axe est de XX On pourra aussi calculer la contribution d une modalit ou d une question aux deux premiers axes en faisant le rapport de la somme des deux nombres RSS q1 amp R gt VI et RSS ql amp R gt V2 par la somme de RSS Q amp R gt V1 et de RSS Q amp R gt V2 A partir de ces contributions on pourra dire par exemple la contribution du facteur Sexe aux deux premiers axes est de XX Ce r sultat est important puisqu il permet de rep rer les questions ayant une faible contribution questions que l on pourra ventuellement liminer de l analyse ou du graphique voir Statut Remarque Du fait que les facteurs Q et R sont des facteurs formels certaines demandes d analyse conduiront des r sultats sans int r t ou m me triviaux La demande TAB Q gt V donnera pour l analyse d un questionnaire mis sous forme disjonctive compl te un tableau remplis de z ros puisque pour chaque question les modalit s de r ponse ont le m me point moyen La demande TAB R gt V est d nu e de sens alors que la demande TAB q3 amp R gt V fournit les coordonn es factorielles des modalit s de la seule question q3 CHAPITRE II LE LANGAGE D INTERROGATION DES DONN ES ET LE LOGICIEL EYELID 1 1 PR
20. re du protocole d riv et Calcul des valeurs et des poids associ es chaque unit d riv e Comme tout protocole un protocole d riv est nouveau constitu d un ensemble d unit s Ces unit s sont d crites par les modalit s d un sous ensemble des facteurs du protocole de base Les valeurs associ es ces unit s d riv es correspondent galement un sous ensemble des variables du protocole de base La structure d un protocole d riv est ainsi obtenue par deux op rations l mentaires restriction de l ensemble des unit s de base et regroupement des unit s de base restantes pour chaque unit d riv e Par exemple la formule LID al amp B gt V2 va provoquer la construction d un protocole d riv constitu de 2 unit s correspondant aux diverses combinaisons possibles de la modalit al du facteur A et des modalit s du facteur B alb1 et a1b2 Ce protocole d riv est univari puisque seule la variable V2 est consid r e gt V2 A l unit alb1 de ce protocole d riv sont associ es toutes les unit s de base index es par al et bl 10 unit s de base savoir slalbltl slalblt2 s2albltl sSalblti sSalblt2 Pour les formules ensembliste du langage LID la valeur associ e une unit d riv e pour une variable donn e est la moyenne pond r e des valeurs des unit s de base correspondantes Le poids associ une unit d riv e sera dans ce cas la somme des poids associ s aux unit s
21. s questions initiales extraites du fichier DAT le logiciel INTERF permet de r cup rer certaines questions initiales pour en faire des facteurs Le facteur I qui num re simplement les individus est g n r automatiquement par INTERF Le facteur T pour type galement g n r automatiquement distingue les individus actifs modalit t1 provenant du fichier 11 des individus suppl mentaires modalit t2 provenant du fichier 2 Le fichier des Modalit s fichier M LID chaque unit statistique correspond une modalit le poids de chaque unit est celui fourni par l AFC les variables au sens de LID sont les variables principales fournies par l AFC dans les fichiers J1 et J2 plusieurs facteurs sont construits automatiquement Q la question dont chaque modalit est extraite R le num ro de r ponse dans la question pour chaque modalit et T le facteur type comme dans le fichier des individus t1 pour le fichier J1 t2 pour le fichier J2 Les facteurs Q et R sont des facteurs formels qui jouent un r le d interm diaire de calcul On a d j donn des exemples de demandes LID sur chacun de ces fichiers qui permettent de retrouver un certain nombre de r sultats de l AFC voir chapitre I La suite de cet article va illustrer la richesse de ce langage pour procurer des r sultats graphiques non fournis par l AFC
22. s successives et V l ensemble des variables principales retenues dans l analyse Fichier des individus A partir du fichier des individus on obtient les valeurs propres par la demande d analyse VAR I gt V VAR pour variance le tableau des coordonn es factorielles des individus sur les axes par la demande d analyse TAB I gt V TAB pour tableau La demande TAB I gt VI V2 fournit les coordonn es factorielles des points repr sentatifs des individus le graphique des individus dans le plan des deux premiers axes factoriels par GRA I gt VI V2 GRA pour graphique La demande GRA I gt V2 V3 produirait le graphique des individus dans le plan des axes 2 et 3 etc la contribution relative d un individu par exemple i1 l inertie du premier axe en calculant le rapport des deux nombres obtenus par les demandes RSS il gt V1 et RSS I gt VI RSS pour Raw Sum of Squares IT arrive souvent en analyse des correspondances qu on mette en l ments suppl mentaires des lignes qui correspondent des regroupements d individus Ces regroupements peuvent tre effectu s aussi bien sur un facteur de classification tabli lors du recueil des donn es exemples cat gorie socioprofessionnelle sexe etc qu partir des r sultats d une classification hi rarchique Si nous prenons en compte ce facteur Groupe not G dans la structuration des donn es les coordonn es factorielles des points moyens de chacun des grou
23. seules les parties non vides sont conserv es lors de cette r criture s1 s2 t1 t2 l op rateur de croisement est identique celui de composition amp mais il induit de plus la v rification que les deux familles de parties sont crois es c est dire qu aucune partie vide n est g n r e S lt alb1 a2b2 gt l op ration d embo tement lt gt d un facteur l embo t crit l ext rieur des lt lt dans une famille de parties l embo tant crit l int rieur des lt lt est identique celle de composition amp mais induit de plus la v rification de la relation d embo tement du facteur dans la famille de parties autrement dit que chaque modalit du facteur n engendre de partie non vide que pour au plus une seule partie de la famille de parties embo tante 3 3 Formules lin aires Les trois op rateurs lin aires et permettent d introduire d autres modes de d rivation que le moyennage pond r Toute formule lin aire peut tre d compos e en deux composantes une formule ensembliste associ e qui d finit les unit s du protocole d riv comme pr c demment et un mode de d rivation particulier pour le calcul des valeurs pour chaque unit Pour les formules impliquant seulement les op rateurs et le calcul des pond rations associ es aux unit s d riv es se fait uniquement en r f rence la formule ensembliste associ e S A pour la d rivation intra la
24. statistique Toute demande d analyse se traduira par des r sultats qualitatifs ou quantitatifs Du point de vue qualitatif les r sultats seront sous forme de graphiques un accent particulier ayant t mis dans EyeLID 1 sur les possibilit s d exploration graphique s lection d options graphiques d attributs graphiques choix de couleurs liaison de certains points entre eux etc ce qui permet de faire ressortir les traits pertinents des donn es Du point de vue quantitatif on obtiendra des r sultats num riques tels que inertie d un nuage d un sous nuage etc Par exemple partir d un facteur Groupe G on pourra d composer l inertie selon les axes l int r t d une telle d composition tant de choisir les plans des axes qui discriminent au mieux les groupes Si la comparaison G on associe la comparaison intra G not e I G on obtient la double d composition des inerties voir dossiers Suicides et Statut et 17 En r sum le logiciel EyeLID 1 permet d utiliser de fa on conjointe et compl mentaire quantification et visualisation PREMIERS R SULTATS OBTENUS AVEC EYELID 1 On peut non seulement retrouver les principaux r sultats de l analyse des correspondances mais aussi aller imm diatement plus loin c est ce que nous commenterons maintenant pour chacun des deux fichiers Individus et Modalit s produit par le programme INTERF Dans ce qui suit VI V2 V3 etc d signent les variables principale
25. structure du protocole d riv est la m me que celle de S amp A Le calcul des valeurs de S A se fait par diff rence entre celles des protocoles d riv s S amp A et A ainsi l unit d riv e s1 et al est associ e l cart entre moyenne de slal et moyenne de al A T pour la d rivation d interaction la structure du protocole d riv est la m me que celle de A T Le calcul des valeurs de A T se fait partir de celles de A T en construisant le protocole de support A T doublement centr voir 21 et chapitre IV S t1 t2 pour la d rivation par contraste la structure du protocole d riv est la m me que celle correspondant la formule S Le calcul des valeurs se fait par diff rence entre les valeurs des deux protocoles d riv s S t1 et S t2 pour le sujet si on calcule l cart entre les valeurs associ es s1t1 et s1t2 La pond ration associ e l unit d riv e s1 est la moyenne harmonique des pond rations associ es aux 2 unit s s1tl et s1tl 3 4 S lection de variables Toute formule est suivie de la s lection des variables consid rer pour le protocole d riv gt V2 V3 l op rateur gt s pare une formule quelconque gauche et une liste de variables s par es par des droite Pour S gt V2 V3 on d finit le protocole d riv des moyennes des sujets S pour les deux variables V2 et V3 4 MOTS CL S D EYELID 1 Le mot cl
26. uestions Ainsi partir des deux variables initiales Sexe 2 modalit s et Age 4 modalit s on notera qirl la modalit homme qlr2 la modalit femme q2rl q2r2 q2r3 et q2r4 les 4 modalit s de l Age TROISI ME TAPE EXPLORATION DES DONN ES STRUCTUR ES Nous proc derons maintenant un survol du langage d interrogation de donn es tel qu il est mis en oeuvre dans le logiciel EyeLID 1 en vue de le raccorder aux r sultats familiers d une analyse des correspondances Rappelons que EyeLID 1 est un logiciel interactif d analyse des donn es multidimensionnelles structur es Eye pour exploration visuelle des donn es et LID pour Langage d interrogation de Donn es Le langage renvoie la structuration des donn es laquelle peut soit provenir d un plan d exp rience soit comme ici tre introduite sur des donn es de simple observation en vue de leur exploration Une question pos e sur les donn es se traduit par une demande d analyse qui comprend un mot cl indiquant la proc dure statistique mettre en jeu exemples VAR pour variance TAB pour tableau des donn es etc une formule du langage d interrogation de donn es qui indique les donn es sp cifiques sur lesquelles va tre appliqu e la proc dure statistique exemple dans Statut la formule I lt gl gt d signe les individus du groupe gl la liste des variables num riques variables expliquer su lesquelles portera la proc dure

Download Pdf Manuals

image

Related Search

Related Contents

Roller Blinds Installation and operating instructions  MANUEL D`UTILISATION TAMZAG VIEWER  Rollei Compactline 370 TS black  ATS_Manuale_Manager - FC Security & System  Samsung BW1953 راهنمای محصول  OWNERS MANUAL / MANUEL D`UTILISATION Model / Modèle  TP-Link TD-8840 User's Manual  コンプレッション - ツ一丿レcPT一RG6 (ー) 取扱説明書  Melissa 753-126 User's Manual  ESPECIFICACIÓN DE PRODUCTO VEGEfast PACK  

Copyright © All rights reserved.
Failed to retrieve file