Home
Manuel D`UTILISATION DES FONCTIONS R Soraya
Contents
1. avec n le nombre de classes e nomDuJeuDeDonn es CAHanalyseMoynCl png pour le tableau d analyse graphique des moyennes avec n le nombre de classes e nomDuJeuDeDonn es CAHboxPlot png pour la matrice de bo tes moustaches Remarque importante Il n est pas possible de sauvegarder un graphique si le nom de celui ci existe d j Par exemple si un graphique 3 classes a d j t sauvegard on ne pourra sauvegarder automa tiquement un autre graphique 3 classes sans les variables seuils par exemple Pour r gler ce conflit on peut enregistrer manuellement les graphiques soit en faisant Clic droit Enregistrer soit en allant dans Fichier Enregistrer sous 3 5 Exemple d analyse Choix du nombre de classes Tout d abord pour commencer l tude d un jeu de donn es il va falloir choisir le nombre de classes le plus pertinent La contrainte g n ralement fix e est de choisir un nombre de classe minimal pour une inertie intra groupe minimale Il est toutefois possible de ne prendre en compte qu une exigence technique qui am nerait par exemple souhaiter que les individus ne soient regroup s qu en 3 profils uniquement Enfin on rappelle que la CAH trie les individus en classes tel que e Les individus d un m me groupe ont des comportements tr s proches les uns des autres la variance intra groupe l int rieur du groupe est faible e Les individus de deux groupes diff rents o
2. x X X X nb_step ChefAtelier Satistacti n ChetAtalier SeuilSatistaction OuwwProd Satistaction Matrice de distance Matrice de distance Matrice de distance Matrice de distance Ld e o Pa i w gt o 0 es e pt o aj ir we 01 o 3 e Fer 9 e LA o eLo gt f e o e gt e ar dr gt 0 E gt do e gt A gt y e o Y gt e i a 1 r td N e a 1 Y LL y LL a e a y y e y A TA y DRE E LR res CN RDS DRE DE ES TT 2 0 2 4 6 2 0 2 2 6 2 0 2 4 6 2 0 2 4 6 X Xx X XxX OwwProd SeuilSatistaction OuvEnt Satisfaction OuvEnt SeullSatisfaction Regles State Matrice de distance Matrice de distance Matrice de distance v F c ao z A w e s gt o P gt LT A b Ps Ss a J o 5 e P 3 o R gt el o E so gr see p A gee Y YO gt Y gt A A _ _ 2 0 2 4 0 X X X Production State Entretien State pressionOE_CA State FIGURE 2 Matrice de nuages de points obtenue via la fonction MDS pour le jeu de donn es simulation Seita csv Le nuage de points est la repr sentation en deux dimensions de la matrice de distances entre individus Il est construit de telle mani re que la distance entre deux points dans la projection est approximativement gale la valeur de leur distance dans l espace de d part qui est un espace dont la dimension est gal a
3. 2 3 Parametres delVar Ce param tre permet de sp cifier quelles sont les variables que l on ne veut pas utiliser pour tracer le nuage de points Par d faut ce sont toutes les variables pr sentes dans le fichier qui seront utilis es Les noms des variables doivent tre ceux que l on retrouve dans le fichier de base seule la casse n est pas prise en compte delCol Le second parametre sert a indiquer s il y a des variables que l on souhaite exclure pour la coloration du nuage de points Par d faut ce param tre est gal au premier C est dire que les variables utiliser pour tracer le graphique seront aussi utilis es pour colorer les points du nuage de points bagPlot Initialis FALSE ce param tre permet de visualiser le bagplot des observations Pour l enre gistrer il suffit de modifier le param tre save delim Ce param tre est utilis pour modifier le type du s parateur de colonnes du fichier csv Par d faut le s parateur est une tabulation save Ce param tre permet de sp cifier si l on veut effectuer une sauvegarde automatique des fichiers de sortie ou non Par d faut ce param tre est initialis FALSE c est dire que par d faut le graphique ne sera pas sauvegard Si l on d sire une sauvegarde il faut donc mettre le param tre TRUE Quelques exemples de fonctions sur le jeu de donn es SEITA e Nuage de points avec toutes les variables sauf celles concernant l
4. avoir des valeurs sup rieures peu concentr es En outre la classe 3 semble la plus dispers e Il est int ressant de voir que dans la classe 3 l ouvrier de production a une valeur m diane de satisfaction gale 3 contre 15 pour l ouvrier d entretien De m me la valeur de satisfaction maximale atteinte revient l ouvrier de production dans les classes 2 et 3 avec 80 contre 40 pour l ouvrier d entretien dans la classe 3 En fait on s apercoit que m me si c est l ouvrier d entretien qui a le plus souvent la meilleure satisfaction les autres agents lorsqu ils sont satisfaits le sont avec de meilleures valeurs surtout l ouvrier de production Soraya Popic R o z 2 1 2 3 1 2 3 1 2 3 nb_step ChefAteller Satisfaction ChefAtelier SeullSatisfaction z e g z 2 3 g g R amp o o o o o t 1 2 3 1 2 3 1 2 3 OuvProd Satisfaction OwwProd SeuilSatistaction OuvEnt Satisfaction 40 10 2 30 10 OuwEnt SeullSatistaction Regles State Production State FIGURE 7 Matrice de bo tes moustache obtenue via la fonction CAH pour le jeu de donn es simulation Seita csv Entretien State pressionO0E_CA State FIGURE 8 Matrice de bo tes moustache obtenue via la fonction CAH pour le jeu de donn es simulation Seita csv Soraya Popic e Les relations sont comprises dans l intervalle 10 10 Globalement on voit que la classe 2 pr sente de bons r sultats pour chacun
5. classes est lev e En effet la carte auto organisatrice a pour but de mettre c te c te des classes qui sont proches le plus possible les unes des autres Cependant elles ne sont pas toutes aussi proches les unes des autres il existe des distorsions et cette carte a pour but de le montrer Pour mieux comprendre revenons notre exemple Soraya Popic Carte des distances 5 0 4 5 4 0 3 5 3 0 2 5 2 0 FIGURE 11 Carte des distances obtenue via la fonction SOM pour le jeu de donn es simulation Seita csv e On constate que dans le coin inf rieur gauche il y a une grande distance entre les classes Ces trois classes formant le coin sont plus distantes des autres classes que ne le laisserait penser la grille Si l on s int resse davantage ce trio on constate qu il s agit des simulations 9 25 34 85 88 90 et 92 figure 12 En comparant ces num ros avec les r sultats de la CAH on retrouve les 6 individus de la classe 2 classe minoritaire caract ris e par une faible satisfaction des ouvriers d entretien En effet ces individus tant proches les uns des autres et par ailleurs tr s diff rents des autres individus du jeu de donn es dans le sens o peu de simulations m nent l insatisfaction de l ouvrier d entretien ils sont les bons candidats pour former une classe e Sur la carte des distances figure 11 il y a une autre zone qui pr sente des distances
6. d une fl che jaune ce symbole repr sente la m diane bivari e des observations A l int rieur de cette surface on retrouve 50 des observations La surface plus claire repr sente une extension de la premi re ici elle permet de regrouper 90 des observations En dehors de cette surface les quelques points restant peuvent tre identifi s comme outliers c est dire des points atypiques du jeu de donn es Le bagplot permet de rendre compte de la forme du nuage de points en effet on cherche y inclure 50 des observations c est pourquoi plus la concentration en variables est forte dans une direction moins il faudra aller loin pour les rencontrer e Pour le jeu de donn es SEITA on constate qu il y a un groupe de points atypiques c est celui qui a d j t identifi lors de l tude des MDS On remarque d autres simulations telles que les simulations 13 48 28 et 92 qui pr sentent un caract re inhabituel Soraya Popic 3 Fonction CAH 3 1 Description La fonction CAH permet de r aliser une classification ascendante hi rarchique sur un jeu de donn es d fini Le but de la classification est de simplifier le profil des individus en le regroupant Chaque individu appartient alors une classe un groupe parmi d autres individus qui lui ressemblent et pour lesquels on pourra dresser un profil type On pourra fixer un nombre de classes a priori ou chercher la meilleure repr sentatio
7. delVar Gr ce ce param tre on peut exclure une ou plusieurs variables de l analyse des corr lations delim Ce param tre est utilis pour modifier le type du s parateur de colonnes du fichier csv Par d faut le s parateur est une tabulation Pour le modifier on procede comme suit delim save Ce param tre permet de sp cifier si l on veut effectuer une sauvegarde automatique du fichier de sortie ou non Par d faut ce param tre est initialis FALSE c est dire que par d faut le graphique ne sera pas sauvegard Si l on d sire une sauvegarde il faut donc mettre le param tre TRUE Quelques exemples de fonctions sur le jeu de donn es SETTA e Trac de la matrice de corr lation sans les seuils de satisfaction avec sauvegarde du graphique CORR delVar ChefAtelier SeuilSatisfaction OuvEnt SeuilSatisfaction DuvProd SeuilSatisfaction save TRUE NB Il faut bien prendre en compte l ordre d apparition des param tres ou les nommer explicite ment 1 4 Sauvegarde Le graphique sera enregistr en format png dans le dossier contenant le jeu de donn es sous le nom nomDuJeuDeDonn es CORRgraph png 1 5 Exemple d analyse CORR save TRUE On obtient le graphique de la figure 1 La force du lien entre les variables peut tre lue via les couleurs plus la couleur est fonc e plus le lien est fort ou par la forme du cercle plus il est aplati plus la corr lation es
8. voir que la classe qui contenait l effectif le plus important a un cart type faible pour chacune des variables ce qui veut dire que les simulations qui la composent sont vraiment proches les unes des autres et fonctionnent exactement de la m me mani re e Si l on regarde les classes dans le coin inf rieur gauche celles pour lesquelles la satisfaction du chef d atelier et de l ouvrier de production est maximale contrairement l ouvrier d entretien on remarque que la satisfaction de l ouvrier d entretien mais galement les relations comme l entretien la pression et le niveau de respect des r gles ont des cart types lev s Comme l on sait que le niveau d entretien des machines est fortement corr l la satisfaction de l ouvrier d entretien on peut penser qu il existe peut tre dans ces classes quelques situations pour lesquelles la satisfaction de l ouvrier d entretien est bonne bien que les conditions ne lui soient pas favorables Soraya Popic Etude des carts types nb_step ChefAtelier Satisfaction ChefAtelier SeuilSatisfaction OuvProd Satisfaction A HE OuvProd SeuilSatisfaction OuvEnt Satisfaction OuvEnt SeuilSatisfaction Regles State Production State Entretien State pressionOE CA State FIGURE 13 Matrice de cartes auto organisatrices color e selon les moyennes des carts types obtenue via la fonction SOM pour le jeu de donn es simulation Seita csv
9. MANUEL D UTILISATION DES FONCTIONS R SORAYA POPIC STAGE DE FIN D TUDES LICENCE SID UPS 2011 2012 Objet du document Ce manuel pr sente une description de chacune des fonctions ainsi qu une explication des parametres d entr e et ou de sortie Toutes les fonctions pr sent es dans ce document sont agr ment es d un exemple d analyse bas sur le jeu de donn es seita simulation csv qui contient les valeurs des simulations obtenues via Soclab pour le cas SEITA Soraya Popic Table des matieres 1 Fonction CORRO Lal 1 2 1 3 1 4 1 5 ol 2 2 2 3 2 4 2 0 3 1 3 2 3 9 3 4 3 9 4 1 4 2 4 3 4 4 4 5 DISCOS cidcid naaa sarria ce nue U rra AA a INIESTA PANICO ss sor ratios rr AA Exemple d analyse ee a A en s Fonction MDS DCE LR nn Ad mt AA La e ic puras riera a EME i xs iia nes ria ars AAA Eole d analyse s aseran ekaa ia a a AA de ue Fonction CAH SPA D D AA a A nn ed nn Por ES eaa a e a D De do a a E AA U U DDE a nn D ce Exemple d analyse LL AU aia AA t a Fonction SOM ISSO AN oca riera aaa DR de a UNS soso eses rosas sra dai ss o III ae EA S EIA Fsemple d analyse caros as A AR e UA O A Soraya Popic 1 Fonction CORRO 1 1 Description La fonction CORR permet de tracer un graphique des corr lations bas sur une matrice des corr lations entre plusieurs variables 1 2 Usage CORR delVar 0 delim t save FALSE 1 3 Param tres
10. a Popic Sur la hitmap figure 9 nous pouvons voir les 25 classes composant la carte organisatrice On rappelle qu une classe regroupe des individus qui sont proches les uns des autres l int rieur de chacune d entre elles un rectangle proportionnel l effectif de la classe est dessin Ainsi on peut s apercevoir sur ce graphique que la classe dans le coin inf rieur droit regroupe beaucoup d individus tandis que d autres classes ont un tr s petit effectif Etude des moyennes nb_step ChefAtelier Satisfaction ChefAtelier SeuilSatisfaction OuvProd Satisfaction LE OuvProd SeuilSatisfaction OuvEnt Satisfaction OuvEnt SeuilSatisfaction Regles State gt SE Production State Entretien State pressionOE_CA State FIGURE 10 Matrice de cartes auto organisatrices color e selon les moyennes des variables obtenue via la fonction SOM pour le jeu de donn es simulation Seita csv Pour pouvoir d crire les diff rentes classes on peut commencer par regarder la matrice de graphiques de la figure 10 Pour chacune des variables on a repr sent la carte auto organisatrice telle que la m thode l a cr e Ensuite chacune des classes a t color e en fonction de la moyenne de la variable pour cette classe Plus la valeur de la variable est forte plus la couleur utilis e sera fonc e Ce qu il est crucial de comprendre dans cette tude c est qu une couleur bleue d note une valeur fai
11. ble de la moyenne relativement aux autres moyennes Cela ne veut en aucun cas dire que la moyenne est n gative par exemple elle est juste faible par rapport aux autres moyennes Pour le jeu de donn es SEITA on peut constater que e Un ensemble de classes plac droite de la carte pr sente des satisfactions faibles pour le chef d atelier et le chef de production En regardant les relations on remarque que ces classes sont principalement caract ris es par une production et un niveau d entretien bas e Si l on s int resse l ouvrier d entretien on se rend compte que pour celui ci il y a essentiellement 3 classes pour lesquelles sa satisfaction est lev e En regardant ces trois classes sur les autres sch mas il est possible de d gager les configurations permettant l ouvrier d entretien d tre satisfait Ainsi ce dernier est l aise dans les situations o les r gles et la pression sont relativement lev es pourvu que le niveau d entretien soit faible e L tude de ces cartes nous prouve qu il est plus facile de satisfaire l ouvrier d entretien que les autres agents mais qu il est compliqu de satisfaire les 3 agents simultan ment Un autre graphique est susceptible de nous apporter de l information Il s agit de la carte de base color e selon la distance entre les classes figure 11 plus la teinte tend vers le rose fonc plus la distance entre les prototypes des
12. c plus de modalit s de fonctionnement pour l organi sation et en donnant pour chaque classe celles qui ont une organisation proche de la sienne En fait on pourrait consid rer que la carte auto organisatrice est une combinaison de m thodes de classification comme dans la CAH et de visualisation comme dans le MDS La carte auto organisatrice est bas e sur la cr ation d une grille dont l utilisateur choisit le dimensions d finissant le nombre de classes souhait es Dans notre exemple c est une grille 5x5 qui est utilis e fixant a fortiori 25 classes aussi appel es neurones Chaque neurone est repr sent par un prototype Le prototype est une observation artificielle consid r e comme repr sentative des observations d origine chaque it ration on associe une observation le neurone dont le prototype est le plus proche Ensuite le prototype est mis jour afin de prendre en compte la nouvelle observation et ainsi de suite pour tous les individus SOM save TRUE Pour tudier le jeu de donn es la fonction SOM fournit 5 graphiques diff rents Il faut croiser les infor mations provenant de tous les graphiques pour obtenir une bonne analyse Nous allons commencer par tudier la composition des classes cr es par la m thode Hitmap effectif des classes on FIGURE 9 Carte des effectifs obtenue via la fonction SOM pour le jeu de donn es simulation Seita csv Soray
13. ction du chef d atelier car la production est trop basse e Classe 2 La classe deux pr sente les caract ristiques inverses de la classe 1 En effet pour ces simulations qui convergent tr s rapidement moyenne faible de nb_step les satisfactions des ou vriers de production et du chef d atelier sont tr s bonnes On peut s apercevoir que l entretien et Soraya Popic Class 1 effectif 53 Class 2 effectif 6 Class 3 effectif 41 nb_step ChefAtelier Satisfaction ChefAtelier SeuilSatisfaction OuvProd Satisfaction OuvProd SeuilSatisfaction OuvEnt Satisfaction OuvEnt SeuilSatisfaction Regles State Production State Entretien State pressionOE_CA State Effectifs FIGURE 6 Tableau d analyse des moyennes obtenu via la fonction CAH pour le jeu de donn es simulation Seita csv la production ont des valeurs maximales En cons quence l ouvrier d entretien est tres m content puisqu il a un surplus de travail Le respect de regles a une valeur centrale tandis que la pression des ouvriers d entretien sur le chef d atelier est la plus lev e Cette classe est la plus petite de toute cela veut dire que c est un groupe contenant des simulations qui n occurrent que rarement e Classe 3 Enfin cette derni re classe est en quelque sorte le groupe m dian gt Toutes les sa tisfactions sont moyennes sauf pour l ouvrier d entretien qui pr sente une satisfacti
14. e des relations puisque toutes les boites moustaches sont dans la partie sup rieure du graphique 0 10 m me si la production pr sente des valeurs particuli rement tendues La relation pression ne semble pas tre intervenue dans la construction des classes avec des valeurs h t rog nes dans chacune des classes Soraya Popic 4 Fonction SOM 4 1 Description La fonction SOM permet de r aliser la carte auto organisatrice d un jeu de donn es En fait sur ces cartes les individus sont regroup s en classe comme pour une classification ascendante hi rarchique Parallelement ces classes sont organis es de mani re ce que deux classes qui pr sentent de fortes similarit s soient c te c te alors que deux classes loign es le seront galement physiquement sur la grille L avantage de la carte auto organisatrice est qu elle propose davantage de classes et permet donc de mettre jour des comportements moins vidents plus particuliers En sortie de cette fonction on obtient 5 graphiques qui permettront d tudier cette classification e La carte des effectifs aussi nomm e lt hitmap gt indique pour chaque neurone ou classe son effectif e La carte des individus pour savoir exactement quels individus sont pr sents dans telle ou telle classe e La carte des distances qui r v le par des variations de couleurs la distance entre les neurones e Les derni res cartes pr sen
15. e ne sera pas sauvegard Si l on d sire une sauvegarde il faut donc mettre le param tre TRUE Quelques exemples de fonctions sur le jeu de donn es SETTA e Cr ation d une carte auto organisatrice de taille 4x4 avec des neurones hexagonaux SOM grid type 2 grid length 4 e Cr ation d une carte auto organisatrice sans les seuils de satisfaction SOM 3 delVar ChefAtelier SeuilSatisfaction OuvEnt SeuilSatisfaction DuvProd SeuilSatisfaction NB Il faut bien prendre en compte l ordre d apparition des param tres ou les nommer explicite ment Soraya Popic 4 4 Sauvegarde Les graphiques seront enregistr s en format png Les noms des fichiers seront les suivants e nomDuJeuDeDonn es SOMcarteEff png pour la carte des effectifs e nomDuJeuDeDonn es SOMcarteDist png pour la carte des distances e nomDuJeuDeDonn es SOMcartelnd png pour la carte des individus e nomDuJeuDeDonn es SOMCarteNivMoy png pour la matrice repr sentant la valeur moyenne des variables dans chacune des classes Son quivalent bas sur le calcul de l cart type est enregistr sous ce nom nomDuJeuDeDonn es SOMCarteNivSD png 4 5 Exemple d analyse Nous allons compl ter les r sultats de la classification ascendante hi rarchique en r alisant une carte auto organisatrice sur le jeu de donn es SEITA Cette derni re permettra de compl ter notre analyse en proposant davantage de classes que la CAH et don
16. en tr s faible et donc une production tr s faible entra nant une satisfaction tr s basse des autres acteurs notamment du chef de production Enfin on peut utiliser un dernier outil pour tudier ce jeu de donn es il s agit de la m me matrice de Soraya Popic Carte des individus 82 Er a ye 87 FIGURE 12 Carte des individus obtenue via la fonction SOM pour le jeu de donn es simulation Seita csv graphiques que pr c demment figure 10 sauf que les classes ont t color es en fonction de la valeur de leur cart type pour cette classe On rappelle que l cart type permet de mesurer la dispersion des donn es c est dire que l on cherche savoir si les simulations d une m me classe sont proches les unes des autres ou non En fait cela pourrait para tre contradictoire car le but d une classe est de regrouper des individus tr s proches les uns des autres et donc avec une variance tr s faible Dans la pratique c est globalement ce qui se passe pour nos classes sauf qu elles ne peuvent pas avoir une variance faible pour absolument toutes les variables mais plut t une variance faible g n ralement en moyenne Lors de l interpr tation de ces cartes il faut bien v rifier le nombre d individus composant la classe pour ne pas confondre un cart type faible et un cart type inexistant si il y a un seul individu dans la classe on ne peut calculer d cart type e On peut
17. entre classes lev es En regardant la matrice de repr sentation de la carte en fonction des variables on constate que certaines de ces classes sont particuli res puisqu elles ont tendance pr senter des valeurs similaires tr s faibles pour chacune des variables Les simulations qui composent ces classes font partie de ce qui a t la classe 1 de la CAH nombre d individus important satisfaction lev e de l ouvrier d entretien au d triment de ses collabora teurs niveau des relations faible La carte auto organisatrice a permis de r v ler l existence d un comportement assez marginal de l organisation permettant de trouver une situation o aucun des acteurs n est satisfait L organisation n a pu trouver de stabilit pour ces simulations c est pourquoi pour l une de ces classes compos e d un seul individu on a une valeur de nb_step tr s importante Par ailleurs on voit bien ici le lien de compl mentarit existant entre l interpr tation de la CAH et celle des cartes auto organisatrices e Si l on revient la case contenant le plus grand nombre d individus et que l on cherche le num ro des individus sur le nuage de points de la CAH on voit qu il repr sente le noyau dur gt de la classe 1 Ces observations sont tr s proches les unes des autres et forment le sch ma le plus classique de l organisation SEITA avec une satisfaction positive de l ouvrier d entretien corr l e un entreti
18. es seuils de satisfaction des diff rents agents La coloration du nuage de points se fera a fortiori sans les seuils de satisfaction Enfin on sauvegarde le graphique MDS delVar ChefAtelier SeuilSatisfaction OuvEnt SeuilSatisfaction DuvProd SeuilSatisfaction save TRUE e ll est galement possible de ne faire varier que certains param tres comme dans les exemples ci dessous ici on souhaite enlever le chef d atelier mais seulement pour la coloration MDS delCol ChefAtelier Satisfaction ChefAtelier SeuilSatisfaction save TRUE NB Il faut bien prendre en compte l ordre d apparition des param tres ou les nommer explicite ment 2 4 Sauvegarde Le MDS sera enregistr en format png dans le dossier contenant le jeu de donn es sous le nom nomDu JeuDeDonn es MDSgraph png Le bagplot sera enregistr en format png galement dans le m me dossier sous le nom nomDuJeuDe Donn es MDSbagplot png Soraya Popic 2 5 Exemple d analyse MDS bagPlot TRUE save TRUE On prends toutes les variables pour tracer le nuage de points et pour colorer Matrice de distance Matrice de distance Matrice de distance Matrice de distance 7 7 t A e wN o a yA Ei a 5 gt ARE e gt Te 6 gt e gt o L p gt lt y e a tt 8 o LL z e ye yA A A A 2 Y A Y AA S 2 0 2 4 6 2 0 2 4 6 2 0 2 4 6 2 0 2 4
19. n Cette fonction affiche plusieurs graphiques en sortie tout d abord elle produit un arbre hi rarchique des classes aussi nomm lt dendrogramme gt permettant de choisir le meilleur nombre de classes ainsi qu un MDS pr sentant les individus selon la classe choisie Aussi afin de d gager des profils on utilisera le tableau d analyse des moyennes et la matrice de bo tes moustaches 3 2 Usage CAH class 0 delVar 0 manSelect FALSE MAV FALSE bPlot FALSE delim t save FALSE 3 3 Parametres class Ce param tre permet d indiquer en combien de classes on souhaite partager les individus Il est possible de fixer un seul nombre de classes ou d en tester plusieurs dans une m me fen tre graphique Si l on souhaite tester plusieurs classes la fois il est n cessaire de faire pr c der ces chiffres par un lt c gt tel que class c 2 3 4 delVar Gr ce ce param tre on peut exclure une ou plusieurs variables de la classification manSelect Par d faut FALSE manSelect permet de faire une s lection manuelle sur le graphique dendrogramme du nombre de classes La s lection s effectue avec le bouton gauche de la souris Une fois les classes s lectionn es il faut cliquer sur le bouton droit de la souris pour obtenir les sorties suppl mentaires bPlot Permet d obtenir une matrice de bo tes moustaches pour chacune des variables de l tude on obtient la bo te moustache
20. nne de chacune des variables En les comparant les unes aux autres on dressera les profils de chacune des classes On peut simplifier la lecture de ce tableau en remplacant les valeurs moyennes par un code couleur simple si la moyenne consid r e est basse par rapport aux autres elle sera repr sent e par une pastille bleue allant du fonc au clair si elle est forte par rapport aux autres elle sera rouge c est ce que l on obtient dans la deuxi me fen tre graphique et que l on peut sauvegarder en png On peut d crire les classes de cette mani re voir figure 6 e Classe 1 La premiere classe regroupe les simulations qui ont t les plus longues converger On peut remarquer que les satisfactions et seuils de satisfaction des chefs d ateliers et des ouvriers de production sont les plus faibles En revanche la satisfaction de l ouvrier d entretien pour ces simulations est maximale Toutes les relations sont tr s faibles cela signifie que le respect des r gles la production le niveau d entretien et la pression sont tr s faibles On peut aussi interpoler les r sultats et essayer d aller plus loin dans l analyse l ouvrier d entretien est tr s satisfait car l entretien est faible il ne r alise donc pas ou peu de t ches A l inverse l ouvrier de production ne peut plus travailler correctement car l entretien des machines est mauvais ce qui entra ne une baisse de la satisfa
21. nt des comportements tr s loign s la variance inter groupe la variance entre les groupes est la plus lev e possible Dans le cas des donn es SEITA l tude du MDS nous avait d montr l existence de 3 groupes potentiels Pour affirmer cela nous allons dans un premier temps tracer le dendrogramme et le MDS du jeu de donn es partitionn en 2 3 et 4 groupes afin de voir si le d coupage des individus en 3 classes est bien le plus pertinent Soraya Popic CAH class c 2 3 4 save TRUE On constatera que le tableau d analyse des moyennes ne peut tre sauvegard en sortie en effet ce dernier permettant de d crire les classes cr es il n est pas pertinent tant que ce nombre de classes n a pas t fix Dendrogramme de classes Matrice de distance Dendrogramme de classes 80 inertie ntra groupe 4 nertie ntra groupe 4 mat data CR X mat dataCR 2 Classes 3 Classes Matrice de distance Matrice de distance t s nerte ntra group X mat dstaCR 4 Classes FIGURE 4 Partition du jeu de donn es en classes multiples obtenue via la fonction CAH pour le jeu de donn es simulation Seita csv Le dendrogramme est obtenu gr ce un algorithme qui chaque it ration relie les deux individus les plus proches jusqu l obtention d une seule et m me classe C est cette information que l on peut lire sur l axe des abscis
22. on assez lev e proche de la satisfaction maximale observ e dans la classe 2 Le respect des r gles est maximal tandis que pression entretien et production sont faibles Dans ces simulations c est l ouvrier d entretien qui est le plus satisfait suivi de l ouvrier de production On peut constater que de mani re g n rale il n est pas possible d avoir une bonne satisfaction pour le chef d atelier et pour l ouvrier d entretien Chaque bo te moustaches figures 7 et 8 est color e selon la couleur qui a t attribu e sa classe On peut aussi voir que la largeur de la bo te est proportionnelle son effectif permettant de ne pas perdre de vue l importance relative de chacune des classes Il est int ressant de constater que e Pour la variable nb_step les donn es l int rieur de chacune des classes sont bien h t rog nes l tendue des valeurs est faible m me si pour chacune des classes on constate la pr sence d outliers La classe 1 est celle qui propose les plus fortes valeurs de nb_step et la plus grande tendue e Si l on s int resse au niveau des satisfactions des agents on peut voir en premier lieu que dans chacune des bo tes moustaches on constate des valeurs bien r parties autour de la m diane ce qui signifie que les donn es sont bien r parties Seules les bo tes moustaches concernant la satisfaction des ouvriers d entretien dans les classe 2 et 3 ont tendance
23. r ailleurs l inertie intra groupes est assez basse Description des classes d une partition Maintenant que l on a fix le nombre de classes d sir savoir 3 on va pouvoir obtenir des donn es suppl mentaires sur ce d coupage en groupes notamment gr ce au tableau d analyse des moyennes Soraya Popic Dendrogramme de classes Matrice de distance 80 l Class 1 Class 2 Inertie intra groupe 40 l Y 0 20 1 SSARAFR LS ARR MT ENS UF Me fi LE ON A IS A E gt mat dataCR X hclust ward FIGURE 5 Partition du jeu de donn es en 3 classes obtenue via la fonction CAH pour le jeu de donn es simulation Seita csv Ici on a donc les 100 simulations r parties selon 3 classes Sur la matrice de distances les points ont t remplac s par le num ro des individus Il convient maintenant de comprendre comment ces classes ont t cr es quelles sont les caract ristiques de chacune des classes Pour cela on utilisera le tableau d analyse des moyennes disponible sous cette forme en csv s nb_step ChefAtelier Satisfaction ChefAtelier SeuilSatisfaction DuvProd Satisfaction DuvP 1 5824 4 17 36 17 71 24 04 32 56 20 62 17 31 0 86 1 838 5 42 0 53 53 112 2433 33 46 79 43 04 64 45 57 86 9 04 9 56 3 52 6 53 8 6 2 02 6 3 4085 07 3 67 0 06 32 83 8 24 17 6 16 45 5 11 0 68 0 76 0 06 41 Pour chacun des groupes on a calcul la moye
24. s concentrations de couleur On cherche ensuite les variables qui permettraient d expliquer ces trois groupes e On remarque que les satisfactions et seuils de satisfaction des chefs d ateliers et ouvriers de pro duction expliquent bien les trois groupes en effet on voit une s paration nette entre les 3 groupes le long de l axe des abscisses Soraya Popic e Aussi la variable entretien rend bien compte de l existence de 3 groupes avec deux groupes proches points oranges p les et oranges et un groupe d individus atypiques points oranges fonc s e On peut galement s apercevoir qu l inverse les variables production r gles et pression ne permettent pas d expliquer les trois groupes Par exemple pour r gles on voit des points fonc s tout le long de l axe des abscisses ce qui signifie qu ils ne se sont pas regroup s un endroit pr cis et donc cette variable n explique pas l existence de groupes L tude du bagplot va nous permettre d en savoir davantage sur la distribution Bagplot des observations FIGURE 3 Bagplot des donn es obtenu via la fonction MDS pour le jeu de donn es simulation Seita csv Chacun des individus qui correspondent aux 100 simulations tudi es a t nouveau repr sent sur un nuage de points en deux dimensions repr sentant les distances entre chaque individu A l int rieur de la r gion bleue fonc e on voit tout d abord une toile rouge surmont e
25. s de chacune des classes MAV Permet d obtenir dans un fichier au format CSV les valeurs num riques du tableau d analyse des moyennes uniquement disponible pour un nombre de classes unique ou une s lection manuelle cf Sauvegardes delim Ce param tre est utilis pour modifier le type du s parateur de colonnes du fichier csv Par d faut le s parateur est une tabulation save Ce param tre permet de sp cifier si l on veut effectuer une sauvegarde automatique du fichier de sortie ou non Par d faut ce param tre est initialis FALSE c est dire que par d faut le graphique ne sera pas sauvegard Si l on d sire une sauvegarde il faut donc mettre le param tre TRUE Quelques exemples de fonctions sur le jeu de donn es SETTA e Trac du dendrogramme et du MDS avec 2 et 3 classes sauvegarde du graphique CAHCclLass c 2 3 Save TRUE e Trac du dendrogramme MDS et des bo tes moustaches pour une classification en 3 classes sans les seuils de satisfaction des diff rents agents CAH 3 delVar ChefAtelier SeuilSatisfaction OuvEnt SeuilSatisfaction OuvProd SeuilSatisfaction bPlot TRUE NB Il faut bien prendre en compte l ordre d apparition des param tres ou les nommer explicite ment Soraya Popic 3 4 Sauvegarde On considere pour cette fonction 3 mani res d obtenir le dendrogramme et le MDS e Choix de plusieurs nombres de classes e Choix d un nombre de clas
26. ses Une classe correspond une branche de l arbre si l on trace un trait horizontal sur le dendrogramme et que l on compte le nombre de fois o il coupe une branche du dendrogramme on obtient le nombre de classes Sur l axe des ordonn es on lit la valeur de l inertie intra groupes que l on souhaite la plus faible possible En effet cette derni re n tant autre que la variance l int rieur des groupes on la veut tr s basse afin que des individus formant une classe soient les plus proches gt possible On constate que plus l on descend le long de cet axe plus le nombre de classes est important or on souhaite galement un nombre de classes faible Pour notre jeu de donn es selon que la partition soit de deux trois ou quatre classes l inertie intra groupes est respectivement de 60 30 puis 20 En effet l inertie intra classes est une fonction d croissante du nombre de classes Le choix du nombre de classes est finalement subjectif puisque l on va le choisir le nombre de classes k tel que le passage de k k 1 classes ne diminue plus significativement l inertie intra groupes Dans le cas des donn es SEITA on va s attacher avoir un nombre de classes faibles et au vue des donn es on choisira le r sultat produit par le MDS c est dire trois classes En effet d montrer l existence de 3 groupes de simulations distincts et a fortiori de 3 mod les de fonctionnement de l organisation est suffisant Pa
27. ses unique e Choix du nombre de classes manuellement Le choix d un nombre de classes multiples sert comparer diff rents d coupages gt du jeu de donn es afin de choisir la meilleure partition et ne doit pas tre utilis pour l interpr tation des profils En cons quence une commande du type CAH class c 2 3 ne peut permettre d obtenir en sortie le tableau d analyse des moyennes ou encore la matrice de bo tes moustaches utiles pour la description des classes Une fois qu on a fix le nombre de classes d sir on utilise soit la s lection manuelle CAH manSelect TRUE soit la s lection unique CAH class 3 pour obtenir le tableau d analyse des moyennes et selon option les bo tes moustaches En cons quence il n y a qu avec ces configurations que l on peut enregistrer ces sorties Les graphiques dendrogramme MDS et matrice de bo tes moustaches seront enregistr s en format png Le tableau d analyse des moyennes est disponible sous 2 formes en format csv param tre MAV contenant les valeurs num riques et en format png repr sentant l analyse des moyennes de mani re graphique e nomDuJeuDeDonn es CAHgraphnC1 png pour un graphique trac avec un seul nombre de classes n est ce nombre de classes e nomDuJeuDeDonn es CAHgraphMulti png pour un graphique trac avec diff rents nombres de classes e nomDuJeuDeDonn es CAHanalyseMoynCl csv pour le tableau d analyse des moyennes en format csv
28. t forte Le sens de la corr lation peut de m me tre interpr t selon la couleur le bleu indique une corr lation n gative alors que le rouge d note d une corr lation positive ou selon l orientation de l ovale montant si la corr lation est positive descendant sinon Pour le cas SEITA on pourrait interpr ter les donn es comme suit e On constate que le nombre de pas nb_step est corr l n gativement avec toutes les autres va riables Cela signifie que plus l algorithme a besoin d it rations pour trouver une situation conver gente plus la satisfaction et le seuil de satisfaction des diff rents acteurs baissent et plus les r sultats des relations sont bas En fait cela veut dire que lorsque l organisation a des difficult s se sta biliser d o un grand nombre d it rations il faudra certainement passer par une d gradation des satisfactions des diff rents agents afin de trouver une stabilit Soraya Popic Graphique des corr lations entre les variables nb_step ChefAtelier Satisfaction ChefAtelier SeuilSatisfaction OuvProd Satisfaction OuvProd SeuilSatisfaction OuvEnt Satisfaction OuvEnt SeuilSatisfaction Regles State Production State Entretien State pression0E_CA State 0000000000 x00 OOOO OOO E FIGURE 1 Graphique des corr lations obtenu via la fonction CORR pour le jeu de donn es simulation Seita csv e Si l on s int resse aux satisfactions des agen
29. tent une matrice de graphiques la premi re affiche la valeur moyenne des variables dans les diff rentes classes tandis que la seconde en fait de m me pour l cart type 4 2 Usage SOM save FALSE grid length 5 grid type 1 delim t delVar 0 4 3 Param tres grid length Pour cr er la carte on doit fixer les param tres de cette derni re Ici grid length permet de modifier la taille de la grille Par d faut c est une grille 5x5 c est dire une grille comprenant 25 neurones soit 25 classes diff rentes grid type De m me on peut changer la forme de la grille Au lieu d obtenir une grille carr e on peut donner aux neurones la forme hexagonale Il faut par ailleurs comprendre que l hexagone du fait de sa forme permet une classe d avoir un nombre de classes voisines plus importante Le type 1 correspond une grille compos e de neurones carr s tandis que le type 2 engendre une grille de neurones hexagonaux Par d faut la grille est carr e delVar Il est possible d carter certaines variables de l analyse gr ce ce param tre delim Ce param tre est utilis pour modifier le type du s parateur de colonnes du fichier csv Par d faut le s parateur est une tabulation save Ce param tre permet de sp cifier si l on veut effectuer une sauvegarde automatique du fichier de sortie ou non Par d faut ce param tre est initialis FALSE c est dire que par d faut le graphiqu
30. ts on peut tout de suite voir que l ouvrier d entretien est corr l n gativement avec la satisfaction des autres agents Cela signifie que plus les autres agents sont satisfaits moins l ouvrier d entretien l est et inversement On voit tout de suite que cet agent s oppose aux autres et peut donc tre un facteur de m sentente dans l organisation De plus cette tendance est encore plus accentu e quand il s agit d tudier les relations entre l ouvrier d entretien et le chef d atelier e En ce qui concerne les relations elles sont toutes corr l es positivement entre elles ce qui nous am ne penser que par exemple plus le respect des r gles est fort plus l entretien et la production sont lev s e Enfin il est int ressant de voir que l entretien des machines est la relation qui influence le plus la satisfaction des diff rents agents Soraya Popic 2 Fonction MDS O 2 1 Description La fonction MDS permet d obtenir un nuage de points repr sentant la distance entre chacun des indivi dus Chacun d entre eux est ensuite color en fonction de la valeur d une certaine variable Par ailleurs elle permet galement d obtenir un lt bagplot gt c est dire un nuage de points en deux dimensions permettant de d tecter des valeurs aberrantes ou simplement des individus atypiques 2 2 Usage MDS delVar 0 delCol delVar bagPlot FALSE delim At save FALSE
31. u nombre de variables on a ici muni cet espace de la distance euclidienne usuelle dans R o p est le nombre de variables sur l espace des variables dont les valeurs ont pr alablement t centr es et r duites Autrement dit deux points proches sur le graphique ont des valeurs plut t semblables tandis que deux individus loign s sont bien diff rents L interpr tation de ce graphique va nous permettre de visualiser mais galement de comprendre l aide des couleurs la r partition des individus Le nuage de points a t reproduit l identique pour chacune des variables choisies liste modifiable avec delCol puis a t color en fonction de l intensit de cette variable pour chacun des individus Plus on s approche du rouge plus la variable concern e est forte pour cet individu A l inverse un orange p le d note une faible valeur pour la variable concern e Il faut donc tre attentif aux variations de couleurs dans les groupes de points qui sont visuellement s par s Dans notre exemple ces groupes sont principalement organis s selon l axe des abscisses 2 groupes principaux et des simulations lt isol es gt droite du graphique On interpr te les donn es comme suit e D une mani re g n rale on peut voir 3 groupes avec un regroupement d orange p le un autre d orange et un dernier orange fonc Cette observation est assez subjective il faut chercher visuel lement de
Download Pdf Manuals
Related Search
Related Contents
取扱説明書 八王子市消費生活ニュース ピエゾバランス粉塵計 MODEL3521 簡易取扱説明書(3.1MB) Manual do Instalação Descargar Utica Boilers H2OI Operation and Installation Manual 所内各種測定器械の紹介 Copyright © All rights reserved.
Failed to retrieve file