Home
Télécharger l`article
Contents
1. 2 3 3 Classification Nous sommes maintenant capables de produire une matrice de distances mesurant les dif f rences entre les parcours de vie des individus Celle ci peut tre utilis e dans une proc dure de classification hi rarchique ascendante selon la m thode de Ward Le tableau 6 croise les r sultats obtenus par la classification hi rarchique ascendante entre les deux solutions cinq groupes Comme on peut le constater la r partition des individus entre les groupes diff re for tement m me si certains groupes comme le 4 semblent stable dans les deux solutions Notre choix d une solution cinq groupes s est faite en fonction de son interpr tabilit mais aussi l aide des m thodes graphiques pr sent es dans la partie suivante Multi Dimensional Sca ling Nous avons choisi d utiliser pour la suite de cet article les distances bas es sur les taux de TAB 6 Croisement entre les deux solutions taux de transition et co ts optimaux taux de co ts optimaux transition 1 2 3 4 5 Total 1 78 0 0 O 186 264 2 324 0 0 0 0 324 3 12 821 613 0 0 1446 4 37 1 7 259 0 304 5 1 253 3 0 6 263 Total 452 1075 623 259 192 2601 RNTI X 6 N S M ller et al transition Les r sultats obtenus de cette mani re sont plus facilement interpr tables en effet les groupes obtenus par le clustering sont plus homog nes et les coefficients des r gressions logistiques plus signi
2. ge des divorces Les points noirs de taille r duite correspondent aux individus qui n ont pas divorc Le niveau de gris des autres points exprime l ge de l individu au moment du divorce Plus l individu est jeune au moment de son divorce plus le point associ est clair Ce type de repr sentation permet galement de visualiser d autres types d informations Par exemple la figure 4 montre la r partition des dates de naissance des individus sur la re pr sentation Ainsi nous observons que certains comportements ont eu tendance dispara tre comme le fait de rester chez ses parents en haut au centre et que des nouveaux comportements apparaissent comme les mariages tardifs zone sur la gauche de la partie centrale 957 950 935 940 912 FIG 4 Organisation des dates de naissance dans la repr sentation La repr sentation est divis e en unit de surface le niveau de gris de chaque zone d pend de la moyenne des dates de naissance plus la date moyenne est ancienne plus l unit de surface associ e est fonc e RNTI X 8 N S M ller et al 4 2 RankVisu En termes de r duction de dimension on cherche classiquement pr server les distances entre donn es RankVisu propose un nouveau point de vue sur les donn es en cherchant conserver les rangs de voisinages une relation de rang 1 est le relation entre un point et son plus proche voisin une relation de rang 2 est la relation en
3. conclusions comparables RNTI X 9 Visualisation et classification des parcours de vie 5 Interpr tations Nous analysons maintenant les caract ristiques de chacun des groupes L interpr tation peut se faire de plusieurs mani res nous privil gions ici une m thode visuelle pour la dis tinction des groupes Nous disposons de deux types de graphique pour repr senter la forme des s quences individuelles Le premier type consiste repr senter pour chaque ge entre 15 et 45 ans la proportion d individus se trouvant dans chaque tat La figure fig 7 donne les repr sentations pour les groupes 2 et 4 Le deuxi me type de graphique repr sente quant lui chaque s quence individuelle Ainsi on lit sur l abscisse l ge de l individu et les s quences sont dessin es horizontalement L ordre dans lequel les s quences apparaissent est d finie par la distance qui les s pare d une s quence de r f rence choisie au hasard parmi toutes les s quences du groupe fig 8 Ce dernier type de graphique est r alis l aide du module pour le logiciel Stata d velopp par Brzinsky Fay et al 2006 Pail aucun v nement E d part mariage d part et mariage EH enfant E d part et enfant E d part mariage et enfant E divorce FIG 6 L gende des couleurs des figures 7 et 8 Groupe 2 Groupe 4 FIG 7 Groupes 2 et 4 proportions d tats 50 60 70 80 90 100 50 60 70 80 90 100 percent perc
4. 7 2 1 999 1 992 1 988 2 1 994 1 994 0 TAB 5 Co ts de substitution SALTT tats 0 1 2 3 4 5 6 7 0 0 0 881 19 253 1 785 14 913 17 045 20 769 18 679 1 0 881 0 1 702 0 774 1 519 1 185 1 3 2 15 2 19 253 1 702 0 1 25 0 8 1 313 1 34 1 351 3 1 785 0 774 1 25 0 1 083 0 988 0 855 1 189 4 14 913 1 519 0 8 1 083 0 0 901 1232 1 715 5 17 045 1 185 1 313 0 988 0 901 0 1 064 1 319 6 20 769 1 3 1 34 0 855 1 232 1 064 0 0 936 7 18 679 2 15 1 351 1 189 1 715 1 319 0 936 0 solution les seules situations o sont utilis es les insertions suppressions sont en cas de l ger d calage p ex 0 1 2 3 4 4 aligner avec 0 0 1 2 3 4 Dans le cas de la solution bas e sur la matrice des co ts optimaux le co t d insertion suppression a t fix selon les recomman dations de Gauthier et al 2007 c est dire gal la moyenne des co ts de substitution La figure 1 donne une vision graphique de la disparit entre les matrices de distances calcul es avec les diff rentes solutions de co t Le graphique de gauche confronte les distances calcul es avec les co ts de substitution fix s en fonction des taux de transition aux distances calcul es avec un co t de substitution fix 2 Il appara t tr s nettement que les r sultats fournis par ces deux solutions sont quasiment identiques fig 1 partie gauche La comparaison de la solution des taux de substitution avec la solution des co ts optimaux montre une plus grande disparit des
5. Visualisation et classification des parcours de vie Nicolas S M ller Sylvain Lespinats Gilbert Ritschard Matthias Studer Alexis Gabadinho D partement d conom trie Universit de Gen ve nicolas muller gilbert ritschard matthias studer metri unige ch INSERM Unit 722 et Universit Denis Diderot Paris 7 Facult de m decine site Xavier Bichat sylvain lespinats bichat inserm fr Laboratoire de d mographie Universit de Gen ve alexis gabadinho ses unige ch R sum Cet article propose une m thodologie pour la visualisation et la classi fication des parcours de vie Plus sp cifiquement nous consid rons les parcours de vie d individus suisses n s durant la premi re moiti du XX me si cle en uti lisant les donn es provenant de l enqu te biographique r trospective men e en 2002 par le Panel suisse de m nages Nous nous sommes concentr s sur ces v nements du parcours de vie le d part du foyer parental la naissance du premier enfant le premier mariage et le premier divorce A partir des donn es de base sur ces v nements nous discutons de leur transformation en s quences d tats Nous pr sentons ensuite notre m thodologie pour extraire de la connaissance des parcours de vie Cette m thodologie repose sur des distances calcul es par un algorithme d optimal matching Ces distances sont ensuite utilis es pour la classification des parcours de vie et leur visualisati
6. au moment de l enqu te afin de n avoir que des s quences compl tes entre 15 et 45 ans Ainsi notre chantillon est compos de 2601 individus n s entre 1909 et 1957 3 Optimal matching La m thode d analyse de s quences que nous utilisons dans ce travail est celle dite d opti mal matching L algorithme retenu est inspir des m thodes d alignement de s quences et de programmation dynamique utilis es en biologie mol culaire notamment pour la comparaison de prot ines ou de s quences d ADN suppos es homologues Deonier et al 2005 Needle man et Wunsch 1970 Ce type de m thode a t con u pour permettre la comparaison rapide de nombreuses s quences afin de trouver des correspondances parmi celles ci Les premiers algorithmes d optimal matching sont apparus au d but des ann es 70 et leur premi re utili sation dans les sciences sociales remonte l article d Abbott et Forrest sur leur application a des donn es historiques Abbott et Forrest 1986 On doit 4 Abbott de nombreux articles m thodologiques sur l utilisation de ces m thodes dans les sciences sociales et notamment en sociologie Abbott et Hrycak 1990 Abbott et Tsay 2000 L int r t de l application de cette m thode aux parcours de vie est de pouvoir ensuite proc der une classification non supervis e en utilisant les distances calcul es par optimal matching RNTI X 3 Visualisation et classification des parcours de vi
7. de vie ainsi que des m thodes de visualisation qui permettent aux experts d explorer les donn es de fa on intuitive Cette approche permet de prendre en compte les v nements constitutifs d un parcours de vie qu il soit professionnel de sant ou comme ici familial et respecte leur ordre leur dur e et par cons quent l influence que ces v nements peuvent avoir entre eux L assemblage des diff rents outils de visualisation donne l expert une connaissance des donn es qui serait autrement difficile acqu rir tant donn le nombre d v nements d an n es et d individus pris en compte Cette m thodologie met ainsi entre les mains des chercheurs qui poss dent des donn es longitudinales un puissant outil d analyse exploratoire R f rences Abbott A et J Forrest 1986 Optimal matching methods for historical sequences Journal of Interdisciplinary History 16 471 494 Abbott A et A Hrycak 1990 Measuring resemblance in sequence data An optimal match ing analaysis of musician s carrers American Journal of Sociolgy 96 1 144 185 Abbott A et A Tsay 2000 Sequence analysis and optimal matching methods in sociology Review and prospect Sociological Methods and Research 29 1 3 33 With discussion pp 34 76 Brzinsky Fay C U Kohler et M Luniak 2006 Sequence analysis with stata The Stata Journal 6 number 4 pp 435 460 Deonier R S TavarO et M Waterman 2005 Computat
8. distances et un effet d chelle d la plus grande variabilit des co ts optimaux fig 1 partie droite On peut en conclure qu avec ce jeu de donn es l utilisation des taux de transi tion plut t qu un co t fixe n a que peu d influence sur les distances En revanche la diff rence entre la solution des taux de transition et la solution des co ts optimaux est plus marqu e RNTI X 5 Visualisation et classification des parcours de vie distance co ts fixes distances co ts optimaux a EE 682 SNS 54 54 r 47 47 39 39 31 31 24 24 16 16 8 8 2 10 17 25 33 40 48 55 2 10 17 25 33 40 48 55 distance taux de transition distances taux de transition FIG 1 La partie gauche pr sente les distances obtenues par la m thode avec les co ts substitutions bas s sur les taux de transition selon les valeurs des distances obtenues avec des co ts de substitution fix s 2 le fait que les valeurs soient sur la diagonale indique que les distances obtenues par ces deux distances sont gales La partie droite pr sente ces m mes distances fond es sur les co ts de transition en fonction de celles calcul es avec les co ts optimaux Ces vues sont des graphiques en densit plus la quantit de points associ une unit de surface est grande plus l unit de surface est fonc e ainsi ces figures restent lisibles malgr la grande quantit de points pr sent s environ 2000
9. dividu et chaque colonne une variable tableau 1 TAB 1 Exemple de donn es sous la forme d v nements ind naissance d part mariage enfant divorce 1 1974 1992 1994 1996 ma Le passage une repr sentation sous forme de s quences d tats n est pas trivial La diffi cult consiste repr senter sous la forme d un unique tat une combinaison d v nements qui se sont d j produits ou non chaque ge De mani re plus formelle nous d finissons l tat qui d finit un individu un ge pr cis comme une information sur les v nements r alis s On peut dire partir d un tat quels v nements se sont d j produits La r alisation d un ou de plusieurs v nement durant une ann e t entra ne le passage de l tat dans lequel se trou vait l individu t 1 un nouvel tat La d finition des tats partir des v nements est un probl me propre au type de donn es et la probl matique de recherche Une mani re simple de proc der consisterait cr er un tat pour chaque combinaison d v nements Avec cette solution le nombre d tats s l verait 2 pour n v nements ce qui rend l interpr tation dif ficile d s lors qu on prend en consid ration beaucoup d v nements Nous avons donc choisi d agglom rer certaines combinaisons en accord avec les objectifs de recherche Dans le cadre de cette tude nous avons d cid de retenir quatr
10. e 3 1 M thode Nous reprenons ici la formulation de Rohwer et P tter 2002 Prenons Q l ensemble des op rations possibles et a w le r sultat de l application des op rations w Q sur la s quence a Nous consid rons trois types d op rations l insertion d un l ment la suppression d un l ment ou la substitution d un l ment par un autre Si l on attribue un co t c w qui correspond au co t d appliquer l op ration w Q la distance entre une s quence a et une s quence b peut tre formalis e de la mani re suivante d a b min clui wg b a w wg w Q k gt 0 avec clwi we yig clw Autrement dit pour chaque paire de s quences on cherche la combinaison d op rations pour rendre les s quences identiques dont la somme des co ts est la plus petite L algorithme utilis pour trouver cette distance minimale utilise une m thode de programmation dynamique qui est d crite dans Deonier et al 2005 L im pl mentation de l algorithme que nous avons utilis e est celle pr sente dans le logiciel TDA son fonctionnement est d taill dans son manuel d utilisation Rohwer et Potter 2002 3 2 D finition des co ts Comme nous l avons vu pr c demment un co t c peut tre attribu aux op rations w Q Les co ts de substitution auxquels nous nous sommes int ress s en particulier peuvent tre repr sent s sous la forme d une matrice sym t
11. e v nements constitutifs de la vie familiale le d part du foyer parental le premier mariage le premier divorce et la naissance du premier enfant Le tableau 2 pr sente le codage des tats que nous avons tabli par rapport aux quatre v nements retenus Le nombre d tats a t r duit de 16 8 notamment en supprimant des tats impossibles tous ceux qui contiennent un divorce sans un mariage pr alable ou en combinant deux tats par exemple l tat 2 concerne les individus mari s qui RNTI X 2 N S M ller et al ne sont pas partis du foyer parental qu ils aient eu des enfants ou non En se r f rant cette liste d tats et l exemple donn dans le tableau 1 le r sultat de la cr ation d une s quence de parcours de vie familiale se trouve dans le tableau 3 TAB 2 Liste des tats d part mariage enfant divorce 0 non non non non 1 oui non non non 2 non oui oui non non 3 oui oui non non 4 non non oui non 5 oui non oui non 6 oui oui oui non 7 oui non oui non oui non oui TAB 3 Exemple de donn es sous forme de s quence d tats individu 1974 1991 1992 1993 1994 1995 1996 1997 1998 f To n 0 D a lt 3 E Le 6 Les donn es utilis es dans ce travail proviennent de l enqu te biographique r trospective men e par le Panel suisse de m nages www swisspanel ch en 2002 Nous n avons gard que les individus g s d au moins 45 ans
12. ent 40 1 40 L 10 20 30 fi o 10 20 30 D un point de vue sociologique et d mographique les r sultats de l optimal matching per mettent d observer l volution dans le temps de certains ph nom nes d gageant ainsi des effets de cohorte Pourtant dans le cas de cette application il est difficile d observer des changements de comportements tant donn la date de naissance maximale des individus En effet ceux ci sont tous n s avant 1957 c est dire avant une p riode de modifications des comportements c est dire la fin des ann es soixante Les r sultats b n ficieraient donc d une r duction de la p riode de vie observ e afin d inclure des individus n s plus r cemment Les groupes sont mal gr tout distinguable de mani re graphique le groupe 4 figure 7 correspond aux individus qui partent du foyer parental mais ne se marient pas ou tard les premiers mariages interviennent partir de 36 ans alors que le groupe 2 contient des individus qui partent se marient et ont des enfant jeunes 25 ils sont plus de 50 en avoir RNTI X 10 N S M ller et al Groupe 2 Groupe 4 200 400 600 800 1000 FIG 8 Groupes 2 et 4 s quences individuelles 6 Conclusion La m thodologie que nous mettons en place permet une fouille efficace des donn es de parcours de vie Nous proposons une m thode performante pour quantifier les proximit s entre parcours
13. ficatifs 4 Multi Dimensional Scaling Avant de proc der une classification hi rarchique ascendante la matrice de distances apporte peu d information aux experts Ainsi pour leur permettre d appr hender les r sultats nous proposons de g n rer des cartes exprimant les relations de proximit entre les parcours des individus Une telle repr sentation intuitive des donn es peut tre obtenue par des m thodes de type Multi Dimensional Scaling De cette mani re on dispose d un outil qui permet de visualiser graphiquement les distances et d aider la d cision du nombre de groupes retenir dans une classification hi rarchique 4 1 DD HDS Nous constatons que nos donn es pr sentent de fortes relations non lin aires entre les in dividus Ces relations mettent en chec les m thodes de projection lin aire par exemple le Classical Multi Dimensional Scaling Torgerson 1952 Pour parer ce cas de figure de nombreuses m thodes de repr sentation de donn es non lin aires ont t propos es Leur but commun est d offrir une configuration de points sur un espace de faible dimension qui pr serve les distances entre les donn es avec un effort particulier pour la conservation des distances courtes Parmi elles nous avons choisi DD HDS Data Driven High Dimensional Scaling Lespinats et al 2007b pour sa capacit viter les faux voisinages donn es loign es dans l espace d origine mais
14. ional Genome Analysis an Intro duction Springer Gauthier J A E D Widmer P Bucher et C Notredame 2007 How much does it cost Optimization of costs in sequence analysis of social science data Manuscript University of Lausanne Under review RNTI X 11 Visualisation et classification des parcours de vie Lespinats S B Fertil P Villemain et J Herault 2007a Rankvisu mapping from the neighbourhood network submitted Lespinats S M Verleysen A Giron et B Fertil 2007b Dd hds a tool for visualization and exploration of highdimensional data IEEE transactions on Neural Networks Vol 18 5 pp 1264 1279 Needleman S B et C Wunsch 1970 General method applicable to the search for simi larities in the animo acid sequence of two proteins Journal of Molecular Biology 48 pp 443 453 Notredame C P Bucher J A Gauthier et E Widmer 2005 T COFFEE SALTT User guide and reference manual disponible sur http www tcoffee org saltt Rohwer G et U Potter 2002 TDA user s manual Software Ruhr Universit t Bochum Fakult t fiir Sozialwissenschaften Bochum Torgerson W 1952 Multidimensional scaling 1 theory and method Psychometrika vol 17 pp 401 419 Wu L 2000 Some comments on sequence analysis and optimal matching methods in sociology Review and prospect Sociological Methods and Research vol 29 1 pp 41 64 Summary This article proposes a methodology fo
15. on l aide de techniques de Multi Dimensional Scaling Cet article s int resse en particulier aux probl matiques entourant l application de ces m thodes aux donn es de parcours de vie 1 Introduction Nous proposons dans ce travail d tudier et de comparer diverses techniques de visua lisation et de classification de parcours de vie Plus sp cifiquement nous consid rons les parcours de vie familiale d individus suisses n s durant la premi re moiti du XX me si cle a partir de donn es r colt es par le Panel suisse de m nages Les parcours de vie familiale sont compos s d v nements constitutifs de la vie familiale comme le d part du foyer parental le premier enfant le premier mariage ou le premier divorce Il est possible partir de ces v nements de consid rer des parcours de vie individuels sous la forme de s quences d tats chaque v nement survenant dans la vie de l individu correspondant un changement d tat l Etude soutenue par le Fonds national suisse de la recherche FNS FN 100012 1 13998 et r alis e avec les don n es collect es dans le cadre du projet Vivre en Suisse 1999 2020 pilot par le Panel suisse de m nages et support par le FNS l Office f d ral de la statistique et l Universit de Neuch tel Visualisation et classification des parcours de vie Une m thodologie ad hoc destin e cr er une typologie des parcours de vie et visualise
16. r les comportements individuels et l volution des normes sociales les r gulant est pr sent e ici La m thode principale consiste calculer une distance entre chaque s quence l aide d un algo rithme d optimal matching on obtient ainsi une distance qui respecte le caract re temporel des s quences de parcours de vie Les r sultats sont ensuite visualis s l aide de m thodes de type Multi Dimensional Scaling Cet article est construit de la mani re suivante La premi re partie pr sente les donn es uti lis es ainsi que les transformations n cessaires pour construire des s quences d tats partir d v nements La deuxi me partie pr sente la m thode d optimal matching son fonctionne ment et la probl matique de la d finition du co t des op rations La troisi me partie concerne les m thodes de visualisation de type Multi Dimensional Scaling et leur principe de fonction nement La quatri me partie pr sente les r sultats de l application de notre m thodologie aux donn es du Panel suisse de m nages Les r sultats sont interpr t s l aide de graphiques et de mod les de r gression logistiques Nous concluons finalement sur les possibilit s que nous permettent d envisager l application de cette m thodologie aux donn es en sciences sociales 2 2 Donn es A partir des r ponses un questionnaire nous extrayons des donn es sous la forme d un tableau o chaque ligne est un in
17. r visualizing and classifying life courses More specifically we consider life courses of Swiss people who lived during the 20th century using data from a retrospective survey conducted in 2002 by the Swiss Household Panel We focus on the following important events of the familial life leaving parental home having a child getting married and divorcing We first discuss how the original time stamped event data are transformed into an equivalent state sequence form We present then our methodology for discovering useful knowledge from the observed life courses It relies on distances based on an optimal matching algorithm These distances are then used for clustering the life courses and visualizing them through Multi Dimensional Scaling techniques The paper pays special attention to specific issues in the application of these methods to life course data RNTI X 12
18. repr sent es comme proches et les d chirements donn es proches dans l espace d origine mais repr sent es comme loign es Dans le cas des parcours de vie nous sommes en mesure d affirmer qu une repr sentation en deux dimensions permet d exprimer convenablement l organisation des donn es En effet lorsqu elles sont projet es dans un espace tridimensionnel on peut observer que les donn es occupent une surface bidimensionnelle fig 2 Les relations non lin aires mat rialis es par le fait que cette surface ne ressemble pas du tout un plan sont ici manifestes FIG 2 Visualisation des donn es de parcours de vie dans un espace tridimensionnel angles choisis Chaque point correspond un individu RNTI X 7 Visualisation et classification des parcours de vie Nous constatons en effet qu une repr sentation sur un espace bidimensionnel permet de rapprocher les individus dont les parcours de vie sont proches Par exemple on peut observer que les individus divorc s se rassemblent sur la droite de la repr sentation fig 3 Notons que plus le divorce est pr coce plus l individu s carte vers la droite La m me analyse peut bien s r tre men e pour les 7 tats ce qui permet d appr hender facilement l organisation spatiale des individus donn es non pr sent es FIG 3 Repr sentation bidimensionnelle des parcours de vie Le code couleur permet de visualiser l
19. rique qui d finit une valeur pour chaque paire d tat L attribution de ces valeurs en se basant sur un mod le th orique est particuli rement difficile dans le cadre d une utilisation en sciences sociales ce qui fait l objet d un d bat Wu 2000 Il est en effet d licat de d cider du co t du passage d un tat un autre mais il est pour tant int ressant et parfois capital de pouvoir diff rencier ces co ts Pour cela deux m thodes disponibles ont t essay es sur notre jeu de donn es La premi re est impl ment e dans le logiciel TDA Rohwer et P tter 2002 et d finit le co t de chaque substitution en fonction des taux de transition observ s dans les donn es Le co t du passage d un tat i un tat j est donc calcul de la mani re suivante c Cji 2 P s_1 P jeli 1 Le co t de base est fix 2 et plus la probabilit P i j 1 de passer de l tat i l tat j et inversement est grande plus ce co t baisse Ainsi les substitutions correspondantes aux transitions obser v es fr quemment seront moins co teuse que celles qui n arrivent jamais Une autre m thode propos e dans le logiciel T COFFEE SALTT Notredame et al 2005 consiste calculer une matrice des co ts de substitution optimale par un processus it ratif Gauthier et al 2007 Les tableaux 4 et 5 contiennent les r sultats de l application de ces deux m thodes de d finition des co ts de substitution
20. s sur nos donn es Une analyse visuelle du tableau 4 permet d observer qu un passage de l tat 0 aucun v nement l tat 7 divorce ne s observe jamais dans nos donn es puisque son co t est de 2 dans les co ts tir s des taux de substitution en gras Cette transition correspondrait un individu qui dans l espace d une ann e se marie puis divorce Le passage de l tat 3 d part et mariage l tat 6 d part mariage et enfant est quant lui beaucoup plus fr quent et par cons quent moins co teux Le tableau 5 semble coh rent avec les co ts d finis m me si la comparaison est difficile en raison de la plus grande variabilit des valeurs Le co t des op rations d insertion et de suppression a quant lui t fix une valeur unique de 3 dans la solution bas e sur les taux de transition Ce choix a pour but de favori ser au maximum les op rations de substitution qui ont un coup maximum de 2 afin d viter les ph nom nes de distorsion du temps qu engendrent les op rations d insertion Avec cette RNTI X 4 N S M ller et al TAB 4 Co ts de substitution taux de transition tats 0 1 2 3 4 5 6 7 0 0 1 948 1 985 1 969 1 999 1 999 1 989 2 1 1 948 0 2 1 921 2 1 995 1 981 1 999 2 1 985 2 0 1 997 1 947 2 1 996 1 992 3 1 969 1 921 1 997 0 2 2 1 888 1 988 4 1 999 2 1 947 2 0 1 96 1 987 2 5 1 999 1 995 2 2 1 96 0 1 948 1 994 6 1 989 1 98 1 996 1 888 1 987 1 948 0 1 994
21. tre un point et son deuxi me plus proche voisin etc Lespinats et al 2007a Cette m thode renforce les groupes de donn es et permettra ainsi de valider notre clustering La repr sentation obtenue l aide de RankVisu est mise en relation avec le r sultat d une classification hi rarchique crit re de Ward Q Xo D Da FIG 5 Repr sentation bidimensionnelle m thode RankVisu de 100 individus repr sentatifs de la population choisis par tirage au sort Les cing groupes d appartenance sur la base de la classification hi rarchique sont exprim s par les signes Les voisinages entre individus sont mat rialis s par des segments qui relient chaque point a ces cing plus proches voisins Notons que ces deux m thodes se basent sur des informations relativement diff rentes la classification s appuie sur les distances tandis que RankVisu utilise les rangs de voisinage entre donn es La figure 5 pr sente la repr sentation obtenue par RankVisu en distinguant les groupes identifi s par la classification en cing classes Chaque classe forme sur le graphique un groupe bien d fini ce qui renforce le cr dit de notre classification fig 5 En effet les deux m thodes aboutissent des
Download Pdf Manuals
Related Search
Related Contents
Guide De Démarrage Rapide FRENIC MEGA Teach Yourself Android Application Development in 24 Radio CD MP3 WMA Milano MP28 Monte Carlo Mod: E65/CP4T (230/3) Quadral Quintas 6000 Tech Craft HBL52 User's Manual 取扱説明書 Copyright © All rights reserved.
Failed to retrieve file