Home
D… comme distogramme - ThéMA - Université de Franche
Contents
1. C Fusion Classe C Fusion Classe D placement Limite Classe D placement Limite Classe Colorisation Classe Colorisation Classe amp Distogrammes Crois s amp Distogrammes Crois s C Changement Valeurs Classes Changement Valeurs Classes C Affichage Valeur Nombre de licences popu olx 7 17 17 17 1 C Affichage Valeur Solde de sportifs pop populati Nombre de lice aces popu Ps im x Solde de sportifs populatio PiE F1 6 16 9 11 12 6 D comme Distorsion de valeurs Qui n a pas t confront dans le d pouillement d enqu tes ou l analyse de donn es statistiques des distributions anormales avec des pics sans organisation apparente Quelque soit la m thode de discr tisation l investigation reste d licate En d coupant par amplitudes de classes gales on observe des classes vides et des classes pleines En utilisant les quantiles l h t rog n it des valeurs fait que certaines classes fines peuvent atteindre des sommets en X les individus sont rares et leurs valeurs s talent ou en Y les individus sont nombreux et leurs valeurs sont proches Cela provient de la contrainte de lisibilit impos e par les histogrammes la surface des b tonnets est proportionnelle aux effectifs de la classe Dans le cadre d une analyse par Distogramme cette contrainte est respect e et rend difficile
2. Changement Valeurs Classes Affichage Valeur 4 D comme Discontinuit Au del des possibilit s offertes pour construire des distributions d di es le Distogramme propose plusieurs fonctionnalit s pour analyser les discontinuit s d une variable quantitative dans l espace g ographique fig 3 La premi re consiste modifier avec un curseur le nombre de classes de la distribution La m thode automatique de discr tisation propos e propose un d coupage soit par classes d amplitudes gales par quantiles soit par multiples d cart type centr sur la moyenne Le fait d augmenter de mani re continue le nombre de classes et d en constater les modifications sur la carte permet d une part d valuer l effet de la m thode de discr tisation sur la cartographie d autre part de diminuer de plus en plus la r solution dans l analyse Il peut tre opportun dans certains cas de se focaliser sur la limite entre deux classes et de la modifier de fa on manuelle on choisit sa nouvelle position ou graduelle avec un curseur on la prom ne avec un pas d fini Ce proc d est int ressant dans la mesure o 1l permet de brosser les individus en analysant leurs positions respectives sur la carte et dans la distribution L identification des discontinuit s ou des structures agr g es peut faire appel ces approches il suffit de rel cher la pression sur le curseur d s qu un nombre important d
3. individus parfois proches g ographiquement ou topologique ment changent de classe Alors une quantit d individus la position d une limite de classes sont peut tre discriminants fig 3 V rencontre de Th o Quant F vrier 2001 D comme distogramme 6 Fig 3 Le Distogramme un outil interactif de discretisation par modification du nombre de classes ou de leurs limites Ei XLISP STAT File Edit Distogramme Window MODES so LE Solde de sportifs popul Pie E3 Z Communes Grand Besancon ici D sactiver Mode Graphique 14 18 49 11 1 CHOISIF Modes Graphiques _ Classes Amplitude Egale S lecti Classes Quantiles Chang Amplitudes egales Ecart type Echelle Automatique Facteur Echelle C Fusion Classe Divisio amp D placement Limite Classe Colorisation Classe Distogrammes Crois s C Changement Valeurs Classes C Affichage Valeur Quantite 1 Valeur 1 414213562 Valeur 0 007442255 ETES 2 El sl ja gt 5 D comme Distributions crois es Lors d une m me analyse il est possible d associer plusieurs variables une m me carte La discr tisation d une variable peut galement d pendre de la relation statistique qu elle entretient avec d autres variables Le g ographe doit pouvoir en tenir compte dans son analyse C est pourquoi nous avons impl ment et modifi le croisement des distributions fig 4 tel qu il existe dans cert
4. la discr tisation L id al serait de disposer d individus mieux r partis sur l amplitude de la variable afin de pouvoir plus facilement les s lectionner et les trier graphiquement Il peut tre alors opportun de modifier la structure ou le contenu de la distribution Trois solutions ce probl me sont possibles On peut tout d abord modifier les axes X et ou Y Mais r aliser une simple homoth tie ne ferait que repousser le probl me changement d chelle sur 1 ou 2 axe s La seconde solution est celle retenue par les logiciels d analyse exploratoire se focaliser sur un sous ensemble d individus et tudier ceux ci ind pendamment des autres Ce choix ne permet pas une prise en compte globale de la population La troisi me solution consiste transformer les valeurs C est cette voie que nous proposons de suivre dans le Distogramme L id e est de rapprocher ou d taler certaines valeurs parmi lesquelles une limite de classe pourrait appara tre fig 5 L exp rience montre que rares sont les distributions empiriques qui peuvent tre facilement transformables cas par exemple des distributions hyperboliques Pour celles ci on peut appliquer une transformation globale des valeurs par le log par exemple Pour les autres nous proposons d appliquer une transformation locale par classe Nous d finissons ainsi une fonction de transformation pour tout x d une classe par exemple fig 5 V rencontre
5. spatiale et la statistique existent galement Livemap par Brunsdon 1998 ARPEGE LL Lav Stat par Josselin et al 1999 SpatialStat et SpaceStat 2 D comme Dynamique Le Distogramme lie en permanence une carte et une ou des distribution s statistique s de variable s descriptive s cartographier L expert peut le faire voluer en fonction de ses investigations On peut s lectionner des individus sur la carte et constater leur r partition dans les classes de l histogramme fig 1 L inverse est galement possible on choisit graphiquement une ou plusieurs classes dont les individus sont identifi s en m me temps sur la carte fig 2 Par ailleurs modifier la distribution fait basculer des individus d une classe dans une autre et d clenche la nouvelle cartographie Ce lien dynamique permanent est un l ment cl qui permet l expert de valider invalider imm diatement ses hypoth ses de discontinuit des points de vue statistique et spatial Nous pr sentons en exemple l tude des flux de sportifs dans les communes du p rim tre du Sch ma Directeur du Grand Besan on les deux variables tudi es sont le solde de sportifs nombre de licenci s ext rieurs tous sports confondus venant jouer dans la commune moins les habitants allant pratiquer un sport dans d autres communes le nombre de licenci s Analyses Robustes Pour l Exploration GEographique Lien dynamique entre Arc View e
6. D COMME DISTOGRAMME Didier JOSSELIN THEMA UPRESA 6049 du CNRS Universit de Franche Comt Email didier josselin univ fcomte fr RESUME Le Distogramme est un outil d di l analyse des discontinuit s statistiques et spatiales gr ce au lien dynamique entre une repr sentation cartographique et des histogrammes de variables descriptives Il permet de modifier interactivement le nombre ou les limites de classes de discr tiser transformer et croiser les variables ABSTRACT The Distogram is an exploratory tool provided to analyse statistical and geographical discontinuities by a dynamic link between a map and histograms related to different variables It provides to modify interactively the classes number and limites to trim transform and cross the available variables MOTS CLEFS Analyse exploratoire des donn es g ographiques discr tisation discontinuit s lien dynamique KEYS WORDS Exploratory Spatial Data Analysis discretization discontinuities dynamic link V rencontre de Th o Quant F vrier 2001 D comme distogramme 2 Le monde qui nous entoure n est pas une juxtaposition al atoire d objets g ographiques sans interaction Il ne forme pas un ensemble homog ne isomorphe Qu il s agisse d agglom rations urbaines de r partitions d assolements agricoles l espace g ographique est d coup organis par un ensemble de processus de diff renciation socio spatiale S attacher d te
7. ILLS G 1991 Dynamics graphics for exploring spatial data with application to locating global and local anomalies in The American Statistician August 1991 vol 45 N 3 pp 235 242 JOSSELIN D CHATONNAY P GUERRE L DANCUO B 1999 Lien dynamique entre ArcView et Xlisp Stat LAVSTAT un environnement interactif d analyse spatiale Actes de la Conf rence Fran aise des Utilisateurs ESRI 29 30 septembre 1999 C d rom JOSSELIN 1999 A la recherche d objets g ographiques composites N sp cial Data Mining Spatial Revue Internationale de G omatique pp 489 505 Vol 9 4 TIERNEY L 1990 Lisp Stat an object oriented environment for statistical computing and dynamic graphics John Wiley and Sons NewYork 350 p TUKEY JW 1977 Exploratory data Analysis Addison Wesley WANIEZ P 1991 Analyse exploratoire des donn es GIP Reclus Reclus Mode d Emploi n 17 Montpellier WANIEZ P 1999 La cartographie des donn es conomiques et sociales sur Macintosh et PowerMacintosh avec Philcarto et Philexplo L Harmattan Paris Exploratory Spatial Data Analysis V rencontre de Th o Quant F vrier 2001
8. ains logiciels d analyse exploratoire comme Datadesk ou XlispStat Derri re cette fonctionnalit se cache tout simplement la notion de contingence En effet visualiser la r partition des individus par classe d une variable A au sein d une distribution d une variable B revient r aliser un tableau de contingence et comparer les effectifs r els des effectifs th oriques Si l on constate une quir partition des classes de A dans B les deux variables sont ind pendantes statistiquement Des individus d une classe de A qui occupent la majeure partie d une classe de B marquent une d pendance statistique positive mais n gative si elle couvre une surface plus petite qu attendu hypoth se d ind pendance statistique Un choix manuel des couleurs RVB offre la possibilit l utilisateur de personnaliser son analyse par l emploi des couleurs fig 1 V rencontre de Th o Quant F vrier 2001 D comme distogramme 7 Fig 4 Distributions crois es dans le Distogramme 4 XLISP STAT Ziofx File Edit Distogramme Window K3 XLISP STAT O1 x File Edit Distogramme Window x Ei Communes Grand Besancon E x 4 MODES GRAPHIQUE CHOISIR UN MODE GRAPHIQUE MODES GRAPHIQUES F1 H Communes Grand Be CHOISIR UN MODE GRAPHIQUE S lection Classes S lection Classes C Changement Limite Classes C Changement Limite Classes Division Classe C Division Classe
9. ations de valeurs par classe On aboutit en d finitive une nouvelle distribution plus facilement exploitable graphiquement mais qui ne peut r ellement constituer un document statistique de synth se diffusable en l tat fig 5 Il convient donc de garder la distribution initiale comme r f rence et gr ce la fonctionnalit de croisement dynamique de v rifier en permanence o se trouvent les individus dans les deux distributions Le r le de la nouvelle distribution n est que de faciliter l analyse exploratoire des discontinuit s spatiales elle permet une investigation plus pr cise dans les classes de fortes densit s tout en conservant l ensemble des individus observ s Fig 5 Transformation locale de variable dans le Distogramme AXLISP STAT File Edit Cistogramme window 14 13 14 13 14 14 sh e un gt TO Ha s a B Hb licences pop 1990 facteur Classe 4 x210340 Mim Ea 14 1 14 l3 14 14 un a 3 Joto oa 2 g en LISP defun fontion x 37 1 x 10 V rencontre de Th o Quant F vrier 2001 D comme distogramme 9 7 Conclusion Actuellement l analyse exploratoire des donn es spatiales ESDA FOTHERINGHAM et al 2000 est un domaine de recherche qui se d veloppe fortement Elle d coule directement de EDA Exploratory Data Analysis TUKEY 1977 HOAGLIN et al 1983 qui ne concernait au d part que la statistique Elle met en avant entre autres la d
10. bution statistique reste un outil puissant de simplification de l information m me si elle est parfois discut e En effet elle est moins robuste que d autres repr sentations tel que le Dotplot 1 point 1 individu empil s quand ils sont proches puisqu elle ne fournit pas une repr sentation exhaustive des individus mais les regroupe au sein des classes FLOCH et al 1998 Le choix de l histogramme r side dans sa capacit intrins que la discr tisation de variables et la recherche de discontinuit s Fig il peut tre utilis d au moins trois fa ons _ synth tiquement en calculant des indicateurs centraux telle que la m diane globalement en analysant et en d crivant sa forme nombre de modes et leurs valeurs calcul des coefficients d aplatissement et d asym trie etc V rencontre de Th o Quant F vrier 2001 D comme distogramme 3 localement en observant la position des individus dans la distribution fr quences par classe positions relatives et r partitions des individus dans les classes Toutefois dans un processus d analyse spatiale 1l est l gitime de se poser quelques questions quant l utilisation s par e de ces deux outils La cartographie met elle bien en vidence les traits du ph nom ne que je cherche analyser La variable quantitative est elle correctement discr tis e pour r v ler une r partition statistique ou spatiale particuli re de mes indivi
11. cter les franges de processus d volution les zones de discontinuit l existence d agr gats ou d auto corr lation spatiale constitue l une des t ches du g ographe Ce sont ces raisons qui ont motiv initialement le d veloppement du Distogramme Fondamentalement le Distogramme ne fait que reprendre un ensemble d outils et de concepts couramment utilis s en g ographie Il repose sur des m thodes de discr tisation prouv es CAUVIN REYMOND SERRADJ 1987 et d animations cartographiques Sa particularit est qu il les regroupe en un ensemble coh rent et les met au service de l expert dans un processus interactif Il ne s agit aucunement d un outil de cartographie au sens strict mais plut t d un outil d analyse exploratoire pour visualiser et identifier inter activement tous les individus afin de les associer ou les regrouper Pratiquement le Distogramme est 1ssu du besoin d une meilleure interactivit entre l histogramme d une variable et la repr sentation cartographique des individus d crits de la difficult de discr tiser correctement certaines variables m me transform es de la n cessit de prendre en compte la dimension spatiale dans la construction d un histogramme optimal de l insuffisance des m thodes de discr tisation automatique fournies par les logiciels de cartographie ou les SIG L objectif du Distogramme est d Analyser dynamiquement les di
12. de Th o Quant F vrier 2001 D comme distogramme 8 division par 10 et ajout de 37 aux valeurs de la classe 4 Cette fonction correspond en fait une r expression locale Les fonctions peuvent tre diff rentes dans les classes si l on y observe des comportements sp cifiques En pratique cette m thode pose de s rieux probl mes de coh rence de l information comment comparer les individus transform s avec les autres Plusieurs contraintes doivent tre respect es l ordre des valeurs doit rester le m me des fins de discr tisation ult rieures les valeurs maximales et minimales transform es ne doivent pas exc der les valeurs initiales afin de rester dans la bonne classe dans le cas inverse nous assisterions un m lange inextricable de valeurs brutes et recalcul es utilisateur doit bien garder l esprit quelles classes ont t transform es et de quelle fa on il doit bien rep rer quelles sont les limites des classes avant et apr s transformation lors de la recherche de discontinuit s il doit assumer qu un d placement l mentaire de limite de classe n a pas toujours la m me signification selon la classe consid r e notamment pour une limite qui s pare la classe transform e d une autre Cette m thode requiert donc une attention particuli re cause de la non lin arit de l abscisse de la variable tudi e et des effets potentiels des transform
13. dus Quelle peut tre l influence d une modification de classe Les discontinuit s spatiales dont je soup onne l existence apparaissent elles Ces questions font r f rence deux concepts sur lesquels repose le Distogramme D une part analyser s par ment la carte et l histogramme reste un moyen limit pour appr hender l espace dans sa continuit et sa diversit Faire interagir ces deux outils compl mentaires dans un processus exploratoire donne une dimension nouvelle l analyse Apr s les distibutions statistiques et spatiales le lien dynamique est le troisi me mot cl HASLETT et al 1991 D autre part il semble n cessaire de pouvoir modifier empiriquement la structure des classes dans l histogramme et ce de la mani re la plus conviviale et la plus rapide possible Cela constitue une quatri me fa on d utiliser l histogramme dynamiquement en simulant l impact de modification de discr tisation d une variable sur une cartographie Tout ou partie de ces deux concepts est d j mis en uvre dans certains Syst mes d Information G ographique MacMap ou G oconcept par son module Th matique certains logiciels de cartographie automatique Cartes amp Donn es par exemple ou dans les logiciels du domaine de l analyse exploratoire des donn es XlispStat par Tierney 1990 Datadesk Waniez 1991 et Philexplo Waniez 1999 Certains d veloppements la confluence entre l analyse
14. ive fig 2 Parfois les discr tisations automatiques propos es classes d amplitude gale r partition en quantiles par exemple ne rendent pas bien compte des groupes d individus Si une classe englobe deux sous groupes il peut tre opportun de la diviser A l oppos deux classes poss dant peu d effectifs ou consid r es par l expert comme proches s mantiquement peuvent tre regroup es Il peut tre utile de r aliser des discr tisations de variables fa on en int grant trois crit res compl mentaires le crit re de construction r gle de d coupage et nombre de classes pr alable le crit re statistique bonne r partition et homog n it des individus dans les classes le crit re s mantique valuation de d coupages par l expert prise en compte des r partitions spatiales sur la carte associ e Le troisi me crit re permet l expert de peaufiner sa recherche de d coupages d agr gats de gradients ou de discontinuit s dans l espace g ographique V rencontre de Th o Quant F vrier 2001 D comme distogramme 5 Fig 2 Le Distogramme selection graphique des individus de trois classes d une distribution et analyse de leur r partition spatiale Ei XLISP STAT 5 CHOISIR UN MODE GRAPHIQUE T Changement Limite Classes Division Classe Fusion Classe C D placement Limite Classe Colorisation Classe C Distogrammes Crois s
15. marche empirique et qualitative la robustesse des outils statistiques employ s l importance de la prise en compte des individus autant que de la tendance Le distogramme fait partie de ce courant qui semble adapt l analyse de donn es multisources multiscalaires et incertaines comme le sont souvent les informations g ographiques Dans ce contexte 1l am liore la robustesse de l histogramme par des fonctionnalit s vari es de discr tisation de variables et facilite la recherche de discontinuit s spatiales gr ce au lien dynamique entre les diverses repr sentations statistiques et cartographiques BIBLIOGRAPHIE BRUNET R 1987 La carte mode d emploi Fayard Reclus 269 p BRUNSDON C 1998 Exploratory spatial data analysis and local indicators of spatial association with XlispStat The Statistician n 47 Part 3 pp 471 484 CAUVIN C REYMOND H SERRADJ A 1987 Discr tisation et repr sentation cartographique Collection Reclus Mode d Emploi 116 p annexes FLOCH JM GRUN REHOMME M LADIRAY D 1998 Exploratory Data Analysis Cours de 3 ann e d ENSAE 150 p FOTHERINGHAM A S BRUNSDON C CHARLTON M 2000 Quantitative Geography Perspectives on Spatial Data Analysis SAGE Publications London 270 p HAOGLIN D MOSTELLER F TUKEY J W 1983 Understanding robust and exploratory data analysis Wiley Series in probability and mathematical statistics 447p HASLETT J BRADLEY R CRAIG P UNWIN A W
16. stributions spatiales et statistiques pour permettre une meilleure appr hension des objets g ographiques et des relations qu ils entretiennent fonctionnelles structurelles statistiques spatiales topologiques 1 D comme Double Le Distogramme d velopp dans l environnement statistique d Xlisp Stat TIERNEY 1990 associe deux outils compl mentaires Le premier outil est a carte Nul n est besoin ici de rappeler en d tails ses vertus BRUNET 1987 la seule fonctionnalit de cartographie d un ph nom ne ou de r sidus constituant d j un pas important dans l analyse spatiale Au sein du Distogramme elle est r duite sa plus simple expression puisque la plupart des r gles de s miologie ne sont pas int gr es L information y est g ocod e et des couleurs permettent d identifier les individus regroup s en classes Trois niveaux de complexit peuvent alors tre appr hend s les localisations spatiales absolues des entit s g ographiques les localisations relatives entre ces entit s distances dont topologiques dispersions spatiales etc les structures et les formes spatiales qui en d coulent agr gats objets g ographiques composites etc JOSSELIN 1999 Le second outil est l histogramme Qui n a pas appr hend un probl me en r alisant en premi re tape d une analyse statistique une belle distribution d une variable nominale ordinale ou cardinale La distri
17. t XlispStat V rencontre de Th o Quant F vrier 2001 D comme distogramme 4 Fig l Le Distogramme s lection de communes sur la carte centro des en noir et visualisation de leurs distributions dans les deux histogrammes surfaces noires et dans la liste des communes E4 XLISP STAT File Edit Distogramme Window MODES GRAPHIQUES CHOISIR UN MODE GRAPHIQUE MAMIROLLE FONTAIN CHEMAUDIN S lection Classes C Changement Limite Classes Division Classe SERRE LES SAPINS C Fusion Classe MAZEROLLES LE SALIN MONTFAUCON D placement Limite Classe 2 CHAMPAGNEY Colorisation Classe ALES CHAMP YANS LES MOULINS GENNES CH LEZEULE PIREY CH LEZE Distogrammes Crois s C Changement Valeurs Classes amp Affichage Valeur POUILLEY LES VIGNES p Solde de sportifs population 1990 Mle Ea 14 6 9 11 0 13131512182252926 Le lien dynamique entre diverses repr sentations et aspects d un m me objet d tude est donc un l ment fondamental qui permettra de mettre en phase le processus d apprentissage et d investigation de l expert avec le processus informatique Nous pensons que sa pr sence bonifie les analyses dans leur ensemble gr ce une approche de type syst mique 3 D comme Discr tisation Un certain nombre de fonctionnalit s du Distogramme concernent directement la discr tisation de variable quantitat
Download Pdf Manuals
Related Search
Related Contents
AVerMedia Technologies Cardbus MCE MPEG 2 User's Manual Open Dynamics Engine, v0.5 User Guide TE0630 Spartan-6 FPGA Industrial Micromodule KOHLER K-942-4-CP Installation Guide Hamilton Beach Cookie Press and Cake & Food Decorator User's Manual Renesas Starter Kit for RX63T User`s Manual Valueline VLCB37000B30 Copyright © All rights reserved.
Failed to retrieve file