Home

L`analyse des données

image

Contents

1. L Analyse des donn es mode d emploi 11 introduction INTRODUCTION A L ANALYSE DES DONNEES ET A LA REGRESSION La statistique est une branche des math matiques appliqu es consid r e en France par les math maticiens comme mineure Elle est marginalis e au plan de la recherche scientifique et souvent au plan de l enseignement au point que dans certaines facult s des sciences elle n est pas enseign e dans le cursus des tudiants en math matiques c est d ailleurs tr s regrettable quand on sait que certains des tudiants devront l enseigner ult rieurement en coll ge ou en lyc e Cette situation particuli re au sein de l Universit fran aise s explique par la nature m me de cette discipline dont les m thodes sont d velopp es par des math maticiens pour tre appliqu es par des utilisateurs qui n en sont pas En fait la statistique appliqu e est une approche du r el fond e sur la r p tition d exp riences et d observations cette d marche scientifique est utilis e dans de nombreuses sciences appliqu es ou humaines telles que la psychologie certains psychologues am ricains comme Spearman sont d ailleurs l origine de l analyse factorielle la sociologie la m decine On peut distinguer deux d marches diff rentes la premi re connue sous le nom de statistique descriptive se limite l analyse des donn es recueillies et la seconde la statistique inf rentielle value l
2. a part du hasard dans les observations effectu es pour en extraire autant que possible des propri t s g n rales Cet ouvrage s inscrit surtout dans la d marche de la statistique descriptive Il s inspire dans ses grandes lignes d enseignements effectu s dans des tablissements universitaires de niveaux et d orientations vari s DEUG Math Physique I U T Informatique Techniques de Commercialisation ma trise d Ing nierie Math matique coles de Commerce et de Gestion Il pr sente les m thodes principales de l analyse des donn es et la r gression lin aire multiple dont l importance s est fortement accrue depuis que les probl mes num riques pos s par ces m thodes ont pu tre r solus l aide d ordinateurs et de logiciels Le niveau math matique des tudiants auxquels il s adresse n est pas n cessairement lev son objectif initial est essentiellement de permettre au lecteur de choisir les m thodes adapt es au traitement statistique de leurs donn es de les mettre en oeuvre et d en interpr ter les r sultats correctement L ouvrage ne contient donc aucune d monstration au sens math matique du terme Mais le lecteur est suppos conna tre les l ments classiques de la statistique descriptive moyennes variances carts types histogrammes coefficients de corr lation lin aire Pour appliquer certaines m thodes des notions l mentaires sur les tests statistiques sont n cessaires mai
3. el le plus r pandu dans les entreprises est semble t il SAS qui donne facilement acc s aux bases de donn es Il existe des logiciels peu chers comme STAT ITCF dont l auteur a r dig jadis les programmes d analyse factorielle Le logiciel STATPC qui fonctionne sur les micro ordinateurs de type P C sous MS DOS est disponible en freeware aupr s de l auteur e mail foucart mathrs univ poitiers fr Tous les calculs figurant dans l ouvrage ont t r alis s avec STATPC Avec cet ouvrage et un logiciel d analyse de donn es les tudiants sont en mesure de comprendre les m thodes statistiques et de les appliquer correctement sur des donn es diverses Ils n ont plus qu travailler L auteur souhaite que cet ouvrage les aide dans leurs tudes et les accompagne dans leur pratique professionnelle Poitiers le 10 Juin 1997 Thierry Foucart Remerciements l auteur remercie Sylvie Trichard Jean Cougnard Farid Beninel et Patrick Plassars de leurs remarques pertinentes N B le logiciel STATPC et cet ouvrage sur disquette format WORD6 PC sont disponibles aupr s de l auteur e mail foucart mathrs univ poitiers fr
4. il rencontre dans son travail la statistique permettant de r pondre diff rentes sortes de questions pourquoi alors ne pas se les poser Enfin et c est l objectif principal de l auteur souvent inquiet de la fa on dont l analyse statistique est d vi e pour justifier des mesures prises a priori ou des pr jug s il d veloppera une r flexion critique sur les m thodes et une certaine m fiance vis vis des affirmations fond es sur des chiffres auxquelles il se trouvera confront Il comprendra alors que l valuation quantitative n cessaire pour synth tiser un ensemble d observations donne une image appauvrie de chaque unit statistique Les quatre niveaux de ce programme ambitieux sont tous accessibles des tudiants de formations diverses L exp rience de l auteur dans son enseignement comme dans sa pratique lui permet d affirmer que les math maticiens et les informaticiens ne sont pas a priori favoris s dans cette progression Beaucoup d entre eux en effet se contentent de r gler les difficult s d ordre math matique ou informatique alors que finalement ce sont les moins int ressantes dans le cadre que nous nous sommes fix ici Ils trouveront donc dans cet ouvrage comme les tudiants en psychologie en sociologie en gestion etc une d marche intellectuelle diff rente dans laquelle il n est pas indispensable de ma triser les math matiques ni l informatique pour atteindre les objectifs fi
5. s donn s et d finissons des r gles de d cision Le chapitre IV est consacr la r gression lin aire multiple Apr s avoir expliqu la d marche classique nous critiquons les r sultats d un exemple num rique et en d duisons des m thodes particuli res plus efficaces que la m thode classique Ce chapitre utilise les r sultats l mentaires de la statistique inf rentielle en particulier les tests de Student et de Fisher Snedecor On aborde dans le chapitre V l analyse factorielle des correspondances multiples dont l objectif est l tude simultan e des liaisons entre plusieurs variables qualitatives observ es sur un m me ensemble d individus Cette g n ralisation de l analyse des correspondances est facile mettre en oeuvre et tr s souvent utilis e dans les sciences humaines mais elle donne des r sultats parfois difficiles interpr ter Nous avons plac en chapitre VI l analyse factorielle d un tableau de dissimilarit s et une introduction la classification automatique L analyse d un tableau de dissimilarit s pr sente un int r t p dagogique vident puisqu elle introduit une notion fondamentale de l analyse des donn es les donn es analys es ne sont pas toujours obtenues par un tirage al atoire dans une population statistique et le mod le probabiliste n est gu re utilis En d autres termes les m thodes de description regroup es au sein de l analyse des donn es ne n ce
6. s rappel es dans l ouvrage L Analyse des donn es mode d emploi 12 introduction Les m thodes pr sent es sont les plus courantes analyse en composantes principales analyse des correspondances analyse discriminante r gression lin aire multiple analyse factorielle des correspondances multiples analyse factorielle d un tableau de distances L analyse en composantes principales chapitre I concerne des donn es quantitatives elle donne une description des unit s statistiques et des variables observ es fond e sur l tude des coefficients de corr lation lin aire Des exemples num riques d taill s expliquent comment appliquer les formules Les tableaux de donn es tablis partir de donn es qualitatives peuvent tre tudi s par l analyse des correspondances chapitre IT qui g n ralise en quelque sorte le test d ind pendance du 2 de Pearson sur les tableaux de contingence et d taille la liaison entre les deux variables observ es Nous la pr sentons comme une double analyse en composantes principales L analyse discriminante chapitre II utilise une part plus importante de la statistique inf rentielle Son objectif est de classer des unit s statistiques dans des groupes donn s a priori en fonction des valeurs qu elles prennent sur des variables quantitatives La d marche utilis e est habituelle nous recherchons des variables quantitatives permettant de distinguer le mieux possible les groupe
7. ssitent en g n ral aucune hypoth se th orique sur les distributions de probabilit des observations Cette analyse donne en outre un codage num rique des donn es souvent utilis pour classer les observations l aide d algorithmes il s agit de la classification automatique dont nous donnons un rapide aper u Les chapitres sont ainsi chacun consacr s une m thode statistique particuli re Pour faciliter l utilisation du manuel ils sont r dig s ind pendamment les uns des autres et on trouvera donc parfois des redites En g n ral l expos m thodologique est constitu de trois parties la premi re indique la finalit de la m thode et la nature des donn es tudi es la seconde donne les principes fondamentaux de la m thode la troisi me contient des compl ments dont l int r t consiste la plupart du temps faciliter l interpr tation des r sultats L Analyse des donn es mode d emploi 13 introduction Un exemple num rique est trait enti rement tout au long de ces trois parties et permet au lecteur d effectuer les calculs propos s l aide d une simple calculatrice Tous les r sultats num riques sont donn s pour qu il puisse v rifier ses r sultats Il est clair que cette d marche est limit e ces cas d cole et qu il n est pas question sauf exception d effectuer ce genre de calcul dans la pratique L expos m thodologique est suivi d une ou pl
8. usieurs tudes de cas montrant les propri t s de la m thode statistique Certaines tudes de cas sont corrig es pour les autres nous avons choisi de donner les r sultats num riques que le lecteur devrait lui m me tablir par ordinateur et de guider l tudiant par des questions pr cises Elles traitent de sujets divers et les donn es sont r elles ou simul es suivant le but recherch qui peut tre de montrer l efficacit de la m thode statistique ou ses dangers Le lecteur pourra apr s quelques applications r ussies et quelques checs in vitables d finir les probl mes qu il se pose d une fa on plus adapt e l analyse statistique Plus pr cis ment nous distinguons quatre niveaux d utilisation de la statistique appliqu e Dans un premier temps en effet les difficult s rencontr es par l utilisateur concerneront la fa on dont il peut analyser des donn es il devra choisir la m thode ad quate et en interpr ter les r sultats Apr s quelques exp riences au cours desquelles il s apercevra par exemple que le traitement statistique d une question permettant des r ponses multiples par exemple choisir un ou plusieurs items dans une liste n est ni facile ni efficace il r fl chira sur la r daction des questionnaires pour en permettre ou en faciliter l exploitation Une bonne connaissance des m thodes pourra aussi lui donner des id es sur la fa on d aborder les probl mes qu
9. x s La formation l analyse des donn es et la r gression ne se limite pas la lecture d un ouvrage sur ces m thodes La pratique est une source consid rable d apprentissage c est elle qui permet de prendre du recul vis vis des m thodes qui d veloppe l esprit critique Tout tudiant devrait L Analyse des donn es mode d emploi 14 introduction appliquer chacune de ces m thodes sur des donn es diverses et en tirer des conclusions la fois sur les donn es et sur la m thode Pour cela il est n cessaire d utiliser un logiciel ceux qui permettent d effectuer une analyse factorielle ou une r gression sont nombreux On aura plus de difficult s trouver un programme d analyse factorielle d un tableau de distances d analyse discriminante ou d analyse des correspondances dans les logiciels anglo saxons Il faut parfois faire attention aux r sultats num riques et aux graphiques qui ne sont pas toujours construits correctement Les logiciels ont des conceptions diff rentes certains utilisent des piles c est dire que l utilisateur d finit la suite des traitements qu il veut appliquer aux donn es SAS CHADOC D autres sont tr s puissants dans la r alisation des graphiques SPAD STATLAB ou ont un mode d utilisation tr s conversationnel PCSM STATGRAPHICS Le logiciel S est un langage de programmation comportant des commandes statistiques tr s puissantes Le logici

Download Pdf Manuals

image

Related Search

Related Contents

ADDENDUM  User Manual for SUN Grid Tie Inverter_Wind_no_waterprint  取扱説明書  A20-OLinuXino-MICRO  Orphee Mythic 22 Hematology Analyzer  Marie BONNOT - thalim umr cnrs  MANUAL DE INSTRUCCIONES BOMBA EC.indd  HSPICE Model Guide - Sam Annor Main Page  Leica DX10 Su robusto compañero para la obra  Altavoz Christie Vive Audio LA4S  

Copyright © All rights reserved.
Failed to retrieve file