Home

Etat des lieux sur "le test"

image

Contents

1. Harding Paris Centre de psychologie Appliqu e 159 67 180 p 1994 Gatignol P Evaluations et bilans le point de vue de l orthophoniste Int r t d une valuation sp cifique en vue d une r ducation cibl e Les Actes des 5es Journ es scientifiques de l Ecole d Orthophonie de Lyon 25 29 2004b Gatignol P Duffau H Plaza M nfluence de la variable temporelle sur les performances d acc s au lexique Huteau M Lautrey J Les tests d intelligence Paris La D couverte Rep res 229 123 p 1997 Huteau M Lautrey J Evaluer l intelligence Psychom trie cognitive Paris PUF 310 p 1999 Kim J 0 Mueller C W Introduction to factor analysis what it is and how to do it Beverly Hills CA Sage Publications 79 p 1978 Le Gall A Allain P Applications des techniques de r alit virtuelle la neuropsychologie clinique Champ psychosomatique L Esprit du temps 2001 2202 25 38 170 p 2001 L t B La chronom trie mentale appliqu e l valuation diagnostic de la lecture Les actes de 3e journ e scientifique de l cole d orthophonie de Lyon Bilans et valuation en orthophonie UCLB pp 81 83 2004 F vrier 2010 Metz Lutz M N Les tests dans le bilan d aphasie int r t diagnostique th rapeutique et heuristique Bulletin Audiophonologie Ann Sc Universit de Franche Comt 4 3 287 300 1988 Oudry M Gatignol P Robert A M P
2. la faveur du d veloppement de la micro informatique dans les ann es 70 Avec l informatisation l interaction sujet administrateur de test peut totalement dispara tre puisque la pr sence d un applicateur semble devenir superflue Pour Huteau et Lautrey 1999 la stan dardisation dans ces modes d observation est parfaite tous les biais li s la variabilit des observateurs ayant t cart s Il convient alors de s interroger sur la nature des observations r alis es et d ventuels biais syst matiques Hannes Eichinger Fotolia Par exemple dans quelle mesure les diff renciations interindividuelles tablies d pendent elles du mode d observation retenu A condition de prendre un certain nombre de pr cautions il semble que l effet du mode de questionnement soit faible Limites de l observation standardis e Si l observation standardis e offre l avantage de r duire consid rablement les biais dus l observateur elle constitue aussi une limite ce qui est observable toute nouveaut n entrant pas dans le cadre pr tabli est inutilisable Ainsi les m thodes standardis es sont elles plus adapt es aux domaines bien d frich s qu aux explorations de conduites peu connues La r serve commun ment formul es l encontre des m thodes standardis es repose sur leur suppos e incapacit tenir compte du contexte et appr hender une r alit sous jacente une conduite manifest
3. s que le probl me est pos l inverse on dispose ici de la moyenne obtenue et les inconnues sont constitu es par les scores dans les variables sources et les coefficients de pond ration Les raisonnements math matiques impliqu s dans ces calculs d passent le cadre de notre propos et se trouvent d taill s dans diff rentes publications de langue fran aise Bacher et Reuchlin 1989 Cibois 1983 Reuchlin 1964 1970 ou de langue anglaise Kim et Mueller 1978 Qualit s m trologiques des tests Les fid lit s Tout test doit tre fid le dans les deux sens du terme c est dire pr senter une bonne stabilit temporelle et une bonne consistance interne Le coefficient consistance interne est une mesure de la fid lit IL se calcule en utilisant l alpha de Cronbach bas sur le rapport entre la part de variance de chaque item et la variance de l ensemble des scores de l chelle Pour Beech et Harding 1994 le coefficient de consistance interne du test d une valeur minimale de 0 70 devrait tre obtenu partir d un chantillon de 100 sujets au moins La corr lation des notes obtenues au m me test administr deux reprises repr sente la fid lit test retest Id alement gale 1 00 cette fid lit est jug e satisfaisante partir de 0 70 Pour les auteurs pour tre pris en compte ce coefficient devrait toujours tre calcul sur les performances d un chantillon de 100 in
4. ORIQUE La validit th orique ou validit hypoth tico d ductive ou validit de construction fait r f rence aux tests construits pour mesurer des traits hypoth tiques L intelligence n a pas d existence physique non plus que l aptitude spatiale pourtant des tests ont t construits pour tenter d valuer ces qualit s Ceci fait dire Walton et Bartram 1994 que la validit de construit renvoie ce que nous savons et ce que nous comprenons de la signification du score fourni par un test Cette connaissance peut s laborer de mani re inductive ou d ductive Cependant quelle que soit la m thode par laquelle elle a t acquise elle doit permettre de pr dire des comportements des sujets en situation r elle Pour les auteurs validit d un test ne se r sume pas sa propension effectivement mesurer ce qu il est cens mesurer Les auteurs pr f rent adopter une autre d finition de la validit la validit renvoie la pertinence et la possibilit de justifier les affirmations que l on peut faire partir des scores un test elle concerne galement les l ments dont on dispose pour justifier les inf rences que l on peut faire partir des scores un test L Orthophoniste N 296 24 Informatisation des tests quelle est La pertinence et quelles sont les limites des outils d valuation informatis s Rappelons qu un test est un ensemble d items
5. bas autour de 30 L informatisation des tests s est d velopp e la faveur de l essor de la micro informatique dans les ann es 1970 Comme le note Bonin 2003 identification de facteurs qui contribuent aux variations des latences d initialisation est importante car elle autorise ensuite la d termination au sein d une architecture fonctionnelle du ou des locus i d impact de cette variable et le ou les m canismes qui en sous tend ent l effet F vrier 2010 L informatisation des tests de ma triser la variable traitement d une t che diff rentes preuves ont t labor es et valid es pour tenter d valuer ce param tre Les valuations assist es par ordinateur permettent d tudier l volution parall le de la pr cision de la r ponse et des temps de r ponse French 1994 Le Gall et Allain 2001 Le clinicien peut alors observer d ventuelles dissociations entre une performance rapide accompagn e d un grand nombre d erreurs ou une performance correcte mais lente Ces ventuelles dissociations pourront tre analys es la lumi re des temps de r action recueillis de mani re objective par l informatisation La vitesse de traitement est un indice de degr d automatisation c est dire du co t cognitif de l activit Plus le processus est rapide automatis plus il est inconscient Le sujet n a pas conscience qu il effectue une s rie d op rations mentales qu il ne contr
6. de mesurer les comp tences d un sujet par rapport sa classe d ge de niveau interindividuelles e de voir o se situent les diff rences intra individuelles zones de contraintes Lorsque le profil est h t rog ne E 4 k S 3 poors bampr posh Bemp dors Feah poaae pocne lempi piore lempi Eli i Say ln EL ects legatomar f cernion lacicals L cure largi veal Elton Ehordmique iaiia wipuelha CITE maat kogt Te T J Ici nouveau les notes repr sent es correspondent des notes pond r es Prenons ce patient g de 19 ans il se situe au moins 2 cart type de la moyenne repr sent e par le M pour l preuve de dict e de mots r guliers 6e histogramme en rose sur le graphe Pour calculer l cart type r el il suffit de se reporter g n ralement la fin du manuel du test ou dans la rubrique consignes s il s agit d un logiciel pour reprendre le tableau r capitulatif de normes cf a ci dessus Pour ce cas pr sent la moyenne l preuve de dict e de mots r guliers est de 17 8 et l cart type de 1 47 soit 14 note brute obtenue 17 8 moyenne des sujets l preuve par a 1 47 2 58 Ce patient se situe bien 2 carts type de la moyenne 25 F vrier 2010 Lactar merir rhgulian F large mol regulen Bons lempi p ie lampi iahh hampi Boogie tempr fohi tampf Laotuss Les graphes Lire un graphe c est avant tout s assurer des valeurs note
7. donnant chacun lieu un score et que l ensemble de ces scores est additionn pour obtenir un score d chelle Pour Huteau et Lautrey 1999 cette pratique est doublement justifi e car elle fournit une bonne diff renciation des individus et permet de neutraliser certaines erreurs de mesure Cependant il est n cessaire de s interroger sur la pertinence de l op ration consistant additionner des scores partiels La question est de savoir si tous les items contribuent bien mesurer la m me dimension ou encore s ils constituent bien un ensemble homog ne Cette m thode part d une d finition conceptuelle de la dimension valuer puis s lectionne un ensemble d items de difficult gradu e impliquant cette dimension Ces items sont ensuite soumis un ou plusieurs groupes de sujets afin de ne conserver que ceux qui permettent une bonne diff renciation des individus et constituent un ensemble homog ne Chaque item est caract ris par un indice de difficult qui n est autre que la fr quence de r ussite cet item d terminant son pouvoir de diff renciation des individus Un item a un pouvoir de diff renciation maximum lorsque sa fr quence de r ussite est de 50 il est nul lorsque cette fr quence s approche de 0 personne ne r ussit ou de 100 tout le monde r ussit En cons quence le seuil d limination des items en fonction de leur indice de corr lation item test est g n ralement assez
8. erreur est grande plus la fid lit est faible Cependant cette estimation d pend de l unit de mesure choisie et n a pas la m me signification selon que la dispersion interindividuelle des notes observ es est forte ou faible C est pourquoi l on d finit g n ralement la fid lit par le coefficient de fid lit r variance des notes vraies variances des notes observ es coefficient de g n ralisabilit De la m me fa on que nous avions et puisque la mesure vraie et l erreur sont ind pendantes e mesure observ e mesure vraie erreur al atoire nous avons galement e variance des notes observ es variance des notes vraies variance d erreur Donc nous avons evariance des notes vraies variances des notes observ es variance d erreur En l absence d erreur r 1 Plus la part d erreur augmente dans la mesure observ e plus r diminue On sait que l une des difficult s de l observation en psychologie est qu elle modifie le sujet observ ce qui nous emp che de proc der des estimations directes de la variance d erreur pour chaque sujet car cela supposerait de nombreuses r p titions de la mesure sur le m me sujet Pour pallier cet inconv nient on s en tient g n ralement une r p tition de la mesure la variance d erreur intra Etat des lieux sur le test Qu appelle t on un test Qu est ce qu valuer Du test au testeur Comment franchir Le pas individuelle ta
9. priori et repr sentent la relation entre la probabilit pour un sujet de r ussir un item et non plus la fr quence de r ussite F vrier 2010 dans un groupe et sa position sur une variable latente et non plus son score sur une variable observable Analyse factorielle A la diff rence des m thodes pr c dentes il s agit d une m thode d analyse multidimensionnelle Elle s appuie sur deux postulats elorsque plusieurs variables sont en corr lation elles sont sous la d pendance d un ou plusieurs facteurs communs de variation Ces facteurs sont donc des abstractions math matiques qui ont le statut de variables latentes e les scores dans les variables observ es sont des combinaisons lin aires des scores dans les variables sources Afin d en approcher le principe Huteau et Lautrey 1999 proposent une analogie imaginons un examen comportant 4 mati res chacune des mati res ayant des coefficients diff rents selon la section envisag e par le candidat A notes identiques un candidat n aura donc pas la m me moyenne suivant la section pr sent e La moyenne d un sujet est donc une variable issue de la combinaison lin aire de plusieurs variables sources les notes chaque preuve dont le poids dans la combinaison est fonction des coefficients qui leurs sont affect s L analyse factorielle consiste en la r solution d quations quivalentes celle ci ceci Dominique Luzy Fotolia pr
10. 3 Walton R Bartram M PET Preliminary English Test Teacher s resource book Walton on Thames Nelson 158 p 1994
11. Dossier Etat des lieux sur le test Qu appelle t on un test Qu est ce qu valuer Du test au testeur Comment franchir le pas Simon Marin Curtoud Thierry Rousseau Peggy Gatignol Onidii Fotolia concept d valuation incite g n ralement voquer la figure d Alfred Binet r ateur du premier test psychologique l chelle m trique de l intelligence net et Simon 1905 dont le propos tait d identifier Les enfants pouvant tirer d un enseignement sp cialis Cette vocation trouve galement sa justification dans le fait que l valuation d Alfred Binet s inscrivait dans le cadre des valuations diagnostiques vis e de rem diations En effet il est d usage de distinguer les valuations en fonction de leurs objectifs l valuation sommative visant faire un bilan des connaissances l valuation certificative amenant la production d un dipl me l valuation formative permettant de situer l apprenant dans un parcours d apprentissage voisine de l valuation diagnostique les objectifs de cette derni re tant de d tecter Les causes d un d ficit en vue d y rem dier Vrignaud 2004 1 Orthophoniste 49 rue de Rivoli 75001 Paris 2 Orthophoniste Dr en psychologie 11 avenue Jo l Le Theule 72303 Sabl Sarthe 3 Orthophoniste Dr en neurosciences p le t te et cou h pital Piti Salp tri re 75013 Paris D finition D finir le concept de test n est pa
12. asses un intervalle unit permettant de d finir de nouveaux intervalles concat nation Les nombres acqui rent alors de nouvelles propri t s L unit tant conventionnelle et l origine arbitraire toutes les transformations num riques de la forme y ax b sont permises Il est donc possible ce niveau de calculer une moyenne une variance ou un cart type e Les chelles de rapports utilis es si l on peut non seulement d finir des intervalles entre les classes mais aussi une origine ou montrer que le rapport num rique entre deux classes est gal au rapport num rique entre 2 autres classes Etalonnages Pierre Pichot 1997 nous rappelle que le test est un instrument de mesure constitu d l ments ou items dont l ensemble constitue une chelle La cotation vise transformer la r ponse un item en une valeur num rique suivant des r gles pr tablies La somme des notes obtenues aux items constituant l chelle est la note brute l chelle Or cette note brute n acquiert une signification et ne devient mesure que lorsqu elle est rapport e un talon Les talonnages sont donc des syst mes de cat gories ordonn es dans lesquelles il est possible de ventiler tous les sujets d un groupe de r f rence Il existe alors deux grandes cat gories d talonnages eles quantilages de m mes effectifs eles chelles normalis es partition selon certaines r gles d une distrib
13. d objectifs et l on peut en d gager trois principales LA VALIDIT DE CONTENU Etiquette sous laquelle sont rassembl s les tests constituant un chantillon repr sentatif de t ches ou de conduites Ce sont par exemples les tests issus des programmes ducatifs En effet les programmes ducatifs visent doter les individus d un ensemble de propri t s connaissances comp tences sp cifiques ou plus g n rales Les tests pr sentant un ensemble d items repr sentatifs d une cat gorie d objectifs ducatifs sont dits F vrier 2010 avoir une bonne validit de contenu Walton et Bartram 1994 distinguent cette validit de contenu d une validit apparente en ce que la premi re est estim e par un groupe de professionnels alors que la seconde est estim e par l individu test LA VALIDIT EMPIRIQUE OU CRIT RIELLE La validit empirique d signe une forte corr lation entre un test et un crit re ou variable Ici l objectif n est plus de savoir quel trait sous jacent est mesur par le test mais de savoir si Le test est un pr dicteur correct du crit re Le domaine dans lequel la validit empirique s exprime avec le plus de force est certainement celui du recrutement pour une entreprise capable de d finir pr cis ment ce qu elle entend par r ussite il sera possible d examiner les relations entre ces mesures de r ussite crit res et les scores des tests pr dicteurs LA VALIDIT TH
14. dividus au moins et l intervalle entre les deux administrations devrait se situer entre un et trois mois EVALUATION DES ERREURS DE MESURE On en distingue deux types edes erreurs al atoires variables d une observation l autre et impr visibles au niveau de contr le des observations choisi e des erreurs syst matiques se manifestant de la m me mani re d une observation l autre La th orie de la fid lit ne traite que les erreurs al atoires Cette th orie s applique L Orthophoniste N 296 23 des mesures ayant les propri t s des chelles d intervalles C est la faveur des variations de la mesure lorsqu elle est r p t e que l on prend conscience des erreurs de mesure La th orie de la fid lit postule que les mesures r sultant de la r plication se distribuent normalement l erreur est al atoire Cette erreur a donc autant de chances de se manifester en positif qu en n gatif La th orie consid re qu il est possible de d composer toute mesure observ e en deux parties ind pendantes une mesure vraie non observable laquelle vient s ajouter une erreur al atoire Une premi re estimation de l importance de l erreur al atoire est fournie par la dispersion des mesures observ es r p t es sur un m me sujet On appelle variance d erreur la variance de cette distribution intra individuelle et cart type l erreur standard de mesure Plus cette distribution est dispers e plus l
15. e La mesure Rappelant qu au sens tr s g n ral mesurer c est attribuer des nombres aux choses Huteau et Lautrey 1999 citant Reuchkin 1970 pr cisent que pour que les propri t s des nombres puissent tre appliqu es aux choses il est indispensable de fonder les correspondances entre ces propri t s des nombres et les propri t s des choses Niveaux de mesure Depuis les travaux psychophysiques de Stevens 1951 il est commun ment admis de distinguer quatre niveaux hi rarchis s de mesure ou quatre types d chelles de mesure eLes chelles nominales utilisables dans le cas d observations regroupables en classes d quivalence chacune de ces classes pouvant tre d sign e par un nombre Les nombres n ont ici que la propri t d tre des symboles distincts qu il ny a par cons quent aucun sens ordonner ou ajouter Ce niveau de mesure relativement faible incite parler de mesure qualitative et permet le traitement statistique e Les chelles ordinales utiles lorsque l on peut tablir un ordre entre les classes et L Orthophoniste N 296 21 montrer que les relations inter classes sont antisym triques si A gt B alors B gt A est impossible et transitives si A gt B et B gt C alors A gt C Les nombres d signant les classes deviennent alors des symboles ordonn s e Les chelles d intervalles adapt es un traitement visant d finir des distances entre les cl
16. e essentiel dans l valuation du langage De ce fait elle permet d envisager de nouvelles pistes de r flexion pour la pratique valuative et la prise en charge th rapeutique Un traitement de l am lioration conjointe de la qualit des productions et des temps de r ponse lors de la r solution de t ches linguistiques sera envisager dans chaque valuation Cette notion essentielle de ralentissement mental pr sent mesurable nous para t essentielle consid rer par les professionnels de la sant en vue d une meilleure valuation du handicap et d ventuels ajustements soit au niveau scolaire soit du poste de travail Bacher F Reuchlin M Les diff rences individuelles dans le d veloppement cognitif de l enfant Paris PUF 320 p 1989 Beech J R Harding L et coll Tests mode d emploi guide de psychom trie trad de J Luc Mogenet Paris ECPA 180 p 1994 Binet A Simon T New methods for the diagnosis of the intellectual level of subnormals l ann e psychologique 12 191 244 1905 Bonin P Production verbale de mots Approche cognitive De Boeck Universit Bruxelles 2003 Cibois P L analyse factorielle Paris PUF 128 p 1983 Dickes P Tournois J Flieller A Kopj L La psychom trie Paris PUF 288 p 1994 French C L valuation assist e par ordinateur Chapitre 7 in Tests mode d emploi Guide de psychom trie sous la direction de J R Beech et L
17. es conditions soigneusement contr l es ou standardis es qui incluent des protocoles cot s de mani re syst matique e ces proc dures fournissent des mesures de la performance et am nent tirer des inf rences partir d chantillons du comportement e elles comprennent galement des proc dures qui peuvent aboutir cat goriser ou classer les personnes Par ailleurs les Recommandations stipulent que toute proc dure se r clamant de l ap pellation de test doit pouvoir s appuyer sur des constats de fid lit et de validit en relation avec les objectifs poursuivis et L Orthophoniste N 296 20 fournir les preuves l appui des inf ren ces tir es des scores aux preuves consi d r es Huteau et Lautrey 1997 pr cisent qu un test est un dispositif d observation des individus qui pr sente quatre propri t s e il est standardis o il permet de situer la conduite de chaque sujet dans un groupe de r f rence e Le degr de pr cision des mesures qu il permet est valu fid lit e la signification th orique ou pratique de ces mesures est pr cis e validit Face ces notions de standardisation de fid lit et de validit il est primordial de conna tre et ma triser la m thodologie des tests M thodologie des tests La m thodologie psychom trique issue de la m thode exp rimentale int gre en son champ l tude des diff rences individuelles Elle se carac
18. laza M Cr ation et Validation d un Bilan Informatis de Langage Ecrit chez l adolescent et l adulte Pichot P Les Tests Mentaux Paris PUF Que Sais je n 626 128 p 1997 Reuchlin M La mesure en psychologie in Fraisse P Piaget J ds Trait de psychologie exp rimentale 3 d Paris PUF Vol 1 207 p 1970 Reuchlin M Pr cis de statistiques 7 d Paris PUF 1998 256 p 1998 Stevens S S Mathematics measurement and psychophysics in Stevens S S ed Handbook of experimental psychology New York Wiley pp 1 49 1436 p 1951 Tran T H Duquenne J Moreau E Les troubles de la d nomination D ficits et strat gie Proposition d une grille d analyse des r ponses obtenues en d nomination d images Glossa 71 4 16 2000 Vrignaud P Les tests au XXI si cle Que peut on attendre des volutions m thodologiques et technologiques dans le domaine de l valuation psychologique des personnes Pratiques psychologiques 4 5 27 1996 Vrignaud P Aspects th oriques et m thodologiques g n raux li s l valuation l exemple de l valuation de la lecture 5 journ es d Orthophonie Lyon UCLB 7 15 2004 Vrignaud P Castro D Mogenet J L Recommandations Internationales sur l Utilisation des Tests version fran aise labor e pour la Soci t Fran aise de Psychologie Pratiques Psychologiques L esprit du temps hors s rie juin 33 p 200
19. le pas volontairement et qui mobilisent tr s peu de ressources mentales Bonin 2003 Martin 1999 note que l ordinateur permet la conception de t ches sp cifiques qui facilitent la mesure et l interpr tation des temps de r action La psychologie cognitive qui s int resse notamment au temps de latence entre la pr sentation du stimulus et la r ponse du sujet et au degr d automatisation des proc dures s inscrit dans cette perspective et offre un cadre th orique l interpr tation des temps de r action En effet les traitements cognitifs sont consommateurs de temps et leur dysfonctionnement devrait se traduire par un ralentissement des processus engag s L t 2004 Ces donn es peuvent aider le th rapeute envisager les prochaines tapes de la th rapie et objectiver les progr s de la th rapie De plus il faut tenir compte du biais que peut constituer le calcul des temps de r action par des examinateurs diff rents qui peuvent infl chir les r sultats Le Gall et Allain 2001 un examinateur pouvant tre plus r actif qu un autre Ce biais peut tre contourn si la r ponse du sujet est produite par lui m me soit par un syst me de bouton r ponse ou encore par un programme utilisant les r alit s virtuelles permettant temps de quelques situations concr tes Tableau r capitulatif et ses l gendes Voici un exemple de tableau r capitulatif de normes obtenues pour un test d
20. le test final Cette d marche ne fait pas l conomie d un questionnement sur l ventuelle remise en cause par la s lection d items op r e de la d finition initiale de la dimension Chaque item est caract ris par un indice de difficult qui n est autre que la fr quence de r ussite cet item d terminant son pouvoir de diff renciation des individus Un item a un pouvoir de diff renciation maximum lorsque sa fr quence de r ussite est de 50 il est nul lorsque cette fr quence s approche de 0 personne ne r ussit ou de 100 tout le monde r ussit Il est g n ralement admis que les items dont la fr quence de r ussite est comprise entre 20 et 80 peuvent tre retenus D une grande simplicit cet indice est n anmoins d pendant du groupe de sujets consid r s Les mod les de r ponse l item viennent minorer cet inconv nient Par ailleurs chaque item peut tre caract ris par un indice de discrimination permettant de distinguer les items selon leur contribution au score final Cet indice de discrimination est le coefficient de corr lation entre l item et le score au test Il est lev si les individus qui r ussissent litem ont un score lev au test faible dans le cas o il y a peu de rapport entre la r ussite litem et le score au test Plus l indice de corr lation item test est lev plus l homog n it du test est forte Cependant ce cas de figure est fr que
21. n lieu un score et que ces r sultats sont additionn s pour obtenir un score d chelle Pour Huteau et Lautrey 1999 cette pratique si elle est doublement justifi e elle fournit une bonne diff renciation des individus et permet de neutraliser certaines erreurs de mesure doit nous amener nous interroger sur la pertinence de l op ration consistant additionner des scores partiels ou en d autres termes si tous les items contribuent bien la mesure d une m me dimension ou encore si tous les items constituent bien un ensemble homog ne Les auteurs nous proposent trois mod les dits mod les de mesure visant r pondre ces questions Ces mod les sont pr sent s ainsi que d autres dans l ouvrage de Dickes et coll 1994 F vrier 2010 Karen Roach Fotolia Analyse d items et corr lation item test Il s agit de la m thode de construction de test la plus r pandue et la plus conviviale Cette m thode consiste partir d une d finition conceptuelle d une dimension valuer puis laborer un ensemble d items de difficult gradu e impliquant cette dimension Ces items seront ensuite soumis un ou plusieurs groupes de sujets afin que ne soient conserv s que ceux des items qui permettent une bonne diff renciation des individus et qui constituent un ensemble homog ne Il convient donc de disposer au d part d un nombre d items nettement sup rieur ce que l on souhaite pour
22. nt alors calcul e sur l ensemble des sujets Dans la pratique il est fr quent de s en remettre au coefficient de corr lation test retest pour d finir le coefficient de fid lit SOURCES D ERREUR On peut distinguer trois sources d erreurs relevant de trois modalit s de r p tition de la mesure e Le sujet est plac dans la m me situation des moments diff rents les erreurs d observation proviennent des facteurs associ s au moment de l observation les coefficients de fid lit sont des coefficients de stabilit ou de constance ele sujet se voit proposer des preuves diff rentes dans leur contenu mais cens es mesurer la m me chose Les erreurs d observation proviennent alors de la sp cificit des t ches propos es Les coefficients de fid lit calcul s sont des coefficients d homog n it ele sujet ne passe qu une seule fois le test la cotation et l valuation tant propos es plusieurs observateurs La source d erreur repose donc sur l observateur Le coefficient calcul est le coefficient de fid lit inter observateurs C est dans le but de maximiser cette fid lit que les conditions d observation sont standardis es Les validit s Un test est dit valide lorsqu il permet d atteindre de mani re satisfaisante les objectifs que le constructeur ou l utilisateur ont choisis Huteau et Lautrey 1999 On envisage donc autant de types de validit s que de cat gories
23. nt avec les tests dans lesquels les items sont tr s proches les uns des autres et n valuent que des secteurs tr s troits L Orthophoniste N 296 22 de la conduite En cons quence le seuil d limination des items en fonction de leur indice de corr lation item test est g n ralement assez bas autour de 30 Cette proc dure correspond un mod le de mesure appel la th orie classique du score vrai Son postulat est qu il existe une variable latente au long de laquelle on peut ordonner les sujets selon leurs notes vraies c est dire indemnes d erreur de mesure Cependant le test variable observable ne correspond pas exactement cette variable latente du fait des erreurs de mesure inh rentes au choix particulier des items Ces erreurs de mesure peuvent n anmoins tre valu es Mod les de r ponse l item C est dans les ann es 50 partant de l analyse d items et la faveur des avanc es en micro informatique que sera d velopp la forme des mod les de r ponse litem mais ce n est que r cemment que ces mod les ont connu leur d veloppement la faveur des avanc es en micro informatique Vrignaud 1996 Le mod le pr c dent visait d finir des courbes caract ristiques d items relation entre la r ussite un item et la r ussite au test Ces courbes taient construites partir d observations Dans les mod les de r ponse litem les courbes sont d finies
24. onn n correspond au nombre de sujets ayant subi l preuve en vue de sa normalisation m est la moyenne obtenue l preuve et enfin a est l cart type L cart type mesure la dispersion d une s rie de valeurs autour de leur moyenne Pour calculer un cart type il suffit de faire Note brute obtenue par le patient moins la moyenne cart type e soit pour un enfant de 6 ans 2 mois ayant obtenu la note de 19 l preuve ci apr s l cart type r el de cet enfant sera 19 24 10 4 44 1 14 cart type e t ou d viation standard Nombre de sujets Score voc 1 RE ES ET a 8 ans 6 N 152 52 20 6 39 Notes pond r es Les notes brutes sont transform es en notes pond r es qui permettent de situer l enfant dans un talonnage Prenons l exemple de ce graphe L Orthophoniste N 296 Etat des lieux sur Le test Qu appelle t on un test Qu est ce qu valuer Du test au testeur Comment franchir Le pas Pour les substantifs ce patient obtient un score qui le situe 2 5 cart type e t de la norme notes Z ce qui correspond la note pond r e 5 de l chelle des classes G n ralement que ce soit avec des logiciels de correction ou en fin de protocoles ou de manuel les notes pond r es sont traduites en chiffres 1 5 qui correspondent Notes lt 2 e t 1 99 lt notes lt 0 99 moyenne 0 99 lt notes lt 1 99 e t Notes gt 1 99 e t Le profil Il permet e
25. s chose ais e Pour Marie No lle Metz Lutz 1988 le test est comme une preuve impliquant une t che d finie pour tous les sujets et comportant une technique pr cise pour l appr ciation des succ s et des checs Pour sa part Pierre Pichot 1997 On appelle test mental une situation exp ri mentale standardis e servant de stimulus un comportement Ce dernier tant destin tre compar statistiquement celui d autres sujets plac s dans les m mes conditions exp rimentales formant un groupe de r f rence par rapport auquel le sujet test pourra tre compar La Soci t Fran aise de Psychologie travers son adaptation fran aise des Recommandations Internationales sur l Utilisation des Tests Vrignaud et coll 2003 consid re que toute tentative pour fournir une d finition pr cise d un test en tant que processus chouera vratsemblablement parce qu elle risque d exclure certaines proc dures qui devraient en faire partie et d en inclure d autres qui devraient en tre exclues Face cet obstacle les Recommandations optent pour une s rie de propositions visant organiser le domaine vis Nous en soulignerons quatre e La passation de tests comprend des pro c dures permettant la mesure des compor tements normaux ou pathologiques voire des dysfonctionnements e les proc dures de passation de tests sont habituellement construites pour tre administr es selon d
26. s pond r es comme ci dessus ou percentiles comme ci apr s Un centile est chacune des 99 valeurs qui divisent les donn es tri es en 100 parts gales au centile 50 Ligne correspondant Graphique 3 Profil des notes chelles et centilage complet Zone comprise entre le centile 10 et le centile 90 CG MorSyn Zone comprise entre le centile 25 et le centile 75 Le centile 50 partie centrale en Jaune Le centile 50 veut dire que 50 des enfants obtiennent un r sultat gal ou inf rieur et que 50 des enfants obtiennent un r sultat sup rieur Le centile 25 parties en bleu indique que 25 des enfants obtiennent un r sultat gal ou inf rieur et que 75 des enfants obtiennent un r sultat sup rieur Quant au Centile 75 il souligne r sultat gal ou inf rieur pour 75 des enfants et un r sultat sup rieur pour seulement 25 des enfants Enfin le centile 10 parties externes en jaune met en vidence que 10 des enfants obtiennent un r sultat gal ou inf rieur mais que 90 des enfants obtiennent un r sultat sup rieur Inversement le Centile 90 confirme que 90 des enfants obtiennent un r sultat gal ou inf rieur et que 10 des enfants obtiennent un r sultat sup rieur L Orthophoniste N 296 26 Conclusion l avanc e des technologies l informatisation des outils d valuation rendent compte de la n cessit de consid rer la variable temporelle comme l ment diagnostiqu
27. t rise par une standardisation des conditions d observation une r flexion approfondie sur la mesure et sa signification et la formalisation des notions d erreur de mesure et d erreur de pronostic Standardisation Selon Huteau et Lautrey 1997 1999 la standardisation d une proc dure d observation constitue la caract ristique essentielle des tests Elle vise sinon liminer totalement du moins r duire F vrier 2010 Sm les biais dus l observateur On parle d objectivit dans une observation lorsque plusieurs observateurs ind pendants d crivent de mani re identique la conduite d un sujet observ Il convient cependant de garder l esprit que l objectivit d une observation ne garantit en rien le risque d erreur syst matique commune tous les observateurs ni n atteste priori de la pertinence d une observation Observation automatis e On peut consid rer deux types d observation automatis e le testing collectif et le testing informatis Le testing collectif implique que les sujets soient en groupe les consignes et probl mes soient pr sent s par crit et que quelques indications orales soient donn es l ensemble du groupe Dans cette configuration les interactions entre les sujets et celui qui administre le test sont r duites au minimum En g n ral le questionnaire sous forme de QCM permet une correction automatis e L informatisation des tests s est r pandue
28. ution normale distribution th orique de Laplace Gauss La m thode des quantiles consiste regrouper les notes brutes obtenues de mani re obtenir des cat gories effectifs identiques Cette m thode bien que facile construire est parfois critiqu e pour son manque de diff renciation des sujets se cat gories ordonn es Etat des lieux sur le test Qu appelle t on un test Qu est ce qu valuer Du test au testeur Comment franchir Le pas trouvant aux extr mit s de la distribution et son exc s de distinction des sujets occupant le centre de la distribution C est pour pallier cet inconv nient que l on utilise parfois des chelles normalis es cart type dans ce type d talonnage les cat gories sont toujours d finies par des effectifs mais ceux ci ne sont plus gaux Leurs limites sont d termin es de fa on ce qu en consid rant qu elles d finissent des intervalles gaux il soit possible de reconstituer une distribution proche de la distribution normale Tests r f rences crit rielles Le test r f rence crit rielle permet de situer la performance d un sujet par rapport un univers de contenu connaissances comp tences et se distingue du test r f rence normative qui lui permet de situer la performance du sujet par rapport un groupe La d finition des dimensions 3 mod les de mesure Rappelons qu un test est un ensemble d items donnant chacu

Download Pdf Manuals

image

Related Search

Related Contents

CFN. CFO.  Multipurpose Probabilistic Software for Statistical  Pro.tect  Weil-McLain EGH-85 User's Manual  MCS Tabber User Manual    Vandex Construction Joint Tape  USER'S MANUAL THERMAL TRANSFER / DIRECT  EPIA-M830_FCC_Report..  

Copyright © All rights reserved.
Failed to retrieve file