Home

Télécharger

image

Contents

1. 67 Contributions Les relations peuvent tre absolues ou d clenchables apr s v rification d un contexte Elles peuvent tre conditionn es par le r sultat de l analyse syntaxique en particulier par l tiquetage grammatical fin adj SYN gt troit fin nom A gt arr t poste nom masculin SYN gt fonction poste nom f minin SYN gt PTT 6 2 4 Utilisation du thesaurus dans les environnements de recherche d information textuelle multilingue RIT M LaRITM est une m thode de recherche de textes crits dans des langues diff rentes de celle qui a t utilis e pour r diger la requ te Bien qu il soit possible de traduire tous les documents dans la langue utilis e pour r diger la requ te pour des collections de grande taille l approche la plus conomique pour construire un syst me RITM consiste traduire la requ te dans toutes les langues des collections sur lesquelles porte la recherche au moment de la recherche d Cowie al 1997 Fluhr amp al 1999 Pour d passer les limitations des dictionnaires bilingues g n riques des lexiques et des thesaurus sp cifiques construits partir de vocabulaires contr l s ont t utilis s pour rechercher des informations textuelles cf Cowie et al 1997 H amann 1998 H udon 1997 84 discute l importante potentielle de l usage des thesaurus dans les environnements bilingues multilingues en
2. 1997 Skuce amp al 1997 entre autres Introduction ous la pouss e des technologies et des recherches th oriques multidisciplinaires les m thodes de traitement et de repr sentation des textes subissent actuellement de grands bouleversements Bien que dans les syst mes d information plusieurs fonctions soient encore remplies par l tre humain de plus en plus de travaux de recherche aboutissent la mise au point de techniques ou d heuristiques prenant en charge l analyse des textes la constitution de lexiques celle de thesaurus l indexation et l interrogation de bases de donn es textuelles fond es pour certaines sur des approches linguistiques C est le cas de plusieurs syst mes actuellement disponibles sur le march Spirit Nomino pour ne citer que deux syst mes travaillant sur le fran ais La qualit du r sultat d pend alors des capacit s du syst me traiter la langue dans laquelle est formul e la requ te Les approches linguistiques sont par ailleurs de plus en plus utilis es dans des applications du type Knowledge management un processus d organisation et de mise disposition d une information pouvant tre contenue dans une messagerie un syst me de fichiers une base de donn es ou un site Web Au sein du paradigme linguistique en sciences de l information la terminologie figure au premier rang Elle intervient dans diverses applications telles que l indexation manuelle e
3. rent que le besoin d information n est pas toujours d fini et fixe mais au contraire volutif Pendant la recherche surviennent parfois de nouveaux besoins d information au gr des diff rentes informations rencontr es Le Coadic 1998 Ces approches montrent les limites des approches syst mes et rappellent la pertinence des critiques de l indexation lexicale formul es par Amar 1997 1999 4 et les avantages d une indexation discursive qui laisserait ouvert l utilisateur d un syst me tous les parcours interpr tatifs d Amar ici m me 2 Un ensemble contr l de termes utilis s pour l indexation de l information contenue dans une base de donn es et utilis s galement pour la recherche de l information dans cette m me base de donn es H udon 1995 66 Contributions On consid re ici l usager son comportement son intention comme un l ment central en compl ment de l importance de l appariement du processus de recherche d information Les approches usager t moignent de l arriv e de chercheurs issus d autres disciplines telles que la psychologie les sciences ducatives les sciences sociales la communication ou les sciences cognitives Contrairement au paradigme syst me il n existe pas une seule approche usager mais plusieurs qu on peut rattacher deux grandes cat gories g n rales les approches cognitives et les approches dynamiques D un point de vue
4. s mantiques du thesaurus comme heuristiques dans les syst mes automatiques pour le filtrage de l information La requ te de l utilisateur peut tre reformul e l aide d heuristiques pr d finies fond es sur la structure du thesaurus utilis cf T GID Spirit Fluhr 1992 Fluhr amp al 1999 L objectif de cette reformulation est de produire partir de la question de l utilisateur la totalit des reformulations quivalentes que l on pourrait trouver dans les documents On g re ainsi la diversit d expression linguistique des diff rentes notions Les informations utilis es par le module de reformulation sont de nature syntaxique ou s mantique Pour la s mantique on utilise le type de relation existant entre les termes Le processus de reformulation peut aussi s appliquer lorsque la base contient des documents r dig s dans une autre langue que celle de la question Les relations peuvent avoir une origine morphologique termes d riv s de la m me base d rivation morphologique appel e dans le domaine des sciences de l information stemmatisation ou s mantique Par exemple la synonymie SYN l appartenance g n rique sp cifique G S d inclusion partitive GP SP associatives A etc i Exemple de tmmatisation indexeur lt gt indexation ii Exemples de relations thesaurales index lt A gt descri pteur v hicule lt G S gt voiture
5. Conclusion et perspectives Quelle que soit l application il est devenu n cessaire de revoir les normes de construction de thesaurus en tenant compte des points suivants Mise jour des normes selon les nouvelles exigences de l criture sur cran D vaopper les relations logico s mantiques issues des approches classiques et faire en sorte qu elle sadaptent aux diverses formes de repr sentations Enrichir la r flexion en int grant les travaux terminologiques bas s sur des approches de la s mantique cognitive cf ici m me Temmerman Concevoir les langages d indexation terminologies et thesaurus en donnant une plus grande place l utilisateur ce qui suppose 1 que ce soient des syst mes qui tiennent compte de diff rents types de connaissances 2 d envisager l emploi de niveaux de langue diff rents et de parcours distincts d acc s l information Compte tenu de l incessante augmentation du volume de l information et de l accroissement du nombre des utilisateurs des syst mes de recherche d information le besoin d adapter les r ponses aux particularit s des utilisateurs simpose De ce fait l efficacit d un syst me de recherche d information ne d pend pas seulement de l exactitude des r ponses mais galement de l ad quation des r ponses aux particularit s des utilisateurs Widad M ustafa d Hadi Equipe Ing i ie linguigique et syst mes d information Universt Charles De
6. Web Un dispositif de navigation est un dispositif d organisation du contenu qui peut prendre la forme d un r seau conceptuel de type thesaurus et qui 3 Pour plus de d tails sur la reformulation cf Fluhr 1992 Fluhr amp al 1999 Spirit M anua d utilisation T GID Groupe Technologies 4 www cogsci princeton edu wn 68 Contributions propose l utilisateur de parcourir les n uds du r seau en allant d un concept g n ral un concept particulier et vice versa Concevoir les thesaurus de cette mani re permet alors d adapter les modes d acc s aux besoins des utilisateurs Ce nouveau type de fonctionnement est d ores et d j l uvre dans M ultites T heaurus construction 5 qui est reli dans sa version d valuation en ligne aux moteurs de recherches tels que Altavista et Yahoo La mise en uvre informatique de ces dispositifs de navigation demande alors de comparer l architecture des thesaurus et la structure sous jacente aux sites Web et de d terminer le type de lien logico s mantique le plus apte tre utilis comme lien hypertextua pouvant pointer sur des sites Internet li s aux domaines de connaissances couverts par le thesaurus dispositif de navigation On peut ainsi imaginer que dans un avenir proche des thesaurus con us manuellement 6 ou l aide de listes de termes extraits automatiquement pourront tre transform s en dispositif de navigation
7. m thodologique ces approches sinspirent souvent des m thodes ethnographiques et socio cognitives cf Kolmayer 1997 Ihadjad ne 1999 2 Int r t du thesaurus et avantages de sa transformation en dispositif de navigation sur le Web Avec les m thodes d indexation automatique et la possibilit d acc s au texte int gral l indexation l aide de langages documentaires est en perte de vitesse Ce ph nom ne devient plus perceptible avec l Internet Amar d ici m me examine l volution de la pratique d indexation et en distingue deux types qui correspondent chacun un contexte documentaire donn On peut en effet tre d accord avec Amar cf ici m me sur l inad quation des langages documentaires pour l indexation Cependant malgr ces critiques je proposerai ici d assigner un nouveau r le aux langages documentaires tels que le thesaurus Cet outil repr sente en effet un savoir existant partag par les sp cialistes d un domaine Et l interpr tation des textes peut faire appel ces savoirs II importe dans ce cadre d examiner comment l on peut conserver ce type d outils tout en les adaptant aux nouvelles exigences et l am lioration des approches syst mes d une part et en les affinant vers une assistance l utilisateur d autre part Je pr sente ci dessous les principaux avantages de cet outil 2 1 Structure s mantique du thesaurus et assistance l utilisateur La disposition des rela
8. 2 D avid S 1993 Les unit s polylexicales ments de description et reconnaissance automatique T h se de doctorat en linguistique th orique et formelle Paris Universit de Paris VII Dumas L Plante A et Plante P 1997 Analy ur Linguistique de N omino Verson 1 M ontr l UQAM Fellbaum Ch 1998 WordN amp An Electronic Lexical Databas MIT Press 5 www concentric net M ultites thesaurus 6 6 Dans le cadre de la M a trise SID Syst mes informationnels et documentaires Universit Lille 111 les tudiants construisent des thesaurus dont ils choisissent eux m mes les th mes N ous disposons ainsi de thesaurus qui couvrent 70 domaines environ de l activit humaine IIs vont de la D gustation du vin l Euro en passant par le Diable la srcdlerie au moyen ge Un projet en cours de r alisation vise transformer certains de ces thesaurus en dispositifs de navigation 69 Contributions Felber H 1984 M anud de terminologie 1984 Paris Unesco Fluhr Ch 1992 Le Traitement du langage naturel dans la recherche d information documentaire dans Interfaces intelligentes dans l information gientifique amp technique Inria dirig par Christian Bornes 18 22 mai 1992 Klingthal Bas Rhin pp 103 130 Fluhr Ch Schmit D Andrieux C Ortet Ph et Combe V 1999 Cross lingual Interrogation for Multilingual Catalogs pr sent pour Le Thi
9. 72 M ustafa el H adi W 1993 Etat de l art de l extraction de concepts partir du langage natured Rapport SGD N C redo Universit Lille H1 M ustafa el H adi W 1998 Automatic Term Recognition amp Extraction Tools Examining the N ew Interfaces and their Effective Communication Role in LSP Discourse dans M ustafa el H adi W M aniez J et S Pollitt dit 1998 Structures amp Relations in Knowledge Organization Proceedings of the 5th International ISKO Conference Lille 25 29 Ao t W rzburg Ergon Verlag pp 204 212 O ard D et Diekema A 1999 Cross Language Information Retrieval in Annual Review of Information Science and Technology vol 33 pp 223 256 Rondeau G 1983 Introduction la t minologie 2e dition Chicoutimi Ga tan M orin Sagar J C 1990 A Practical Cours in Terminology Procesing Amsterdam Philadelphia John Benjamins Publishing C ompany S gu la P et Aussenac Gilles N 1997 Un mod le de base de connaissances terminologique dans T1A 97 Actes des deuxi mes rencontres Terminologie et intdligence artifiddle Universit Toulouse Le Mirail 3 4 avril 1997 Skuce D M ayer 1 et Kavanagh 1997 Bases textuelles et bases de connaissances sur le Web le syst me Ikarus VS Journ es Scientifiques du R sau th matique LTT Tunis 25 27 septembre 1997 T GID Groupe Technologies 1995 Spirit M anud d utilisation
10. Contributions Penser les nouvelles fonctionnalit s du thesaurus Cet article tente de suivre l volution dynamique du paradigme linguistique en sciences de l information travers les applications de la terminologie D e l indexation la recherche d information multilingue quels r les peut jouer le thesaurus au sein des syst mes d information La pr sentation suivra en quelque sorte l volution de l apport des applications de la terminologie aux syst mes d information L accent sera particuli rement mis sur le nouveau r le que le thesaurus pourrait jouer et sur la n cessit de l adapter la nouvelle criture sur cran J examinerai aussi la possibilit de son basculement fonctionnel vers un usage d interface pour l acc s l information Termes cl s thesaurus r seau s mantique acc s au contenu recherche d information recherche d information textuelle multilingue dispositif de navigation sur le Web 1 Les approches conceptuelles caract ristiques de la terminologie ont t la base du courant de l acquisition de connaissances car l acquisition des connaissances propres un domaine constitue le fondement m me de la terminologie et la distingue des approches lexicographiques Plusieurs travaux dans le domaine de l intelligence artificielle 1A et du Traitement automatique du langage naturel TAL ont t entrepris dans ce cadre cf Ahmed 1993 M eyer 1993 S guda et al
11. GaulleLille HI Lille Bibliographie Ahmad K 1993 Terminology and Knowledge acquisition Text Based approach TKE 93 pp 56 70 Amar M 1997 Les fondements th oriques de l indexation une approche linguistique Th se de doctorat de l universit Lyon Il Amar M 1999 L indexation un choix de mots ou un choix de textes Vers une indexation discursive sur l Internet communication pr sent e lors des D euxi mes journ es du Chapitre fran ais de l ISKO Lyon 21 22 octobre 1999 Cabr M T 1998 La terminologie Th orie m thode et applications Armand Colin amp les Presses de l Universit d Ottawa U Linguistique Cowie J Davis M et Zajac R 1997 Text Evaluation Conference TREC Un point de vue multilingue dans Actes des 1 S JST Francil Avignon France 15 16 avril 1997 pp 1 5 Cruse D A 1986 Lexical Semantics Cambridge Cambridge University Press D achelet R 1990 Etat de l art de l informatique documentaire Inria Rapport de recherche n 1201 Paris avril 1990 publi dans Le Document dectronique Cours Inria dirig par Christian Bornes 11 15 juin 1990 Ch telaillon Charente M aritime pp 107 132 D ahlberg 1 1978 Conceptual d finitions International Classification vol 5 n 3 pp 142 150 D ahlberg 1 1981 Conceptual Definitions for Interconcept International Classification vol 8 n 1 pp 16 2
12. Van Campenhoudt M 2000 Cours de teminologie site de Termisti www refer org termisti termisti htm W ster E 1968 Dictionnaire multilingue de la machine outil Londres Technical Press 70
13. es paradigmes d acc s au contenu des documents Pour situer l apport de la terminologie aux mod les d acc s au contenu de documents je donnerai un bref aper u des deux principaux paradigmes de recherche d information cf Ihadjad ne 1999 pour une tude critique et d taill e Kolmayer 1997 D eux paradigmes sont actuellement dominants le paradigme syst me et le paradigme usager 1 1 Le paradigme syst me Le paradigme syst me constitue depuis plus de trente ans le paradigme dominant en acc s l information D une fa on g n rale ses partisans consid rent que ce sont les fonctions de traitement de l information notamment celles de l appariement entre les requ tes et les descriptions des documents qui constituent le c ur du syst me L id e sous jacente ces syst mes est que le degr d appariement entre les termes de la base et ceux de la requ te de l usager permet d indiquer la pertinence des documents retrouv s L objectif essentiel consiste am liorer les performances de recherche selon deux mesures le bruit et la pr cision D es tudes tentent d am liorer les proc d s d appariement au travers de divers mod les reposant sur une dichotomie bien connue l appariement de formes les approches bool enne exacte et bool enne tendue le dus ring etc et l appariement du sens reformulation paraphrasage inf rence etc qui sont des approches bas es sur la linguistique et ou l
14. fond s sur la prise en compte des relations conceptualles et s mantiques repr sent es sous la forme d un r seau organisant un domaine de connaissance chaque domaine de 65 Contributions connaissance on fait correspondre une repr sentation plus ou moins sp cifique Certains domaines se pr tent ainsi des classifications hi rarchiques classifications zoologiques botaniques etc tandis que d autres se caract risent par des relations partitives m ronymie holonymie tels que le corps humain animal la machine outil ou les entit s g ographiques et organisationnelles Les relations associatives quant elles caract risent le domaine des sciences humaines et sociales D ans cet article j examinerai l apport de la terminologie l acc s au contenu informationnel 1 et comment ses applications peuvent am liorer les approches syst mes Je prendrai comme exemple le thesaurus 2 2 qui se situe dans les approches syst mes M me si ces approches pr sentent des limites cf Temmerman Cabr ici m me il est possible d apporter une aide l utilisateur au moyen des r seaux s mantiques qui caract risent le thesaurus examinerai donc la possibilit d adapter cet outil la nouvelle criture sur cran et l int r t de son basculement fonctionnel 3 vers un usage d interface pour l acc s l information 1 Place de la terminologie et de ses applications au sein d
15. intelligence artificidle cf D achelet 1990 Mustafa el H adi et al 1993 Le syst me met en correspondance les termes fournis par l usager et ceux du syst me terme d indexation Cette op ration est r alis e via un appariement syntaxique et s mantique Une fois cette transformation r alis e le passage du langage naturel au langage de repr sentation du syst me on aboutit une expression bool enne mettant en relation des termes d indexation qui permet alors la s lection des documents Ces derniers sont ordonn s selon la valeur de la mesure de correspondance avec la requ te D ans ce type d approche on permet l utilisateur de formuler sa requ te en langage natural on lui vite de conna tre et de ma triser l usage des op rateurs bool ens M algr les limites des approches de l appariement de forme cf D achelet 1990 Kolmayer 1997 lhadjad ne 1999 entre autres et 1 2 ces approches sont cependant largement utilis es pour des raisons bien connues L investissement r alis dans ces syst mes est si consid rable que les modifier ne serait pas conomiquement viable Les techniques alternatives n ont pas t test es dans des environnements en grandeur r elle Les r sultats obtenus par des techniques alternatives ne sont pas l heure actuelle suffisamment sup rieurs pour justifier les changements 1 2 Le paradigme usager Q uant au paradigme usager ses tenants consid
16. nn es terminologiques enrichies par des relations s mantiques alle pourrait cependant servir de standard La typologie des relations correspond en effet celle qui est pr sente aussi bien dans les bases de donn es terminologiques que dans les thesaurus de langue comme celui de Roget ou dans les thesaurus documentaires Autrement dit nous avons l exemple d un mod le complet de relations s mantiques associ es un thesaurus dynamique Les approches cognitivistes et socioterminologiques auront par ailleurs un r le important dans l enrichissement des relations s mantiques cf Temmermann D iki Kidiri ici m me Ces approches permettraient de pr ciser et de d velopper le type de relations s mantiques n cessaires la transformation de thesaurus en dispositifs de navigation Si ces dispositifs visent essentiellement assister l utilisateur et am liorer les approches syst mes la prise en compte des aspects cognitifs culturels et sociologiques est fondamentale Les approches classiques et innovantes pourront alors tre compl mentaires 3 2 M ises jour permanentes Le thesaurus est un outil qui devrait id alement tre en construction permanente puisqu il repr sente le corpus s mantique d un domaine en volution Les relations tablies ne devraient pas tre fig es une fois pour toutes les sp cialit s voluant rapidement 3 3 Transformation de thesaurus en dispositif de navigation sur le
17. rd European Conference on Research and Advanced Technology for Digital Libraries Paris France 22 24 septembre 1999 H armann D 1998 The Text Retrieval Conferences TRECs and the Cross Language Track in Proceedings of the Firg International Conference on Language Resurces and Evaluation Grenada Espagne 28 30 mai 1998 pp 517 522 Hudon M 1995 Le thesaurus conception daboration gestion Montr al Asted Hudon M 1997 M ultilingual Thesaurus construction Integrating the Views of Different Cultures in One Gateway to Knowledge and Concepts Knowledge Organization vol 24 n 2 pp 84 91 lhadjadene M 1999 La recherche et la navigation dans un SRI grand public le cas des H ypercatalogues T h se de doctorat Universit de Lyon 1 Kolmayer E 1997 Organisation des connaissances et expertise chez les usagers dans M aniez et M ustafa el H adi Organisation des connaisances en vue de leur int gration dans les syst mes de repr sentation amp de recherche d information Coll Travaux amp Recherche Edition du conseil scientifique de l universit C harles DeGaulleLille I1 Le Coadic Y F 1998 Le besoin d information AD BS dition Paris 1998 M eyer 1 et Bowker L 1992 Cogniterm An Experiment in Building a Knowledge Based Term Bank in Proceedings of the Fifth Euralex International Congress Euralex 92 Tampere Finlande Tampereen Yliopisto pp 159 1
18. signalant leur usage dans les syst mes de transfert de connaissances pratique courante au Canada et dans les pays de l Union europ enne 3 Adaptations n cessaires du thesaurus Certaines adaptations sont cependant n cessaires 3 1 Enrichissement des relations logico s mantiques dans les thesaurus La richesse d un thesaurus se mesure celle du r seau s mantique issu de sa repr sentation conceptuelle Beaucoup de thesaurus souffrent de la pauvret des relations s mantiques utilis es on n y trouve g n ralement que les relations de base g n riques sp cifiques fausses dans certains cas les relations d quivalence et les relations associatives Q uant la relation partitive elle est quasiment absente et souvent remplac e par la relation hi rarchique Les relations s mantiques qui caract risent les travaux terminologiques peuvent en partie servir de mod le pour la construction d un tel outil Ces relations sont d taill es dans les travaux suivants W ster 1968 Felber 1984 Cruse 1986 Van Campenhoudt voir notamment le site de Termisti D ans ce courant classique de la terminologie le r seau s mantique de WordN amp 4 peut inspirer l laboration des relations s mantiques des thesaurus Bien que cette base de donn es soit consid r e comme un produit hybride car elle r unit certaines caract ristiques des bases de donn es lexicales et d autres tir es de certaines bases de do
19. t automatique la construction de vocabulaires contr l s les interfaces d interrogation de bases de donn es textuelles monolingues et multilingues la traduction assist e par ordinateur les outils d aide la traduction tant de plus en plus int gr s des syst mes d information le r sum automatique etc Ses liens avec les syst mes d information et de documentation ont t mis en vidence dans divers travaux W ster 1968 D ahlberg 1978 et 1981 Rondeau 1983 Sager 1990 D es travaux plus r cents ont soulign l importance de la terminologie dans les syst mes d information et de documentation en tant qu outil d extraction de concepts construits dans les documents par le biais de termes qui servent de vecteurs ou de cl s d acc s au contenu Par exemple Cabr 1998 87 88 crit des trois questions cl s en terminologie par rapport la pens e et aux connaissances l acquisition des connaissances la formation des concepts et l organisation des concepts la troisi me est celle qui occupe davantage et l attention et le travail des terminologues Cette question a fait l objet d analyse de la part de sp cialistes des domaines techno scientifiques qui s efforcent d tablir la structure conceptuelle de leur discipline Plusieurs outils d acc s l information prennent sp cifiquement en charge cette dimension conceptuelle 1 C est le cas notamment des thesaurus qui sont
20. tions permet de mieux comprendre et de mieux repr senter les aspects notionnas des termes Les concepts Sorganisent ainsi dans diff rents types de configurations et explicitent les relations notionnelles qui caract risent un domaine de connaissances C ette structure s mantique pourra aider l utilisateur dans sa t che de recherche de l information textuelle 2 2 Am lioration de l acc s au contenu d une base La structure s mantique du thesaurus permet par ailleurs d am liorer l acc s au contenu d une base de donn es de r duire le bruit et le silence d am liorer le taux de pr cision et de ce fait permet l utilisateur de mieux trouver ce qu il cherche la diff rence d un index chaque descripteur du thesaurus est le noyau d un mini r seau autour duquel se d veloppe un ensemble de relations logico s mantiques g n rique sp cifique g n rique partitive et sp cifique partitive relation d quivalence relation d association Cette relation liedes termes appartenant des cat gories diff rentes mais o plusieurs cas de figure rappellent la forte implication de l un des deux termes choisis pour l indexation chaque fois que l autre est consult discipline ou branche d un domaine li s aux objets et ou aux ph nom nes tudi s sylviculture for t un proc d ou une op ration et son agent ou son instrument r gulation de temp rature thermostat etc 2 3 Utilisation des relations

Download Pdf Manuals

image

Related Search

T teams tiktok translate target twitch telegram the tv app twitter turbotax temu teams login ticketmaster t-mobile tradingview teamviewer typing test traductor target login toyota translate google tubi tv torzon darknet taylor swift tiktok login tinkercad

Related Contents

user manual manual de instrucciones notice d`utilisation  1601KB  MSI E350DM-E33 motherboard  USB-CVDK1  Kalorik USK CM 4 User's Manual  Unit 4  allegato e - Comune di Sanarica  X1100 Series All-In-One  Magnavox 27MS3404R CRT Television User Manual  FGL Programming guide  

Copyright © All rights reserved.
Failed to retrieve file