Home

Les Cahiers du CENTAL

image

Contents

1. gouverneur de Californie ou bodybuilder Ce sera l inverse pour un outil de veille politique D autre part les difficult s d annotation li es l ambigu t des entit s se retrouvent quelque soit le degr de finesse de cat gorisation recherch Du point de vue linguistique les probl mes rencontr s sont de type homonymie polys mie Kleiber 1999 ou de type m tonymique e g La France a sign le trait de Kyoto pays ou gouvernement Certains cas sont relativement ais s r soudre mais d autres posent davantage probl me m me pour un humain e g Orange a invit M Dupont ville ou Voir le site http www muc saic org 26th conference on Lexis and Grammar Bonifacio 2 6 October 2007 LES ENTITES NOMMEES USAGE ET DEGRES DE PRECISION ET DE DESAMBIGU SATION soci t Ainsi si l on veut caract riser plus finement les EN il importe avant tout de les d sambigu ser Apr s avoir consid r plus avant les divers probl mes li s au statut r f rentiel des EN Poibeau 2005 nous pr sentons la cat gorisation tablie pour les besoins du projet 2 Etude exp rimentale Notre tude s inscrit dans le cadre du projet de Recherche et D veloppement Infom gic qui concerne le domaine de l Analyse de l Information Le projet vise mettre en place un laboratoire industriel de s lection de tests d int gration et de validation d applications op rationne
2. r alisation d un dictionnaire lectronique relationnel des noms propres du fran ais in Proceedings of GDR PRC Communication Homme Machine S minaire Lexique Grenoble 164 175 MCDONALD D 1996 Internal and External Evidence in the Identification and Semantic Categorisation of Proper Names in Boguraev B et Pustejovsky J ds Corpus processing for lexical acquisition Language Speech and Communication MIT Press Cambridge London 21 37 PAUMIER S 2003 De la reconnaissance de formes linguistiques l analyse syntaxique Th se de doctorat Universit de Marne la Vall e POIBEAU T 2005 Le statut r f rentiel des entit s nomm es in Actes de la 13 Conf rence Nationale sur le Traitement Automatique des Langues Naturelles TALN 2005 Dourdan France ROCHE E et SCHABES Y 1997 Finite State Language Processing Roche E et Schabes Y ds MIT Press Cambridge Mass London Language Speech and Communication 464 p SEKINE S et NOBATA C 1998 An Information Extraction System and a Customization Tool in Proceedings of the New Challenges in Natural Language Processing and its Application 25 26 May 1998 Tokyo Japan SEKINE S SUDO K et NOBATA C 2002 Extended Named Entity Hierarchy in Proceedings of the Third International Conference on Language Resources and Evaluation LREC 2002 Las Palmas Canary Islands Spain 1818 1824 TOLONE E 2006 Rapport techn
3. le biais d un sch ma qui sp cifie la classe de l EN ses types et sous types ainsi que ses attributs La Figure 1 illustre le sch ma de repr sentation des EN de type Noms de lieux Elle est suivie par l ensemble des Type Ville types sous types et attributs associ s cette classe d EN Pays Chine Sous type Capitala Types et sous types Figure 1 EN de type Lieu Groupe de pays Regroupement g ographique ie Pays de l Afrique de l Ouest Regroupement conomique ie Union conomique et mon taire ouest africaine UEMOA Continent ie Afrique Pays ie C te d Ivoire Etat ie Washington tat f d ral des Etats Unis R gion ie Ile de France Capitale ie Vienne capitale de l Autriche 3 Pour plus d informations voir https www4 online thalesgroup com QuickPlace infomagic Main nsf 26th conference on Lexis and Grammar Bonifacio 2 6 October 2007 CLAUDE MARTINEAU ELSA TOLONE STAVROULA VOYATZI D partement ie Vienne d partement de France Ville ie Lyon ville de France Attributs Microtoponyme Place A roport ille 7 donn Num ro de d partement Lac ie lac Ba cal Fleuve ie La Seine Langue officielle Oronyme Capitale Montagne ie Le Mont Blanc France Superficie D sert ie d sert du Niger Niger Nombre d habitants Voies de communication Rue ie rue de Montreuil Paris Boulevard ie b
4. 2 228 entr es du fran ais Courtois 1990 Enfin nous avons enrichi semi automatiquement partir du corpus et du Web les ressources d j existantes d environ 500 entr es ie Noms d Organisations et Abr viations Tolone 2006 16 3 2 L exploitation du contexte imm diat l utilisation de grammaires locales La cr ation de grammaires locales sous forme de graphes RTN est amplement utilis e pour l extraction des EN Cette m thode consiste utiliser la pr sence de mots appel s mots d clencheurs dans le contexte imm diat droit ou gauche d une EN potentielle On peut donc reconna tre EN Neuf T l com gr ce la pr sence du d clencheur T l com qui constitue selon McDonald 1996 22 une preuve interne car il fait partie de PEN elle m me De mani re similaire on reconna t que Vivendi dans le contexte Le groupe Vivendi prend le contr le de Neuf T l com est une EN de type Organisation Selon McDonald 1996 23 le d clencheur groupe repr sente ici une preuve externe car 1l n appartient pas forc ment l EN et constitue le contexte d apparition de l EN dans l occurrence donn e Les grammaires locales que nous avons utilis es comportent environ 600 graphes Ces graphes ont t labor s au sein de l IGM depuis de nombreuses ann es et sont rassembl s et accessibles gr ce au syst me Graalweb Constant 2004 Initialement pr vus pour effectuer la reconnaissan
5. Les Entit s Nomm es usage et degr s de pr cision et de d sambigu sation Claude Martineau Elsa Tolone Stavroula Voyatzi Universit Paris Est Marne la Vall e Abstract The recognition and classification of Named Entities NER are regarded as an important component for many Natural Language Processing NLP applications The classification is usually made by taking into account the immediate context in which the NE appears In some cases this immediate context does not allow getting the right classification We show in this paper that the use of an extended syntactic context and large scale resources could be very useful in the NER task Keywords named entity electronic dictionary transducer syntactic context Introduction La n cessit de ma triser des flux et des stocks d informations multim dias en croissance constante affecte les secteurs les plus vari s de l conomie et de l action gouvernementale L information d aujourd hui est en effet massive le Web visible repr sente aujourd hui 8 milliards de pages les disques durs des particuliers et des entreprises environ le centuple On parle aujourd hui de Gigaoctets voire de T raoctets d informations ou de donn es disponibles complexe et h t rog ne il ne s agit plus seulement aujourd hui de g rer des donn es qui se pr sentaient sous forme structur e dans des fichiers plats ou dans de petites bases de donn es mais bien de trai
6. M 1981 Les bases empiriques de la notion de pr dicat s mantique in Langages n 63 Larousse Paris 7 52 HOBBS J APPELT D BEAR J ISRAEL D KAMEYAMA M STICKEL M et TYSON M 1996 FASTUS a cascaded finite state transducer for extracting information from natural language text in Roche E et Schabes Y ds Finite State Devices for Natural Language Processing MIT Press Cambridge USA 383 406 JACQUEMIN C et BUSH C 2000 Fouille du Web pour la collecte d entit s nomm es in Actes de la 8 amp Conf rence Nationale sur le Traitement Automatique des Langues Naturelles TALN 2000 Lausanne 187 196 KLEIBER G 1999 Probl mes de S mantique la polys mie en questions Presses Universitaires du Septentrion Lille Sens et structures 223 p LE MEUR C GALLIANO S et GEOFFROIS E 2004 Conventions d annotations en Entit s Nomm es ESTER http www afcp parole org ester publis html pp 6 10 Li H SRIHARI R Niu C et Li W 2002 Location normalization for information extraction in Proceedings of the 19th International Conference on Computational Linguistics vol 1 Association for Computational Linguistics Taipei Taiwan 1 7 MAUREL D et PITON O 1999 Un dictionnaire de noms propres pour Intex Les noms propres g ographiques in Linguisticae Investigationes vol 22 277 281 MAUREL D BELLEIL C EGGERT E et PITON O 1996 Le projet PROLEX
7. Time Number Expressions NUMEX Money Percent La reconnaissance et l extraction d EN sont des t ches bien tablies depuis les conf rences MUC Rep rer et cat goriser les EN permet un acc s particuli rement pertinent au contenu des documents et de ce fait repr sente un enjeu crucial pour l analyse et la compr hension automatique des textes De nombreux syst mes ont t d velopp s pour l extraction d EN en diff rentes langues Certains reposent sur une approche symbolique et utilisent une base de r gles construites la main Hobbs et al 1996 D autres sont fond s sur une approche statistique et emploient des connaissances acquises automatiquement par apprentissage Bikel et al 1997 D autres enfin adoptent une approche hybride Watrin 2006 Cependant les premi res d finitions et cat gorisations des EN selon les conf rences MUC ne permettent pas de r pondre aux besoins des diff rentes applications certaines se contenteront d annotations classiques telles que lieu organisation personne tandis que d autres auront besoin d annotations beaucoup plus fines Un outil de veille technologique aura par exemple besoin de distinguer les occurrences de Renault en tant que soci t des occurrences de Renault en tant que v hicule En revanche le m me outil n aura pas besoin de savoir que Arnold Schwarzenegger peut avoir diff rentes fonctions telles que acteur
8. ammaticales nom ou adjectif habituellement prises en compte comme d clencheurs se r v lent souvent insuffisantes et aboutissent une cat gorisation erron e L extension du contexte d analyse et la prise en compte du verbe et des ph nom nes de figement notamment en ce qui concerne le contexte syntaxique droit sont fort souhaitables Dans ce but nous envisageons dans la suite de ce travail d utiliser les ressources pr sentes au sein du lexique grammaire Gross 1981 afin d am liorer la pr cision de l extraction des EN R f rences ALLERTON D 1987 The linguistic and sociolinguistic status of proper names in Journal of Pragmatics vol 11 61 92 BIKEL D M MILLER S SCHWARTZ R et WEISCHEDEL R 1997 Nymble a high performance learning name finder in Proceedings of the 5 Conference on Applied Natural language processing 31 03 03 04 1997 Morgan Kaufman Publishers Inc Washington DC pp 194 201 CHINCHOR N 1998 MUC 7 Named Entity Task Definition version 3 5 in Proceedings of the 7 Message Understanding Conference MUC 7 19 April 1 May 1998 Fairfax VA CONSTANT M 2004 GRAAL une biblioth que de graphes mode d emploi in Muller C Royeaut J et Silberztein M ds Cahiers de la MSH Ledoux 1 INTEX pour la linguistique et le traitement automatique des langues Presse Universitaire de Franche Comt Besan on 321 330 COURTOIS B 1990 Un syst me
9. ce de patterns morphosyntaxiques ils ont d tre adapt s pour l extraction d EN Ceci a consist transformer ces automates en transducteurs qui produisent les balises initiales et finales d limitant chaque EN De plus des variables y ont t ajout s afin d extraire non seulement PEN mais aussi les attributs la concernant cf Figure 2 Ceci permet de fournir comme r sultat de l extraction une fiche o figure l occurrence de l EN reconnue assortie de l ensemble de ses attributs pr sents dans l occurrence cf Figure 3 r puhique n Er ATTRIBUTS soulign s r e assembl e oe el f int rieur lt Person_Ent gt conseil entite fonction S nat Kre Di ile Caron Azedr lt E gt FEP H lt N Prenom gt Se L 4 Ea x So Ki erson_Ent gt RE et le maire A PS MN Gusgho lt Person gt lt Person_Ent gt m p entite prenom prenom Bunnar lt Person entite civilit civilite Pr nom prenom Nom nom Nationalit nationalite gt Figure 2 Figure 3 Graphe reconnaissant des EN de type Personne Visualisation sous forme de fiches La preuve externe est n cessaire pour obtenir des performances lev es dans l extraction des EN Friburger 2002 Si on ne prend en compte que la preuve interne on peut souvent aboutir des erreurs de cat gorisation Par exemple le nom propre contenu dans la soci t Hugues Aircraft pose probl me Hugues figure dans le dictio
10. de dictionnaires lectroniques pour les mots simples du fran ais in Courtois B et Silberztein M ds Dictionnaires lectroniques du fran ais Langue Fran aise n 87 Larousse Paris 11 22 DAILLE B et MORIN E 2000 Reconnaissance automatique des noms propres de la langue crite les r centes r alisations in Maurel D et Gueunthner F ds Traitement Automatique des Langues vol 41 3 601 621 DISTER A et FAIRON C 2004 Extension des ressources lexicales gr ce un corpus dynamique in Lexicometrica Paris version lectronique http www cavi univ paris3 fr lexicometrica thema thema7 Texte Dister pdf FOUROUR N 2002 Nemesis un syst me de reconnaissance incr mentielle des entit s nomm es pour le fran ais in Actes de la 9 Conf rence Nationale sur le Traitement Automatique des Langues Naturelles TALN 2001 Nancy vol 1 265 274 FRIBURGER N 2002 Reconnaissance automatique des noms propres Application la classification automatique des textes journalistiques Th se de doctorat Universit de Tours Paris 26th conference on Lexis and Grammar Bonifacio 2 6 October 2007 CLAUDE MARTINEAU ELSA TOLONE STAVROULA VOYATZI GRASS T 2000 Typologie et traductibilit des noms propres de l allemand vers le fran ais partir d un corpus journalistique in Maurel D et Gueunthner F ds Traitement Automatique des Langues vol 41 3 643 669 GROSS
11. de mots qui commencent par une majuscule et qui ne sont pas reconnues Ces s quences sont tiquet es NON RECONNU Lors de la seconde phase ces s quences sont recherch es parmi les EN d j m moris es Apr s comparaison celles qui sont des occurrences d une EN d j m moris e sont tiquet es de la m me mani re Ceci permet d accro tre le taux de reconnaissance des EN Les changements de fr quences dans le lexique en t moignent cf Figure 4 LEGENDE SSSR NATIONALITY PERSON MDE MESURE NS NUMBER PERCENT YO ER MES PE DATE DUREE TIME NON RECONNU HHHGGS CATEGORIES PASSE 1 S Le pr sident de ESEESE Laurent GhASbS a t re u pour A entretien suivi J A d jeuner par le pr sident italien Carlo Azeglio Ciampi annonce un communiqu de la pr sidence S M en visite officielle doit rencontrer le pr sident du SSH le pr sident du SES et le maire di S il sera re u en audience par le pape au sud de doit galement s entretenir avec des repr sentants du patronat nm lcc a HHGG PASSE 2 S Le pr sident de SSSR LaurentiGbaste t re u tien suivi d il d jeuner par le pr sident italien Carlo Azeglio Ciampi annonce un communiqu de la pr sidence S M Gbagbo en visite officielle doit rencontrer le pr sident du SSRSEN le pr sident du BERS et le maire di il sera re u en audience par le pap Lx au sud de S doit galement s entretenir avec
12. des repr sentants du patronat nmflcc a Figure 4 Visualisation des EN reconnues par double lecture Cette tude tant en cours et faute d un corpus de r f rence annot la main nous ne pouvons pas parler encore de pr cision et de rappel En revanche il nous est possible d attribuer des tiquettes plus fines et correctes pour certaines cat gories d EN cf 3 3 D ailleurs ce corpus poss de un certain nombre de particularit s qui ont rendu cette t che 26th conference on Lexis and Grammar Bonifacio 2 6 October 2007 LES ENTITES NOMMEES USAGE ET DEGRES DE PRECISION ET DE DESAMBIGU SATION plus complexe taille importante des d p ches allant jusqu plusieurs milliers de caract res micro toponymes africains absents des dictionnaires noms propres africains comportant des apostrophes infixes i e N Djamena s quences isol es couramment utilis es i e ternel Gbagbo et titres des articles enti rement en majuscules Conclusion et perspectives Cette tude a montr la validit des grammaires locales existantes au sein du syst me Graalweb Leur transformation pour passer de la stricte reconnaissance des EN leur extraction a t une partie substantielle de ce travail Cette tude a galement mis en relief l importance qu il faut accorder des ressources linguistiques adapt es sans lesquelles une cat gorisation correcte des EN ne saurait tre obtenue D ailleurs les cat gories gr
13. erne pr sence du d clencheur Quai qui nous am nerait fournir la cat gorie lieu_micro toponyme La prise en compte du contexte syntaxique droit se trouve ne nous permet pas non plus de corriger l tiquetage car ce verbe peut accepter un nom de lieu en position de sujet Seule la prise en compte du compl ment pr positionnel dans l impossibilit nous am nerait la cat gorisation correcte de PEN Quai d Orsay peut donc tre correctement reconnu gr ce l exploitation du contexte syntaxique loign en l occurrence le pr dicat complexe NO Vsup Pr p X NO se trouver dans l impossibilit de VOinf W VS NO se trouver Loc N sans qu il soit besoin de faire appel la notion de r f rent Quai d Orsay Minist re des Affaires Etrang res n1 des ressources ext rieures ie bases de connaissances encyclop dies etc 4 R sultats et probl mes Nous avons reconnu dans ce corpus 189 021 occurrences d EN r parties dans les cat gories suivantes 49 135 EN de type personne 21 765 EN de type organisation 60 766 EN de type lieu 37 520 EN de type date 9 685 EN de type dur e et 10 150 EN de type heure Les r sultats obtenus par application des grammaires locales sont trait s par un programme qui effectue un traitement en deux phases n cessitant chacune une lecture du texte Lors de la premi re phase les EN reconnues sont m moris es dans un lexique On recherche galement dans le texte les s quences
14. ique de stage en Master d Informatique Universit de Marne la Vall e Paris 39 p WATRIN P 2006 Une approche hybride de l extraction d information sous langages et lexique grammaire Th se de doctorat Cental Universit de Louvain La Neuve Belgique 26th conference on Lexis and Grammar Bonifacio 2 6 October 2007
15. lles des meilleures technologies franciliennes dans le domaine de l ing nierie des connaissances Le pr sent travail porte sur l extraction et l annotation fine de certains types d EN dans les documents textuels 2 1 Corpus d tude Notre recherche a t r alis e sur un corpus interne de THALES L amp J coordinateur du projet Infom gic Il s agit d un corpus brut en fran ais de 38 M gaoctets comportant 3 173 071 occurrences de mots Il est constitu de d p ches d agences et d extraits de presse portant sur les v nements politiques en C te d Ivoire et au Kossovo durant la p riode 2000 2003 2 2 Typologie des EN Plusieurs typologies ont t propos es pour les noms propres en g n ral certaines morpho syntaxiques Allerton 1987 d autres graphiques Daille et Morin 2000 ou bien encore s mantiques Grass 2000 Pour ce qui est des EN d autres cat gorisations ont t tablies parmi lesquelles nous citons ESTER Le Meur Galliano et Geoffrois 2004 et celle de Sekine ef al 2002 La typologie adopt e dans le projet comporte les neuf classes d EN suivantes Noms de personnes Noms de lieux expressions spatiales incluses Noms de faits Noms d organisations Dates et heures expressions temporelles incluses Noms de moyens Coordonn es Expressions num riques Noms d uvres Nom de Lieu P kin Chacune de ces classes est affin e par un ensemble de sous classes et est illustr e par
16. nnaire des pr noms La seule preuve interne apport e par ce pr nom fait penser que Hugues Aircraft est un nom de personne ce qui est contredit par la preuve externe soci t Ce type d erreur de cat gorisation est tr s fr quent entre noms de personnes et noms d organisations 3 3 L exploitation du contexte loign le cas du contexte syntaxique droit Les contextes pris g n ralement en compte ne font intervenir que des noms ou adjectifs La prise en compte de contextes plus longs et d autres cat gories grammaticales notamment les verbes et les expressions fig es est essentielle pour ne pas aboutir une cat gorisation erron e de l entit trait e Consid rons l exemple 26th conference on Lexis and Grammar Bonifacio 2 6 October 2007 CLAUDE MARTINEAU ELSA TOLONE STAVROULA VOYATZI Le Quai d Orsay se trouve dans l impossibilit d affirmer que Dictionnaire Orsay N PR Toponyme Ville fs Preuve interne Quai d Orsay lieu_micro toponyme Preuves interne externe Quai d Orsay_se trouve lieu_micro toponyme Contexte loign Quai d Orsay_ se trouve dans l impossibilit organisation La premi re erreur de reconnaissance Orsay lieu_ ville est fr quente dans la mesure o les EN de lieu sont souvent imbriqu es dans des constituants plus grands qui sont eux m mes des EN La deuxi me erreur de reconnaissance est due la prise en compte de la preuve int
17. oulevard Haussmann Paris Certaines classes types et sous types d EN ne sont pas utiles dans toutes les applications alors que de nouveaux peuvent tre n cessaires suivant l apparition de diff rents besoins Cette typologie doit donc tre ouverte et param trable pour chaque application Nous allons pr sent d crire la m thode et les ressources utilis es dans notre travail 3 M thode et ressources utilis es Le but de notre travail est de d velopper un syst me d extraction et d annotation fine d EN en r utilisant autant que possible les ressources et outils existants en particulier ceux d velopp s au sein de l quipe d Informatique Linguistique de l IGM l Universit de Marne la Vall e Nous avons donc adopt une approche symbolique qui nous a galement permis de valider la couverture et la pertinence de nos ressources ainsi que de les adapter pour passer de la simple reconnaissance l extraction Cette m thode a d j t exp riment e dans le domaine d IE Roche et Schabes 1997 149 168 329 352 383 402 et s est r v l e suffisamment efficace Pour l extraction des EN nous avons fait appel au syst me Unitex Paumier 2003 Unitex est un environnement de d veloppement qui permet de construire des descriptions formalis es de grammaires et d utiliser des ressources telles que des dictionnaires g n raux et sp cialis s Tous les objets trait s par Unitex sont ou peuvent
18. ter et d analyser des fichiers plus complexes comme des textes non structur s des images et m me des enregistrements audio et vid o soumise des contraintes de temps r el la prise de d cision s effectue aujourd hui habituellement sous le signe de l urgence la crise constituant le cadre quasi normal de l action aussi bien dans l entreprise que dans le domaine gouvernemental Cr er des outils qui automatisent l exploration ou l extraction d informations pertinentes notamment dans les textes est alors crucial Les syst mes d extraction d information Hobbs et al 1996 Fourour 2002 de recherche d information Sekine et Isahara 1998 et de fouille de textes Jacquemin et Bush 2000 sont de plus en plus nombreux La t che d extraction d information en anglais Information Extraction d sormais IE consiste rep rer dans les documents les informations permettant de convertir le texte en une fiche signal tique standard partir de laquelle il est possible de r pondre des questions factuelles telles que quand et 1 Institut Gaspard Monge Universit Paris Est Marne La Vall e claude martineau elsa tolone stavroula voyatzi univ mlv fr CLAUDE MARTINEAU ELSA TOLONE STAVROULA VOYATZI o se d roule nt le ou les v nements relat s dans le texte quels sont les acteurs et quel est leur r le Il est possible de voir cette t che comme conversion d informations faiblement s
19. tre transform s en des transducteurs nombre fini d tats RTN en anglais 3 1 L utilisation des dictionnaires lectroniques La constitution de dictionnaires lectroniques est largement utilis e pour l extraction des EN Ces dictionnaires peuvent tre sp cialis s et comportent alors des EN en tant que telles ie anthroponymes toponymes sigles ou g n raux et contiennent des mots figurant en tant que contexte imm diat d une EN qu ils en fassent partie ou non ie la ville de Marseille Les dictionnaires sp cialis s que nous avons utilis s dans notre t che sont les suivants Type de dictionnaire Auteur Exemple Pr noms Maurel et al 1996 Caroline N PR Hum Pr nom fs Toponymes Maurel et Piton 1999 Seine N PR Hydronyme fs Pays Capitales et Gentil s Maurel et Piton 1999 France N PR Toponyme Pays 1soFR fs Adjectifs toponymiques Maurel et Piton 1999 parisiens parisien A Toponyme Ville mp Noms de profession Fairon 2004 banquiers banquier N Profession mp Sigles et Abr viations Maurel et al 1996 Solensi Solidarit Enfants Sida N Sigle fs 4 Voir http infolingu univ mlv fr 5 Les dictionnaires ont t labor s dans le cadre du projet Prolex 26th conference on Lexis and Grammar Bonifacio 2 6 October 2007 LES ENTITES NOMMEES USAGE ET DEGRES DE PRECISION ET DE DESAMBIGU SATION Nous avons galement utilis les dictionnaires morphologiques des mots simples 984 723 entr es et compos s 27
20. tructur es en donn es structur es qui seront alors plus faciles exploiter Li et al 2002 Notre travail s inscrit dans le cadre d un projet de recherche et s int resse l extraction des entit s nomm es d sormais EN dans un corpus bien sp cifique section 2 Apr s une pr sentation de l objectif de la t che d extraction d EN section 1 pr cisant le r le des ressources logicielles et linguistiques utilis es nous nous penchons sur les probl mes li s la d sambigu sation et au raffinement de la cat gorisation d EN section 3 Enfin nous pr sentons nos r sultats section 4 et les perspectives qu ouvre ce travail 1 Entit s nomm es Selon Chinchor 1998 la notion d EN est utilis e pour regrouper tous les l ments du langage qui font r f rence une entit unique et concr te appartenant un domaine sp cifique ie humain conomique g ographique etc On d signe traditionnellement par le terme d EN les noms propres au sens classique les noms propres dans un sens largi mais aussi les expressions de temps et de quantit Le terme d entit nomm e est utilis dans le domaine du traitement automatique des langues TALN depuis les conf rences Message Understanding Conferences MUC qui ont tabli la cat gorisation suivante Cat gories Sous cat gories Named Entities ENAMEX Person Organization Location Temporal Expressions TIMEX Date

Download Pdf Manuals

image

Related Search

Related Contents

  GGIG Graphical Interface Generator User Guide  Blankit* C5 - Western Chemicals  Baixar arquivo  HOJA DE DATOS DE SEGURIDAD  Symantec™ IT Management Suite powered by Altiris™ technology  Istruzioni per l`uso  RGB 164xi  Réf: A16283  Panasonic EY6932 Cordless Drill User Manual  

Copyright © All rights reserved.
Failed to retrieve file