Home
Elsa TOLONE LIGM, Université Paris
Contents
1. et d exploiter les annotations syntaxiques r sultantes pour cr er une ressource linguistique plus riche et plus tendue un treebank pour le fran ais Six types de constituants ont t choisis pour cette campagne groupe nominal GN noyau verbal NV groupe adjectival GA groupe adverbial GR groupe pr positionnel GP et groupe pr positionnel noyau verbal PV Les relations d pendances entre mots pleins relever sont les suivantes d pendance sujet verbe SUJ V d pendance auxiliaire verbe AUX V objet direct COD V autre compl ment du verbe CPL V modifieur du verbe MOD V subordonn e COMP attribut du sujet ou de l objet ATB SO modifieur du nom MOD N modifieur de l adjectif MOD A modifieur de l adverbe MOD R modifieur de la pr position MOD P coordination COORD apposition APPOS et juxtaposition JUXT Le guide d annotation utilis lors de la campagne Passage est le guide des annotations syntaxiques de r f rence PEAS Les m triques d valuation utilis es sont celles d finies l occasion de la campagne EASy la pr cision le rappel et la f mesure avec diff rents modes de rel chement de contrainte sur la mesure des fronti res de constituants Paroubek et al 2005 Pour la premi re campagne de Passage de 2007 la r f rence utilis e est un extrait d environ un million de mots du corpus EASy Paroubek ef al 2005 de styles vari s http gforge inria fr
2. valuation Passage la section 3 avant de d tailler les r sultats obtenus par FRMG lorsqu on lui fait rejouer cette campagne en le couplant successivement avec les quatre lexiques d crits la section 4 Nous montrons en particulier que pour l instant c est encore la version standard du Lefff qui donne les meilleurs r sultats Enfin nous discutons la section 5 de la fouille d erreurs r alis e sur les sorties produites afin d identifier les entr es lexicales verbales susceptibles d expliquer la baisse de pr cision obtenue par les autres ressources par rapport au Lefff puis nous concluons la section 6 2 Les ressources lexicales 2 1 Lefff LGLex et DICOVALENCE Nous avons utilis les donn es lexicales issues de trois ressources lectroniques librement disponibles Lefff Lexique des formes fl chies du fran ais Ce lexique est une ressource morphologique et syntaxique large couverture du fran ais qui couvre l ensemble des cat gories Sagot 2010 Le Lefjf d velopp dans le formalisme lexical Alexina est orient vers une utilisation dans des outils de traitement automatique mais cherche pr server une pertinence linguistique Il est ainsi utilis par exemple dans des analyseurs grande chelle pour diff rents formalismes LFG LTAG et d autres Des travaux r cents en ont am lior la qualit et la couverture pour certaines classes d entr es constructions impersonnelles constructions pronomi
3. sur le Traitement Automatique des Langues Naturelles TALN 02 Nancy France de La Clergerie E 2005a From metagrammars to factorized TAG TIG parsers In Proceedings of IWPT 05 poster p 190 191 Vancouver Canada de La Clergerie 2005b DyALog a tabular logic programming based environment for NLP In Proceedings of 2nd International Workshop on Constraint Solving and Language Processing CSLP 05 Barcelone Espagne Hamon O Mostefa D Ayache C Paroubek P Vilnat A amp de La Clergerie E 2008 Passage from French parser evaluation to large sized treebank In Proceedings of the 6th Language Resource and Evaluation Conference LREC 08 Marrakech Maroc Joshi A K Levy L amp Takahashi M 1975 Tree Adjunct Grammars Journal of Computer and System Science 10 10 1 136 163 Paroubek P Pouillot L G Robba I amp Vilnat A 2005 EASy campagne d valuation des analyseurs syntaxiques In Actes de l atelier EASy de TALN 05 Dourdan France Sagot B 2010 The Lefff a freely available and large coverage morphological and syntactic lexicon for French In Proceedings of the 7th Language Resources and Evaluation Conference LREC 10 La Valette Malte Sagot B amp Boullier P 2008 SXPipe 2 architecture pour le traitement pr syntaxique de corpus bruts Traitement Automatique des Langues T A L 49 2 155 188 Sagot B amp Danlos L 2007 Am liorer un lexique syntaxique l aide des tables du Lexique
4. voire cr er des ressources linguistiques et d autre part en vue d applications concr tes comme l extraction d informations ou la fouille de textes L objectif de ce travail est d valuer divers lexiques syntaxiques par le biais de l valuation de l analyseur syntaxique FRMG de La Clergerie 2005a Thomasset amp ric de La Clergerie 2005 lorsqu il est coupl chacun d entre eux Il s agit donc d une valuation orient e t che task based de ces ressources Nous avons valu le Le fff dans sa version 3 0 Sagot 2010 ainsi que trois ressources obtenues en rempla ant presque toutes les entr es verbales du Le ff par d autres ressources savoir successivement le lexique ZGLex Tolone 2011 construit partir des tables du Lexique Grammaire du fran ais le lexique DICOVALENCE van den Eynde amp Mertens 2006 ainsi qu une nouvelle version des entr es verbales du Le ff obtenues partir de sa fusion avec DICOVALENCE et d un travail de validation manuelle Pour cela tous ces lexiques ont t convertis au format du Le f le format Alexina L valuation a t faite sur la partie du corpus EASy utilis lors de la premi re campagne d valuation Passage Hamon ef al 2008 Nous commen ons par d tailler ces quatre ressources lexicales qu il s agisse de lexiques d j existants le Lefff LGLex ou DICOVALENCE ou de la nouvelle version du Le ff section 2 2 Nous pr senterons ensuite l analyseur FRMG et la campagne d
5. Distribution de la version 2 en ligne sous licence LGPL LR l adresse http bach arts kuleuven be dicovalence g n ralement pour envisager l utilisation du Le ff en analyse s mantique Nous avons effectu un premier travail dans cette direction en cherchant int grer DICOVALENCE au sein du Leff En effet DICOVALENCE distingue quant lui les diff rents sens d un m me lemme verbal en plusieurs entr es Pour cela nous avons mis en uvre la m thodologie d crite dans Sagot amp Danlos 2008 Ainsi nous avons tout d abord converti DICOVALENCE au format Alexina am liorant pour ce faire l outil de conversion utilis pr c demment Danlos amp Sagot 2008 La fusion du r sultat de cette conversion avec le Le jf a t r alis e de la m me fa on que dans Danlos amp Sagot 2008 en pr servant toutes les informations issues des deux ressources exemples etc La difficult est qu il est fr quent qu un lemme verbal donn ait plusieurs entr es dans DICOVALENCE et plusieurs dans le Le jf ce qui rend d licate la mise en correspondance de chaque entr e de l un avec z ro une ou plusieurs entr es de l autre Nous avons donc appliqu les heuristiques d crites dans Danlos amp Sagot 2008 qui permettent la mise en correspondance de deux entr es si les inventaires de fonctions syntaxiques de base sujet objets direct et indirects sont identiques et si l inventaire de fonctions syntaxiques obliques locatif d
6. Elsa TOLONE LIGM Universit Paris Est France amp FaMAEF Universidad Nacional de C rdoba Argentine elsa tolone univ paris est fr ric de LA CLERGERIE ALPAGE INRIA Paris Rocquencourt amp Universit Paris 7 France Eric De La Clergerie inria fr Beno t SAGOT ALPAGE INRIA Paris Rocquencourt amp Universit Paris 7 France benoit sagot inria fr VALUATION DE LEXIQUES SYNTAXIQUES PAR LEUR INTEGRATION DANS L ANALYSEUR SYNTAXIQUE FRMG R sum Dans cet article nous valuons divers lexiques avec l analyseur syntaxique FRMG le Lefff LGLex le lexique syntaxique construit partir des tables du Lexique Grammaire du fran ais le lexique DICOVALENCE ainsi qu une nouvelle version des entr es verbales du Lefjf obtenues par fusion avec DICOVALENCE et validation manuelle partielle Pour cela tous ces lexiques ont t convertis au format du Lefff le format Alexina L valuation a t faite sur la partie du corpus EASy utilis lors de la premi re campagne d valuation Passage Mots cl s lexiques syntaxiques analyseur syntaxique campagne d valuation fouille d erreurs 1 Introduction De nombreux analyseurs du fran ais ont t d velopp s ces derni res ann es et il importe de les valuer afin d am liorer leur pr cision et leur robustesse sur des corpus grande chelle Ceci est en effet de nature am liorer l exploitation des annotations syntaxiques produites d une part pour enrichir am liorer
7. Grammaire Constructions impersonnelles Cahiers du Cental Sagot B amp Danlos L 2008 M thodologie lexicographique de constitution d un lexique syntaxique de r f rence pour le fran ais In Actes du colloque Lexicographie et informatique bilan et perspectives Nancy France Sagot B amp Fort K 2007 Am liorer un lexique syntaxique l aide des tables du Lexique Grammaire adverbes en ment In Actes du 26 me Colloque Lexique et Grammaire LGC 07 p 145 152 Bonifacio France Sagot B amp Fort K 2009 Description et analyse des verbes d sadjectivaux et d nominaux en ifier et iser Arena Romanistica Journal of Romance Studies 4 102 110 Sagot B amp Villemonte de La Clergerie E 2006 Error mining in parsing results In Proceedings of the 21st International Conference on Computational Linguistics and 44th Annual Meeting of the Association for Computational Linguistics p 329 336 Sydney Australia Association for Computational Linguistics Thomasset F amp ric de La Clergerie 2005 Comment obtenir plus des m ta grammaires In Proceedings of TALN 05 Dourdan France Tolone E 2011 Analyse syntaxique l aide des tables du Lexique Grammaire du fran ais Th se de doctorat LIGM Universit Paris Est France 340 pp Tolone E amp Sagot B 2011 Using Lexicon Grammar tables for French verbs in a large coverage parser In Z Vetulani Ed Human Language Technology Forth Language and Technology Conferen
8. ce LTC 2009 Pozna Poland November 2009 Revised Selected Papers Lecture Notes in Artificial Intelligence LNAI Springer Verlag para tre van den Eynde K amp Mertens P 2006 Le dictionnaire de valence DICOVALENCE manuel d utilisation http bach arts kuleuven be dicovalence manuel 061117 pdf
9. e d erreurs 5 Fouille d erreurs La fouille d erreurs sur les verbes reprend les principes de fouilles d erreurs pr sent s dans Sagot amp Villemonte de La Clergerie 2006 tout en l adaptant En effet dans ce travail l objectif tait en premi re approximation d identifier les formes dont la pr sence dans une phrase tend rendre la phrase inanalysable Dans le pr sent article cet objectif est adapt e afin d identifier les entr es d un lexique hyp qui semblent d grader les performances de FRMG comparativement un lexique de r f rence ref ici le Leff l id e est de trouver les formes et plus pr cis ment les formes verbales dont la pr sence dans une phrase analysable avec le lexique de r f rence ref tend rendre cette phrase inanalysable avec le lexique hyp Le corpus EASy est trop petit pour obtenir des statistiques suffisantes pour un diagnostic complet des ressources Mais l algorithme ne n cessitant pas de disposer d un corpus de r f rence seule l analysabilit c est dire la couverture tant exploit e nous avons pu ajouter au corpus EASy environ 100K phrases avec AFP Europar Wikipedia et Wikisources ce qui constitue le CPJ Corpus Passage Jouet Nous avons regard en d tail les 15 premiers suspects dans ZGLex afin de d terminer d o proviennent les erreurs entre parenth ses est indiqu le nombre de phrases contenant ce verbe qui n ont pas pu tre analys es sachant que seule une phrase e
10. e silence aujourd hui la m moire de la victime cette entr e est cod e dans la table 38LHD avec la construction N0 V N1 Loc N2 destination r prouver 11 dans la phrase Dieu ne r prouve donc personne cette entr e est cod e dans la table 12 avec la construction N0 V N1 de N2 Enfin certains cas sp cifiques rediriger 50 dans des phrases erron es telles que deux cent cinquante troisredirige ici consoler 6 dans des phrases avec pronominalisation de l objet telles que Elle essayait de le consoler l entr e est cod e dans les tables 13 et 32R1 avec la construction NO V N1 accept e mais sans qu aucune ne code la possibilit de pronominaliser le premier compl ment et camper 5 dans Les troupes campent entre Harlem et Nim gue l entr e devrait tre reconnue car elle accepte la construction N1 V Si l on se penche pr sent sur les 5 premiers verbes les plus suspects dans les 9 phrases suivantes qui n ont pas t analys es avec le nouveau Lefff l origine de l erreur est plus difficile d terminer et ne semble pas toujours li e au nouveau Lefff Il se peut dans certains cas que le succ s de l analyse avec le Le ff standard soit plut t le r sultat d une surg n ration tomber employ dans une phrase complexe avec partie du corps cette lourde pens e lui tombe sur le coeur tomber et dominer employ s dans une construction avec laisser qui semble mal g r e Reprit M Levrault en se lai
11. f rents types de passif etc La particularit essentielle du dictionnaire r side dans le fait que les informations valencielles sont repr sent es selon les principes de l Approche Pronominale en syntaxe Blanche Benveniste et al 1984 Pour chaque place de valence appel e paradigme le dictionnaire pr cise le paradigme de pronoms qui y est associ et qui couvre en intention les lexicalisations possibles Il pr cise aussi les reformulations possibles comme le passif 2 2 Construction d une nouvelle version des entr es verbales du Lefff par fusion avec DICOVALENCE et validation manuelle Bien que le principe g n ral sous tendant les entr es lexicales du Le ff soit que chaque sens distinct d un m me lemme doive correspondre une entr e distincte ce principe n est respect que tr s partiellement dans la version actuelle de la ressource C est pourtant une n cessit pour am liorer la qualit du Le jf comme ressource descriptive pour permettre la prise en compte d informations telles que les restrictions de s lection pendant ou apr s l analyse syntaxique pour coupler terme le Le ff avec des ressources lexicales s mantiques et plus lDistribution de la version 3 0 en ligne sous licence LGPL LR l adresse http gforge inria fr projects alexina 2Distribution de la version 3 3 en ligne sous licence LGPL LR l adresse http infolingu univ mlv fr Donn es Linguistiques gt Lexique Grammaire gt T l chargement
12. iste des 100 lemmes verbaux les plus fr quents du fran ais Nous avons valid corrig fusionn et compl t manuellement toutes les entr es correspondant ces lemmes verbaux dans le lexique fusionn Le r sultat de ce travail est un lexique morphologique syntaxique et s mantique compos de 12 613 entr es couvrant 7 933 lemmes verbaux distincts 3 L analyseur syntaxique FRMG et la campagne d valuation Passage FRMG FRench MetaGrammar de La Clergerie 2005a Thomasset amp ric de La Clergerie 2005 est un analyseur syntaxique profond large couverture pour le fran ais Une description grammaticale de haut niveau sous forme de m ta grammaire sert de point de d part pour la g n ration d une grammaire d arbres adjoints TAG Tree Adjoining Grammar Joshi et al 1975 Cette grammaire est transform e par le syst me DyALog de La Clergerie 2005b de La Clergerie 2002 en un analyseur syntaxique L analyseur syntaxique FRMG d coulant des phases de compilation de la m tagrammaire FRMG ne peut bien s r fonctionner seul Il s int gre dans une cha ne compl te de traitement comprenant en amont le lexique syntaxique Lefff et les nombreux modules de SXPipe Sagot amp Boullier 2008 en charge de la segmentation de la correction orthographique et de la d tection des entit s nomm es Pour une phrase donn e FRMG retourne l ensemble des analyses compl tes sous forme de for t En cas d chec pour une analyse comp
13. l te l analyseur retourne un ensemble d analyses partielles couvrant au mieux la phrase Enfin sous la contrainte d un temps limite timeout si l analyseur n a pu conclure l ensemble des analyses il retourne celles d j disponibles mode just in time En pratique tr s peu de phrases moins de 1 se retrouvent sans aucune analyse compl te ou partielle Ensuite la for t d analyse peut tre convertie sous forme d une for t de d pendances et galement d sambigu s e en utilisant un ensemble de r gles heuristiques tr s peu lexicalis es On obtient ainsi une unique analyse par d pendance qui peut ensuite tre convertie dans le format Passage utilis dans le cadre des campagnes d valuation Passage On peut voir par exemple la figure 1 la sortie au format Passage de la phrase Depuis quelques semaines les rapports entre les deux camps se d gradent comp mod nom no en mie L Figure 1 Exemple de sortie au format Passage Pr cisons que FRMG est un logiciel libre accessible sous la GForge de l INRIA Il est galement possible de jouer avec la cha ne de traitement et de visualiser la grammaire FRMG sur http alpage inria fr frmgdemo La campagne d valuation Passage 2007 2009 Hamon et al 2008 soutenue par l ANR a pour objectif d valuer les analyseurs du fran ais d am liorer l exactitude et la robustesse des analyseurs du fran ais sur des corpus grande chelle 100 millions de mots
14. locatif etc dans l entr e du Lefff est inclus dans celui issu de DICOVALENCE Pour chaque lemme on obtient ainsi au moins autant d entr es que dans le lexique qui en contient le moins et au plus la somme des nombres d entr es dans chaque lexique lorsqu aucune mise en correspondance n a fonctionn Pour b n ficier au mieux de la bonne qualit g n rale des informations syntaxiques pr sentes dans DICOVALENCE nous avons d cid de r aliser une validation manuelle partielle mais significative du r sultat de la fusion Ainsi nous avons valid manuellement toutes les entr es correspondant des lemmes telles que le nombre d entr es dans le lexique fusionn tait strictement sup rieur au maximum du nombre d entr es entre les deux ressources Une telle situation signifie en effet qu au moins une entr e du Lefff n a pu tre mise en correspondance avec une entr e de DICOVALENCE et inversement ce qui fait soup onner que la fusion s est pass e de fa on incorrecte en raison d erreurs dans l un ou l autre des lexiques ou en raison de diff rences d analyse un objet indirect en de pour une ressource pouvant tre un d locatif pour une autre par exemple Nous avons ainsi valid corrig voire fusionn manuellement toutes les entr es pour 505 lemmes verbaux produisant ainsi 986 entr es Par ailleurs nous avons extrait du corpus de l Est R publicain une table de fr quence des formes fl chies qui nous a permis de dresser une l
15. nales adverbes en ment verbes en iser et ifier notamment par comparaison et fusion avec d autres ressources lexicales comme DICOVALENCE et les tables du Lexique Grammaire Sagot amp Danlos 2007 Sagot amp Fort 2007 Danlos amp Sagot 2008 Sagot amp Fort 2009 LGLex Ce lexique syntaxique a t construit partir des tables du Lexique Grammaire du fran ais en un format textuel et XML Constant amp Tolone 2010 apr s un travail de mise en coh rence et d explicitation des propri t s syntaxiques dans les tables du Lexique Grammaire Tolone 2011 Gr ce une d finition formelle ou une interpr tation dynamique de toutes les constructions la version texte du lexique ZGLex a ensuite t convertie au format Alexina Tolone amp Sagot 2011 Cela a pu tre fait pour l ensemble des verbes issus des 67 tables regroupant 13 867 entr es dont 5 738 entr es distinctes et des noms pr dicatifs issus des 78 tables regroupant 12 696 entr es dont 8 531 entr es distinctes DICOVALENCE Le dictionnaire de valence verbale DICOVALENCE van den Eynde amp Mertens 2006 est une ressource informatique qui r pertorie les cadres de valence de plus de 3 700 verbes simples du fran ais soit plus de 8 000 entr es Le dictionnaire explicite en outre certaines restrictions s lectionnelles certaines formes de r alisation pronominales phrastiques des termes la possibilit d employer le cadre valenciel dans dif
16. projects mgkit Shttp atoll inria fr passage index fr html Disponible sur le site http www limsi fr Individu anne Guide PEAS_reference_annotations_v2 2 html journalistique m dical oral questions litt raire etc dont 4 306 phrases constituaient d j la r f rence de la campagne EASy en 2004 et 400 nouvelles phrases ont t annot es manuellement depuis Pour pouvoir tenir compte des noms pr dicatifs du lexique LGLex il a fallu modifier la m ta grammaire en faisant l approximation suivante n importe quel d terminant peut venir de mani re optionnelle devant un nom pr dicatif 4 R sultats On peut voir les r sultats des diff rents lexiques sur le corpus EASy dans le tableau 1 Lexique Couverture Couverture Constituants Relations Temps Timeout phrases 2 2 s Lefff 3 555 76 08 89 21 66 36 0 30 0 00 Nouveau Leff 3 495 74 81 88 65 65 41 0 43 0 03 LGLex 3 437 73 60 87 97 63 03 0 84 0 03 DICOVALENCE 2 773 59 78 86 98 61 91 0 42 0 00 Tableau 1 R sultats comparatifs sur le corpus EASy exprim s en terme de f mesure Les meilleurs r sultats et performances de FRMG sont obtenus avec la version standard du Le ff version 3 Ceci peut s expliquer par le fait que les deux ressources ont t d velopp es ensemble depuis longtemps En comparaison les r sultats sont finalement assez proches pour les autres ressources Les temps d analyse sont plus importants pou
17. r LGLex avec en cons quence plus de phrases chouant pour cause de timeout ceci provient du grand nombre d entr es par verbe dans LGLex titre de comparaison les lemmes verbaux les plus ambigus dans le Lefff sont tenir et re faire 6 entr es alors que dans le lexique ZLGLex il s agit des lemmes tenir 53 entr es jouer 44 entr es et prendre 35 entr es De plus LGLex contient un grand nombre de noms pr dicatifs li s des verbes support DICOVALENCE a un faible taux de couverture relativement aux autres lexiques mais des f mesures qui sont finalement bonnes ceci confirme la pertinence de l approche suivie par les d veloppeurs de cette ressource qui se sont concentr s sur les emplois fr quents des lemmes les plus fr quents Nous pr sentons les r sultats pour quelques relations verbales dans le tableau 2 Lexique SUJ V AUX V COD V CPL V ATB SO Leff 79 29 91 55 72 48 62 40 66 46 Nouveau Leff 78 76 91 15 72 18 62 59 59 45 LGLex 77 78 89 28 66 46 59 47 45 79 DICOVALENCE 76 12 86 74 65 49 61 62 8 65 Tableau 2 R sultats comparatifs pour quelques relations verbales f mesures DICOVALENCE semble avoir des probl mes sur certains verbes tr s fr quents en particulier sur le verbe tre comme le montre la tr s faible f mesure pour la relation ATB SO 8 65 contre 66 46 pour Lefff cf tableau 2 et comme galement mis en vidence par la fouill
18. rdre D autres sont cod es dans les tables mais avec des compl ments obligatoires qui ne sont pas pr sents dans les phrases du corpus kidnapper 12 et revendre 5 dans des phrases sans deuxi me compl ment telles que Les deux Italiens ont t kidnapp s le 18 d cembre et dans Charles mangeait l avoine des chevaux doublant les fournitures revendant par une porte de derri re ce qui entrait par la grande porte ces deux entr es sont cod es dans la table 36DT elles acceptent comme construction de base NO V N1 Pr p N2 sans effacement possible du deuxi me compl ment introduit par la pr position c est le cas de toutes les entr es de cette table Une forme suspecte doit aussi avoir tendance appara tre seule dans de telles phrases ou en cooccurrence avec des formes qui ne sont pas trop suspectes l chelle du corpus entier On trouvera le d tail du mod le sous jacent dans Sagot amp Villemonte de La Clergerie 2006 il s exprime sous forme d une paire d quations mutuellement r cursives refl tant le niveau local des phrases et le niveau global du corpus L algorithme de r solution est un algorithme de point fixe crouer 5 dans la phrase Le lyc en de 18 ans soup onn d avoir poignard vendredi un camarade Hakim dans leur lyc e du Kremlin Bic tre Val de Marne a t mis en examen et crou hier alors que lyc es et coll ges sont invit s observer une minute d
19. ssant tomber dans un fauteuil moi je dis qu il faut pas laisser JS tomber comme a Pour quelles raisons en temps de guerre un tr s grand nombre de personnes habituellement paisibles et inoffensives se laissent elles dominer par la haine cuisiner approcher et orner employ s dans des phrases pour laquelle l chec n est pas imputable aux entr es verbales il sait pas cuisiner Comme il approchait du ch teau de ses p res elle a voulu tout prix orner sa vieille ville elle l a orn e sans proportion avec ses destin es et son avenir parer qui il manque la redistribution passive Partout sur la route les fen tres vous regardent par es de fleurs et de verdure 6 Conclusion Convertir un lexique au format Lefff permet de l utiliser peu pr s imm diatement avec FRMG Pour un lexique de bonne qualit comme DICOVALENCE ou les tables du Lexique Grammaire les r sultats obtenus sont bons En effet une f mesures pour les relations au dessus de 60 est meilleure que les r sultats de FRMG avec le Lefff lors de la campagne de 2007 59 65 de f mesure pour 56 de couverture N anmoins les derniers points de f mesure d coule d une adaptation plus fine entre la grammaire et le lexique et de la recherche des erreurs ou incompl tudes lexicales Il est en effet normal que tout lexique poss de des entr es erron es qu il est difficile de trouver Les techniques de fouille d erreurs permettant de comparer dans
20. st donn e par verbe titre d exemple mais qu au total 212 phrases sont concern es pour cet chantillon Certaines entr es ne figurent pas dans les tables c est le cas de r affirmer 28 de r lire 10 de la forme pronominale se r implanter 5 mais galement de mixer 7 dans la phrase Mix par Jimi Hazel assist de Bruce Calder enregistr chez Jimi l Electric Lady Studios New York puisque cette entr e est cod e dans la table 36S avec un sens diff rent Max mixe les carottes et avec les navets dans un mixeur Certaines entr es figurent dans les tables mais ne sont pas cod es codage c est le cas de susciter 41 qui n est cod e dans aucune des deux tables dans laquelle elle est pr sente 36DT et 38R recruter 14 qui figure dans la table 38R sans tre cod e ce qui implique qu part la construction de base NO V N1 Pr p N2 aucune autre construction n est cod e d localiser 9 qui figure dans la table 38L sans tre cod e sa construction de base est NO V N1 Loc N2 source Loc N3 destination les effacements de certains compl ments pouvant tre cod s dans la table et zapper 4 qui figure dans la table 35L sans tre cod e sa construction de base est NO V Loc N1 source Loc N2 destination elle ne peut donc pas tre reconnue dans la phrase Elle a galement d plor la m moire de plus en plus s lective de la jeune femme qui zappe les d tails qui font d so
21. un sens ou l autre les verbes de deux lexiques sont un moyen de rep rer plus rapidement ces entr es terme ce travail doit aussi renforcer la fusion de diverses ressources lexicales en une seule ressource de tr s grande qualit N anmoins les choix linguistiques derri re chaque ressource ont un impact ainsi le Le jf standard version 3 fournit des entr es verbales plut t factoris es peu de distinctions s mantiques cadres de sous cat gorisation factoris s alors que LGLex liste de nombreuses entr es par verbes correspondant divers sens et associ es des cadres de sous cat gorisation plus simple mais se chevauchant R f rences Blanche Benveniste C Delofeu J Stefanini J amp Eynde K v d 1984 Pronom et syntaxe L approche pronominale et son application au fran ais Paris SELAF Constant M amp Tolone E 2010 A generic tool to generate a lexicon for NLP from Lexicon Grammar tables In M D Gioia Ed Actes du 27e Colloque international sur le lexique et la grammaire L Aquila 10 13 septembre 2008 Seconde partie volume 1 of Lingue d Europa e del Mediterraneo Grammatica comparata p 79 193 Rome Italie Aracne Danlos L amp Sagot B 2008 Constructions pronominales dans DICOVALENCE et le Lexique Grammaire Int gration dans le Lefff In Actes du 27 me Colloque Lexique et Grammaire L Aquila Italie de La Clergerie E 2002 Construire des analyseurs avec DyALog In Actes de la Conf rence
Download Pdf Manuals
Related Search
Related Contents
Bedienungsanleitung Man_UsersMan_r4_DTX-MFM-GFM-SFM_es PLL Synthesizer User`s Manual mANuAL DE INSTruCCIONES TAFCO WINDOWS NU2-185V-I Installation Guide Emerson HD7100 CD Player User Manual MANUAL DE TESORERÍA Bohr- und Einpressmaschine ECOFLEX Philips Stick 929689614802 important information Copyright © All rights reserved.
Failed to retrieve file