Home
article
Contents
1. En amont des donn es lexicales proprement dites le mod le lexical du Lefff est am liorer certains cas verbaux non triviaux sont revoir en particulier les modaux et verbes adjoints selon la terminologie de DICOVALENCE qui correspondent respectivement aux verbes de la Table 1 et aux verbes de perception de la Table 6 du Lexique Grammaire le mod le utilis pour les constructions fig es est trop simpliste certaines fonctions syntaxiques sont probablement d coupler distinguer Att d un pseudo objet de type PQ ou ajouter cf PM et certaines r alisations comme les concessives sont mieux prendre en compte Enfin nous allons mettre l accent sur diff rents types d interface de visualisation et d dition du Lefff voire de comparaison avec d autres ressources converties au format Lefff 12Des travaux de comparaison avec Synlex Lefff sont aussi en cours en collaboration avec Claire Gardent 237 Laurence DANLOS Beno t SAGOT R f rences BLANCHE BENVENISTE C DELOFEU J STEFANINI J amp EYNDE K V D 1984 Pronom et syntaxe L approche pronominale et son application au fran ais Paris SELAF Boons J P GUILLET A amp LECL RE C 1976a La structure des phrases simples en fran ais Classes de constructions transitives Rapport interne LADL CNRS Paris 7 Boons J P GUILLET A amp LECL RE C 1976b La structure des phrases simples en fran ais Constructions intransitive
2. t SAGOT 4 3 O l un apporte l autre Le Lexique Grammaire et DICOVALENCE sont deux ressources tr s riches mais incompl tes Toutefois elles peuvent mutuellement s enrichir Ainsi DICOVALENCE comporte des infor mations pr cises sur les pronoms suspensifs cf plus haut tandis que le Lexique Grammaire ne prend pas en compte les interrogatives indirectes et regroupent sous l identifiant ADV les compl ments pronominalisables en ainsi autant Pr p quand etc A l inverse le Lexique Grammaire comporte des informations plus pr cises que DICOVALENCE en particulier le syst me des noms parties du corps IV qui permet de rendre compte d alternances telles que Luc caresse les cheveux de Marie Luc lui caresse les cheveux les compl ments sous cat goris s mais non pronominalisables cf Table 38PL couper le g teau en quatre parts gales o le compl ment introduit par en n est pas pronominalisable certaines restructurations telles que Luc copie les habitudes de L a Luc copie L a dans ses habitudes certaines relations de d rivation morphologique rappelons par exemple que la table 32RA regroupe les verbes morphologiquement d riv s d adjectifs assombrir gt sombre Certaines propri t s ou constructions complexes comme les diff rentes constructions prono minales font l objet de codages diff rents dans chacune des ressources Dans un futur proche nous chercherons compre
3. CE Les objectifs des lexiques consid r s comme de tout lexique syntaxique sont de d finir pour chaque lemme verbal donn ses diff rents emplois et pour chacun de ces emplois son ou ses cadres de sous cat gorisation et les informations compl mentaires qui s y rapportent p ex les informations sur le contr le Nous pr sentons donc un travail de comparaison entre le Lexique Grammaire et DICOVALENCE ressources pr sent es bri vement dans les sections 2 et 3 afin de comprendre leurs points com muns et leurs divergences et d aider leur am lioration mutuelle Section 4 Puis nous mon trons Section 5 en quoi le mod le lexical utilis dans le Lefff permet de mod liser les in formations pr sentes dans l une ou l autre de ces ressources am liorant ainsi sa pr cision sa couverture et donc la qualit des outils de TAL qui l utilisent 2 Introduction au Lexique Grammaire Dans le Lexique Grammaire un cadre de sous cat gorisation d un emploi de verbe plein qui donne sa valence est d fini par deux crit res de base non hi rarchis s nombre et nature directe ou indirecte des compl ments le tableau ci dessous r sume les sch mas de cadres de sous cat gorisation d finis par ce crit re No V z ro compl ment No V NM No V Pr p NM un compl ment No V Ni No No V M Pr p N deux compl ments No V M Pr p Na Pr p N3 No V Pr p Ni Pr p N2 Pr p N3 trois compl ments
4. Ces sch mas sont ensuite affin s selon la valeur des pr positions sont distingu es Pr p Pr p de Pr p Loc Pr p avec et Pr p autres r alisations du sujet et des compl ments nous employons le terme de position pour d signer un l ment N o No correspond au sujet et N i gt 1 un compl ment Une position peut tre r alis e comme une compl tive not e Que P une infinitive not e Vin f ou un groupe nominal not GN Pour chaque N les distributions suivantes sont celles qui sont le plus souvent retenues N Que P Vinf GN ou N Vinf GN ou N GN ces distributions s ajoutent le sujet impersonnel pl onastique r alis par les pronoms il ou a soit No ilimp ou No aimp Les diff rents cadres de sous cat gorisation des emplois des verbes sont structur s en Tables Chaque table est d finie par une propri t d finitoire Parmi les propri t s d finitoires on peut distinguer les propri t s de base de celles qui sont occasionnelles Les propri t s d finitoires basiques correspondent l intersection des deux crit res que nous venons d expliquer Ainsi la propri t d finitoire de la Table 9 est No V QueP 1 No ce qui correspond au sch ma No V M N3 en ce qui concerne le nombre et la nature des compl ments et au fait que la r alisation de N est N Que P Vinf GN Par exemple le verbe dire appartient la Table 9 parce qu il est l
5. DE LA CLERGERIE E amp BOULLIER P 2006 The Lefff 2 syntactic lexicon for French architecture acquisition use In Proc of LREC 06 SAGOT B amp DANLOS L 2007 Am liorer un lexique syntaxique l aide des tables du lexique grammaire Constructions impersonnelles et expressions verbales fig es Cahiers du Cental to appear SAGOT B amp VILLEMONTE DE LA CLERGERIE E 2006 Error mining in parsing results In Proc of ACL 2006 p 329 336 Sydney Australia VAN DEN EYNDE K amp MERTENS P 2003 La valence l approche pronominale et son application au lexique verbal Journal of French Language Studies 13 63 104 VAN DEN EYNDE K amp MERTENS P 2006 Le dictionnaire de valence DICOVALENCE manuel d utilisation http bach arts kuleuven be dicovalence manuel_061117 pdf VERONIS J 1998 Multext Lexicons A set of Electronic Lexicons for European Languages Rapport interne 238
6. O Suj P1 Obj P2 Obj P3 Objde PL Loc PDL Dloc PMi Att PQ Att discutable PP Obl ou Obl2 PM ignor pour le moment 236 Comparaison du Lexique Grammaire des verbes simples et de DICOVALENCE radigmes de pronoms de DICOVALENCE peuvent galement se convertir directement en listes de r alisations au sens du Lefff Toutefois le Lefff ne retranscrit pas ces paradigmes dans toute leur richesse et de l information est donc perdue Elle pourrait ne pas l tre si l on prenait galement en compte les traits s mantiques que l on peut extraire des paradigmes de pronoms Mertens comm pers Mais pour l instant DICOVALENCE n a t utilis que pour proc der une valuation du Lefff pas pour compl ter et corriger ce dernier 5 4 Exemple d valuation les constructions verbales impersonnelles L valuation d un lexique comme le Lefff peut se faire naturellement via l valuation d ana lyseurs qui reposent sur lui travail que nous effectuerons dans le futur Mais une valuation directe par comparaison avec d autres ressources est galement riche d enseignements Pour illustrer le dialogue que nous avons instaur entre le Lexique Grammaire DICOVALENCE et le Lefff nous avons proc d une comparaison entre le Lefff et DICOVALENCE pour les entr es verbales impersonnelles renseign es dans le Lefff partir d ILIMP et donc indirectement partir du Lexique Gra
7. TALN 2007 Toulouse 5 8 juin 2007 Comparaison du Lexique Grammaire des verbes pleins et de DICOVALENCE vers une int gration dans le Lefff Laurence DANLOS Beno t SAGOT 1 Lattice Universit Paris 7 Institut Universitaire de France 2 place Jussieu case 7003 75251 Paris Cedex 05 France 2 Projet Signes INRIA Dom Universitaire 351 cours de la Lib ration 33405 Talence Cedex France laurence danlos linguist jussieu fr benoit sagot inria fr R sum Cet article compare le Lexique Grammaire des verbes pleins et DICOVALENCE deux ressources lexicales syntaxiques pour le fran ais d velopp es par des linguistes depuis de nombreuses ann es Nous tudions en particulier les divergences et les empi tements des mo d les lexicaux sous jacents Puis nous pr sentons le Lefff lexique syntaxique grande chelle pour le TAL et son propre mod le lexical Nous montrons que ce mod le est m me d int grer les informations lexicales pr sentes dans le Lexique Grammaire et dans DICOVALENCE Nous pr sentons les r sultats des premiers travaux effectu s en ce sens avec pour objectif terme la constitution d un lexique syntaxique de r f rence pour le TAL Abstract This paper compares the Lexicon Grammar of full verbs and DICOVALENCE two syntactic lexical resources for French developed by linguists for numerous years We focus on differences and overlaps between both underlying lexical models Then we introduce the Lefff la
8. a t te verbale des phrases suivantes Luc o a dit Marie qu il faisait beau tre malade une b tise 1Dans ces phrases N2 appara t avant N1 en accord avec le fait que les propri t s d finitoires n imposent pas d ordre sur les compl ments 230 Comparaison du Lexique Grammaire des verbes simples et de DICOVALENCE Les propri t s d finitoires occasionnelles servent affiner la structuration en tables obtenue par les propri t s de base Ainsi les verbes entrant dans le sch ma No V avec No GN sont r partis en deux tables selon le trait plus ou moins humain du sujet On peut donc inclure des traits s mantiques sur les N GN dans les propri t s d finitoires On peut aussi inclure des traits morphologiques soit sur le verbe par exemple la table 32RA a pour propri t d finitoire N V Ni avec No GN N GN et V est un verbe d riv d un adjectif voir assombrir gt sombre soit sur un N GN par exemple la Table 32CV a pour propri t d finitoire No V M en Na avec No GN Ni GN Na GN avec N3 qui est d riv d un verbe voir caram liser gt caramel Enfin les propri t s d finitoires occasionnelles peuvent inclure une relation interdite ou autoris e entre deux phrases Par exemple la Table 32NM a pour propri t d finitoire No V Ni avec No GN N GN et o la forme passive est interdite Cette valise p se 10 kilos 10 kilos sont pes s par cette valise La T
9. able 34L0 a pour propri t d finitoire la relation de paraphrase entre N V Loc N et par abus de notation N V de No Des abeilles grouillent dans le jardin Le jardin grouille d abeilles Les propri t s d finitoires basiques et occasionnelles d bouchent sur 61 tables Les crit res nombre et nature des compl ments et r alisation des positions n tant pas hi rarchis s la struc turation en tables peut tre pr sent e de deux mani res i la pr sentation classique o la r alisation des positions est le premier crit re mis en avant qui distingue les tables compl tive ou infinitive 3 N avec N GN regroupant les Tables 1 18 de Gross 1975 des tables sans compl tive ni infinitive V N N GN regroupant les Tables 30 40 de Boons et al 1976a Boons et al 1976b Guillet amp Lecl re 1992 ii la pr sentation de Lecl re 1990 o le nombre et la nature des compl ments est le premier crit re mis en avant Il nous reste pr senter l aspect matriciel des tables Un verbe emploi de verbe satisfaisant la propri t d finitoire d une table est l en t te lexicale d une ligne de la table Une table comporte plusieurs colonnes qui indiquent les propri t s respect es ou non par les en t tes lexicales de la table Les cases de la matrice relient les propri t s aux en t tes lexicales avec des et des 3 Introduction DICOVALENCE DICOVALENCE est un dictionnaire de valen
10. ce verbale pour le fran ais h ritier du lexique PRO TON Van den Eynde amp Mertens 2003 Il a t d velopp dans le cadre m thodologique de l Approche Pronominale cf par exemple Blanche Benveniste et al 1984 Pour identifier la valence d un pr dicat i e ses d pendants et leurs caract ristiques 1 Approche Pronominale exploite la relation qui existe entre les d pendants dits lexicalis s r alis s sous forme de syn tagmes et les pronoms qui couvre en intention ces lexicalisations possibles Les pronoms et les paranoms cf ci dessous contrairement aux syntagmes aux fonctions syntaxiques ou aux r les th matiques ont deux avantages majeurs tout en tant des l ments de r f rence minimale ils sont des l ments purement lin guistiques d nu s des propri t s qui rendent difficile l interpr tation de la grammaticalit d nonc s utilisant des d pendants syntagmatiques ils sont en nombre restreint leur inventaire est fini La valence peut donc tre obtenue sans qu il y ait besoin d un travail d interpr tation l aide d une v rification syst matique et exhaustive des combinaisons entre les diff rents pronoms et le pr dicat verbal Les pronoms retenus forment un ensemble plus large que ce que l on d signe usuellement par le terme de pronom il s agit des pronoms clitiques des pronoms person 231 Laurence DANLOS Beno t SAGOT nels pleins et des
11. d faut et l autre passive dont les arguments syntaxiques seront caract ristiques de la construction passive Actuellement la liste de fonctions utilis es est la suivante Suj fonction sujet Obj fonction objet Obj fonction objet Objde fonction de objet Loc fonction locative Dloc fonction d locative Att fonction at tributive Obl et Ob12 fonctions obliques Une terminologie assez traditionnelle a t pr f r e pour des questions de lisibilit une terminologie plus alg brique comme utilis e dans DICOVALENCE Ce qui ne signifie videmment pas par exemple que toute r alisation d un Objde comporte la pr position de ni l inverse que tout compl ment 235 Laurence DANLOS Beno t SAGOT Les r alisations possibles quant elles sont de trois types pronoms clitiques clitique no minatif cln accusatif cla datif cld g nitif en locatif y syntagme direct syntagme nominal sn adjectival sa infinitif sinf phrastique fini scompl interrogative indirecte qcompl et syntagme pr positionnel syntagme direct pr c d d une pr position comme de sn sinf ou pour sa scompl et de scompl repr sentent les r alisations en de ce que P Le Lefff extensionnel est illustr dans le Tableau 2 On notera que les listes de fonctions syn taxiques dans les entr es active et passive de mang sont pr sent es en ordre inverse Ceci pour simuler d une fa o
12. e Synlex Lefff mais elle est indirecte imparfaite et n cessite une explicitation formalis e de donn es linguistiques sous entendues dans le Lexique Grammaire apport qui n est ni simple ni ais Nous avons donc pr f r pour le moment nous focaliser sur certaines constructions mal trait es dans le Lefff et extraire du Lexique Grammaire les informations lexicales pertinentes pour les y int grer Dans sa version actuelle 2 5 le Lefff a t am lior de cette fa on pour les constructions impersonnelles verbales et adjectivales Sagot amp Danlos 2007 ex traites de l outil ILIMP Danlos 2005 d velopp en partie partir du Lexique Grammaire pour un certain nombre d expressions verbales fig es Danlos et al 2006 En revanche la conversion de DICOVALENCE au format Lefff est plus directe La convergence sur un nombre important de points entre les paradigmes de DICOVALENCE et les fonctions syntaxiques du Lefff rendent la correspondance relativement simple impl menter Les pa introduit par de est la r alisation d une fonction Objde Pour une description plus pr cise voir Sagot amp Danlos 2007 100n notera que le se r fl chi ou r ciproque est consid r comme une r alisation de type cla ou cld selon les cas Les poux se disputent Pierre se laisse cette possibilit 11Les correspondances quelques exceptions pr s sujet des impersonnelles par exemple sont les suivantes P
13. e fran ais de Multext Veronis 1998 pour les noms adjectifs et adverbes lexique dont la libre exploitation nous a t autoris e explicitement par son prin cipal auteur Les informations syntaxiques ont t tout d abord renseign es int gralement la main en profitant au mieux de l architecture deux niveaux du Lefff cf ci dessous Depuis diverses techniques ont t utilis es pour tendre et corriger le Lefff acquisition automatique avec validation manuelle d entr es morphologiques et d informations syntaxiques atomiques TVoir cependant Nakamura 2006 qui a cod les interrogatives indirectes pour la Table 6 No V Que P 1 234 Comparaison du Lexique Grammaire des verbes simples et de DICOVALENCE Sagot 2006 Sagot ef al 2006 corrections et ajouts manuels ou guid s par des techniques automatiques telles la fouille d erreurs dans les sorties d analyseurs syntaxiques Sagot amp Vil lemonte de La Clergerie 2006 et recherche de mots inconnus dans de grands corpus Le Lefff est donc aujourd hui un lexique syntaxique large couverture pour le fran ais Actuel lement en version 2 5 il est enti rement t l chargeable sous sa forme extensionnelle et sera prochainement t l chargeable galement sous sa forme intensionnelle sous une licence libre LGPL LR sur le site internet www lefff net 5 2 Mod lisation des informations syntaxiques Le Lefff repose sur une architecture deu
14. ires dont les passivations possibles passif tre se passif et ou se faire passif Le tableau 1 pr sente l entr e unique du verbe supprimer extraite de DICOVALENCE TAB 1 Exemple d entr e de DICOVALENCE repris de Van den Eynde amp Mertens 2006 VALS supprimer PO P1 VERB SUPPRIMER supprimer VTYPE predicator simple NUM 80500 EX r supprimer une loi r supprimer les obstacles TR afschaffen opheffen intrekken weghalen weglaten schrappen doen verdwijnen PO je nous on qui que elle il ils celui ci ceux ci a P1 te vous qui ceci la le les en Q en que celui ci ceux ci a Seref l un l autre ses c RP passif tre se passif se faire passif 4 Comparaison entre le Lexique Grammaire et DICOVALENCE 4 1 Divergences fondamentales Avant d entrer dans des consid rations scientifiques signalons qu une diff rence majeure entre le Lexique Grammaire et DICOVALENCE r side dans le fait que DICOVALENCE est disponible librement dans son int gralit alors que le Lexique Grammaire n est distribu que partiellement par ses d positaires actuels 2Un m me pronom peut appartenir plusieurs paradigmes p ex nous appartient PO P1 et P2 3 1 y a en moyenne 2 4 entr es par lemme 4On se reportera Van den Eynde amp Mertens 2006 pour une description pr cise de ces termes SEnviron 60 des donn es sont accessibles sur le site http infoling
15. mant D une mani re plus g n rale les verbes peu usit s et les entr es douteuses correspondant des phrases traditionnellement pr fix es par sont consid r s comme acceptables par le Lexique Grammaire alors que DICOVALENCE aura tendance ne pas les conserver D un point de vue m thodologique le Lexique Grammaire repose sur une structuration hi rar chique refl t e par une organisation en tables l inverse DICOVALENCE est un ensemble non structur d entr es La structuration des entr es que l on peut formaliser par un graphe d h ritage n a aucune cons quence pour la r alisation d analyseurs syntaxiques N anmoins une telle structuration refl te des g n ralisations linguistiques pertinentes et facilite le d veloppe ment et la maintenance de ressources lexicales C est ce qui a amen la structuration en deux niveaux du Lefff un niveau intensionnel structur et un niveau extensionnel plat Section 5 2 4 2 O l un empi te sur l autre Nous avons observ deux types d empi tements entre les approches utilis es par le Lexique Grammaire et par DICOVALENCE D une part le Lexique Grammaire fait abondamment usage de l approche pronominale quoiqu implicitement Par exemple le syst me Pr p Loc utilis pour les compl ments pr positionnels introduits par les pr positions de dans sur sous etc est enti rement fond sur la pronominalisation de ces compl ments pa
16. mmaire L valuation s est faite sur les entr es d factoris es une entr e comportant des disjonctions sur les r alisations ou cause de fonctions syntaxiques faculta tives est remplac e par un ensemble d entr es On peut alors comparer les cadres complets ou se restreindre aux cadres fonctionnels liste des fonctions syntaxiques r alis es Au niveau des cadres fonctionnels les r sultats sur les constructions verbales impersonnelles sont les suivants 60 cadres pr sents la fois dans DICOVALENCE et dans le Lefff 160 cadres tous corrects pr sents seulement dans le Lefff et 19 cadres pr sents uniquement dans DICOVA LENCE certains d entre eux nous ont sembl inacceptables certains autres sont la cons quence de difficult s de conversion entre DICOVALENCE et le mod le lexical du Lefff Le Leff est donc d sormais couvrant et pr cis sur les impersonnelles 6 Conclusion L am lioration du Lefff partir du Lexique Grammaire et de DICOVALENCE est donc en cours dans le but d obtenir une ressource de r f rence pour le TAL En ce qui concerne le Lexique Grammaire la pertinence et l utilit de ces travaux reste limit e compte tenu de la disponibilit restreinte des tables Ceci n est pas le cas de DICOVALENCE et nous comptons effectuer partir de cette ressource en collaboration avec Piet Mertens un travail sur les constructions verbales pronominales pour augmenter la qualit du Lefff sur ce point
17. n trop conomique les r les th matiques Nous envisageons d indiquer plus explicitement les r les th matiques TAB 2 Quelques entr es du Lefff extensionnel apprend v pred apprendrez lt Suj snlcln Ob j snlclal sinflscompligcompl gt cat v pers P13s Pierre apprend conduire la conduite imagine v pred imaginer lt Suj snicln Obj snlcla Att snlsalsinflcomme snlcomme sa gt cat v pers PS13s Pierre imagine Marie nue se d v tir mang v pred manger lt Suj snleln Ob j snlcla gt cat v active avoir Kms mang v pred manger lt Obl par sn Suj snlcln gt cat v passive Kms 5 3 Enrichir du Lefff partir du Lexique Grammaire et de DICOVALENCE Le Lefff repose ainsi sur une architecture efficace et un format directement utilisable en TAL De plus ce format est en partie le r sultat d un consensus issu de travaux r alis s dans le cadre du projet ILF LexSynt Nous avons donc commenc enrichir le Lefff partir du Lexique Grammaire et de DICOVALENCE ce qui demande une connaissance approfondie de ces deux ressources tant donn les divergences entre les mod les lexicaux sous jacents Il n est pas possible de convertir directement au format Lefff les informations lexicales pr sentes dans le Lexique Grammaire Les travaux de Gardent ef al 2005 effectuent une telle conver sion pour les tables distribu es d bouchant sur le lexiqu
18. ndre dans quelle mesure elles s harmonisent et ou se compl tent En conclusion ces deux ressources doivent imp rativement tre harmonis es et mutuellement enrichies pour obtenir une ressource lexicale compl te du syst me verbal fran ais Nous nous sommes attaqu s cette t che avec l objectif d enrichir une ressource destin e au TAL C est ce que nous allons d crire dans la section suivante consacr e au lexique Leff 5 Le Lefff pr sentation et enrichissement 5 1 Historique Le d veloppement du Lefff a commenc en 2003 partir du constat suivant cette poque il n existait pas de lexique syntaxique pour le fran ais qui soit librement utilisable et dont la couverture soit importante La construction d un tel lexique a donc t initi e au sein du projet Atoll de l INRIA par Lionel Cl ment avec le double objectif qu il soit adapt au TAL tout en restant linguistiquement pertinent Dans un premier temps le Lefff s est limit un lexique morphologique des verbes du fran ais acquis automatiquement et valid manuellement selon une technique originale Cl ment ef al 2004 Sagot 2005 C est le Lefff 1 distribu depuis 2004 Dans un second temps le Lefff a t tendu l ensemble des cat gories tout en devenant un lexique morphologique et syntaxique L extension toutes les cat gories a t faite manuellement pour les cat gories ferm es et l aide du lexique morphologiqu
19. pronoms dits suspensifs qui regroupent ce que l on appelle habituellement pronoms interrogatifs et adverbes interrogatifs ou ind finis comme qui quand Sont ga lement pris en compte les paranoms qui se distinguent des pronoms par leur modifiabilit rien modifi dans rien d int ressant et l impossibilit de reprise par un syntagme il ne trouve rien les indices vs il les trouve les indices Les combinaisons entre pr dicats et pronoms induisent des paradigmes de port e globale Cer tains correspondent peu pr s aux traditionnelles fonctions syntaxiques PO je tu il elle qui correspond la fonction sujet l exclusion du il impersonnel P1 la fonction objet direct P2 la fonction objet ou dative etc d autres permettent des distinctions plus fines que dans d autres approches PQ paradigme de quantit PM paradigme de mani re etc DICOVALENCE proprement dit se pr sente comme une liste d entr es correspondant chacune un emploi d un lemme verbal Sont tout d abord donn s l entr e et son type pr dicateur simple verbe adjoint verbe auxiliaire verbe copule verbe de dispositif construction r sul tative Suivent alors les diff rents paradigmes qui d pendent du pr dicateur les termes de valences avec pour chacun d eux la liste des pronoms et paranoms qui peuvent en tre la r alisation Sont enfin indiqu es certaines propri t s compl menta
20. r les pronoms y en o l ici etc De m me la distinction entre pr positions et compl menteurs pouvant appara tre devant les infinitives repose sur les propri t s de pronominalisation tout comme le ph nom ne de chute de la pr position et de ce devant Que P Ainsi la table 8 regroupe des constructions du type No V de ce Que P 1 Luc doute de ce que Marie parte et du type No V Que Phi Luc doute que Marie parte gr ce la pronominalisation en en et en de cela de la compl tive qu elle soit ou non introduite par de ce D autre part DICOVALENCE ne se limite pas strictement l tude des r alisations pronominales des actants verbaux Par exemple le pronom a peut pronominaliser une compl tive l indicatif ou au subjonctif mais aussi une infinitive une concessive ou un interrogative indirecte DICO VALENCE est donc oblig de sp cifier les syntagmes dont a peut tre la pronominalisation Ceci est fait par une mise entre parenth ses du type de syntagme correspondant a qpind a qpsubj a inf etc Le cas ch ant l identifiant de r alisation syntagmatique est assorti d un compl menteur a de_inf a _inf a de ce gps etc 6Des consid rations parall les au niveau des grammaires ont induit le d veloppement de la notion de m ta grammaire description grammaticale structur e et factoris e permettant la g n ration de grammaires classiques 233 Laurence DANLOS Beno
21. rge coverage syntactic lexicon for NLP and its own lexical model We show that this model is able to integrate lexical information present in the Lexicon Grammar and in DICOVA LENCE We describe the results of the first work done in this direction the long term goal being the consitution of a high quality syntactic lexicon for NLP Mots cl s lexique syntaxique Lexique Grammaire DICOVALENCE Lefff Keywords syntactic lexicon Lexicon Grammar DICOVALENCE Lefff 1 Introduction l heure actuelle il existe deux grandes ressources lexicales syntaxiques pour le fran ais d velopp es depuis de nombreuses ann es dans des laboratoires de linguistique le Lexique Grammaire Gross 1975 Boons et al 1976a Boons et al 1976b Guillet amp Lecl re 1992 et le dictionnaire DICOVALENCE Van den Eynde amp Mertens 2006 L objectif de cet article est de comparer ces deux ressources lexicales afin d en tirer le meilleur parti et de l int grer dans le Lefff Lexique des Formes Fl chies du Fran ais Sagot 2006 Sagot amp Danlos 2007 lexique syntaxique destin au TAL et en cours de d veloppement Nous nous limitons ici aux seules 229 Laurence DANLOS Beno t SAGOT entr es des verbes pleins c est dire ni fig s ni supports d adjectifs ou de noms pr dicatifs le Lexique Grammaire et le Lefff comportent des entr es pour les verbes non pleins et des entr es non verbales mais ceci n est pas le cas de DICOVALEN
22. s Gen ve Droz CL MENT L SAGOT B amp LANG B 2004 Morphology based automatic acquisition of large coverage lexica In Proc of LREC 04 p 1841 1844 Lisbon Portugal DANLOS L 2005 ILIMP Outil pour rep rer les occurences du pronom impersonnel il In Actes de TALN 2005 Dourdan France DANLOS L SAGOT B amp SALMON ALT S 2006 French frozen verbal expressions from lexicon grammar to NLP applications In Actes du colloque sur le lexique et la grammaire 2006 Palerme Italie GARDENT C GUILLAUME B PERRIER G amp FALK I 2005 Maurice Gross grammar lexicon and natural language processing In Proc of the 2nd LTC Pozna Poland GROSS M 1975 M thodes en syntaxe Paris Hermann GUILLET A amp LECL RE C 1992 La structure des phrases simples en fran ais Les constructions transitives locatives Gen ve Droz LECL RE C 1990 Organisation du lexique grammaire des verbes fran ais Langue Fran aise 87 NAKAMURA T 2006 Lexique et grammaire des interrogatives partielles en fran ais tude des verbes une compl tive directe PhD thesis Universit de Marne la Vall e SAGOT B 2005 Automatic acquisition of a Slovak lexicon from a raw corpus In Proc of TSD 2005 LNAI 3658 Springer Verlag Karlovy Vary Czech Rep SAGOT B 2006 Analyse automatique du fran ais lexiques formalismes analyseurs PhD thesis Universit Paris 7 SAGOT B CL MENT L VILLEMONTE
23. syntaxiques compl mentaires contr le attribution im personnel Les fonctions syntaxiques ne sont utilis es ni dans le Lexique Grammaire ni dans DICOVA LENCE mais les notions respectives de position et de paradigme s en rapprochent Elles sont d finies dans le Lefff par des crit res proches de ceux de DICOVALENCE d velopp s au cours de travaux de comparaison et fusion avec le Lexique Grammaire et DICOVALENCE en particu lier sur les constructions impersonnelles cf Sagot amp Danlos 2007 mais galement au cours de travaux non publi s en collaboration avec Claire Gardent Ces crit res reposent sur la sub stituabilit en prenant en compte pronoms ef syntagmes sur le principe de r alisation unique d une fonction syntaxique pour un pr dicat donn et sur l identification de la fonction par un paradigme de pronoms l exception des cas partage d arguments c est dire les attributs 8Le passage de la forme intensionnelle la forme extensionnelle est galement un passage d un lexique de lemmes un lexique de formes Ceci permet certaines formes d indiquer des modifications dans leur structure syntaxique par rapport la structure par d faut correspondant la classe syntaxique Ainsi bien que le conjugueur ne construise qu une forme pour le participe pass d un verbe passivable le lexique extensionnel comportera deux entr es pour cette forme l une active avec le cadre par
24. u univ mlv fr Pour les verbes pleins seules 41 tables sur 61 sont distribu es Ceci emp che d avoir une vision globale sur les entr es d un verbe donn certaines entr es pouvant faire partie de tables non distribu es 232 Comparaison du Lexique Grammaire des verbes simples et de DICOVALENCE Deux strat gies diff rentes ont t mises en uvre dans le d veloppement de ces ressources DICOVALENCE se concentre volontairement sur les verbes les plus fr quents 3738 lemmes et pour ces verbes sur leurs emplois les plus fr quents 8313 entr es A contrario le Lexique Grammaire s est lanc dans une qu te sans limite d exhaustivit l int r t discutable aboutis sant 6500 lemmes d crits par 13 375 entr es titre d illustration la Table 31H des construc tions de type NE V comportait 129 entr es dans l annexe de Boons et al 1976a cette m me table qui fait partie de celles qui sont distribu es librement comporte aujourd hui 626 verbes dont certains lemmes peu usit s tels que bovaryser calancher se curedenter ou faon ner Au niveau des entr es la m me exhaustivit est recherch e dans la table 9 non disponible sauf dans Gross 1975 qui rappelons le a pour propri t d finitoire No V Que P 1 No inclut des verbes tels que bourdonner bramer chuinter coasser couiner croasser cr pi ter ou gargouiller ces entr es sont analys es par fusion bramer dire en bra
25. x niveaux i un lexique intensionnel o l informa tion est factoris e au maximum qui associe chaque lemme une classe morphologique et une classe syntaxique c est ce niveau qu est fait le travail de d veloppement ii un lexique ex tensionnel obtenu partir du lexique intensionnel par compilation qui associe chaque forme une structure repr sentant explicitement toutes les informations linguistiques associ es c est ce lexique qui est utilis par les analyseurs Ci dessous une entr e intensionnelle pour le lemme manger et une entr e extensionnelle pour la forme fl chie mange manger v er std verbe_transitif_direct mange v pred manger lt Suj snlcln Obj snlcla gt cat v pers PS13s Au niveau intensionnel les informations syntaxiques sont donc d crites l aide de classes syn taxiques d finies par h ritage de propri t s syntaxiques atomiques propri t s elles m mes d finies de fa on ind pendante de la d finition des classes Au niveau extensionnel le cadre de sous cat gorisation d une forme donn e est constitu d une liste de fonctions syntaxiques cha cune indiquant les r alisations possibles de cette fonction ainsi que le caract re obligatoire ou non de sa r alisation indiqu par des parenth ses La structure syntaxique compl te outre le cadre comporte le cas ch ant des macros introduites par qui repr sentent de fa on im plicite des informations
Download Pdf Manuals
Related Search
article articles article furniture articles of incorporation articles of organization articles of confederation article 15 article summarizer article 92 ucmj article 134 ucmj article 92 article 134 article 2 of the constitution article 1 of the constitution articles of association articles of organization llc article 19 articles in english article 80 article furniture reviews articles of incorporation ny articles of organization florida
Related Contents
Accu 45 Accu 60 Accu 75 Accu BS 60 - WOLF Nortel Networks 5000i User's Manual 取扱説明書 /A1305SA Wine cellar Bodega USK WCL 20629 115V~130W SNMP Web Card.book Copyright © All rights reserved.
Failed to retrieve file