Home

Modèle de structuration des relations lexicales fondé sur le

image

Contents

1. Luv seysnes Luv 4 p sues n Luv ep 3 qo sawed s anuaye s iasiede s aipues6 nioip3e s 6 ouepu d p suoryed red sostuesio ANNONVY Sy e olloo 01 8 omsty zTu do uo2 p z T squeqoe p t gza do e Z 21 2 21 211 szuepe iedonesanou q ga do o2unsnbi7 snuiwp iqsne Q2un4ju0DSsneD sn dp idsneo JIUEWTULEAUON JiuewWTuul d Tle u TH dQUON T szuepe 2 g zs snuly p sqd ul snidp sad ul lal uepe T s l nue e s in 3 nns sanbnewbejuis suonel q A Z 316 31 YNOd A uuosi d VT SH3AN3 X NPIAIPUI 1 30 3NDnONVu 205 5 4 Perspective sur le syst me de fonctions lexi cales orient e sur les parties du discours 5 4 1 Objectif Nous mettons en avant une troisi me perspective pour l organisation du syst me de FL centr e sur les parties du discours Celle ci offre la possibilit d organiser les FL en fonction des parties du discours associ es leurs mots cl s et valeurs et permettra ainsi d effectuer des requ tes orient es sur les parties du discours des lexies en jeu dans une relation Il est possible par exemple partir de la lexie TETU d acc der l ensemble de ses d riv s s mantiques et collocatifs organis s de la fagon
2. e s u uuulo x v l Tzf soiz LiadQdasu A Ans 11 U S auley as e A N s rned s f msl waquioz II nvapsvf aiwesedde aiqounddd uoabsnog X ans X N uiKuod H asnaoiag T I uosumpto od Ho ui uo joH 24499 anbuguas uu 2901411056 nal quo d ym s 0 suep 495592 x Luv op T II aweqv Uuedouly qesedsip 52990 0oun uly 4J UUO IDUOJ JudjQUe pof ayp4q Oe 4uUIY quene alyeg 1004 asnoy se4o s ns Dane lAlns 3s X N AN usu IT s d 1Ty5e4 ano ua A 4nod 1 4 J T 202000 Ty5e4 ino us A nodsusu FAN 97244079 t12e4 N ans 3s x N d ffzo unol 10q0 T35e4 2314210 vs LS0p 8046 anvf 8601 2 1042 3995 490196 d du 1079 4035e 4 1398 3s 42 04 s n0d 0 DeY N 4ed 459 N u2uaaund 1 1 Atu 1qo p
3. g podde e inb alpnya Inb 2u l5S e Zuossxod aipnyg inb eT fowts9 UOILIUUOIIIIUL ep qvoddns aisdoznv aspuas anod X sed Sip i yoddey nbuy pu g a1quu Jadde uo nb uejaddey abvanvs e pupupo asennes 6 UA ink pueis ASIA IZn f ap dnoo A m 1 fpe usion ua AA l no y ns InO snoss p np 1 uo no p snoss p u Ano41 s InO sspd 1 1 27 jiueuneq un p s 1uod s 1no1 anod yas Ind aun uano e Yas Ind aljguaf ap zfl pubtod ay v y aun auano e Yas NO A1N9904999900 p 7 a9ub10d sanoJ xnap UN p ss 1iA 4 l943u02 e Yas INY aromus apupia ap yunou as nYo uowssaid qZ T 249t1q llil 3anoq un p uou ne uuo1 un p ink pA090Q ap 3ue ui un p quairoid n 1 p 5o uov uollue un p ssod Ing aqupwupfur ap uoneindas ej e ynu pavun aBennes e l e sed ya au NO qojd 4 Y iu
4. qrodsuva sed n1o Jj Hodsueij ASN s uodsunuq 71524 I9SLINDLY 1224 O HOIPUS OS O N 8 uorponp u z 9 Opu p N u 18 sunod EN ur oo nbianu 12e3 9 ne p npu 1 yl o med v l 196vfon 1990 d29p as 4210 Zjeay A NPIAIpUl quawanbsoquia z eeytTiedai4 NPIAIPUI OS p40q D ins suep pioq g uow 8 Vo Lav a1puaid tjesyTieds1q NpiAipul N ans do abun aupuaud sau D haod LIND 19097 SILLDUD s 19n6107 sappiasoddp 05e desu UOT3EST131 3u uruuorjouo A Lav op 6 2 Lav in 9 d n u99u0 0ounjJJsne u srx UOT26ST 9 UOT 6 MNe A 6 ELNHTVENZAZ NOLLOV A sabosspod uoginuy 1911009 uu uu In ANS s q qolfuu sioanvu uognuy A17e ZJU A LTIOU ap pnboo quad useyiuy QUST o qley sob punish use 911SUu9Jur 9140 isu qur p uorjeoureno A SALLVOLATIVnO A 191 s nbryueurgs s sser red s stue3S1Io AVALVE SUOT YTOY 9 G oINSTY Lav op 0 ounjuijg s
5. anbuol aynbatf Rasaf ivyyoip sany p obuvo aanjb asiug abung ayonow noazng 200 odAH soutAuodAP A AIANASNA LNANATA noapo fnbs uownosvquia anbsvg JO 4 4 Luouvbrnnu uibua_ nvossina qu tunpq zin UASO HONATVAINUA AVALVA 190 Luv s squos auf puof sod samo 0ljoej1 qvuijsneo ray 422ond t Lav ms s nbiavu Tie v Lav 4 nolfu 0Y 0 aapaw 019e3T qvuijJnbiq N 9p quawanbsoqua zZjeaysedas uosIP31e2 AN P q y Ie 3 d 405 05 mv 0oun3u q0S Ins suep pioq ASN vanbunqua uabunyo Zjeaysedaig A uosie31e2 aboifnou samo Qoun4ul4 N ms Lav wanoysa 019eg1 qvuiqT1sneo N msl 6pnotj 035e4T lqvu 30S N ans wanoysa s 01oejJT qVu j u six p urq uonrredsIGT A LTD 1 g un quld ul JAY 1 ANS uino1 1 s D D yand 0102ejJuogiluvy 0128 H ARUV uor yepe S GT A Iuav op uoypmowugowwu ap Nyo 61 N ur oor 2102983 auzpf u9llumouu 19790 19780990 012ejJu j lt 34od gt o1do1d woN s y no mod ne sanasan 0226 01 LINUD 4IIUDIDQ s i9so N 42p40q0 nne un p 3uo uuonisod s
6. 8 aun juepuad szepjos s p sed situtuo2 3s Ind n f np gpf p rpu ul un sed sne 159 tumN uo5vm M ajquiasua suep uoljsod unN e e 459 n x n x ppow ru p adnl y sow xne nbsnf pu s p ind znouab no xnou 8 xne nbsnf pu s p ind Y uobpm sa Sessed s l anod xnesaiu ayodwos puos no dotjo puoi uuoj aun e mo doqJo nauiod uuoJ aun e ul y ap qanq se uuoj aun e 46 10 uoinl uoiByas e 121 e 7092729 K luo oA ej 43 eui n l e 7190U09 UIJEW n l e sfayo T I1 21 020q siued xn p sJ u2 s l a4jua nai e n x n x n x n x n n x n n x anbiprinl T 11 2712020Q xneunqu s 1ueA p n l e ini INI d ap lt aduejsisuod e gt 12edse e jury e8ei ey e n n x ezl ny ssn si ian e InDx syd o uuuuo2 sild s p e Ind paano uobom A sayuge anod 40 un siosed sap e InO 122105 nvadoyo lielos s anod x n assvyo ap nvadoyo h sseu anod x n anb asipueyssew ap op qZuoxnosi quoo Xx
7. FF T S SS T sre gue JONGIOA nbuueur s sonbryeusequds sonbt ouepu d p soydeis s pgi eusipered sofeorxoy S OU SSTEUUO SNOS 116 oydeIs u pi suoney r GZ sniq Jo s fr n x quo SUOTJEOI s p 3 NDUIIAI s rp o SoTROIXeT s run OIJUO qg 1 suomnse r sorped mnu Ins qouue sndio5 nbixe u4s 4 suor un qg oun yo T 1 suoner n s rpv s p onbryweurgs stepsue Jo Nowues u ruols stesuedy jousedso JoNpIomM pueur re omy suep sonbryeursey jousedso AION SINOD SUOLI u s s nbiyeur rpered srep JONPIOM stp np s rred ormurAuoque rurKuo s rf nad uo suonei s nbusrm3uroq ueu om4 Inod xne s r snos oryenb 1adAy 31 s eSrx suorey n Asd stepsue 1 N P30AA aIN JONAS SO9HIJUOPI SUOIFEIOY s p 91NJEN nbrio u1 uorysod s enSuerT WoON 56 SoT OUUOTY TOI SOJUOIXO s 52Inoss r Sop uosrereduroo Z Nes qey rurKuoyuse yo rurKuou s Jnes suon
8. selon le premier r gime il est possible de dire bagarre entre N et N cause de Z si Z est la cause de la bagarre leur bagarre cause de Z si Z est la cause de la bagarre bagarre entre N et N pour Z si Z est la finalit de la bagarre leur bagarre pour Z si Z est la finalit de la bagarre selon le second r gime les actants de BAGARRE a peuvent tre exprim s comme suit bagarre de N avec N cause de Z si Z est la cause de la bagarre sa bagarre avec N cause de Z si Z est la cause de la bagarre bagarre de N avec N pour Z si Z est la finalit de la bagarre 2Prep propos d signe une expression de type pr positionnel exprimant grosso modo le sens a propos de par exemple propos de au sujet de concernant portant sur sur sur la question de 28 sa bagarre auec N pour Z si Z est la finalit de la bagarre Nous insistons particuli rement sur les relations lexicales repr sent es dans le DiCo Dans le cadre de la LEC deux grands types de relation sont consid r s d une part des liens paradigmatiques ou d riv s s mantiques d autre part les expressions syntagmatiques ou collocations Si la notion de d rivation morphologique est bien connue et d finie comme une relation a la fois s mantique et formelle entre deux unit s lexicales relations du type fumer fumoir nom de lieu effondrer effondrement nom d action noir noircir verbe causatif
9. 44 47 assis n 59 525 757 59 2 7 FL exprimant les relations s mantiques se d t riorer et r parer 62 EROE 72 Ban eee os 73 80 3 4 Typologie de l encodage traditionnel 92 3 5 Liste des FL pr sent es dans Zholkovsky et 1970 93 104 1227777 106 4 1 Classes s mantiques de FL associ es aux lexies tiquet es animal 121 2222 148 146 4 4 Les vingt l ments de cadre les plus fr quents dans FrameNetl 147 151 021 152 5 1 Classification de Steele et Meyer 1990 163 5 2 Classification de Grimes I990 164 5 3 Classification de Alonso Ramos et Tutin 1996 165 54 Fiche de la FL Sioc dans Alonso Ramos 1993 377 169 dies t pais a 188 191 ses z 19 boi s s eee Be cae m s Be Bee Bee 19 0 5 10 Collocatifs de RANCUNE organis s par patrons de d pendance HA 7 204 5 11 Correspondance entre les parties du discours profondes et les par 2775 208 5 12 Structures syntaxiques profonde et de surface de Marie casse les sss 209 be yee 00027 212 D 0 CO 5 14 Liste des cibles communicationnelles vis es par les FL 221 5 15 Relations lexicales de RANCUNE organis es en fonction des cibles 1168077 222 KT Systeme de FL repr sente sous forme de tablo de domes 220 234 242 253 6 5 Fiches de trois lexies potentielles CR
10. snan3uo7 qajanboo boo 914 2491q anod gsijiin yu nud po yez uo s op e sssaiaqui s Inb nbuqez nb UILLI TIIZfF94491 queuqey 251199 Pez ne 1eD ap puos queuwuny us ynpoid X anb puoi ap uuoj ua eftasons dnoone q 1ueu l1uo2 esipueli4 uoynonu eT UOPNOW ne eui wwo silin nead asnsinoy Lspib q pupuno aBene3 sed ynpoid loj auuaryo uarya ajjawa4 DUDI np tu jJ 4 dvup seuuosiod xn p sed jueweueznuuis si i3n n 4nod 31e4x dpsp auuosied n s aun Jed si ian n anod 1124 map psvubsod uo suep mq pn1g III7ZZ u is pmqo 1490109 pivuno 5 ds3 wobom juasuew sisSessed sa nb anod dinbj 1 uobpm yu unop sueBessed s l nb anod dinb3 q npano s d e
11. d livrer non marqu lib rer officiel procurer poulet non marqu petit de la poule vieilli billet message minet enfantin chat fam homme l ger r pulsif sp c relatif la force de r pulsion soutenu qui cr e du d go t Tableau 6 I Distinction de deux lexies l aide des marques d usage fam et p jor enfantin affectueux cocotte femme l g re poule surnom affectueux donn une fille femme non marqu offic sp c train v hicule pour le transport ensemble de directives ensemble des pneus d un v hicule non marqu fam vulg crever percer prouver un sentiment mourir intense Tableau 6 11 Distinction de trois lexies l aide des marques d usage 6 4 5 tiquettes s mantiques 6 4 5 1 Pr sentation Chaque lexie du DiCo est s mantiquement caract ris e par une tiquette s man tique Il semble donc a priori possible partir d une lexie d crite d inf rer l ti quette s mantique de ses synonymes et de ses quivalents s mantiques verbaux nominaux adjectivaux ou adverbiaux Une telle g n ralisation peut galement tre faite partir des genres prochains des d finitions lexicographiques de n importe 241 que dictionnaire ou base de donn es lexicale o D duction de Petiquette s mantique via les FL d quivalenc
12. corcer peler s parer d pouiller nettoyer d cortiquer A plucher d piauter corcher Figure 2 6 Unit s lexicales verbales li es ECORCER organise dans un continuum l hyperonymie hyponymie et la similarit intra et inter domaine A partir de ces donn es leur objectif est de confectionner un dictionnaire refl tant ce ph nom ne Comparaison avec la LEC et les fonctions lexicales Nous voudrions formuler certaines remarques par rapport a ces travaux I nous semble que les fonctions lexicales de la LEC sont capables de r aliser un travail tout fait similaire Les deux approches rel vent de paradigmes diff rents alors que la LEC adopte une approche lexicologique les exp riences de Duvignau et Gaume se placent dans une perspective plus cognitive D apr s les exemples de 60 m taphores relev s Duvignau met trois hypoth ses 2004 p 161 1 il existe des concepts d action comme DETERIORER ou RE PARER 2 ces concepts v hiculent leur intension l essentiel de leur significa tion a travers des expressions linguistiquement vari es 3 ces expressions linguistiques r alisent gt l essentiel de la signi fication du concept dans des champs semantiques diff rents qui renvoient 4 des types d objets sp cifiques papier voiture mai son et parfois des domaines d activit particuliers m canique batiment Puis elle r partit les
13. l inverse les mod les purement relationnels envisagent l unit lexicale comme une unit atomique dont le sens se d finit par les relations lexicales qu elle entretient avec les autres unit s du lexique Ces mod les ne fournissent pas de d composition s mantique des unit s lexicales ils ne consid rent pas que le sens fait partie des unit s lexicales mais qu il se situe parmi elles On pourrait galement qualifier ces 13 car ARGI1 x vehicle ARGSTR D ARG y person D ARG z person 1 el process EVENTSTR m E2 2 transition FORMAL X QUALIA CONST wheel TELIC drive E1 Y X AGENTIVE create E2 Z X Figure 2 2 Description de l unit lexicale CAR dans le lexique g n ratif jovsky 1907 approches de holistes Murphy 2003 104 puisqu elles consid rent le sens comme mergeant du syst me relationnel d une langue le sens d une unit lexicale tant d pendant des autres unit s lexicales avec lequel elle entre en relation Ces deux approches ne sont pas incompatibles Il existe des approches mixtes qui reconnaissent le besoin de repr senter le sens des unit s lexicales de fagon indivi duelle tout en maintenant la n cessit d une repr sentation explicite des relations lexicales C est le cas par exemple du mod le de Crusel 1986 qui consid re que les relations syntagmatiques et paradigmatiques contribuent au sens des unit s lexi cales ou de la LE
14. suep jueanod as x 20 ayuom ovo X ap q ss Pu bo ubol s g q ps sunazd n donbiq ynepinbiq aspia yvgsru assiesedsip nb sasned A x 490949 11452090 0oun 42 Inbiq tuy eziuopsi oaio 0dun4nbry juawasesodwa q ss dlez ub sav vausazua IZ nods 0ounjnbi1 loJed ap un assiqns nb s sne Pu bo ubol suv naud iosed 0ye4nbiq ae uos apIA as anb s sne lubol uv sazfuobap noud ae 035enb17 uou adpuad YObH uUbH Luv T IZnofin2 035ejJnbiq 242909 T faunqura0 Tie aqe ubb saddesy anod A Jeune anod s sin x 8 ZA N T 2 9 eTeasqe 7 cA anano anod s sin x ove ZA N uno 114279 CTesigeT Iano A m ui x Luv op AN sunu 7 anbnq ZT easqeq au20714 197 WI o asned 2439 A P KEN ydus row 1tioqe N ans Ano4 s N 4 quesii3n ua yobb x lt no nvaznood aysu suep sawe x uo e fa1n6 Tyeaydaouy XXII 28019 1e1So enbidA uos un 41988009 ap tt
15. UO NO ioipuq LJDADU 4911u01J9 PNIJSUOD uo Woupuy uv uns supp o poq 9 907 NOLLVSITVOOT A 192 5 3 Perspective combinatoire sur le syst me de fonc tions lexicales 5 3 1 Objectif Cette section pr sente les objectifs vis s pour l organisation des FL en fonction de leurs propri t s combinatoires Nous envisageons ici une relation entre un mot cl et sa valeur par le biais d une FL du point de vue de leur configuration syntaxique l un vis vis de l autre Une telle organisation permet un acc s aux patrons de d pendance syntaxique ind pendamment de toute autre information Classifier les FL en fonction de leur patron de d pendance syntaxique facilite la s lection d une FL lors d une requ te sur les diff rentes relations associ es une lexie donn e Par exemple sous la lexie MEURTRE on observe les relations syntag matiques suivantes Syntagmes dans lesquels MEURTRE subit une modification syntaxique Magn atroce affreux brutal horrible inqualifiable odieux A2Prepar avec pr m ditation pr m dit Syntagmes dans lesquels MEURTRE est un actant syntaxique Oper accomplir commettre ART tremper dans ART CausOper pousser N X au Real enqu ter sur ART P Real lucider ART Real punir ch tier venger ART Prepar comploter pr parer pr m diter ART Ce type d organisation des collocations a un
16. ap TI T mow e sasuad yey inb yobs 24614 21622 Sel d inb Pu b l pions e4fauons 1008 e inb yobs n2910 q 207 aduejsisuod no 15 dse e inb Pu b l ua 2720792 ap ej e inb Pu bol anourinf autuof ap lt 1908 gt ue sisuo ej e inb yobs umuobin gb adqun ana tuv op s z p saufuo2 queynsas uonedijqng uoyvry ap sul s p e 2 192q 188ue1 e SIJULLD TND T 241991 ouen8 Us uue un p s 1An04 94098 suep A X 1ed snuaigo squio4 27946 z 21quu ine due sues ney 10114 no bo ap puelA aseq e Pld ep q nvoubr ap aseq e 1e d j 1090n0 jinos e ap 3u ul lliqeu p adalq UOY 101 9 ap an qo uom anbeyo ap elued agubiod uo anb ap suno sed inns sanooseq nb 21qu0 jaysesed and jua np aysesed XXV11 nq p purqos sed ap 1u uu no2 p ss 1lA upmos guna nbid43 q vl Ao awuuiofrun 1 4n9990 ap sjuawaje 910146 281199 ap TITy r ddo an ue un an
17. A N SdoAuo doig INV 191JUOU to3s jrueur jue Tua Lav gl s p Luv oirejsiqes tesy sues n LiS9dOuoN IZ N mod A N Jopres amp LadQiuo7 A N Luv s rnum e H dod ui A N 4 INV Itquossor Inou Tudo Iy3ueud l lejqy luornejouuoT yu smpur lejqyauy Jotunouei e el T lqy Lav red 91049p op ut d Ty usen LNVLOV AAINAUA HTAIO lt JOUR S 19nU9328 8 T srede S 2 3 9101998 sniqp sqd ul 9701998 994989 OPINOS Vonersepueut2 AU V nmsnlur G Anuy oUITIS 43A TH TA fiq f pur yn A qqemp nSuoy ue z s 990197 apuojoid use DOUPSSIEUUOIOI Ilu 9 oysourus Jyu urru ss r 92 410 41810 lt 923 5 6 Conclusion A partir du constat que les classifications des FL ne sont que partielles nous avons postul une organisation plus riche des FL sous la forme d un syst me dont nous avons d taill les caract ristiques Ce syst me repr sente l ensemble des FL selon un rapport diff rentiel et permet de faire ressortir leurs similitudes et diff rences et ce selon plusieurs points de vue Les perspectives d organisation du syst me correspondent plusieurs inform
18. Juri Apresjan Igor Boguslavsky Leonid Iomdin et Leonid Tsinman Lexical Func tions as a Tool of Etap 3 premi re version du texte Dans Proceedings of MTT 2003 Paris 2003 Jury Apresjan Igor Boguslavsky Leonid Iomdin et Leonid Tsinman Lexical func tions in NLP Possible Uses Dans Computational Linguistics for the New Mil lenium Divergence or Synergy pages 1 11 Heidelberg 2000 Beth T Atkins et Alain Duval Robert amp Collins Dictionnaire Fran ais Anglais Anglais Fran ais Paris Le Robert Glasgow Collins 1978 Lucie Barque FrameNet et le traitement de la polys mie Journ e d tude de PATALA 13 mai 2006 Maria Auxiliadora Barrios Rodriguez El dominio de la funciones l xicas en el marco de la teor a sentido texto These de doctorat Universidad Complutense de Madrid 2008 Pascale B langer Exploration des liens de condensation pour le r sum des textes grace l application des formalismes de la th orie Sens Texte M moire de mai trise D partement de linguistique et traduction Universit de Montr al 2003 Pascale B langer et Richard Kittredge Paraphrasing with Space Constraints Linguistic Operations in Journal Abstracting Dans Proceedings of MTT 2005 Moscou 2005 Morton Benson Evelyn Benson et Robert Ilson The BBI Dictionary of English Word Combinations John Benjamins Amsterdam Philadelphia 1997 264 Jean Binon Serge Verlinde Jan van Dick et Ann Bertels D
19. cycliste Az mepris couvert de dans les FL verbales Les FL de type Oper et Reali i prennent le mot cl comme compl ment d ob yet direct L indice signifie que le sujet grammatical de la valeur correspond a lactant syntaxique profond du mot cl Dans les deux exemples suivants le pre mier actant de la lexie ABOIEMENT de type s mantique lt animal gt correspond au sujet grammatical des verbes METTRE POUSSER et LANCER Oper aboiement mettre pousser ART lancer ART s en direction de N Z On note que les FL telles que Oper 2 sont une invention du DiCo Elles servent distinguer les verbes supports bi actantiels des verbes supports tri actantiels Cette question a t trait e notamment par 2007 L indice 7 s il est pr sent indique que la valeur prend un second compl ment correspondant l actant syntaxique profond 7 du mot cl Ainsi dans l exemple suivant Real 2 colle II question poser soumettre ART N Y le premier actant de la lexie COLLE II est le sujet grammatical des verbes POSER et SOUMETTRE et son second actant le second compl ment de ces verbes Les FL de type Func et Facti prennent le mot cl comme sujet grammatical Par cons quent les indices actantiels et renvoient aux premier et deuxi me compl ments du verbe par exemple Facto piste I1 mener N Y N X 3Se reporter la sect
20. de la d finition de ACCUSER I 1 et apportent une pr cision suppl mentaire la FL Ver Ces notations forment avec elle deux FL qui doivent tre respectivement interpr t es comme De fa on justifi e et De fa on explicite 16 a Vern ir accuser 1 1 raison justement b Vermanigre accuser7 1 1 ouvertement tout haut Suivant le m me sch ma les indices des exemples 17b et 17a fonctionnent comme des pointeurs vers les composantes de sens origine et destination de la lexie CANALISATION dont la structure actantielle est la suivante POUR LE d placement X DU liquide DU gaz Y DE l endroit Z l endroit W 17 a Involvorigine canalisation partir de N Z b InvolVaestination canalisation se d verser dans N W 88 5 FL semi standard Les FL semi standard recouvrent sans doute l ensemble le plus h t rog ne de for mules de FL Dans tous les cas les elements ajout s aux FL standard servent apporter une pr cision s mantique qui n est pas repr sent e par la FL standard Ces notations renvoient elles aussi aux composantes de la d finition de la lexie auxquelles elles s appliquent Cependant le processus se fait non plus en mention nant le type de composante comme plus haut mais en pr cisant une information sur cette composante Dans les exemples suivants on trouve des pr cisions sur la mani re 18 l aspect 19 la localisation 20 l
21. tion de mots on note que si la synonymie l hyperonymie et les collocations sont 65 tr s r pandues la coordination permettant d identifier des s ries paradigmatiques telles que sel poivre moutarde reste absente des dictionnaires Un dernier point qui nous semble fondamental en vue d une application lexicographique est l id e d activer un tr s grand nombre de liens pour laisser a l utilisateur la possibilit de filtrer et de s lectionner lui m me les l ments dont il a besoin D apr s nous cette dynamique de s lection des unit s lexicales m riterait d tre impl ment e dans une base de donn es lexicale C est en partie ce que nous proposons dans notre mod le de structuration qui sera pr sent au chapitre 2 4 Conclusion Ce deuxi me chapitre a permis de clarifier certains points n cessaires la compr hension de notre probl matique Premi rement nous avons voqu les diff rentes disciplines scientifiques s attachant d crire le lexique de fa on relationnelle Les diff rents mod les h rit s de ces disciplines mettent en avant des structures du lexique qui se diff rencient par un certain nombre de propri t s Les relations elles m mes sont de diverses natures les mod les linguistiques consid rent les relations entre unit s lexicales attest es le plus souvent en corpus sur les plans la fois pa radigmatique et syntagmatique les bases de connaissances et les mod les
22. tude Elles sont r dig es dans un m talangage visant viter les probl mes de synonymie ou d ambigiiit Les lexies choisies doivent tre les moins ambigiies et les moins idiomatiques possibles au risque de produire des formules stylistiquement lourdes Par exemple l expression destin est retenue au d triment de pour cette derni re tant jug e trop polys mique 27 Qqch Qqn tendre montrer que est justifi e accusation 1 1 corrobo rer tayer soutenir ART 28 Chair de utilis e comme aliment agneau a agneaub 29 Qui a lieu devant les tribunaux bataille II 1 juridique de proc dure 8 Les lexicalisations de r gime Nous n avons pas encore mentionn un type particulier de relation qui se situe entre une relation lexicale et la lexicalisation d un actant du r gime d une unit lexicale Nous les appelons lexicalisations de r gime H s agit de relations sp cifiant un ou plusieurs actants du mot cl Elles expriment sur le plan conceptuel des sous types de l unit lexicale en mot cl La valeur de ces lexicalisations de r gime varie en fonction des types d actants sp cifi s Par exemple pour les lexies CEIN TURE II et ENCOURAGEMENT 2 31 dont les structures actantielles sont les suivantes CEINTURE II O L ON TROUVE X ET QUI SE TROUVE AUTOUR DE Y ENCOURAGEMENT 2 LE fait X EST UN POUR LA personne Y FAIRE Z Y 90 on remarque des formu
23. uo6om aeq un p dinb3 aed yez nbiSo o 3 11uq 206 no s ze3 np dane querxAydse S ug UOUDOINIWIDWU l21JJo q ul siS luz 0 Nos 104 83110 SALI e JUepsJeSa41 uq 4 1070Q aBues uo WOspuy s d 2772290 ap sdiod 1u us 3J XXV11 ppyruvf qurinvisai se iuez s p sed 191n d 1s sound o nvadoyo sound ap auio 1s d sod p N Yow l anod 32odsa1 ajoqui s un 4sa Ind n x n sed s ueyn3 sii s p e 391 159 IND 9791 ap uobom AA lqul su un suep J luu id 159 n nb ap un suep J luj p s n x n x LAUU9YUD 9 urvd aouasedde e ua inb no l uuonipes3 ap apow 3s inb anod yez is Jas sups uind jes sues squaipaisui s p s inb anod yez 159 n n x TyFunod yniq suue ap seq e squelpaiSul s p s inb anod yez 3s InO mo doto jied ap ale is ap nvadnya ey 159 991044 uoquml uossin sed 355 LE n x n 44 m6 ap
24. Confrontons maintenant ces FL potentielles aux conditions requises pour le statut standard La condition de cardinalit est remplie Ces deux relations sont consid r es dans la plupart des approches ontologiques comme des relations fondamentales au m me titre que l hyperonymie et l hyponymie Elles sont tr s fr quentes et touchent une partie tr s importante du lexique La condition de diversit est elle aussi largement satisfaite dans la mesure o les valeurs sont presque aussi vari es que les lexies auxquelles s appliquent les deux FL Au niveau de l int gration au syst me de FL ces deux FL fonctionnent comme une paire de FL inverses ce qui motive d autant plus leur cr ation Ces deux FL nous semblent donc de tr s bonnes candidates au statut standard 4 3 1 3 Les relations mat riau artefact et ingr dient artefact et la relation X produit r alis partir de X Les relations mat riau typique artefact et ingr dient typique artefact sont parfois consid r es comme la m ronymie On retrouve dans WordNet Fellbaum 1998 par exemple trois types de m ronymie member meronymy association asso ciate substance meronymy steel iron et part meronymy table leg La FL Mero que nous venons de pr senter repr sente le troisi me type Nous proposons la cr ation de la fonction Compos pour encoder les relations mat riau typique art
25. Hypo chanson 1 1 berceuse 180 Qui sert pour toutes les portes d un batiment c 1 1 passe passe partout Il s agit galement de composantes servant d crire les parties constitutives d une entit d not e par une unit lexicale soit les m ronymes et hollonymes ainsi que les composantes ingr dient et mat riau typique Mero cerise queue noyau Hollo train d att rissage avion Compos yaourt 4a lait b ferment On inclut par ailleurs dans cette classe les composantes s mantiques d signant les relations hi rarchiques entre individus ou animaux gt Bien que ces relations fonctionnent comme une paire on ne trouve dans le DiCo que des occurrences de la relation lt descendante gt Celle ci est encod es par la FLNS Petit de par exemple Petit de poule I poussin poulet Sont galement repr sent es dans cette classe la paire de composantes seman tiques l ment r gulier ensemble de par exemple Sing chaine 1 cha non maillon Mult assiette a pile ainsi que la paire chef quipe par exemple Cap majorit 1 3 chef leader Equip navire quipage La derni re sous classe se situe l g rement l cart des pr c dentes elle regroupe les composantes s mantiques li es la mesure encod es par la FLNS Metr et ses diff rentes variantes dont nous avons sugg r la cr ation au chapitre pr c dent secti
26. Igor Mel uk Nadia Arbatchewsky Jumarie L o Elnitsky Lidja Iordanskaja et Adele Lessard Dictionnaire explicatif et combinatoire du fran ais contemporain Recherches lexico s mantiques I Les Presses de l Universit de Montr al Mont r al 1984 Igor MeTeuk Nadia Arbatchewsky Jumarie Lidja Iordanskaja et Suzanne Man tha Dictionnaire explicatif et combinatoire du fran ais contemporain Recherches lexico s mantiques III Les Presses de l Universit de Montr al Montr al 1992 Igor Mel uk Nadia Arbatchewsky Jumarie Lidja Iordanskaja Suzanne Mantha et Alain Polgu re Dictionnaire explicatif et combinatoire du fran ais contempo rain Recherches lexico s mantiques TV Les Presses de l Universit de Montr al Montr al 1999 Igor MeTeuk Andr Clas et Alain Polgu re Introduction la Lexicologie Explica tive et Combinatoire Duculot Louvain la Neuve 1995 Igor Mel uk et Alain Polgu re D rivations s mantiques et collocations dans le Dico LAF Langue fran aise 150 2 66 83 juin 2006 Igor Mel uk et Alain Polgu re Lexique Actif du Fran ais De Boeck Larcier Bruxelles 2007 Igor Mel uk et Leo Wanner Lexical Functions and Lexical Inheritance for Emo tion Lexemes in German Dans Leo Wanner dir Lexical Functions in Lexico graphy and Natural Language Processing pages 209 278 John Benjamins Am sterdam Philadelphie 1996 Igor Mel uk et Aleksandr K Zholko
27. ce couple Crit res syntaxiques La valeur entretient elle une relation actantielle ou attributive avec le mot cl Le mot cl est ici un actant de la valeur On limine toutes les FL qui ont pour patron de d pendance un r le de modificateur du mot cl ou d un de ses actants Combien d actants a la valeur y compris le mot cl La valeur a deux actants X et le mot cl On limine toutes les FL qui ont moins ou plus de deux actants Quelle est la position syntaxique profonde du mot cl dans la relation Le mot cl est le deuxi me actant de la valeur On limine toutes les FL pour lesquelles le mot cl serait le premier actant par exemple Fact Crit res communicationnels Quelle est la cible communicationnelle de la relation H s agit du premier actant de PISTE I 2 qui est sujet grammatical du verbe et theme de l nonc poten tiellement form On limine toutes les FL qui n ont pas le premier actant du mot cl pour cible communicationnelle Crit res s mantiques S lectionner une ou plusieurs classes ou sous classes s mantiques On s lectionne la sous classe d but ainsi que la sous classe Utilisation On limine les FL repr sentant les cat gories s mantiques non s lectionn es Dans le meilleur des cas l assistant ne proposera qu une seule FL pour l encodage d un lien donn Toutefois ce r sultat unique n tant pas la situation la
28. effec tuer une lecture gt des FL afin de d grouper ces caract ristiques et de les rendre explicites Une fois celles ci isol es il est alors possible de faire merger des rap prochements in dits entre les diff rentes FL et de cr er un syst me repr sentant ces diff rentes formes de regroupement Le syst me ainsi labor nous pouvons l exploiter pour r aliser plusieurs appli cations dans un premier temps nous pr sentons un outil d aide l encodage des relations lexicales directement d riv du syst me dans un second temps nous d terminons dans quelle mesure il est pos sible en s appuyant sur le syst me de FL d inf rer certaines g n ralit s et de les impl menter en vue d automatiser partiellement la r daction de fiches lexicogra phiques du DiCo ou d autres BLEC Nous pensons que cette th se peut apporter une contribution dans plusieurs do maines Tout d abord vis vis de la LEC le travail r alis permettra d organiser les FL en un mod le coh rent et hi rarchis Il offrira galement la possibilit d in t grer les FL non standard jusqu ici cart es des traitements automatiques et de mettre profit les FL pour servir de nouveaux objectifs Enfin il permettra d ou vrir le DiCo ou autre BLEC une utilisation plus tendue En ce qui concerne la lexicographie computationnelle notre projet propose une structuration novatrice des relations lexicales pouva
29. f roce profonde IncepPredPlus rancune s accro tre grandir D autres collocations ou derivations semantiques visent un actant semantique par ticulier du mot cl soit son premier actant Able rancune port la rancunier Real rancune c der la son deuxi me actant Operas rancune s attirer ART avec T du fait de par N Z lt en V ppr s Z gt son troisi me actant Oper rancune engendrer provoquer susciter ART ou un participant ext rieur ne correspondant pas 4 un de ses actants LiquFunco rancune d sarmer dissiper teindre ART 214 D autres encore visent la valeur de la FL par exemple Propt rancune par Cette r partition des d riv s s mantiques et des collocatifs d une unit lexicale a un int r t pour guider un processus de r daction ot un utilisateur cherche par exemple a encoder un message mettant en valeur un l ment particulier plut t qu un autre Si pour exprimer un nonc signifiant X n prouve plus de rancune pour Y on cherche mettre l accent sur un participant ext rieur qui est respon sable de ce fait on choisira les collocations Qqn d sarmer dissiper teindre la rancune En revanche si l on souhaite ne pas voquer la cause de ce fait et mettre en avant le nom RANCUNE on choisira les collocations la rancune s teint disparait s vanouit On peut galement dans une optique
30. la pr sentation de mod les th oriques du lexique et de plusieurs bases de donn es lexicales Cet tat de l art nous a per mis de mettre en perspective la LEC par rapport aux autres mod les relationnels du lexique Nous consacrons ce troisi me chapitre la pr sentation de notre outil th orique les fonctions lexicales Les fonctions lexicales dor navant not es FL ont t d finies il y a une cinquantaine d ann es Nous souhaitons en dresser un bilan afin de mettre en valeur leurs forces et leurs faiblesses et de d terminer si elles se montrent satisfaisantes pour servir les besoins des applications dans les quelles elles sont exploit es Les FL ont t utilis es pour la r daction de plusieurs dictionnaires et bases de donn es lexicales monolingues bilingues didactiques et sp cialis es ainsi que dans diverses applications en traitement automatique des langues La plupart des ressources et applications d velopp es avec les FL sont pr sent es en d tail l annexe Nous avons choisi de pr senter les FL en distinguant d une part la notion th o rique de FL et d autre part les diff rentes formes d encodage des FL afin de nous carter des pr sentations canoniques qui en sont faites Les FL sont traditionnelle ment d finies d un point de vue formel comme des fonctions de type math matique not es f x y o y repr sente la valeur plus pr cis ment un ensemble de va leurs et z le mo
31. tionnels 2 1 Introduction Cette th se vise Pelaboration d un modele d organisation des relations lexicales en vue d une impl mentation dans une base de donn es lexicale relationnelle L objec tif de ce chapitre est d une part de mettre en perspective notre travail vis vis des autres ressources et mod les lexicaux relationnels et d autre part de poser le cadre conceptuel de la th se en d finissant les concepts cl s qui y sont trait s En premier lieu nous devons introduire la distinction entre un mod le lexical re lationnel et une ressource lexicale relationnelle distinction sur laquelle repose en partie l organisation du chapitre Un mod le relationnel est une repr sentation th o rique du lexique visant mettre en valeur les diff rentes relations existant entre les unit s lexicales Certains mod les relationnels donnent lieu des ressources lexicales relationnelles Ces derni res permettent de mat rialiser et de valider les premiers travers la description des propri t s relationnelles des unit s lexicales d une langue donn e Dans la suite de ce chapitre section 2 2 nous pr sentons plusieurs ressources lexicales relationnelles Parmi elles certaines sont construites d apr s des mod les th oriques particuliers c est le cas notamment du DiCo Polgu re 2000 de Frame Net Fillmore et al 2003 ou encore de WordNet Fellbaum 1998 D autres sont labor es sans ar
32. 168 Granularit des FL de l encodage traditionnell91 du systeme des relations lexicales20 98 I Indice de polysemie ou homonymie 237 230 L Lien lexical Param tres descriptifs de 227 M Marques d usage 237 Modele lexical relationnel p Mod le Sens Texte 193 N Nombre de FL P Parties du discours 235 de surface 207 des locutions 208 profondes 206 Patrons de d pendance syntaxique 197 281 R Relation lexicale Encodage automatique de 244 Relation paradigmatique L7 Relation syntagmatique Requ tes SQL 229 Ressource lexicale relationnelle 9 S Syst me de FL Impl mentation du 225 Perspective combinatoire Perspective communicationnelle Perspective s mantique 171 Perspective sur les parties du discours 205 Propri t s du 170 Syst me lexical 225 Annexe I Liste des FL cit es Cette annexe pr sente les diff rentes FL cit es dans la th se Nous les r partissons dans deux sections la premi re regroupe les FL standard et semi standard ces derni res figurent sous les FL standard auxquelles elles se rattachent la seconde pr sente les FL non standard Dans chacune des deux sec
33. 177 Classification des FL Collocation Base dela CONGO sisi care Composantes s mantiques li es aux FL Condition d universalit Condition de cardinalit Condition de diversit D D rivation morphologique 131 Derive morphologique 131 D rivat me 133 Marqueur morphologique 137 D rivation s mantique D riv s mantique Diagnostic d erreurs dans le DiCo 1236 DE E El ment de cadre 145 Encodage alg brique Encodage explicite 105 168 Encodage traditionnel Typologie de Encodage vulgaris Etiquette s mantique 240 F Fiche lexicographique 231 R daction automatique de 231 Reconstitution automatique de 120 FL localement standard FL non standard FLNS 112 Normalisation des 115 Standardisation des 115 FL r versibles 244 Double implication 245 Simple implication 244 FL semi standard 111 EL Shand ard vv dc san 111 280 FL standard combin es Configuration de FL FL Complexes i daa FL standard simples G Grammaire de FL
34. 5 A Luv vapunwap saAessa atu 1qo p x A N j auopun tTiedO 1e4ess3 q dn oo p J ess x Luv sanbiug m l Tye sd u s essq X anod woy auanu dinby anurulq ywop snoq nesanou x uv 4949294 T I uonpsnoon lusdone Aanou ne Anou 3u u ululo isoy 0oun4ne Anou aq apeiZap as 121909p as ap ulnulixeyy ausvy wyiny e 4 nunuo x Luv 4 pi06 e0uns19dsa Tido 8 awaw ne queusyeddy 014100 0 u3z172 WNJO Jisigauop X N oipurnio TTauoT Ji3aseaquoS d d apJaunb19 suoD nys l ye slu do nb suo o 118 3s JUOP Nenze auzvja0L0d 247218550 sodulo o alajuoy Juawauboub 7UaWAL0GD 41 gt suep jueyodui sn d Z ap padsy auzuao 1 20q2p aus que odui sulow aipua Pu bo ubol suv 49697790 nvapsvf snuip pesqsner LAN 0048 auf T IZ mnump li doIsneO sjuejua s p 191n d quew A P X ubb fl 1999790 aouazis H dosne y2bb ap aSueyda us sne Pu b ubol ne ubbl auznpas aouapis H d
35. Ces r flexions posent les bases de ce dont devrait rendre compte un modele dans les processus de stockage de production et de reconnaissance d unit s lexicales Dans la perspective de la production trois faits importants doivent apparaitre Premi rement les humains activent beaucoup plus d unit s lexicales qu ils n en ont besoin lorsqu ils parlent Deuxi mement le lemme sens et partie du discours peut tre s par de sa forme le son Troisi mement il se peut que le contour d une unit soit correctement s lectionn mais qu au moment de la production une autre unit similaire soit prononc e a sa place En ce qui concerne la reconnaissance des uni t s lexicales tout comme pour le processus de production les locuteurs envisagent beaucoup plus d unit s lexicales que celles qui se retrouvent s lectionn es la fin Un grand nombre d entre elles sont activ es puis graduellement filtr es et suppri m es Aitchison d clare qu il est impossible l heure actuelle d impl menter un tel mo d le en raison de sa tr s haute complexit Toutefois cette esquisse du fonction nement du lexique mental apporte des pistes originales pour l enrichissement de la structuration d une base de donn es lexicale La prise en compte des proximi t s phon tiques pour viter les erreurs semble tout a fait novatrice et pertinente Par ailleurs parmi les relations qui ont pu tre d gag es lors des tests d associa
36. Claus V Claus A Claus Adv Claus Claus Tableau 5 1 Classes des couples de parties du discours associ s aux liens lexicaux encod s par les PL Nous illustrons dans la figure Porganisation des d riv s semantiques et collo catifs de RANCUNE selon leur parties du discours telle qu elle pourrait figurer dans une base de donn es lexicale 212 TA ep sin eA s p s puojo d sinoosrp np red s stueSIo ANNONVY suoner y ETG MBIA red 3doiq SHHMMHAQV lt Iray rowu EyadQneaanou aq X N 8 av q orrdsur 18dO ray toqtosns ionboao d ierpuesue s do 2 99144 uo gt Z N 184 yrey np_ ooae Iy q mg s S 1odo 9791998 9999 pINOS uonezsapueu PA IUY unsnfur G Anuy OUTIS9T 43A sues n H dQuoN ZN mod A N 8 l Jopres amp UadQiuo7 A N Luv s rnum e H dod ui T T TA f Q T PUT soeATA fqemp 3uSeyy LAN Sdoauo doig INY gu ss r Inou 27 0 91939 USE Nnuy 990197 opuojoid use yuosmpur r qynuv Jotunouei e el 931od T lqy Lav red op ut d Ty usen SAILOAHLCAV lt ruy s yno z nurissip u juoo5 t9u9 2 Jiue A luuu duoN A N INV Jorjuour ro3s
37. Exemples La direction de cette entreprise a rapidement tir des le ons de cette bourrasque boursi re Face la bourrasque essuy e par la gauche le ministre n a pu retourner la situation en sa faveur En une nuit le 16 d cembre 1992 jour de forte bourrasque sur le syst me mon taire europ en sa fortune s est enrichie de un milliard de dollars Figure 112 Fonctions lexicales et exemples pour BOURRASQUE II 1 dans le DEC Le DiCo Le DiCo a fait l objet d une pr sentation au chapitre 2 section 2 2 1 p de cette th se Nous renvoyons donc le lecteur la section concern e II 2 Ressources lexicales bilingues et multilingues La Th orie Sens Texte et son module lexical la LEC est une th orie ind pen dante d une langue particuli re Il est donc possible d utiliser la m me structure de repr sentation et les m mes outils pour d crire des langues diff rentes C est l l objectif premier des FL qui rappelons le ont t formalis es pour servir les besoins de la traduction automatique Les FL standard sont pos es comme univer selles Nous pr sentons deux ressources bilingues et multilingues utilisant les FL une base de donn es con ue partir du Robert amp Collins et le projet Papillon No tons galement que Bouchaddakh a d velopp un chantillon de base de donn es lexicale bilingue fran ais arabe La base de donn es lexicales du Robert amp Collins en fonctions lexi
38. II est possible d obtenir plusieurs chemins partir de diverses structures s man tiques Par exemple de l unit lexicale CAR l unit lexicale DRIVER on obtient l ensemble de chemins suivants 1 car Tobj driver 2 car Mod driver 3 car Mod road hog Hyp driver 4 car Tobj crash Tsub driver 5 car Tobj control Tsub driver 6 car Tobj broadside Tsub driver T car Mod road hog Join road hog Hyp driver 8 car Locn in compartment Tsub driver 9 car Unsp on intention Possr driver 10 car Attrib intention Possr driver Il est possible partir de sous chemins de deux structures s mantiques diff rentes de cr er un chemin tendu Par exemple CAR et TRUCK ne sont reli es directement par une relation s mantique ou par un chemin s mantico relationnel dans aucune structure s mantique Cependant si l on joint les deux relations s mantiques sui vantes car Hyp vehicle et vehicle Hyp truck toutes deux tir es de diff rentes structures semantiques il est possible partant de Vunit lexicale VEHICLE d obtenir le chemin suivant 49 car Hyp vehicle Hyp truck On remarque que la polys mie n est pas trait e dans MindNet les acceptions ne sont pas diff renci es explicitement Par exemple rien ne permet de d terminer
39. Structured Query Language Traitement Automatique des Langues Th orie Sens Texte Symboles et conventions typographiques LEXIE Lexie ou unit lexicale ex CASSER LOCUTION Locution ex CASSER LES PIEDS VOCABLE Vocable ex CASSER signifi Signifi d une unit lexicale ex casser CONCEPT Nom de concept auquel renvoie une unit lexicale ex CASSER lt CADRE gt Cadre s mantique dans FrameNet ex lt ACCOUTREMENTS gt L MENT l ment de cadre s mantique dans FrameNet ex WEARER Fonction Lexicale Fonction lexicale ex Magn Glose Glose de fonction lexicale ex Intense Mot cl dans les FL ou les r gimes de valeurs ex Adv crainte avec ART Article ou autre d terminant dans les r gimes des va leurs de fonctions lexicales ex Real bateau piloter ART NB Cette th se suit le mod le typographique fran ais concernant les espaces avant les ponctuations doubles A Fr d ric et Marianne Osterrath Remerciements J aimerais tout d abord remercier mes deux directeurs de th se Alain Polgu re et Sylvain Kahane qui ont su me guider dans cette recherche tout en me laissant une tr s grande libert de manceuvre Je leur suis sinc rement reconnaissante pour leurs conseils leurs encouragements pour leur fa on de travailler toujours stimu lante rigoureuse et chaleureuse et pour la grande confiance qu ils m ont a
40. apprentissage des langues 2006 Cependant les FL utilis es dans ces projets ne couvrent qu une partie des d rivations s mantiques et des collocations recens es Les FLNS ne peuvent pas entrer en ligne de compte dans les traitements automatiques en raison de l h t rog n it de leur encodage Elles sont en effet encod es selon un m talangage naturel qui met l accent sur la lisibilit et la clart de la formulation Par cons quent cet encodage est tr s h t rog ne et difficilement exploitable pour des applications en TAL on ne peut en rep rer les similitudes 115 ni ais ment l analyser de fa on automatique La distinction de plusieurs statuts pour les FL et la diff rence d encodage qui en r sulte conduit mettre l cart les FLNS qui constituent pourtant une part non n gligeable des relations repr sent es dans le DiCo soit environ 16 La position de MeTeuk et al 11995 150 Pegard des FLNS est assez radicale Elles ne sont pas pr visibles et ne peuvent donc pas tre d gag es et recens es de fa on m thodique La seule mani re de les inventorier c est de les retrouver dans les textes En plus pour les m mes raisons on ne peut pas les d crire l aide d un formalisme pr d termin au contraire le sens de chacune doit tre formul dans le DEC au coup par coup Notre position vis vis des FLNS va l encontre de cette affirmation et postule arar I
41. corps psychisme casser gercer blesser balafrer soigner panser traiter m dica M DECINE meurtrir d moraliser bouleverser menter voiture bus ME dysfonctionner accidenter cabosser r parer recarrosser remonter CANIQUE esquinter endommager maison immeuble fissurer l zarder d truire d labrer restaurer ravaler recr pir B TIMENT Tableau 2 11 Exemples de concepts d action DETERIORER et R PARER avec les FL Degrad LiquFuncg ainsi que CausDe nouveauPred CausDe nouveau Funco 1 et CausDe_nouveauFacty remettre en tat il est possible d obtenir le m me genre de descriptions Nous avons rassembl dans la figure 2 7 un ensemble d exemples tir s du DiCo qui expriment ces relations Duvignau parle de diff rences interdomaines Dans notre approche nous voyons ces diff rences comme relevant de champs s mantiques particuliers par exemple 62 SE DETERIORER Degrad foret 1 br ler Degrad humeur la s alt rer Degrad lait b aigrir cailler coaguler surir tourner Degrad maison 1 1 tomber en ruines se d grader se d labrer Degrad terre 1 1 s appauvrir LiquFacto canalisation crever clater se d t riorer LiquFacto tuyau I 1 bloquer boucher obstruer crever percer ART LiquFunco curiosit 41 3 d sarmer mousser ART LiquFunco for t 41 couper d boiser d fricher ART LiquFunco maison 1 1 d molir d trui
42. elle poss de une tiquette s mantique similaire celle de CINEMA fII c est dire comportement qu elle est reli e cette lexie par la FL Syn Nous pouvons galement d terminer la marque d usage fami lier Avec ces donn es il nous est donc possible de reconstituer les fiches de deux lexies potentielles CINOCHE sous forme de structure de traits comme ci dessous nom CINOCHE nom CINOCHE pdd nom pdd nom usage familier usage familier tiq tablissement de spectacle tiq comportement Syn lt cin ma L3 gt Syn lt cin ma Il gt On observe que les champs pdd et usage sont quivalents dans les deux fiches Tou tefois les champs tiq sont diff rents Il n est donc pas possible d unifier les deux structures de traits On peut alors postuler l existence de deux lexies CINOCHE et CINOCHE Notons que l identification des lexies est tout fait arbitraire et ne sert qu les diff rencier ne pr vaut en aucune mani re sur jj Poursuivons cette m thodologie avec la valeur cuisiner pr sente dans les deux re lations suivantes Vo interrogatoire nom masc fait de questionner fam cuisiner IN Y Reala plaque III nom f m accessoire de cuisson cuisiner sur ART 252 L analyse des FL et des autres l ments nous permet de reconstituer les deux fiches suivantes nom CUISINER nom CUISINER pdd verbe pdd verbe usage familier usage non
43. elles forment 6 leur identification et mod lisation Tout au long de ce chapitre nous verrons que ces propri t s ne convergent pas d un mod le un autre 2 1 2 1 Nature des relations Plusieurs termes sont employ s pour d signer les relations entre unit s lexicales ou entre concepts trait es dans les diff rentes approches liens lexicaux rela tions s mantiques relations lexicales relations s mantico lexicales relations lexico s mantiques relations conceptuelles ou encore relations textuelles ou contextuelles Voici la terminologie que nous adopterons tout au long de la description des dif f rents mod les Nous parlerons de relations lexicales pour d signer des relations 16 r currentes habituellement dites s mantiques s mantico lexicales ou encore lexico s mantiques entre deux unit s lexicales g n ralement identifi es par leur sens Par exemple le lien entre les unit s lexicales GRAND et PETIT est une occurrence de la relation lexicale d antonymie Nous devons alors poser une diff rence entre une relation lexicale d une part et les liens lexicaux qui en constituent des occurrences d autre part Par exemple la rela tion lexicale nom de lieu o se trouve se d roule est instanci e par une multitude de liens lexicaux dont CRIME LIEU du CRIME ou encore VIER CUISINE VACHE TABLE On parle de relation conceptuelle pour d signer une relation entre deux co
44. ensemble des FL et des traductions pr sentes pour une entr e Pendant le jeu on lui montre la d finition de la lexie ainsi qu une d fini tion et des exemples de chaque FL Ce jeu permet a l utilisateur d am liorer son habilet employer les unit s lexicales appropri es Jeu 5 Mots avec indices Ce jeu est orient sur le mode bilingue et fond sur des paires de lexies le sys t me pr sente des questions dans la langue la mieux connue de l utilisateur et celui ci doit donner une traduction dans la langue qu il apprend La version espagnole de CALLex CALLEX ESP Boguslavsky et al 2006 pro pose des exercices selon un angle l g rement diff rent Les jeux prennent la forme d exercices qui utilisent les gloses des fonctions lexicales Par exemple AntiVer va tre vulgaris e par no aut ntico cuadro no aut ntico cuadro r ponse falsificado acusaci n no aut ntica acusaci n r ponse gratuita Le DAFLES et Alfalex Le Dictionnaire d Apprentissage du Fran ais Langue Etrang re ou Seconde DAFLES est une base de donn es lexicale d velopp e l Universit de Louvain par Serge Verlinde Jean Binon et Thierry Selva au sein du Groupe de Recherche xlvi en Lexicographie P dagogique GRELEP La m thodologie d laboration de la base de donn es repose en tr s grande partie sur les principes de la LEC On n ob serve toutefois pas de formali
45. est dire autant au mode de d roulement d un fait qu aux instruments permettant le d roulement de ce fait Cette classe contient trois sous classes la premi re a trait aux instruments aux moyens et fa ons permettant le d roule ment d un fait Ces composantes s mantiques sont le plus souvent repr sent es par les trois FL de d rivation s mantique circonstancielle Sinstr Smeg t Smod par exemple Sinstr crime I b arme de ART Smea excuse 1I lettre mot d s Smoa vie 1 2 genre mode style de 184 On trouve galement dans cette classe des composantes s mantiques indiquant la fa on dont l entit d not e par le mot cl est utilis e ou exprim e Instr couteau au Vel avec ART coups de Advi gratitude avec Vel NonAdv animosit sans Adv Real dans le sens de ART En regardant a travers l orifice de serrure par le trou de la Enfin cette classe regroupe diverses composantes s mantiques encod es par des FL standard ou non standard indiquant les diff rentes mani res dont se d roule l action ou l v nement d not par le mot cl par exemple AdvoNonManif admirer 1 secr tement En s asphyxiant avec du gaz se suicider au gaz 5 2 2 8 Classe CAUSE La classe CAUSE rassemble les composantes semantiques exprimant la cause par exemple Propt animosit par Dont la rai
46. les mod les morphologiques des noms et des adjectifs la conjugaison des verbes les constructions syntaxiques possibles pour les verbes et les noms la place de l adjectif ant pos ou postpos 8La base de donn es peut tre consult e l adresse suivante www kuleuven be dafles x vil Vexploration des d finitions permet l acc s aux d finitions contenant un ou plu sieurs mots pr cis s Coupl au DAFLES le projet Alfalex est une ressource fournissant un certain nombre d exercices pour l apprentissage du vocabulaire Alfalex se sert du DAFLES et d un corpus pour g n rer des exercices portant sur les propri t s suivantes des unit s lexicales la formation des mots morphologie conjugaison d rivation le genre des noms la combinatoire des mots les champs s mantiques ainsi que la traduction du fran ais vers le n erlandais et inversement L environnement d ap prentissage permet de situer le niveau de fran ais des utilisateurs il calcule dans un premier temps le score pour chaque exercice garde en m moire les erreurs commises et propose nouveau des exercices sur ces erreurs Il offre un corrig pour chaque exercice l aide des informations lexicales du DAFLES et soumet des exercices adapt s au niveau valu des apprenants II 5 Applications des FL en Traitement Automa tique des Langues Apr s la revue des ressources cr es sur les principes
47. potentielle de la d finition d une lexie On voit en que le sens d intensit de Magn ne porte pas sur l intensit du coup de feu lui m me mais sur la quantit de coups de feu tir s En conservant la m me FL tout en rempla ant quant par temp en 13 on d place l intensit sur la longueur de l action 87 12 Magn coup de feu 1 nourris soutenus 13 Magn admirer 411 longuement pendant des heures Les deux autres l ments usual et actual servent indiquer respectivement si la valeur est habituelle ou si au contraire elle est ponctuelle La relation en 14 indique que la valeur doit tre exprim e pour d noter un v nement habituel et non un v nement actuel ou ponctuel la question O est Pierre par exemple on ne pourra r pondre fr quente le cin ma En revanche actual dans l exemple indique que l action se d roule actuellement et ne doit pas tre interpr t e comme quelque chose d habituel auquel cas on aurait comme valeurs ne pas avoir d imagination tre terre terre etc 14 Realftl cin ma L 3 fr quenter ART 1 q 15 NonOper3 imagination 2 tre court tre en panne d lt 1 peri g Le second type de pointeurs dans les formules de FL renvoie des composantes pr cises de la d finition On remarque par exemple qu en et 16b les no tations en indice renvoient respectivement aux composantes motif et mani re
48. tif visant le d veloppement d une base lexicale multilingue comprenant entre autres Vallemand l anglais le fran ais le japonais le malais le lao le tha le vietnamien et le chinois Il existe peu de dictionnaires pour humains et machines entre le frangais et de nombreuses langues asiatiques L ojectif selon 2002 64 est donc de r duire les cotits de cr ation de cette connaissance lexicale en adop tant une m thode inspir e des projets lt open source gt et fonctionnant grace des contributeurs b n voles Ce dictionnaire tant multilingue sa macrostructure se pr sente sous la forme d une structure pivot chaque entr e des diff rents dictionnaires monolingues est reli e a ses traductions dans les autres langues via un lien interlingue dans la structure pivot La structure pivot est fond e sur la notion d acceptions interlingues appel es aries Mangeot et Kuroda 2003 34 2006 donne l exemple du vocable Le projet papillon est pr sent l adresse suivante http www papillon dictionary XXXV French DiCo English DiCo Vocable affection n lexie affection lendresse allection 2 m decine Vocable maladie nt lexie maladie Interlingual Links Vocable affection N Refinement Links Figure Macrostructure du dictionnaire Papillon AFFECTION en fran ais qui comporte deux sens tendresse et maladie Ce vocab
49. 198 Classe 2 Structures actantielles deux actants Dans la deuxi me classe figurent les patrons repr sentant des structures actantielles deux actants On observe plusieurs configurations possibles Les FL Func Fact par exemple sont associ es au patron suivant 1 les FL Factz au patron 17 21 Operi Real sont associ es au patron 1 etc Prenons l exemple de la FL AntiReal ne pas r aliser l action inh rente illustr e ci dessous AntiReal barricade enfoncer franchir forcer ART On lui associe le patron 2 4 que l on peut illustrer de la fa on suivante AntiReal2 ENFONCER Il Il deuxieme actant de 8 Y BARRICADE Avant de poursuivre vers les structures actantielles 4 trois actants nous devons pr ciser quelques aspects de certaines constructions verbe support Comme l a d crit 2007 la diath se de certaines FL mod lisant des verbes sup ports c est dire la correspondance entre leur actants s mantiques et leurs actants syntaxiques profonds n est pas pr visible Selon les valeurs qu elles retournent leur nombre d actants syntaxiques profonds diff re Prenons l exemple des rela tions et pour la lexie INTERROGATOIRE dont la structure actantielle est la suivante PAR LA personne X DE L individu Y A PROPOS DE Z 110 Oper interrogatoire conduire effectuer mener ART aupr s de N 111 Oper interrogatoire faire
50. Classes s mantiques de FL associ es aux lexies tiquet es animal A partir de ces classes s mantiques les FLNS et FL semi standard de toutes les lexies d animaux ont t compar es et homog n is es Par exemple les FL de la classe s mantique lt trait distinctif de gt ont t r gularis es comme suit cf tab 4 1 Lexie Ancienne FLNS Nouvelle FLNS Valeur AGNEAU Pelage de l A Trait distinctif de VA pelage toison laine CHAT Caract ristique de la langue des C Trait distinctif du C langue r peuse ELEPHANT Caract ristique physique de la Trait distinctif de l E peau peau ru peau des gueuse LION Poils couvrants la t te d un L Trait distinctif du L pelage de crini re la t te TIGRE Trait distinctif du pelage d un T Trait distinctif du T pelage pelage ray Tableau 4 1 FLNS li es aux lexies d animaux avant et apr s normalisation Cette approche offre une m thodologie cadr e et organis e et se r v le notamment tr s efficace pour la r vision des encodages de FLNS Cependant elle ne permet pas de tenir compte des r gularit s de relations entre champs semantiques En effet 122 les relations similaires sont observ es l int rieur d un champ s mantique donn Or comme nous l avons vu la page les FL sont soumises la condition de cardinalit c est dire qu elles doivent tre suffisamment larges pour s appl
51. Leo Wanner Bernd Bohnet et Mark Giereth What Is Beyond Collocations In sights from Machine Learning Experiments Dans Actes d Euralez 2006 Turin septembre 2006 Anna Wierzbicka Semantics Primes and Universals Oxford University Press Oxford 1996 Morton E Winston Roger Chaffin et Douglas Herrmann A taxonomy of part whole relations Cognitive Science 11 4 417 444 1987 Aleksandr K Zholkovsky Sintaksis somali Nauka Moskva 1971 Aleksandr K Zholkovsky et Igor Mel uk vozmoznom metode i instrumentax semanticeskogo sinteza Nau no texniceskaya informacija 5 23 28 1965 Aleksandr K Zholkovsky et Igor Mel uk O sisteme semanticeskogo sinteza I stroenie slovarja Nau no texniceskaya informacija 11 48 55 1966 Aleksandr K Zholkovsky et Igor Mel uk semantiteskom sinteze Problemy kibernetiki 19 177 238 1967 Aleksandr K Zholkovsky et Igor Mel Guk Sur la synth se s mantique T A Informations 2 1 85 1970 Pierre Zweigenbaum Bruno Bachimont Jacques Bouaud Jean Charlet et Jean Fran ois Boisvieux Le r le du lexique s mantique et de l ontologie dans le traitement automatique de la langue m dicale Dans Pierre Le Beux et Anita Burgun dir Actes du Colloque CRISTAL S Saint Malo 1996 Index A Assistant l encodage des liens lexicaux Attribut de description 142 147 Cible communicationnelle 213 Classes semantiques
52. N Y d Labrealio charrette charrier charroyer N Y dans ART Ces quatre relations contiennent le sens fonctionne est utilis Si Von se place d un point de vue purement s mantique il semble pertinent de les regrouper afin de pouvoir acc der ces collocations en partant d une seule composante s mantique L objectif de l organisation s mantique de notre syst me est double 174 Il s agit d une part de pouvoir acc der partir d une composante s mantique autant de FL qui peuvent l exprimer Par exemple pour la lexie CHARRETTE on souhaite pouvoir acc der en partant de la composante fonctionnement ou utilisation aux FL Labrealj Factz Facto et Realy D autre part si une FL poss de plus d une composante s mantique on souhaite acc der cette FL par n importe laquelle de ces composantes Par exemple partir de la lexie KLAXON a il doit tre possible d acc der au syntagme balancer un coup de klaxon par la composante utilisation ainsi que par la composante n gativit 5 2 1 2 Identification des composantes s mantiques Notre objectif n est pas de dresser un relev exhaustif et normalis de l ensemble des composantes s mantiques associ es aux FL mais de les identifier de fa on relative ment souple et explicite Les composantes similaires seront regroup es l int rieur d une m me rubrique ou classe s mantique Afin d ex
53. Nous tenterons cependant tout au long du cha pitre de confronter certaines FLNS r guli res aux crit res de standardit afin de proposer d ventuelles candidates au statut standard Nous devons pr ciser pr sent deux objectifs tout fait distincts de notre travail la standardisation et la normalisation des FLNS Par commodit nous cr ons le n ologisme standardit pour traduire le terme anglais stan dardness 115 La standardisation consiste cr er de nouvelles FL standard ce qui n cessite de confronter les candidates aux crit res de standardit et de les valider ou au contraire de les rejeter La standardisation conduit galement effectuer des regroupements de liens lexicaux auparavant isol s La normalisation consiste la fois modifier la granularit de Pencodage des FLNS pour regrouper des liens lexicaux similaires et proposer des r gles pour la formalisation de l encodage des FLNS sans pour autant les faire passer au statut standard Gardons bien cette distinction l esprit car tout au long du chapitre il sera ques tion tant t de normaliser les FLNS et tant t de les standardiser A ces deux objectifs vient s ajouter un troisi me ils agit de d finir des strat gies d une part pour la recherche d analogies s manti co syntaxiques parmi les liens lexicaux et d autre part pour g rer l volution de la description de ces liens lexicaux Le corp
54. Oper b col re encourir ART Figure 3 7 Illustration de l encodage explicite L encodage alg brique L encodage alg brique est quant lui tr s proche de l encodage traditionnel Il est fond sur des formules lin aires unidimensionnelles qui synth tisent la fois le contenu s mantique et la structure syntaxique des FL L encodage alg brique est un m talangage avec lequel le lexicographe et le linguiste peuvent penser 2001 14 c est dire tout fait adapt pour les lexico graphes puisque les formules sont tr s proches de l expression en langage naturel Par exemple la formule Caus Non Manif L doit tre comprise comme causer que L ne se manifeste pas Ce m talangage doit tre d fini en amont de l encodage explicite et non l inverse 107 le passage du premier au second tant trivial il consiste remplacer les simples FL par leurs d finitions explicites et calculer les op rations Op rations sur les FL Il existe des relations entre les FL que l on peut mod liser par deux op rations le produit et la fusion Notons que ces deux op rations ne sont pas repr sent es de fa on explicite dans l encodage traditionnel Le produit est le mode de combinaison de FL le plus productif Kahane et Polguere 12001 15 le pr sentent comme suit Le produit h de deux FL syntagmatiques f et g a les propri t s sui vantes 1 h L est un colloc
55. QSyn probl me fam colle II 6 4 4 2 Exp rimentation Une fois de plus l exp rimentation men e a montr qu outre le fait de remplir au tomatiquement ce champ dans les fiches de DiCo l analyse des marques d usage des valeurs sert deux autres t ches rep rer des ventuelles erreurs ou incoh rences dans l tiquetage et distinguer des lexies en relation de polysemie ou d homonymie Devant plusieurs marques associ es un m me mot forme le lexicographe devra donc d terminer s il s agit d une lacune ou au contraire d un indice d une pluralit d acceptions Diagnostic d erreurs ou oublis La valeur bibine est marqu e comme usage familier dans un cas et reste non marqu e dans un autre AntiBon bi re 1 a fam bibine AntiBon boisson 1 bibine 239 De la m me fa on on remarque que disert est dans les trois relations ci dessous tour tour non marqu soutenu et vicilli Ver Bon avocat 1 1 disert Bon A loquence soutenu disert QA verve vieilli disert gallinac en tant que valeur de la m me FL Gener Terme g n rique est marqu sp cialis et non marqu Gener coq gallinace Gener poule 1 sp c gallinace Nous sommes clairement ici en pr sence de lacunes dans l encodage des donn es du DiCo Cette exp rience aura permis une correction importante des marques d usage Indice pour la distinct
56. Qqn faire Qqnl causer que a lieu Qan calculer Qan construire Qqn mettre en service Qqch causer que soit ap parente Qqn Qqch faire que de X 175 se manifeste Qqnl faire commencer Autorit judiciaire causer que X soit interrog comme Administration cr er Qqn crire Qqn installer dans le lieu N Qqch causer que se mani feste Ces gloses peuvent tre paraphras es par une formule unique cr ation laquelle on associe CausFunco Voyons ci dessous titre d illustration la mise en correspondance de quelques FL avec leur composantes s mantiques Facto ancre mordre tenir fonctionnement Real ancre jeter mouiller ART utilisation S balai poussi re participant AntiBonS2 bateau passager clandestin participant n gativit IncepOper fortune 1 la amasser accumuler se constituter etc ART commencement S CausFunco farine meunier participant Syn vaisselle 2 plonge quivalent Contr comptoir 1 1b salle contrastif Partie de pipe I bec fourneau tuyau 1 1 partie de Equip navire quipage participant collectif Hypo chanson 1 1 berceuse type de SoSingReal chiffon a coup de unit utilisation Prepar meurtre com
57. Sioc C Par exemple le sens boxe est pr sent dans la lexie RING Cette formule indique que Sioc prend en mot cl un nom ou un verbe et renvoie des valeurs uominales Figure 5 4 Fiche de la FL Sioc dans 1993 377 FL Notre objectif n est pas de d finir la dimension alg brique du syt me de FL ni de calculer leurs propri t s s mantiques et syntaxiques partir des op rations formelles explicit es par 2001 mais d tablir la structura tion d ensemble au sein de laquelle figure individuellement chaque FL En d autres termes nous cherchons regrouper les caract ristiques communes des FL pour en d gager un mod le d organisation permettant d obtenir une vision globale des dif f rentes interactions possibles entre FL au sein d un syst me structur et explicite Il est en effet difficile de d gager les propri t s d un syst me si l on se limite Petude de ses unit s En plus de montrer les similitudes entre FL ce mode d or 170 ganisation permettra de mettre en avant leurs diff rences et de faire ressortir leurs valeurs au sein du syst me 5 1 2 2 Propri t s d finitoires pour un syst me de fonctions lexicales Nous d finissons quatre propri t s du syst me de FL que nous avons labor 1 Fonction du syst me Il s agit d une mod lisation des propri t s attach es aux FL elles m mes mod lisant les relations lexicales Le syst me a pour objectif de mettre en
58. Toutefois le parall le que nous sugg rons entre le th me d un nonc et la cible communicationnelle d une FL ne vaut que pour les cas o un nonc n est ni cliv ni pseudo cliv ni focalis Les FL ne se situent pas en effet ce niveau d expression communicationnelle A partir des relations 117 plus haut et 118 ci dessous 118 Opera coup de recevoir ART de N X 219 il est possible de former les nonc s Pierre passe un coup de fil Paul et Paul recoit un coup de fil de Pierre dont les th mes respectifs sont Pierre et Paul La cible communicationnelle de Oper 2 constitue donc le premier actant s mantique de son mot cl alors que la cible communicationnelle de Opera constitue le deuxi me actant s mantique de son mot cl Selon le proc d qui vient d tre expos nous pouvons d terminer que les cibles communicationnelles des FL Funco Func Facto et Facts illustr es ci dessous cor respondent leur mot cl puisqu il constitue le sujet grammatical des valeurs qu elles retournent qui permet l expression du theme de l nonc form Funco catastrophe 1 se produire Func catastrophezl1 s abattre sur N X Facto avocat 1 1 exercer Facts avocat 1 1 repr senter N Y 5 5 2 3 FL encodant des relations paradigmatiques Pour ce qui est des FL paradigmatiques nous distinguons trois cas Premi rement les cas o la FL permet l identifica
59. Universit de Montr al janvier 2007 Birte L nneker Rodman et Collin F Baker The FrameNet Model and its Appli cations Natural Language Engineering 15 3 415 453 juillet 2009 Mathieu Mangeot Projet Papillon int gration de dictionnaires existants et gestion des contributions Dans Actes de JST 2002 volume 1 1 pages 64 65 National Olympic Memorial Youth Center Tokyo Japon 17 19 novembre 2002 Mathieu Mangeot Papillon Project Retrospective and Perspectives Dans Pierre Zweigenbaum dir Proceedings of Acquiring and Representing Multilingual Spe cialized Lexicons the Case of Biomedicine G nes Italie 22 Mai 2006 LREC workshop 2006 Mathieu Mangeot et Kyoko Kuroda Divergences interlinguistiques dans le dic tionnaire multilingue Papillon Dans Actes de MTT 2003 First International Conference on Meaning Text Theory pages 33 42 16 18 juin 2003 272 Colin McIntosh Ben Francis et Richard Poole dir Oxford Collocations Dictionary for Students of English Oxford University Press Oxford 2002 Igor Mel uk Lexical Functions in Lexicographic Description Dans Proceedings of the Fight Annual Meeting of the Berkeley Linguistics Society pages 427 444 Berkeley Department of Slavic Languages and Literatures University of California 1982 Igor Mel uk Cours de morphologie g n rale Vol 2 Significations morpholo giques Montr al Les Presses de l Universit de Montr al Paris CNRS di
60. Y Sem 7 MANIERE gt Sem 7 1 Instrument moyen mani re b Sem 7 2 Mani re dont Tentite est utilis e exprim e gt Sem 7 3 Mani re de r aliser l ac tion v nement gt Sem 8 CAUSE Y Sem 9 LOCALISATION gt Sem 9 1 Lieu typique gt Sem 9 2 Position spatiale temporelle Y Sem 10 ACTION V NEMENT Sem 10 1 Cr ation causation d exis tence Sem 10 2 Manifestation Sem 10 3 Utilisation fonctionnement typique Sem 10 4 Augmentation am lioration Sem 10 5 Diminution d gradation Sem 10 6 Disparition Fin d existence Sem 10 7 Non fonctionnement Refus Sem 10 8 Tentative Figure III 1 Codes associ s aux classes s mantiques Y Syntp 1 1 actant gt Syntp 1 1 Y Syntp 2 2 actants gt Syntp 2 1 1 gt Syntp 2 6 1 gt Syntp 2 2 2 gt Syntp 2 7 2 gt Syntp 2 3 3 gt Syntp 2 8 3 gt Syntp 2 4 4 gt Syntp 2 9 4 gt Syntp 2 5 gt Syntp 2 10 Q Y Syntp 3 3 actants Syntp 3 1 1 2 Syntp 3 15 2 3 Syntp 3 2 2 1 Syntp 3 16 2 1 52 Syntp 3 3 2 3 Syntp 3 17 2 2 Syntp 3 4 2 4 gt Syntp 3 18 3 1 Syntp 3 5 3 2 Syntp 3 19 3 2 Syntp 3 6 1 1 Syntp 3 20 3 4 Syntp 3 7 1 4 2 Syntp 3 21 3 1 Syntp 3 8 1 4 3 Syntp 3 22 3 3 Syntp 3 9 1 4 4 Syntp 8 23 Q 1 Syntp 3 10 1 Syntp 8 24 Q 2 Syntp 3 11 1 1
61. ap assaiiA ej anod ans w ap JHUN Luv op _nva p g nun ie1 SP ANSAN nv op 5puuo onovdvo 1suodsuer nad anb asipueydiew ap ayquend 9INSOIN A anor xc ep ann abodinba dinb Tsalniy JOINS891 quu surr A 289 daSiiqeys l anod ins Jaw uo anb 3ieu 8 ap JOUDI ANS 1uodsue11 sinoo s UO JEDIeqWID 1l1 d uoppand sans sijn neadeiq quawanbsoquia p ajjasasspd e Japgode e queues j ssed ILLDWD AIUD JOSI IGOWLUI e ues 1u uuni31su ating PDULIANO JaBuip e queAas Jilisodsiq 014418 BJOUOS EUS S yOz UN 3147PW e JURAIAS psog e Ji1isodsiq Noad ap ainbyf oap JueAe e ainjdjnos p40q1 1 O12 e dnod oqtu01 OJI W 900179 INOLA OBA WUeAR IJUVUIYI out IMOS 41850110Q 9702 ojqny ypnoo abpdinba p ssa PdYIOI 21409 0 SLILO s p 214409 JUDI quod ajjasasspd anbos proq s urKuod A A N N 22843 03oeg NO 1 9704114 seyesid s p sed gsijiqn 159 ind u anbyunyvsup pe nbi UD psunaq nbnueny l azine e 9199 uN p A sayodsues g Yas Ind ap yer s uludo uou 3esn un e In 343181042 SAJBISIOID SOP 9118 e Yas Ini ayred ap u29d ej g yas Ind Top im paoqsuna 191 oyoruad
62. cis ment la nature et l origine des derivations s mantiques et des collocations d autre part de fournir un cadre et une m thode de travail pour l en codage de ces relations et leur normalisation Premi rement on remarque une forte corr lation entre les FL et le ph nom ne de d rivation morphologique Nous ex ploitons ce lien entre FL et d riv s morphologiques dans la section La grande 117 majorit des FL correspondent certains types de d riv s morphologiques des langues de plusieurs familles linguistiques Notons toutefois que la piste de la mor phologie d rivationnelle se r v le davantage valable pour les d riv s s mantiques En ce qui concerne plus particuli rement les collocations mais non exclusivement nous proposons une seconde m thodologie Nous exposons dans la section 4 5 une strat gie permettant de mieux d terminer la nature des relations lexicales et de les organiser selon des attributs typiques li s aux unit s lexicales Par exemple la lexie HORLOGE sont associ s des attributs de forme et de fonctionnement qui peuvent tre exprim s au moyen de collocations par exemple murale carillon Vheure etc Normaliser les FLNS en fonction de ces attributs va permettre de les identifier et de les organiser de fagon plus pertinente dans les bases de donn es lexicales 4 2 Travaux ant rieurs Plusieurs recherches ont t men es pour proposer de nouvelles FL standard et tenter de
63. comme Tillustrent les exemples suivants Mel uk 2006 31 210 A PART ENTI RE locution pr positionnelle emploi adjectival COMME DU POISSON POURRI locution conjonctionnelle emploi adverbial DANS LE SENS DES AIGUILLES D UNE MONTRE locution pr positionnelle emploi adverbial Ces pr cisions sur la fagon dont les parties du discours sont vues dans la th orie Sens Texte permettent a pr sent d tablir la classification des FL vis e dans cette section 5 4 3 Les diff rents couples de parties du discours associ s aux liens lexicaux repr sent s par les fonctions lexi cales Une FL est consid r e dans les repr sentations syntaxiques profondes comme une lexie On peut donc lui attribuer une partie du discours profonde Cependant si certaines FL correspondent une et une seule partie du discours profonde par exemple Oper et Real sont des verbes Sioc et S des noms A et Ag des adjectifs Adv et Loc des adverbes et Imper un clausatif profond d autres peuvent tre li es deux parties du discours Magn et Ver sont des adjectifs ou des adverbes profonds en fonction du mot cl auquel elles sont appliqu es mot cl nominal Magn aboiement fort furieuz f roce mot cl adjectival Magn arm bien fortement jusqu au dents D autres encore ont un comportement lt cam l on gt dans le sens o elles pousent la partie du discours profonde du m
64. de fonction inverse s inscrit dans cette perspective Cependant on doit y apporter quelques critiques Tout comme 1993 203 231 nous pensons que cr er de nouvelles FL selon cette m thode augmente inutilement le nombre de FL De plus l id e de cr er des fonctions inverses va dans une certaine mesure contre courant du principe d orientation du Par exemple la relation entre ERASE et MISTAKE est orient e aussi le sens de Liquidative dans le contexte de MISTAKE se lexicalise par ERASE cependant ceci ne vaut pas forc ment pour la relation inverse le sens State dans le contexte de ERASE ne se lexicalise pas n cessairement par MISTAKE En d autres termes Grimes en cherchant une nouvelle voie semble s carter quelque peu des fondements th oriques inh rents aux FL pour tablir une repr sentation des FL qui cherche a tout prix a tre logique Par ailleurs si la premi re partie de sa classification semble apporter une perspective nouvelle en revanche la seconde partie n apporte pas d l ments novateurs 5 1 1 4 Classification de 1993 et Alonso Ramos et Tutin 1996 Dans sa th se de doctorat 1993 fait le point sur les classifications que nous venons de pr senter et en propose une nouvelle Cette classification est reprise et raffin e dans nous la reproduisons avec notre traduction dans la figure p 1165 Cette classification bien qu elle soit construite en regard des insuffisances formul es
65. et vice versa f et g peuvent ou non tre identiques Si elles sont iden tiques on parlera d un cas de FL r fl chie dans le cas contraire on dira qu il s agit d une paire de FL inverses Pour repr senter la double implication nous adoptons 246 la notation suivante f L L gt g L gt L e FL r fl chie Les FL r fl chies repr sentent les diff rentes formes d quivalence et d opposition s mantiques Elles sont d taill es dans le tableau Relation FL Exemple Synonymie Syn 1 Syn Syn frigidaire r frig rateur Quasi synonymie QSyn QSyn QSyn bataille 11 1 combat 11 1 Relation conf re C C aboiement 1 grognement 1 Antonymie 1 Anti Anti ami Il ennemi I Quasi antonymie QAnti QAnti QAnti compliment a r primande Conversion Conv Conve Convo craindre effrayer N X Relation contrastive Contr Contr Contr cigarette 41 pipe I Tableau 6 IV FL r fl chies e Paire de FL inverses Nous avons relev quelques paires de FL inverses dans le DiCo Elles sont pr sen t es dans le tableau Nous avons galement rep r quelques relations potentiellement r versibles mais dont l une n est pas encod e par une FL Il s agit de paires comprenant les d riv s actantiels adjectivaux Aj et les d riv s adjectivaux potentiels Able Ablez Les FL Able et Able n ont pas de FL inverses recens
66. eye dnuy s lnn uou yos nb pos ua sez x Luv aszowun Tjeayiuy juewus3e duo AJP X npiaipu uv sano Teaynuy sdwa n d ainp ind nq94q effu0rvsuanu0s use nu aquesiejd n q asnaynoy e uoxupsa nuoo 3 sieidugejijiquvy syiqoe n d quos A X ll nbe queing ausow e uorpsuanuos 24e4 gt 2uZe Uy su qul n q yq of uZeyiqUYy sillin nb A npiAipuy z s pun sabossvd nvaznq uo anb x anod woy utoqoo2 T 1 241924 IGuognuy N Sdaaua llAIss 43e Jue sajiuew s sin x N dnoo muy effuorppy ljeay uognuy anbiu e5 uu uoe x Luv pqp eZqu undauoo zT14i do uogiuv Jew uuon uoy d yno snd X Pu bo ubol Lav s nbydwos g 7a20 sn qpasqsney uogiuy JUeINp JUaWWeSIJNs aped A Jesse sed ou x Luv uaundno0n euormsionuos LadQuajliuy uogiuy neaniu seq ap x op nad roan q uo2psuanuod H do uSeyynuy uoqnuy sjuesyjns ajsnf 1no1 xn utuunjoA n q saubiou abvbvq uSeyyuy uoginuy n q azupssauaquius eHuorDs1onU09 nue1yuoouogiijuy n q ansn
67. fre eql 1529119190 Hospua e nai n queke woy suun s l adnosBas Inb uonelsosse un p uuON assnow 4 2 1 uo sun uns as Inb assnoy spiod queinos ainsay np uns yy r suounsnd sjnod ainsay UOS1D 09 alley ap ns j pnavu n yq s Aug A o 94098 g 212240d HS IN o o noanwu q uorpssavuo Enba o j j 010 PIN n q YOSYPUUP IA nqpp o q4annos y o qd nv2396 aie anod in uo nb suequetui e Suel yy s 27191880 s soyez 3405 quop nbid 2 neu 1e AJ quobin apjassvpa el yez 2112 n d 1suop xnaidaid neu 1e A uy 2p409 anod nek eyyir nov nov naud s suey JUOS JUOP neu l1e A 214914 nolig s p yez uo JUOP neu 1e AJ poaays qu nun6 seyyo naud un Jed jos l suep aassie nbleyy aquiaiudua naud anbieyyjo uopinog 21712q0 leyy s boo ajnod leyy op TTyF na X uoneyndod aun suep ap
68. gt ex slice pie lt stuff object gt ex steel car lt feature activity gt ex paying shopping et lt place area gt ex Everglades Florida La m ronymie est donc repr sent e dans ces approches a travers trois niveaux de granularit diff rents d crivant respectivement une trois et six relations distinctes Le nombre de relations lexicales identifi es dans les mod les est loin de r unir un consensus Selon T Fontenelle cette question est intimement li e au cadre th orique l int rieur duquel on se place et l utilisation que l on compte faire des relations identifi es Les coles peuvent tre en total d saccord sur ce nombre d autant plus qu il peut varier en fonction de l utilisation que l on compte faire du mod le relationnel Ainsi Werner 1988 postule l existence de trois re lations de base la modification la taxonomie et la s quence pour expri mer n importe quel type de connaissance lexicale l oppos Ahlswede amp Evens 1988 identifient et codent plus de 100 relations diff rentes rien que pour les adjectifs On s accorde g n ralement sur la n cessit de tenir compte dans les lexiques orientation s mantique des quatre relations suivantes que l on peut qualifier de fondamentales synony mie antonymie hyperonymie hyponymie Fontenelle 1997a 67 Recenser les diff rentes relations lexicales d une langue consiste tablir des anal
69. la topographie des relations lexicales d une langue Nous nous situons dans le cadre th orique de la LEC et utilisons le DiCo comme corpus de travail Il s agit d une base de donn es lexicales du fran ais d velopp e par Igor Mel uk et Alain Polgu re l Observatoire de Linguistique Sens Texte de l Universit de Montr al Notons que par analogie avec la distinc tion entre un mod le de dictionnaire de type explicatif et combinatoire un DEC et les diff rents dictionnaires r alis s selon ce mod le tels que le DECFC Dictionnaire Explicatif et Combinatoire du Fran ais Contemporain Mel uk et al 1984 1988 11992 19991 nous distinguons d une part ce qu on peut appeler une base lexicale explicative et combinatoire BLEC belek c est dire un mod le de base de donn es lexicale labor selon les principes th oriques de la LEC et d autre part les diff rentes bases de donn es r alis es selon ce mod le Il en existe plusieurs exemples le DiCo le DiColnfo 2007 le DICE Alonso Ramos 2004 la base de donn es bilingue d riv e du Robert amp Collins Fontenelle 1997b etc Contrairement un DEC une BLEC est labor e avec et en vue d un format lectronique Son objectif est d offrir une grande libert pour la structuration et la consultation des donn es Dans cette th se bien que nous utili dans les cas ambigus l tiquette s mantique de la lexie qui permet d
70. le mot cl de la FL et ses deux actants peuvent former un nonc du type Pierre donne un coup de fil Paul Dans un nonc on distingue g n ralement le rh me ce qui est d clar dans l nonc et le theme ce propos de quoi on le d clare L element communicativement dominant d un nonc correspond son th me Or la notion de th me dans le cadre d un nonc ou d une proposition correspond a la cible communicationnelle que nous cherchons d terminer pour les FL de ce type Ceci revient donc d terminer quel est pour chaque FL permettant la formation d un nonc le th me de cet nonc 2001 127 consid re deux moyens dans les langues pour l expression du th me Languages manifest two major strategies to implement the Semantic Theme syntactically the Semantic Theme is implemented either as the first Deep Syntactic Actant DSyntA 1 of the main verb of the clause which gives the Surface Syntactic Subject or as a Deep Syntactic append element a Surface Syntactic Prolepsis In many languages the Semantic Theme tends to be implemented by the DSyntA I of the main verb i e the Surface Syntactic Subject Nous consid rons donc que la cible communicationnelle d une FL dont les valeurs permettent de former un nonc avec le mot cl et ventuellement ses actants est le sujet grammatical de la valeur qui repr sente par d faut le th me du message exprim
71. les Source Cependant on occulte d une certaine mani re la relation de sens dont une analyse en termes de cadres est ca pable de rendre compte dans le cadre lt TRANSFER gt le DONOR peut tre repr sent par les r les Agent et Source exprim s respectivement par TO GIVE et TO RECEIVE 3 Relations entre cadres On distingue quatre types de relations entre les cadres une relation d h ritage une relation dite de sous cadre une relation d utilisation et une relation de renvoi 1 Relation d heritage Frame inheritance Heritage complet si le cadre B h rite du cadre A il doit y avoir un l ment dans B correspondant chaque l ment de A Les l ments de B peuvent avoir un nom diff rent de ceux de A mais il doit exister un lien entre eux Heritage monotone si un cadre parent ou un l ment parent a un type s mantique le type semantique du cadre ou de Telement enfant doit tre le m me ou un sous type de celui du parent Heritage multiple un cadre enfant peut avoir plusieurs parents 2 Relation de sous cadre Sub frame relation Beaucoup de cadres ex priment des concepts qui ont des sous parties naturelles et bien d finies Il s agit notamment des v nements complexes Le cadre lt PICNIC gt par exemple comprend les sous cadres lt PREPARING FOOD gt lt GOING TO A SUITABLE SPOT gt 37 Les sous cadres contiennent des l ments li s aux l ments du cadre
72. les expressions idiomatiques constituent la majeure partie des textes en langues naturelles 4 tel point qu un locuteur natif n a pas conscience de Vidiomaticit ench ss e dans sa propre langue maternelle 19 M me dans les dictionnaires traditionnels o beaucoup de locutions sont trait es de mani re insuffisante et o le regard de Petranger n intervient pas les emplois idiomatiques prennent plus de place que les emplois non idiomatiques Si tous les emplois idiomatiques taient trait s selon leur dignit lexicale et selon les besoins d un tranger leur sup riorit serait crasante Car le lexique est beaucoup plus idiomatique qu on ne pense Sa caract ristique principale n est pas sa compositionnalit mais son idiomaticite 1997 280 Le caract re la fois omnipr sent et inconscient de l idiomaticit d une langue la rend donc difficile saisir et caract riser 2 1 2 4 Degr de figement des liens lexicaux La phras ologie d une langue c est dire l ensemble de ses expressions idioma tiques comporte un caract re graduel et ont pr sent plusieurs typologies des expressions idiomatiques Nous ne rentrons pas dans le d tail de ces classements mais attirons l attention du lecteur sur la distinc tion fondamentale entre deux types d expressions les locutions et les colloca tions Pour les d finir nous devons introduire les notions de compositionalit et de choix Un syntagme
73. les lo cutions n entrant en ligne de compte que dans la mesure o elles participent une collocation Par exemple dans le syntagme collocatif peler une pomme de terre la locution POMME DE TERRE joue le r le de la base de la collocation et PELER de son collocatif 2 1 2 5 Granularit du syst me des relations lexicales Pour aborder la question de la granularit du syst me des relations lexicales et de leur d nombrement nous devons rappeler la diff rence pr c demment mentionn e 21 entre une relation lexicale et les liens lexicaux qui en constituent des occurrences Le choix de rassembler deux liens lexicaux sous une m me relation lexicale ou sous deux relations diff rentes tient au degr de granularit que l on choisit Plus le degr de description est pr cis et plus le nombre de relations risque d augmenter Prenons le cas de la m ronymie Dans certains mod les on la consid re comme une simple relation partie tout sans plus de pr cision Au contraire dans la base de donn es WordNet trois types de m ronymie sont distingu s member meronymy gt ex association associate lt substance meronymy gt ex steel iron et part meronymy ex table leg poussent plus loin encore la granularit en proposant six types de relations m ronymiques soit lt component integral object gt ex pedal bike member collection gt ex ship fleet lt portion mass
74. lettre S3 accusation I 1 objet motif de ART De m me il existe des cas o le deuxi me ou troisi me actant d une lexie est galement l instrument servant la r aliser par exemple S2 Sinstr canard 11 instrument vent clarinette saxophone etc xli L emploi des r les actant patient instrument permet de pr ciser le r le des actants qui sont vus plus largement comme des participants et d viter toute am big it dans Tinterpretation des FL Le DiColnfo offre un mod le ais ment reproductible pour la structuration de bases de donn es terminologiques Notons que ce modele n est pas incompatible avec un dictionnaire terminologique plus traditionnel Un exemple de cette possible mixit est donn par Le Dictionnaire Analytique de la Distribution Il s agit de la version informatis e du dictionnaire papier de Dancette et Rethordi 2000 dictionnaire sp cialis de nature encyclop dique qui a int gr la description de certains liens entre termes en utilisant les FL Plusieurs autres chercheurs ont entrepris la mod lisation des relations terminologiques au moyen des FL Ainsi propose des exemples d entr e de type DEC pour des termes de g ologie zoologie et physique a encod une partie des relations terminologiques d un dictionnaire de biologie mol culaire Biolex l aide des FL et propose de combiner le mod le lex matique fonctionnel et le mod le Sens
75. ment que l adjectif COURT ont tent d valuer le degr de prototypicit en dressant une chelle de 1 5 pour des liens allant du moins prototypique au plus prototypique Par exemple alors que la paire IMMA CULATE FILTHY totalise une moyenne de 4 62 le couple MAXIMIZE MINIMIZE est consid r antonyme au plus haut degr de prototypicit soit 5 Par ailleurs certaines expressions sont porteuses d une charge idiomatique plus importante que d autres Par exemple dans le DiCo la relation d intensification appliqu e au verbe REGRETTER I 1 pr sente les collocatifs suivants beaucoup norm ment et infiniment Ces trois valeurs forment un crescendo du moins vers le plus idiomatique La notion d idiomaticit est un continuum et il est bien souvent difficile de trancher entre un syntagme libre et un syntagme collocationnel Aussi si certaines expressions semblent totalement libres pour un locuteur natif d une langue on observe par le biais de r v lateurs tels que les syst mes de traduction automatique qu elles sont pourtant idiomatiques et contraintes dans leur forma tion Par exemple comme le souligne Orliac 2004 2 l expression transparente to brush one s teeth est une collocation en anglais Pour d signer la m me action on ne peut employer une expression quivalente telle que to wash one s teeth alors que les deux expressions sont possibles en frangais se brosser laver les dents Selon F Hausmann
76. nous proposons deux m thodologies pour le j 20 rep rage d analogies entre relations lexicales Pune destin e aux derivations s mantiques l autre aux collocations Nous reconsiderons l encodage des fonctions lexicales non standard et en sugg rons une normalisation permettant de mieux les identifier et de mieux les organiser dans les bases de donn es lexicales Dans le cinqui me chapitre nous proposons une vue d ensemble des diff rentes classifications labor es sur les FL pour justifier la n cessit d en cr er un systeme organisationnel Nous pr sentons le syst me que nous avons r alis en d taillant chacune de ses perspectives Dans le sixi me chapitre nous detaillons la fa on dont le syst me a t impl ment et pr sentons les applications que nous en avons d riv es un outil d aide a l en codage des relations lexicales ainsi qu un algorithme pour le calcul d informations lexicographiques destin l automatisation partielle de la r daction de fiches lexi cographiques Enfin le septi me chapitre constitue la conclusion g n rale de la th se Nous pro posons un bilan des aspects th oriques et applicatifs d velopp s tout au long de ce projet en mettant en valeur la contribution apport e Nous pr sentons galement les perspectives futures que nous souhaitons d velopper dans le prolongement de la th se Chapitre 2 Ressources et modeles lexicaux rela
77. riau etc On note par exemple les FLNS suivantes d crivant les diff rentes formes de jupe Forme Qui descend jusqu aux mollets de X jupe mi mollet Forme Qui descend jusqu aux genoux de X jupe au genoux Forme Qui a des plis comme d coration jupe plis fronc e pliss e 183 5 2 2 6 Classe PHASE ASPECT Cette classe regroupe les composantes s mantiques ayant trait au d roulement d un fait Nous avons distingu sept sous classes Les quatre premi res sous classes correspondent diff rentes phases d une action ou d un v nement soit la pr paration le d but le milieu la fin par exemple Prepar assassinat comploter pr parer IncepFunc abc s 1 se d velopper se former na tre Loc in N Y Centr d bat 1 centre c ur de ART FinOperi ab me II 1 sortir de ART Les cinqui me et sixi me sous classes regroupent les composantes s mantiques exprimant un aspect tel que le r sultat ou la r it ration par exemple Sres tirage 1 1 copie exemplaire tir part De_nouveauOper ami I 1 redevenir ART Enfin la septi me sous classe comporte les composantes s mantiques ayant trait l expression de la dur e d une action ou d un v nement par exemple Magn TP applaudissements prolong s 5 2 2 7 Classe MANI RE La classe MANI RE regroupe les composantes s mantiques li es la mani re au sens large c
78. s p sonbryeurse yuAS sed s om r yuouronb q sonbryeursipered l u 118019711 s rg rx q SOQUUOP seq s run yo sJu rmoj oooo SoTROTXeT Suorye r pueu fe O9IX9 T4 U99109 reoneur syryeo o r3 sean WeIs OIOJEUIQUIOD IP9Id s m um f s p y suey 10d uote So qe op s lqur su SoJoridoid op s rreyruns mneurure3 OIOJEUIQUIO Z p ursiyeuuounqrunsip SIPSURIJ nbrx T S TB TX 591 sonbt PUUOISUOU run s p nbryuvur s sed ueulgs s oeds sus np Iptynur onbriygut soedso s s urKuouKs s nbiy s eorx onbrureudp uomno n suoos sreduedy u4Aso lq ST EUL1O1 sonbryueur nbrx np onbryoeprp u1 q rded 9S s9Au p suorsoo oo s rg rx l suorey r ey INS q o rq xXNeAeI stesue nad s nbrsoroqdrour sonbryeurse yAS soap sonbryeut sonbryeursipered soguuop seq 3rpered suoryejol OUIOJ snos f rordo 6 rurAuou4s SOJROIXET Suorye r stesue 9 0pIJuY SUOIJETON s p nbrio u3 uorrsoq s enSueT WoON 57 2 3 Deux modeles psycholinguistiques Dans cette section nous pr sentons deux tr
79. sentiment de et celles s exprimant seulement dans une relation paradigmatique par exemple Gener chien animal 96 1997 PROPOSITION Spec et Part Fontenelle 1997b pour repr senter l hy ponymie et la relation de m ronymie fonctionnelle 1999 SUPPRESSION La FL Nocer Nuire a illustr e par les deux exemples ci dessous est supprim e dans Mel uk et al 11999 Nocer moustique piquer Nocer voiture faucher happer ren verser 2002 PROPOSITIONS A l examen de relations lexicales fr quentes dans un corpus terminologique Meta donnee m tadonn e Avant compiler pr compiler Reciprocite connexion interconnexion Un seul utilisateur mono utilisateur 2003 AJOUT en tant que localement standard gt De_ nouveau 2007 PROPOSITIONS Locye travers et Lim Limite bord de 2003 Locper mer par Locpe champ travers Ve Lim territoire fronti re Lim for t bordure lisi re or e Lim tuyau ouverture PROPOSITION Trait caract ristique Grizolle 2003 cf section du chapitre suivant pour plus de d tail sur cette proposition PROPOSITION ET USAGE S INIT Etat pr c dent une action Apresjan et al 2003 97 S INIT wake up sleep S INIT calm down anziety S INIT stop movement PROPOSITION ET USAGE ANTI1 et 12 Apresjan
80. type relationnel paraphrasable par lt relatif gt comme dans les paires de lexies FA MILLE FAMILIAL ENFANT ENFANTIN CHAT FELIN etc Cette FL ne doit pas tre 249 confondue avec A qui mod lise un modificateur adjectival du premier actant d une lexie comme dans les paires ADMIRATION ADMIRATIF ELOQUENCE ELOQUENT ZELE ZELE etc Nous avons relev dans le DiCo les relations suivantes que nous marquons comme erron es l aide d un ast risque So curieuz 1 1 curiosit 1 So fier 1 frert I1 1 So gai ta gait a So t tu ent tement Ces erreurs ont t mises en valeur par l application de la r gle 527 Ao qui a g n r les relations inverses Ao curiosit 1 curieur 1 1 Ao fiert 1 1 fier l Ao gait a gaidla Ao ent tement t tu Ces relations taient elles m mes erron es puisque les valeurs ne correspondent pas aux quivalents adjectivaux des mots cl s mais aux modificateurs de leurs premiers actants tel que X a de la curiosit 1 etc c est dire la FL L encodage initial ad quat n est pas So Equivalent nominal mais SoPred Fait que X soit On peut alors d clencher la r gle Ay SoPred et g n rer les descriptions suivantes SoPred curieur 41 1 curiosit 1 A curiosit 41 curieux 1 1 SoPred fier 1 fiert 1 1 A fiert 1 1 fier 1 SoPred gai ta gait a A gait a gaia
81. 1o1ed tu e u InO nbvunopuu 4quotu uusiue3 ui un e 2e43 ini onbruiophyond j puvyda 2 sasuad yez InO n va f auavf ingo Annexe l Applications r alis es avec les FL On distingue trois types d applications de la LEC et des FL Bien que ces derni res aient t con ues dans une optique de traduction automatique et plus largement de traitement automatique des langues ce n est pas le seul cadre d application dans lequel elles entrent en jeu Le mod le lexicologique de la LEC est un mod le lexical relationnel et d compositionnel Son utilisation naturelle est donc la description des propri t s s mantiques et relationnelles des unit s lexicales La LEC a donn lieu plusieurs types de ressources que nous pr sentons dans cette section des ressources g n rales monolingues section M1 bilingues ou multilingues section 2 ainsi qu des ressources sp cialis es monolingues ou bilingues section 3 Par ailleurs les FL peuvent constituer un bon cadre de r f rence pour l enseigne ment du lexique C est l une application majeure qui ne semble pas avoir t pr vue au moment de leur laboration mais pour laquelle elles se r v lent un outil novateur et efficace De nombreux travaux ont d j t r alis s dans cette voie Nous pr sentons le LAF Callex le Dice le Dafles et Alphalex dans la section Enfin la finalit premi re des FL ta
82. 4 4 1 Pr sentation Le DiCo associe un certain nombre de marques d usage aux lexies d crites familier fam vulgaire vulg p joratif p jor vieilli vieilli vieillissant vieillis sant litt raire litt soutenu soutenu officiel offic formel formel sp cialis sp c religieux relig rural rural ironique iron enfantin enfan tin affectueux affectueux n ologique n ol anglicisme angl qu b cisme 238 Queb francisme ou relatif au fran ais de France fir En s appuyant sur ces notations il est possible de d terminer automatiquement les marques d usage des valeurs de FL pour lesquelles on veut cr er une fiche lexicographique Pour chaque valeur on pourra cr er automatiquement un champ lt marque d usage gt l int rieur de la fiche qui lui est d di e Par exemple pour la lexie VIEILLE FILLE 7 on pourra exploiter les informations suivantes QSyn c libataire p jor vieille fille et d duire que le champ lt marque d usage gt de sa fiche doit comporter la mention p jor Il est galement possible de prendre en compte les marques d usage lorsque l on d crit automatiquement certains liens lexicaux cf section 6 4 6 Ainsi partir de la relation suivante QSyn colle II nom f m fam probl me on pourra d duire
83. Cible ou enfin la valeur de la FL Cible V gt Cible Mot cl de la FL gt Cible Q Participant ext rieur gt Cible 1 Premier actant du mot cl Cible 2 Deuxi me actant du mot cl gt Cible 3 Troisi me actant du mot cl gt Cible 4 Quatri me actant du mot cl Cible 5 Cinqui me actant du mot cl gt Cible 6 Sizi me actant du mot cl gt Cible V Valeur de la FL Figure 5 14 Liste des cibles communicationnelles vis es par les FL Cette r partition des FL est illustr e travers la lexie RANCUNE dans la figure 5 15 222 s fl uuonrporunuruo s fqD s p uonouoy Uo SO9SIUBSIO ANNONVY Op S 9 eoIX9 SUOTJEIOH GT G mr red 3doiq Td VI dd TAIO lt Lav Ioue 1onugyye tosrede snulp pasgsnes Lav a951 oju r 1091dxo 1981778 01901998 sN qpaigsney ruy r yu urre 09unqiuo sne Lav pur j 1odisstp 03sunjnbiq HNATHALXA LNVdTOLLMVd lt Iray mu Si gdone xnou aq IX N 8 Lav T ndsur T u do Lav toqtosns ionboao d q rpu u 15dO op yf qo LNVLOV AMNAISIOUL HTAIO lt lt z soidd j uo gt Z N ed yez Luv q m s S 1doO op LNVLOV ANAIXNAQ HTAIO lt ruy s yno z ynurissip Iuoquos T q s piue US quo
84. Deux types d antonymes sont distingu s Les antonymes directs par exemple HEAVY et LIGHT sont conceptuellement oppos s et constituent aussi une paire lexicale Les antonymes indirects par exemple HEAVY et AIRY sont conceptuellement oppos s sans tre pour autant consid r s comme une paire lexicale WordNet organise les adjectifs en groupes de synsets associ s par similarit s man tique un adjectif focal qui relie le groupe un autre groupe contrast du p le oppos de l attribut Par exemple PONDEROUS est synonyme de HEAVY qui est un antonyme direct de LIGHT Par cons quent on observe l opposition conceptuelle PONDEROUS LIGHT par le biais de HEAVY Outre les synonymes et les antonymes il existe des pointeurs vers les attributs de noms susceptibles d tre modifi s par des adjectifs Par exemple l adjectif HEAVY est associ l attribut weight TALL pointe vers les attributs height et stature Enfin on observe des formes d ri v es par exemple TALLNESS pour TALL Les adjectifs relationnels ne sont pas trait s de la m me mani re en raison de leur diff rence de comportement ils ne sont pas gradables et n ont pas d antonymes directs Ils sont donc contenus part dans la structure de la base de donn es La relation propos e pour les adjectifs relationnels est la d rivation Pour chaque ad jectif relationnel on indique le nom dont il est d riv par exemple PRESIDENTIAL est
85. FL composantes s mantiques multiples Certaines FL encodent plusieurs composantes s mantiques Par exemple 173 alors que la FL Real en 107 repr sente la composante utilisation la FL plus complexe AntiBon Realia X utiliser en manifestant de l agressivit envers N en 108 encode deux composantes s mantiques utilisation et n gativit 107 Real lazonzfa klaxonner 108 AntiBon Realia klaxon a balancer ART coup de a N 4 Plusieurs FL pour une m me composante s mantique Certaines FL s mantiquement tr s proches n ont toutefois pas un encodage similaire dans la mesure o elles repr sentent des configurations syntaxiques diff rentes entre un mot cl et sa valeur Par exemple les fonctions Fact Real et Labreal habituellement cat goris es parmi les verbes d utilisa ij tion ou de fonctionnement gt comportent toutes pour les lexies d artefact le sens d utilisation ou de fonctionnement d volu l artefact Elles se diff rencient par les positions syntaxiques des actants du mot cl Ainsi la lexie CHARRETTE dont la forme propositionnelle est not e ci dessous contr le trois actants utilis e par l individu X pour transporter Y et tir e par l animal Z On trouve dans le DiCo les relations lexicales suivantes 109 a Real charrette conduire mener ART b Facto charrette rouler Fact charrette transporter
86. FL d rivat me exemple Locad Se depla ant Fran ais mener a mener vers Locab Se d pla ant Fran ais porter em porter partir de PredLocin Se trouver Inuktitut snaq sna mi rive tre sur la rive dans Instr Instrumentatif Hongrois bicikli bicikli vel v lo v lo Propt Cons cutif Hongrois harag harag b l col re par col re CausPred Factitif Fran ais gal gal iser Func Verbalisateur Fran ais bourgeon bourgeonn er Oper Labor Involv Incep Inchoatif Esperanto ami ek ami aimer tomber amoureux Cont Continuatif Allemand machen vveiter machen suivre un cours poursuivre Fin Terminatif Hongrois enni meg enni manger finir de manger Liqu Liquidatif Fran ais honorer d s honorer Excess Fonctionnement Fran ais charger sur charger excessif De nouveau R it ratif Francais tenter re tenter Centr Le milieu de Fran ais car me mi car me Syn Synonymie Frangais cin cin oche Tableau 4 11 Correspondance entre FL et d rivat mes Le tableau LIT met en vidence une tr s forte corr lation entre les FL standard et les d rivat mes de plusieurs langues du monde La majeure partie des relations encod es par les FL standard peuvent tre exprim es au moyen de la d rivation morphologique Voyons a pr sent s il est possible d effectuer une corr lation entre la d rivation morpho
87. N uoo 8 q 4of NOAUI D N N Woon zpu T774940 Nonu o Z M N aubynos I7 mp ppo Yaoea Z N msl 197104 eZuonpsa nuoo eoung g N uaquodsuviy m y eoe4 z AN l 4 z X N ans uq oqp s j oydous0309 T un i 1154 s ueq e xn q souno q m peaS q Z queyoe un TA op S D T A xne s roosse sonbixequds s Su gA Sop STJ GG AMITA 204 Luv e nod T lqv ap ut ld Lyy sed Tv ubew VT 4ed 1doid 1 132 s pinos 22222 5 lnsn ui i Anuv uuni6 l ZIA ubennuy liq l pul nbuo sdwa ubew 22018 ubew saannqiuye s in nns I yueud l T lqyTuone ouuo 3 binpul T lqvnuv T lqv uessieuuo2 us nuvo aysouwiue p quawiuassal In o3uei u so s nbneuiBipeued suonel q Z N nod A N e X N LuV Jeudsul Z N np LuV 5 A saua MV 4 lnuimn e A SI8AUS J YYW JWNoU I Anoid Luv Wue Luv d sns i nboAoid 181pue us LuV dissip Ieuuesap LY Jawye gt Januajze l siede LYV Hu lj nu lju uuire LV ase 21110122 Luv sluaquod 1 U2E2 LYV
88. Spec Whole et Part Sequence et Phase DETAIL FUNCTIONS Actant functions Ni No Ns S A1 Able Advi Posi Peripheral functions Location Locationfrom Locationto Locationtemporal Niocative Loc Loc a LOCtemp et Sioc Instr et Ninstr Sinsir Nmod Naz et Nconsequent inad Sinads Sres Aspect functions Incep Cont Centr Degrad Fin et Perf Prep Prox Antecedent et Consequent Degree functions Magn Bon Ver Increase et Decrease Plus et Minus Factives functions Subject Factive Object Factive and Adjunct Factive Miscellaneous functions Imper Figur Involv Manif Sympt Son Figure 5 2 Classification de Grimes 165 A FL paradigmatiques B FL syntagmatiques 1 Relations de substitution Syn Anti Antigomp Contr Gener Convijk 7 Verbes supports Oper Func Labori 2 D rivations syntaxiques So Ao Vo Advo 8 Verbes de r alisation Real Fact Labreal 3 D rivations actantielles Si Ai Adv 9 Pr dicateur Pred 4 D rivations circonstancielles Sinstr Smed Sres Smod 10 Verbes phasaux Incep Cont Fin 5 Qualificatifs d actants potentiels Able Qual 11 Verbes causatifs Caus Liqu Perm 6 Ordre typique Imper 12 Verbes aspectuels Prox Perf Result 13 Verbes introducteurs d une nou velle situation Involv Manif Sympt k 14 Verbes ayant un sens n
89. Syn Liqu Loc FL candidates Conv Oper Magn Mult Der d riv s syn Func Anti Sing taxiques Labor Gener Bon Copul Fact Ver Degrad Incep Real Son Fin S Prepar Caus A Figure 3 5 Liste des FL pr sent es dans Zholkovsky et Meluk 1970 Notons que nous n indiquons ni ne d taillons ici l ensemble des propositions la plupart d entre elles sont d taill es dans le chapitre suivant section 4 2 Le recen sement des diff rentes propositions de FLSS invite 4 se demander qui statue sur les FL et d termine si une proposition va mener un ajout Les listes de r f rence sont habituellement consid r es comme les FL appartenant au DEC ou au DiCo ou pr sentes dans les publications de Mel uk et Polgu re Cependant il n existe pas 94 de comit de validation des FL Aussi certaines propositions sont mises en usage dans certaines bases de donn es lexicales sans recevoir de r elle lt validation gt Dans la chronologie que nous pr sentons nous distinguons donc s il s agit d une simple proposition ou si la proposition est int gr e un syst me et est op ratoire Nous utilisons les termes proposition ajout usage et suppression Notons galement que certaines propositions ont t sugg r es tr s longtemps avant qu elles ne soient in t gr es dans les lt listes de r f rence gt C est le cas par exemple de la FL Spec propos e Fontenelle 1997b pour rendre compte de la relation
90. Syntp 3 25 3 Syntp 3 12 1 2 Syntp 8 26 Q 1 Syntp 3 13 1 3 Syntp 3 27 6 2 52 Syntp 8 14 2 1 Y Syntp 4 4 actants gt Syntp 4 1 1 4 2 3 gt Syntp 4 3 2 4 1 3 gt Syntp 4 2 1 4 3 2 Y Syntp Mod Modification simple gt Syntp Mod 1 Z Y Syntp 41 Modification un actant gt Syntp Mod1 1 1 gt Syntp Mod1 5 2 gt Syntp Mod1 2 2 gt Syntp Mod1 6 3 gt Syntp Mod1 3 3 gt Syntp Mod1 7 b Syntp Mod1 4 1 Figure II 2 Codes associ s aux classes de valences syntaxiques lvii v Pdd 1 Valeur Pdd 1 1 Pdd 1 2 Pdd 1 3 Pdd 1 4 Pdd 1 5 v Pdd 2 Valeur Pdd 2 1 Pdd 2 2 Pdd 2 3 Pdd 2 4 Pdd 2 5 v Pdd 3 Valeur Pdd 3 1 Pdd 3 2 lviii N Pdd 3 3 V A NN Pdd 3 4 Adv A ADN Pdd 3 5 Claus A V N v Pdd 4 Valeur Adv 25757 Pdd 4 1 N gt Adv 5 Pdd 4 2 Adv V Pdd 4 3 V Adv N V Pdd 4 4 Adv Adv AV Pdd 4 5 Claus Adv Vo v v Pdd 5 Valeur Claus mi pdd 5 1 N Claus o pdd 5 2 A Claus A pdd 5 3 V Claus N A pdd 5 4 Adv Claus pdd 5 5 Claus Claus Figure III 3 Codes associ s aux classes de couples de parties du discours des liens lexicaux encod s par les FL gt Cible Z gt Cible gt Cible 1 Cible 2 gt Cible 3 Cible 4 Cible 5 gt Cible 6 Cible V Mo
91. Texte avec les FL pour tablir une m thodologie de repr sentation du vocabulaire des domaines sp cialis s On note galement Pexistence de ressources terminologiques inspir es de la LEC comme le DAFA qui toutefois ne retient pas l encodage brut gt des FL pour Tidentification des relations terminologiques Il y a donc fort penser que ces travaux terminologiques fond s sur une m thode de description lexicographique et utilisant les FL comme outil syst matique pour la description des liens terminologiques constitueront un moteur dans le domaine La ressource est accessible en ligne l adresse suivante http olst ling umontreal ca dad xlii II 4 Ressources lexicales vis e p dagogique et ou tils d apprentissage du lexique Nous avons pr sent dans le deuxi me chapitre de cette th se diff rents mod les relationnels du lexique Le principe commun ces mod les est de mettre l accent sur l interconnexion des l ments lexicaux Une base de donn es lexicale reposant sur un tel mod le constitue donc un outil relativement cadr pour parcourir le lexique 1996 104 consid re les FL comme un outil heuristique pour l ap prentissage des langues et montre comment elles peuvent servir d outil m thodique pour parcourir le lexique en prenant n importe quelle unit lexicale comme point de d part That is why we can expect to cover the information we want by picking any lexeme whatever as s
92. aide Pencodage des liens lexicaux au moyen des FL section 6 3 directement li cette repr sentation du syst me de FL Enfin dans la section nous pr sentons des heuristiques pour l automatisation de la r daction de certains champs de fiches lexicographiques 6 2 Impl mentation du syst me de fonctions lexi cales Nous avons choisi d impl menter le syst me de FL sous la forme d une table de donn es qui s inserit dans la base de donn es relationnelle plus g n rale du DiCo 226 d velopp e par Alain Polgu re a FOLSTPJ Cette table contient six champs cf figure dans lesquels figurent des codes renvoyant aux diff rentes classes du syst me de FL fonction pdd s m syntp cible FL_ inverse Magn 3 1 4 2 4 3 4 3 1 Mod 1 Obperiz 2 1 2 2 2 4 1 3 3 7 1 _ QSyn 1 1 2 3 3 2 4 4 5 5 1 1 _ s QSyn 1 55 1 1 1 3 5 1 _ 3 Figure 6 1 Syst me de FL repr sent sous forme de table de donn es Le champ fonction est g n r automatiquement lors de la compilation du DiCo il contient le nom de la FL Le champ pdd renvoie aux classes du syst me de FL repr sentant les couples de parties du discours associ s aux FL Dans le champ sem sont repr sent es les classes s mantiques Le champ syntp contient les codes renvoyant aux classes de valences syntaxiques profondes Dans le champ cible est indiqu quelle est la cible communicationnelle v
93. anglais MATE Bohnet et al 2000 est un g n rateur automatique de phrases d velopp au d partement d informatique de Stuttgart par Bernd Bohnet Andreas Langiahr et Leo Wanner Il repose galement sur le mod le linguistique de la Th orie Sens Texte L environnement de d veloppement prend en entr e une structure concep tuelle d riv e des donn es pr sentes dans une base de donn es lexicale de type DEC Le processus de g n ration consiste en une s rie de mises en correspondance des diff rentes structures li es aux niveaux de la TST d ja mentionn s plus haut Une fois que la structure morphologique de surface est atteinte le r sultat prend la forme d une cha ne lin aire de mots forme Le module central de l environne ment de d veloppement est un compilateur mettant en correspondance deux deux les structures des diff rents niveaux de repr sentation Un d bogueur ainsi qu un inspecteur sont r alis s pour venir en aide un utilisateur lors de l analyse du traitement des structures L utilisateur peut ainsi interagir avec le compilateur 2002 a r alis un synth tiseur automatique de texte Sentence Garden permettant de g n rer pour une phrase donn e l ensemble de ses paraphrases pos sibles Il se distingue des autres mod les par le fait qu il cherche g n rer partir d une repr sentation s mantique l ensemble des r alisations possibles d un mes sage et non une seule C
94. associe la FL Obpergi par exemple le patron 2 1 que l on peut illustrer comme suit Oper assentiment obtenir recevoir recueillir ART de N X Oper21 RECEV OIR ll F ku deuxi me actant premier actant Y de de ASSENTIMENT Classe 4 Structures actantielles quatre actants La quatri me classe rassemble les structures actantielles comprenant quatre ac tants Parmi l ensemble des relations lexicales du DiCo nous n avons relev que deux patrons de valence syntaxique profonde quatre actants encod es par les FL Labreal 23 et Labory39 Labrealj23 enveloppe I1 acheminer exp dier N Y NZ sous Labor 32 testament 1 l guer N Z a N Y 200 Ces deux FL pointent respectivement vers les patrons 1 2 3 et 1 3 2 Le patron 1 3 2 peut tre repr sent par le sch ma ci dessous Labor132 IV premier actant de s deuxi me roisieme actant de actant de LEGUER IV M ite x Il Z Y Nous n avons pas relev parmi les relations du DiCo de relations actantielles plus de quatre actants Nous passons par cons quent la pr sentation des relations attributives Classe 5 Relations attributives simples Le premier type de relation attributive correspond une modification du mot cl Elle est repr sent e par le patron 17 71 Rappelons que le symbole lt est toujours situ droite du symbole repr sen
95. astronomie h Discipline qui tudie langue linguistique Cette relation concerne un tr s grand nombre d unit s lexicales la condition de cardinalit serait donc remplie si l on souhaitait faire de cette FL une candidate au statut standard Toutefois la diversit des valeurs est relativement limit e dans la mesure o celles ci sont souvent d riv es morphologiquement de leur base par le d rivat me logie La FLNS tude de semble bien s int grer au syst me de FL elle peut se combiner la FL S par exemple pour encoder la relation Personne qui tudie cf exemples 71 ce qui motive d autant plus sa normalisation 71 a S Etude de crime 1 a criminologue Si tude de poisson 1 a ichtyologue Si tude de signe III astrologue 4 4 2 3 La relation fait entit X qui a Paspect qui voque X La plupart des relations d rivationnelles adjectivales sont encod es au moyen de FL standard Ao quivalent adjectival A1 tel qu il est A tel qu on le Able tel qu il est susceptible de Qual tel qu il est potentiellement objet de ainsi que leurs modulations avec les diff rents actants concern s comme le montrent les exemples 72 a d cevant b Able crainte craintif Qual haine odieux d A abandon 1 2b abandonn e Ao catastrophe 1 catastrophique 140 No
96. attributs du type forme taille fonction contenu 145 et d encoder l ensemble des FL qui leur sont associ es au moyen de ces attributs Toutefois avant d entreprendre une analyse des FL en termes d attributs nous souhaitons en premier lieu mettre notre travail en perspective avec l approche du projet FrameNet Nous pr sentons donc les diff rents l ments de cadres propos s dans FrameNet qui s av rent relativement similaires du moins dans leur fonction d identification aux attributs que nous cherchons d finir 4 5 1 2 Les l ments de cadre dans FrameNet Nous avons pr sent FrameNet en d tail a la section Dans cette ressource lexicale chaque unit lexicale est reli e un ou plusieurs cadres conceptuels qu elle voque Ces cadres conceptuels sont d finis au moyen d l ments de cadre Frame Elements ou FE Ceux ci permettent de d crire la valence s mantique d une unit lexicale Chaque cadre contient des l ments de cadre centraux core FE et des l ments de cadre secondaires non core FE Par exemple le cadre lt TRANSFER gt a pour l ments centraux DONOR RECIPIENT THEME et TRANSFEROR et pour l ments secondaires MANNER MEANS PLACE PURPOSE REASON et TIME Chacun des l ments de cadre est susceptible d tre exprim au moyen d unit s lexicales de divers types Notons qu il s agit avant tout de cooccurrences libres exprim es dans une phr
97. aueinq sou noadoip T1Z 10 nAd ne deiq aqubyiubisur mif jueyodui lt sed 13s u gt n d s Z nu uluo2 1400 eziuops aaioo jaueyodiul 3s Z nu luo2 1uoq puuossnd q Ty nuga unouue 359 uosiei el uoq qav op wwupasbosd 149o9wuoo 1u uu noui p l 4199p inb zu wnooq ep 1405 X p El ANS SUO EWHOJU s l NO l5 JJo JUaUNDOG n s BUN p 292147 BWWOD 5 un e X Jed n qo 1u uinooq op 59990 sau6woo ginosse zu wnooqo s ou tos T a10 e sai seu uuou ud se lpn inb anbyiualds auljdiosiqx arboyoopwminyd nb ui diosiq e r nsnf dane sin uo anb sajjeq s p uoisu uuq 2702000 702000 Juuru x s q ay 8 1 3 eEu quo UN p ne uuoj as inb 9daq 2112492 I amp un d un suep A ap ap gudaq uoissaid naud juawaljuo3 ap 313 q 1 agsDng asiuZ q ayoung 1ne n02 aqx ap siun d 499 nb sueq Anownf uou uo6om ai uunj ap 459 nb l sueq assaipp T HUOSWWW T
98. avantage d un syst me de FL sur une classification nous devons faire la distinction entre ces deux termes Alors qu une classification organise et pr sente des l ments dans des classes d termin es selon un ou plusieurs crit res forme sens etc un syst me vise expliciter les liens entre ses l ments selon plusieurs perspectives c est dire refl ter l ensemble de leurs connexions possibles Notons que le terme syst me de FL est couramment employ dans la litt rature portant sur 156 la LEC sans qu il fasse pour autant r f rence un v ritable syst me explicit Nous tachons donc d expliciter le syst me que forment naturellement les FL en mettant en valeur un certain nombre de leurs connexions Nous mettons en avant les rela tions entre les FL selon quatre perspectives d taill es dans les sections 5 2 et une perspective s mantique une perspective li e aux parties du discours une perspective combinatoire et finalement une perspective communicationnelle Ces quatre perspectives constituent un mod le d organisation des FL partir du quel nous pourrons dans de futurs travaux cr er des interfaces de consultation pour une BLEC adapt es des besoins particuliers recherche onomasiologique recherche par structure syntaxique etc Le syst me est r alis d apr s les FL du DiCo plus particuli rement l ensemble des FL standard et semi standard ayant deux ou plus de deux arguments disti
99. com plexe et donc indirectement li s entre eux 3 La relation d utilisation Uses relation La relation d utilisation est moins strictement d finie que la relation d h ritage Si le cadre B utilise le cadre A le cadre B n a pas besoin d avoir un l ment correspondant chaque element du cadre A Par exemple le cadre lt CONVERSATION gt est clairement re li au cadre plus abstrait lt COMMUNICATION gt mais le cadre lt COMMUNICATION gt contient un l ment que le premier n a pas MESSAGE Par cons quent on dit que lt CONVERSATION gt n h rite pas de lt COMMUNICATION gt mais qu il Tutilise 4 La relation voir aussi See also relation Cette relation sert expliquer la nature des diff rences entre les cadres Il s agit d un pointeur d un cadre vers d autres cadres similaires Structure g n rale de la base de donn es FrameNet et modes d acc s aux donn es La base de donn es lexicale contient actuellement environ 9 000 unit s lexicales dont plus de 6 100 sont compl tement d finies dans 625 cadres s mantiques se mantic frames en anglais et exemplifi es l aide de 135 000 phrases annot es Elle est structur e en deux bases de donn es une base de donn es lexicale contient des informations sur les cadres et les unit s lexicales une base d annotations contient les phrases annot es et les sous corpus dont elles sont tir es chaque mot cible da
100. comme valeurs des unit s lexicales Toutefois alors que le mot cl d une FL est une unit lexicale unique sa valeur est constitu e d un ensemble d unit s lexicales par exemple la FL Oper repr sentant le verbe support d une unit lexicale appliqu e COMMERAGE A retourne l ensemble d unit s lexicales DIRE FAIRE SE LIVRER Oper comm rage a dire faire ART s se livrer A ART s Les FL identifient deux aspects d une relation lexicale D une part son sens inten sification r alisation etc et d autre part son patron syntaxique mot cl sujet verbe intransitif verbe mot cl compl ment etc Elles synth tisent donc le lien entre la s mantique et la syntaxe C est en ceci qu elles s int grent dans les mod les de repr sentation Sens Texte La TST comporte plusieurs niveaux de repr senta tion dont les premiers sont les repr sentations s mantique syntaxique profonde et 72 syntaxique de surfacd Les FL apparaissent dans les repr sentations syntaxiques profondes qui font le lien entre les repr sentations s mantiques et les repr senta tions syntaxiques de surface Elles constituent alors des unit s lexicales profondes dont le r le est de pointer vers une famille d unit s lexicales qui remplissent le r le s mantico syntaxique correspondant 1996 80 Ainsi dans la repr sen tation de la figure la fonction AntiReal appliqu e la lexie BARRICADE et vulga
101. d hyponymie qui n a t int gr e au DiCo qu en 2007 sous le nom de Hypo 95 CHRONOLOGIE SOMMAIRE DE L EVOLUTION DE L ENSEMBLE DES FONCTIONS LEXICALES STANDARD SIMPLES 1966 67 Premiers inventaires Zholkovsky et Mel uk 1966 11967 1969 PROPOSITIONS Erastov Matur Commencer tre pr t Cum Appartenant au m me groupe avec un statut quivalent Pel Quelque chose qui couvre et protege L Mobil Etre en mouvement de fa on normale prototypique Prim premier plus important parmi un ensemble de L Vacant libre vacant qui peut tre uti lise Metr param tres quantifi s typiques Fas C t Partie avant de L et LocLim Dans les limites de L 1988 AJOUT proposent les fonctions Dimin Diminutif et Augm Augmentatif Dimin dom house domik a small and pleasant house Dimin ozero lake ozerko a small and pleasant lake Augm dom house domisce domina a huge house Augm ruka hand rucisca a huge hand Ces FL sont abandonn es dans les publications ult rieures sur les FL 1990 PROPOSITIONS Grimes propose la notion de FL inverses qui sera d taill e la section 4 2 2 du chapitre suivant 1993 PROPOSITION Gener et Gener pour la dis tinction entre les relations d hyperonymie pouvant s exprimer syntagmatique ment par exemple Gener amour
102. d activit s pour l enseignement du lexiqud Polguerel 2007 Le DICE Pour l espagnol il existe galement un projet fond sur la LEC le Diccionario de colocaciones del espanol DICE Il s agit d une base de donn es lexicale d ve lopp e l universit de la Corogne sous la direction de Margarita Alonso Ramo Pour le moment la nomenclature du DICE se limite aux unit s lexicales des noms de sentiment La base de donn es suit rigoureusement les principes du DEC et du DiCo tant pour le d groupement de la polys mie que pour la repr sentation des collocations Les collocations sont organis es en fonction de leur patrons syn taxiques par exemple pour l unit lexicale CELOS jalousie les collocations sont regroup es selon les types suivants attributs des participants ex A celoso CELOS adjectif ex Magn grandes verbe CELOS ex IncepOper coger CELOS verbe ex Fact carcomer et nom de CELOS ex Germ germen Les vulgarisations des FL sont pr f r es Pencodage brut des FL que l on peut toutefois faire apparaitre en activant un lien Le dictionnaire s accompagne d exercices pour l apprentissage du vocabulaire es pagnol Il s agit premi rement d exercices de production qui s articulent autour de cinq questions 1 trouvez le bon collocatif parmi des propositions sous forme de questions choix multiple 2 trouvez le bon collocatif sans pro
103. de verbes les plus riches r alis s sur Panglais Il est d velopp l universit du Coloradd Le projet repose la fois sur les classes de verbes de Levin et la s mantique des cadres Il est mis en correspondance avec d autres bases de donn es lexicales comme WordNet et Fra meNet VerbNet est organis en classes de verbes celles ci tant des extensions des classes de verbes propos es par Levin Chaque verbe est d crit au moyen de r les th matiques de restrictions sur ses arguments et de cadres conceptuels frames en anglais constitu s d une description syntaxique et d un ensemble de pr dicats s mantiques Les donn es de VerbNet sont directement utilisables pour effectuer des calculs formels TVerbNet est accessible l adresse suivante http verbs colorado edu mpalmer projects verbnet html 52 Antidote Charest et 1 2007 est un logiciel d velopp par Druide Informatique La version actuelle du logiciel Antidote HD comprend plus de dix dictionnaires synonymes familles morphologiques analogies cooccurrences conjugaisons etc un correcteur grammatical et orthographique ainsi qu un ensemble de guides lin guistiques Les donn es des dictionnaires de cooccurrences et d analogies sont col lect es de fagon automatique ce qui leur conf re une grande quantit de relations lexicales Toutefois ces relations ne sont pas aussi pr cises que celles recens es dans les BLEC Les l
104. discours dans la Th orie Sens Texte sont consid r es d une fa on par ticuli re On observe pour certaines unit s lexicales un manque de correspondance entre leur fonctionnement syntaxique profond et leur fonctionnement syntaxique de surface Par exemple la locution BEC ET ONGLE se comporte en syntaxe pro fonde comme un adverbe modifiant un verbe alors qu en surface elle prend la forme d un syntagme nominal 33 34 et avant lui Zholkovsky 1971 197 209 propose alors de s parer deux ensembles de parties du discours Dans l approche Sens Texte conform ment la distinction entre les structures syntaxiques profondes et les structures syntaxiques de sur face on distingue deux familles de parties du discours les parties du discours PROFONDES et les parties du discours DE SURFACE cette dis tinction a t introduite et discut e dans Zholkovskyl 1971 197 209 Les premi res sont assign es aux lexies qu on trouve dans la struc ture syntaxique profonde les secondes aux lexies qu on trouve dans la structure syntaxique de surface et dans la Structure Morphologique Profonde Les parties du discours profondes Cinq parties du discours profondes ont t d termin es en se fondant sur les r les 207 syntaxiques passifs et actifs profonds pouvant tre remplis au niveau syntaxique profond soit le verbe le nom l adjectif l adverbe et le clausatif 2006 41 43 Donnons quelques pr ci
105. en 36 Ils repr sentent tous une relation entre une entit et un produit qui en est d riv On pourrait choisir de regrouper les liens entre les noms d animaux et les plats pr par s avec leur chair Dans ce cas la FL choisie refl terait une granularit fine qui exclurait les relations entre ELEPHANT et IVOIRE ou entre PAIN et TARTINE etc Au contraire choisir une description plus large comme Produit d riv par exemple permet de les regrouper toutes sous une seule et m me formule 36 a Foie de produit par gavage canard foie gras b Tranche de enduite de N pain beurr e tartine Friandise contenant beaucoup de sucre sucrerie d Plat base de agneau blanquette r ti m chout e Boisson alcoolis e faite avec cerise cherry kirsch guignolet f Plat base de viande de coq au vin g Mat riau que l on obtient partir des d fenses de l phant ivoire h Aliment pr par d riv de lait fromage laitage beurre La description des relations lexicales doit faire face 4 cette question de granularit En effet si l on consid re les FL standard et semi standard on remarque qu elles sont situ es sur un continuum du moins granulaire vers le plus granulaire Cepen dant cette granularit ne semble pas tre trait e de fa on homog ne sur l ensemble des relations lexicales La cause en est assez vidente puisque d s lors qu on s int resse de p
106. ensemble d exemples Dans ces exemples les FL Metrparametre Sont destin es remplacer les FLNS cit es Metrgimension Nom de la mesure de dimension Dimension des balles que l on utilise avec fusil 1 a calibre Mesure de la taille de bateau calaison d placement tirant d eau Taille de enveloppe 11 dimension format taille Metrcapacite Nom de la mesure de capacit Unit de mesure de la capacit en Y de clinique 1 lit Unit de mesure de la capacit en Y de restaurant couvert Metrgur e Nom de la mesure de dur e Longueur moyenne de dans une population de X vie 1 1 esp rance Metrouaiite Nom de la mesure de qualit Qualit de de X conversation b niveau Param tres selon lesquels on value dans la soci t vie 2 condi tions niveau qualit Metr eutat Nom de la mesure de r sultat Points obtenus par X Y dans partie 2 score r sultat Metrvitesse Nom de la mesure de vitesse Unit de mesure pour la vitesse de bateau n ud Unit de mesure pour la vitesse de navire n ud Metrcourant Nom de la mesure de courant d bit Mesure du courant de fleuve 1 d bit Vitesse d coulement de Y par robinet d bit Cette liste n est pas exhaustive d autres types de mesure pourraient s ajouter en respectant le mod le propos 129 4 3 2 2 Marque Nous proposons la FLNS Marque pour regrouper les relati
107. est r a lis et exploit en lexicographie en psycholinguistique et en intelligence artificielle Elles sont labor es d apr s des motivations et m thodologies tr s diverses Nous les avons principalement choisies en raison de leur forte pertinence en mati re de repr sentation des informations lexicographiques qu elles proposent Nous nous at tardons plus particuli rement sur quatre ressources le DiCo FrameNet WordNet et MindNet La pr sentation du DiCo nous permet d apporter des pr cisions concernant le pro jet plus global de la th se Nous y voyons l occasion de pr senter notre corpus de travail et de d finir en d tail les relations qui seront prises en compte dans le mod le que nous souhaitons laborer soit les d rivations s mantiques et les collocations Le projet FrameNet m rite galement une attention particuli re dans la mesure o il propose une perspective originale du traitement des unit s lexicales et d passe les approches traditionnelles centr es sur la d finition des sens ou signifi s En tentant d expliquer des ph nom nes linguistiques par des repr sentations cognitives l aide de cadres conceptuels il offre un point de vue la fois linguistique et cognitif sur l organisation des unit s lexicales Il semble difficile de passer outre WordNet qui exerce une h g monie parmi les ressources lexicales et sert de r f rence pour la r alisation d un grand nombre d ap plications da
108. extraits du DiCo 62 a Pi ce d habillement de la cour avocat 41 pitoge toge toque robe b V tements de facteur 1 uniforme nous pouvons ajouter les quelques liens lexicaux suivants pour illustrer l int r t de cette formule 63 a V tement typique policier uniforme k pi gilet pare balle b V tement typique soldat uniforme treillis c V tement typique cur soutane Nous concluons l expos des analogies entre relations lexicales encod es par des FLNS diff rentes rep r es d apr s la simple observation de notre corpus Les pro positions qui viennent d tre faites ont pour but d illustrer cette d marche empi rique Bien d autres similitudes pourraient tre d gag es suivant ce proc d Nous 131 allons pr sent proposer deux cadres m thodologiques pour guider la recherche d analogies la d rivation morphologique et les attributs de description 4 4 Recherche de r gularit s via la d rivation mor phologique 4 4 1 Corr lation entre les fonctions lexicales et la d rivation morphologique La d finition de la notion de d rivation s mantique donn e par 2000 et pr sent e en d tail 4 la section p ne met pas suffisamment en vidence le rapport qu elle entretient avec la d rivation morphologique Dans cette section nous souhaitons d velopper l troit lien existant entre les FL et le syst me morpho logique des langues En privil g
109. f roce AntiMagn Peu intense faible jappement AntiBon Ind sirables intempestifs postpos et A au pl Oper X mettre mettre pousser ART lancer ART A surtout au sing Article LAF ABOIEMENT t ouah ouah iste grognement 1 hurlement I 2 G n r cri 1 3 Verbe aboyer Nom pour X chien I Intense fort lt furieux f roce Peu intense faible jappement Ind sirables intempestifs postpos et A au pl X mettre un A mettre pousser ART lancer ART A surtout au sing Figure 3 3 Comparaison de l article LAF et de la fiche DiCo pour ABOIEMENT 3 3 2 1 Pr cisions pr liminaires pour la compr hension de l encodage traditionnel des FL Avant d entamer la discussion sur l encodage traditionnel nous devons pr ciser quelques l ments formels pour faciliter leur interpr tation Nous nous attardons principalement sur la repr sentation des actants Les actants sont repr sent s par des indices en chiffres arabes 1 2 3 n Ces chiffres renvoient aux actants syntaxiques profonds du mot cl auxquels s applique 81 une fonctiori Les indices 2 et 7 dans les FL nominales adjectivales ou adverbiales Le num ro i renvoie a l actant de la lexie concern e S4 repr sente le nom typique du premier actant syntaxique profond d une lexie A le modifieur typique du second actant syntaxique profond d une lexie par exemple Si bicyclette
110. faire un zigzag alors que la valeur de est zigzaguer qui comprend le sens de ZIGZAG 109 Operi zigzag faire ART ind f Oper zigzag zigzaguer Dans l encodage explicite Oper et Oper sont repr sent es comme suit Oper Opery F V L Z vil L objectif de ces deux encodages est de fournir une d finition formelle satisfaisante de Pencodage des FL tout en proposant un formalisme facilement calculable et pouvant entrer en compte dans les applications comme la traduction automatique et la g n ration de phrases L encodage explicite est tout fait appropri pour ces taches dans la mesure ot il est enti rement d fini sur les plans s mantique et syntaxique et permet la d finition des op rations formelles de produit et de fusion Notons galement que ces diff rents types d encodage sont reli s entre eux Comme Pont montr Kahane et Polguere 2001 il est possible partir de Pencodage alg brique de g n rer les gloses de l encodage vulgaris 3 4 Conclusion Ce troisi me chapitre tait destin dresser un bilan sur les FL Nous avons dans un premier temps pr sent la notion de FL d pouill e de son encodage en for mulant les crit res qui permettent de la d finir Par la suite nous avons montr la fa on dont la notion de FL se mat rialise travers diff rents encodages tablis pour r pondre des objectifs particuliers lexicograph
111. fauz 236 On doit par cons quent distinguer 1 les FL pour lesquelles la partie du discours de la valeur est unique par exemple IncepPredPlus et So 2 les FL pour lesquelles la partie du discours de la valeur varie en fonction de celle du mot cl elle peut tre quivalente celle du mot cl par exemple Syn Anti et Conv ou diff rente par exemple Magn AntiBon etc Ces diff rents cas conduisent des traitements particuliers dans le premier la FL seule permet de d terminer la partie du discours d une valeur dans les deux autres on doit galement avoir recours a la partie du discours du mot cl pour d terminer celle de la valeur 6 4 3 2 Exp rimentation Le calcul d informations lexicales sert un double objectif dans la mesure o il per met en parall le un diagnostic des erreurs pour la r vision des fiches Diagnostic d erreurs La recherche des parties du discours constitue un outil pour la v rification de Pencodage des donn es Dans le DiCo lorsqu un m me mot forme est associ a deux lexies de parties du discours diff rentes il re oit un marqueur venant pr ciser de quelle partie du discours il s agit prenons l exemple de vivant not de fa on diff rente dans les deux relations ci dessous Ai vie 1 1 vivantaa X qui a Si vie 1 1 vivantx Nom pour X La g n ration automatique des parties du discours des lexies non d crites fon
112. g 0 ASN ms Luv fuoddnos Zounysney z 0 IX N 8 Luv wauuop fa0uvsadsa tounysney 1 0 p X N sws uaddosf uouyvarupr Ttt1ogedesuju8en Z Tg M N g Iv sauuop piooop g TIIZ 6bu vouu91 rtusdo Z A N av noppa 2 2e IX N Lev saudsur un una Y a do T ssod V suep X N 4255999 aidoid inown Tejesigenuy Z T IZ N 4 Luv 49s4 n sanoo 22 g Z IX N 9 Lav 24960fua qns nof opofap ado 142 LEV op Z N vauuoyouns IITZ utsd el e iqe1 e T n A N voan uowsoffn tUoge zT MSN ans Luv 4 sod uasoddy TTzl nbu d yNe q pT Z N ur oo T l 42sspd 190104 05 1593 e7 T A N 9 X ssod v vassaipp squawassipnojddp tuadgo g T ASN Z N supo 17 nbyusjo etqoeq z7 AA Jur A ASN Y 24999t1u4 9d ynof pe pz Z N g A N 49404 uangiysip uazsoddp 1 2 e7 A X N ASN s m n 117914914 pes T77 ASN X N 4 soddo rie uns 2 T7 syueyoe SIOIT ruv T 1 0Modwun 0pe4nb 0 s Lav 4929sns sanbonosd eZf 6pi vunuoo ri sdo 7 Iray sosy 2 Hg Lav au9guoo woan 2 221 ruy noan IZnoliq e x 7
113. ici orient e du nom vers l adjectif et non l inverse Cependant certaines FL sont r versibles c est dire que le mot cl de l une devient la valeur de l autre et r ciproquement Par exemple partir de So aboyer aboiement on peut inf rer Vo aboiement aboyer et inversement C est cette observation qui a conduit Grimes a rechercher des FL in verses comme nous les avons pr sent es dans la figure p et cr er de nouvelles FL pour former des couples de FL inverses Nous entendons par r versibilit la capacit pour une FL avoir une FL inverse Les paires de FL inverses sont not es f g par exemple Va So Notons que la propri t de r versibilit ne concerne pas toutes les FL de plus les FL concern es n ob issent pas toutes au m me sch ma d inf rence Nous distinguons diff rents cas de figure que nous r partissons en fonction des types d inf rences qu ils sous entendent Inf rence simple Le premier type d inf rence concerne les cas o f 1 g sans que l inverse soit possible g Z f On peut postuler une inf rence selon la r gle suivante partir 245 de la relation f L L on peut inferer la relation g L Li mais non l inverse si g L L alors f L L Nous formalisons cette r gle de la fa on suivante f L L gt g L Prenons l exemple de Son et QS partir de la relation Son cheval hennir on peut inf rer la relat
114. jrueur jiuela 84 av el s p Tuy orrejstyes Tjeay ruy imou r jyu urre 09un4auo sne Lav pur j 1odisstp 03sunjnbiq ANNONVY Lav Iwe 1onuayye 1osrede snui paiqgsnep JOUR S IONUZJJV S T srede S snuijAJp 1dd ou Lav 10010ju01 19 49X 1981778 IPOID sn qp idsneo IPULIS 9101998 5 SHHMMHA lt Iy 3ueud l T lqy Tuor eyouuo op yefqo 5 2 soURSSTRUTODOL lu VO 2HSOUIUE JO Jyu uru ss r INDOOUCI SINON lt 213 5 5 Perspective communicationnelle sur le syst me de fonctions lexicales 5 5 1 Objectif Le mode d organisation que nous pr sentons dans cette section vise d terminer la cible communicationnelle d une FL Nous appelons cible communicationnelle d une FL Velement soit le mot cl de la FL l un de ses actants s mantiques un participant ext rieur sa structure actantielle ou encore la valeur de la FL qui est mis en avant au niveau communicationnel dans la relation encod e par la FL Illustrons notre propos l aide de la lexie RANCUNE dont la structure actantielle est la suivante DE L individu X ENVERS LA personne Y POUR LE fait Z Y Nous postulons que parmi les derivations semantiques et les collocations associ es a cette lexie certaines prennent pour cible communicationnelle le mot cl par exemple Magn rancune
115. la fa on suivante Pierre ET accuser l 1 m0 paresse Un deuxi me niveau de representation syntaxique profonde repr sente les re lations syntaxiques profondes entre les elements sous la forme d un arbre de d pen dance non ordonn Les relations syntaxiques profondes sont universelles Mel uk 1997 Il s agit des six relations actantielles I II III IV V et VI de la relation attributive ATTR qui couvre les cas de modification au sens large de la relation coordinative COORD repr sentant toutes les formes de coordination ainsi que de la relation appenditive APPEND pour les l ments de la phrase tels que les inter jections les formes d adresse et les adverbes de phrase Nous ne retenons que les relations actantielles et la relation attributive les relations coordinatives et appen ditives n tant pas concern es par notre probl matique L arbre de d pendance a pour n uds des unit s lexicales Les arcs de arbre repr sentent des relations syntaxiques Notons que l on ne tient pas compte ce niveau des pr positions r gies ni des ventuelles formes de flexion et de pronominalisation On observe dans l exemple ci dessous que les actants syntaxiques profonds I IT et III de ACCUSER I 1 sont en correspondance avec les actants s mantiques X Y et Z de accuser 1 1 195 ACCUSER I 1 a I III PAUL PIERRE PARESSE def sg PIERRE Le niveau de
116. le des actants par rap port au terme d crit Une r alisation linguistique typique de ces actants est pr sent e dans un tableau en dessous de la forme propositionnelle AGENT PATIENT internaute 1 utilisateur 1 application 1 donn es 1 fichier 1 jeu 1 licence 1 licence 1 logiciel 1 musique syst me d exploitation 1 4La base de donn es est consultable l adresse suivante http olst ling umontreal ca Elle comprend environ 1 000 termes d crits et 20 000 termes reli s 3 Une rubrique d exemples vient illustrer l emploi du terme exemples en contexte tir s directement du corpus XXXIX d crit dans des tage informatique Contexte s Source s C est vrai aussi que la d mocratisation du graveur de CD a ANTHO relanc la mode du piratage innocent qui consiste copier tout et n importe quoi pour des proches sans id e d en tirer profit C est la nouveaut avec Office XP pour combattre le pira INSTXP Qu est ce que le piratage de logiciels Le piratage de logiciels est une usurpation des droits d auteurs macromedia com 4 Puis vient la rubrique termes reli s qui pr sente la combinatoire des termes Il s agit des relations paradigmatiques et syntagmatiques entre termes Les relations sont d crites au moyen de formules explicites normalis es qui correspondent grosso modo aux vulgarisations de FL Un encodage plu
117. mod le de structuration des relations lexi cales fond sur les fonctions lexicales de la Th orie Sens Texte Les relations lexicales consid r es sont les d rivations s mantiques et les collocations telles qu elles sont d finies dans le cadre de la Lexicologie Explicative et Combi natoire 1995 En partant du constat que ces relations lexicales ne sont pas d crites ni pr sent es de fa on satisfaisante dans les bases de donn es lexicales nous posons la n cessit d en cr er un mod le de structuration Nous justifions l int r t de cr er un syst me de fonctions lexicales puis d taillons les quatre perspectives du syst me que nous avons mises au point une perspective s mantique une perspective ax e sur la combinatoire des l ments d une relation lexicale une perspective centr e sur leurs parties du discours ainsi qu une perspec tive mettant en avant l l ment sur lequel se focalise la relation Le syst me int gre l ensemble des fonctions lexicales y compris les fonctions lexicales non standard dont nous proposons une normalisation de l encodage Le syst me a t impl ment dans la base de donn es lexicale du DiCo Nous pr sentons trois applications dans lesquelles il peut tre exploit Premi rement il est possible d en d river des interfaces de consultation pour les bases de donn es lexicales de type DiCo Le syst me peut galement tre directement consult en tant qu assi
118. not distorted En d autres termes on consid re que le n ud communicativement dominant d une repr sentation semantique est sa paraphrase minimale On note que dans la repr sentation s mantique le n ud communicativement dominant est soulign Deux types de syntagmes doivent tre distingu s les syntagmes collocatifs qui mo difient le mot cl et les syntagmes collocatifs qui le prennent pour actant Illustrons le premier type de syntagme avec les relations en 112 et 113 ci dessous 112 Magn acclamation chaleureuses enthousiastes 113 AntiVer applaudir 1 mollement du bout des doigts On d gage respectivement de ces relations les repr sentations s mantiques sui vantes acclamation 1 intense applaudir Il 1 non sinc rement Les noeuds acclamation et applaudir sont communicativement dominants dans les repr sentations s mantiques des relations et 113 Les syntagmes accla mation chaleureuse et applaudir mollement peuvent tre en effet minimalement paraphras s et r duits acclamation et applaudir Des syntagmes dont intense et non sinc rement sont les sens communicativement dominants sont des syntagmes tels que la chaleur de l acclamation et la mollesse des applaudissement On remarque pour ce premier type de syntagme que le n ud communicativement dominant correspond au gouverneur syntaxique du syntagme Le deuxi me type de synt
119. plus courantes du fran ais qui contr lent un certain nombre de d rivations semantiques et de collocations Les informations lexicales repr sent es dans le DiCo Le DiCo fournit une caract risation s mantique des unit s lexicales au moyen de br ves formules appel es tiquettes s mantiques 2003 Une tiquette semantique correspond approximativement au genre prochain d une definition ana lytique Les lexies BAGARRE a et BAGARRE b par exemple ont les tiquettes s mantiques suivantes permettant de les identifier et de les diff rencier rapide ment BAGARRE a change de coups 27 BAGARRE b confrontation verbale Le DiCo donne galement des informations sur les actants s mantiques et syn taxiques des unit s lexicales Un tableau de r gime permet de sp cifier la correspondance entre les actants semantiques et syntaxiques et la fa con dont les actants syntaxiques sont exprim s La lexie BAGARRE a par exemple compte trois actants s mantiques Sa forme propositionnelle est la suivante ENTRE L individu X ET L individu Y A PROPOS DE OU POUR Z Deux r gimes lui sont associ s R g 1 X Y I entre N et N A poss Z I Pr p propos N Z est la cause de B pour N Z est la finalit de B R g 2 X 1 de N A poss Y avec N Z Ill Pr p propos N Z est la cause de B pour N Z est la finalit de B Ces r gimes doivent tre interpr t s de la mani re suivante
120. plus global de FL que nous pr sentons dans le chapitre Chapitre 4 Normalisation de l encodage des fonctions lexicales non standard 4 1 Introduction la suite de la pr sentation des FL le travail expos dans ce chapitre vise la recherche de r gularit s s mantiques parmi un ensemble de relations lexicales re pr sent es par des FL dites non standard et le traitement homog n is de leur encodage Commen ons par un bref rappel de ce qui a t pr sent au chapitre pr c dent Les FL ont un caract re graduel et s organisent autour de quatre statuts 1 Les FL standard sont construites 4 partir d un noyau d une soixantaine de FL simples Mel uk et al i 1995 125 Elles doivent r pondre aux principes de cardinalit de diversit et d universalit cit s la section 3 2 2 1 Elles peuvent tre compos es d un seul l ment ou combin es entre elles 43 42 Anti joyeux triste antonyme 43 IncepPredPlus abc s m rir commencer devenir plus important 2 Les FL semi standard sont constitu es d une FL standard et d une com posante s mantique non prise en charge par la FL standard Par exemple la description de la relation 44 ayant le sens causer le silence de qqn se diff rencie de la relation 45 par la pr sence de la composante s mantique en change de qqch qui vient compl ter la FL standard 44 CausOper silence r duire
121. qu il existe au contraire un grand nombre de relations lexicales encod es des FL standard que ces relations sont du moins en partie pr visibles et qu elles m riteraient non pas d tre d crites au coup par coup mais d tre formul es selon un encodage normalis qui mette en valeur leurs r gularit s Nous avons galement questionn dans le chapitre pr c dent le fondement de la distinction entre les FL standard et non standard Mise a part la condition d univer salit 2007 46 propose d assigner le statut standard aux FL satisfaisant les deux conditions suivantes La condition de cardinalit stipule qu une FL doit s appliquer un nombre important d unit s lexicales et non tre limit e aux unit s lexicales d un seul champ s mantique La relation lexicale suivante par exemple Qui ne vit pas l tat sauvage canard d levage domestique ne concerne que certains noms d animaux et ne pourra donc pas tre repr sent e par une FL standard La condition de diversit impose une diversit parmi les valeurs retourn es par les FL Ainsi les valeurs de la FL Bon qualificatif positif sont diversifi es selon les mots cl auxquels elle s applique par exemple Bon aspiration noble 114 Bon bijou somptueux Bon d jeuner succulent Cette FL remplit donc ce crit re pour tre consid r e comme une FL standard Ces conditions offrent des c
122. repr sentation syntaxique de surface pr sente la fagon dont les l ments sont employ s dans une phrase sous la forme d un arbre de d pendance non ordonn C est ce niveau qu apparaissent les relations syntaxiques de sujet compl ment d objet direct compl ment d objet indirect ainsi que les pr positions ACCUSER I 1 Pi oor obj ind DE PAUL PIERRE pe PARESSE sg 5 3 3 tablissement des diff rents patrons de d pendance syntaxique associ s aux fonctions lexicales 5 3 3 1 Utilisation de l encodage explicite Afin d tablir une liste des diff rents patrons syntaxiques des relations lexicales syntagmatiques nous proc dons la conversion de l encodage traditionnel des FL en encodage explicite Kahane et Polgu re 2001 Cet encodage a d j t pr sent au chapitreBlet illustr dans la figure 3 7 p 06 Rappelons qu il vise expliciter le contenu s mantique d une fonction ainsi que sa structure syntaxique Cette derni re est exprim e au moyen de deux l ments la partie du discours et la valence active c est dire la liste des d pendants syntaxiques par ordre croissant d oblicit Par exemple la FL Fact est transcrite selon l encodage explicite syntaxique de la mani re suivante V 1 lt V gt indique que la valeur est verbale Z gt en premi re position qu elle a pour premier actant syntaxique profond le mot cl lui m me et 196 1 gt en seconde position qu elle a po
123. rifier si cet ensemble de d rivat mes est v ritablement ouvert et dans quelle mesure il l est Contrairement ceux du tableau TI les d rivat mes ci dessus de a j sont moins fr quents dans la langue ce qui explique qu ils soient mis en correspondance avec des FLNS et non des FL standard Ce pendant rien n indique qu il ne soit pas possible de les num rer De nombreuses tudes en d rivation morphologique ont d j entrepris des inventaires plus ou moins syst matiques des d rivat mes du fran ais 1983 1987 13 et Dubois Charlier 19991 Si l on peut d gager des listes exhaustives d affixes d rivationnels c est que l ensemble des d rivat mes n est pas ouvert du moins l int rieur d une langue donn e Dans cette optique partir d un inventaire de d ri vat mes peut constituer une m thodologie tout a fait pertinente pour d couvrir des analogies entre relations lexicales Nous illustrons cette approche dans la section suivante 4 4 2 Recherche d analogies entre liens lexicaux partir de marqueurs morphologiques Comme nous venons de le pr senter la pr sence d un marqueur morphologique pour une relation lexicale est g n ralement un r v lateur de la fr quence de cette relation Afin d illustrer la m thodologie fond e sur la piste de la morphologie d rivationnelle nous exposons dans cette section la fagon dont il est possible de rep rer partir de ma
124. rog nes et pourraient difficilement figurer telles quelles au sein d une ressource lexicographique Ce n est toutefois pas l objectif du projet MindNet il n est donc pas tonnant que les projets de ce type mettent davantage Vaccent sur la quantit de donn es couvertes que sur leur pr cision 51 2 2 5 Autres ressources lexicales relationnelles Les quatre ressources que nous venons de pr senter ne sont pas les seules actuelle ment disponibles et utilis es Nous mentionnons dans cette section d autres res sources lexicales r alis es sur l anglais le fran ais et l allemand que nous jugeons utiles pour notre recherche Nous nous proposons de les d crire sommairement Vaide d un tableau comparatif visant offrir une vue d ensemble des principales ressources lexicales relationnelles Nous envisageons un certain nombre de crit res destin s d gager les principales caract ristiques de ces ressources soit 1 les positions th oriques sous jacentes 2 les langues couvertes par les ressources 3 le type de relations repr sent es si elles sont conceptuelles lexicales ou contextuelles paradigmatiques ou syntagmatiques 4 le nombre et Tidentification des relations repr sent es 5 la structure des ressources Toutefois le tableau tant tr s succinct nous devons faire au pr alable une br ve pr sentation de chacune des ressources VerbNet Kipper et al 2006 est l un des lexiques
125. s comme l informatique et ne sont pas repr sent es dans le DiCo TI existe une hi rarchie d tiquettes s mantiques d velopp e par Alain Polgu re et acces sible l adresse suivante http olst ling umontreal ca dicopop laf hierarchie php Il convient d utiliser le navigateur Firefox pour la visualiser fp tr fl ph ANCRE 0 N V nom fem instrument DU hutenu X X I de M A poss Cf grappin De grande taille Magn grosse antepos grande X lt Equipage de X gt faire usage de Reall I Real1 1 I jeter mouiller 1 E Le navire a jete mouille l ancre moui ller Le navire a mouille Equipage de X causer que X soit retenu par Labreal1 1 1 I mettre N X a 1 1 ancrer N X Le capitaine a ancre le navire Fait de causer que X soit retenu par 1501 111111 1 ancrage mouillage de N X Z X tre retenu par Reall II tre a l se tenir a 1 Le croiseur est arrive hier a Malte o il a jet l ancre Les navires retenus en aval et en amont de 1 emb cle ont finalement pu lever l ancre _ancre de salut_ jeter l ancre_ _lever l ancre_ Figure 6 2 Fiche DiCo de la lexie ANCRE 234 235 Le champ exemple regroupe quelques exemples illustrant l usage de la lexie en contexte Le champ ph contient tous les phrasemes dans lesquels la lexie figure Dans les bauches de fiche que nou
126. s mantiques et des typages d actants par le biais des FL ainsi que les h ritages de colloca tions parmi les lexies d un m me champ s mantique Cette derni re question a t trait e par a partir d observations faites sur le champ s mantique des motions en allemand Par exemple les noms d motions sont susceptibles d tre associ s la FL Oper et d avoir la valeur prouver a approfondi la question de l h ritage lexical en propo sant une g n ration de valeurs par analogie et en d finissant des domaines pour chaque type de FL A partir de la d finition de traits s mantiques li s aux unit s lexicales constituant le domaine d une FL il est possible de pr voir d une part qu une lexie rel ve du domaine d une FL donn e d autre part la ou les valeurs qui lui seront associ es si on lui applique la FL en question Nous envisageons d appliquer une telle m thode aux fiches d velopp es pour le frangais dans le DiCo en menant l exp rience sur des champs s mantiques bien d finis Ceci nous permettra de pr dire la fois des FL et des valeurs typiquement associ es des lexies de champs semantiques particuliers Nous aimerions par ailleurs exploiter des ressources exog nes pour r cup rer et identifier un grand nombre de collocations et de d riv s s mantiques Tout comme le montrent les travaux de Wanner entre autre 2006 il est possible en extrayant des collocations partir de c
127. s de granularit fig s et d acc der tous les liens lexicaux en fonction de certains param tres descriptifs ind pendamment de leur description formelle dans l encodage traditionnel 259 7 2 Perspectives futures Nous envisageons d explorer deux voies compl mentaires dans nos recherches fu tures La premi re concerne le d veloppement de l encodage des FL la seconde a trait au d veloppement logiciel des outils de consultation et d automatisation du DiCo et plus largement de toute BLEC Nous avons mentionn a plusieurs reprises au cours de cette th se la n cessit de cr er une grammaire de formation des FL semi standard Rappelons que celles ci sont form es d une formule de FL standard et d une notation venant pr ciser une composante semantique additionnelle cf exemples ci dessous 148 pour frapper qqn Labreala ceinture 1 1 battre N avec ART 149 temporairement LiquFunco conversation a interrompre ART Les FL semi standard forment un ensemble tr s h t rog ne les notations utili s es ne sont pas r dig es selon un patron d fini et ne respectent aucune norme d criture Notre objectif est d tablir un patron d encodage qui encode deux types d information d une part l identification du type de composante sur laquelle on apporte une pr cision par exemple la mani re la finalit la cons quence la dur e les participants etc d autre part l information en
128. s lexicales CHAPEAU et WAGON dans les figures 4 5 et Notons que les figures doivent tre lues selon le mod le suivant ancienne FL FL normalis e CHAPEAU ASPECT Qui est fait de paille Mat riau paille de paille Qui est fait de feutre Mat riau feutre de feutre feutre Qui est orn de plumes Aspect orn de plumes plumes plumet Qui a une forme ronde Forme ronde rond Qui a une forme pointue Forme pointue pointu FONCTION Que X porte pour chasser Fonction chasser de chasse Que X porte pour se prot ger du soleil Fonction se prot ger du soleil de soleil Figure 4 5 FLNS adjectivales normalis es de la lexie CHAPEAU 152 WAGON ASPECT Qui comporte deux niveaux pour les passagers Forme deux niveaux imp riale Qui a des parois et un toit pour abriter Y Forme avec paroi et toit couuert Qui n a ni paroi ni toit Forme sans paroi ni toit plateforme d couvert plat UTILISATION Equip pour que les passagers y dorment Fonction dormir couchette s lit s Equip pour que les passagers y mangent Fonction manger restaurant quip d un bar Fonction boire ou manger restaurant Qui est le premier dans un ensemble de W Position premier premier de t te Qui est le dernier dans un ensemble de W Position dernier dernier de queue Qui est la Num e position dans ensemble de W Posit
129. sajjaldyjo s uuop4oo2 aysad aaq P wepy 1ed siuwoT e uonotuu 1u uui e SWWOD si i3n 2122 noad nbuqej uo Ionb dane a gt m y d egz T bv4 yez uo onb ap aed e 285079 augiwasd ap uobpm sa Sessed xne 1uioJuo3 1ne jIeW l JULIJO SWWOD 25108987 x 288912 puoo s ap uobpm ssaSessed s anod nbiuiouo2 snid l 4ue 2510839187 140 ans jouoinj uoanog 2st499 DAR ae S lOO LE uossiog tuv op no suy xyyo d yidunoopad map 17277010619 euodsues uo nb suep Jejouy 19181199 252199 auuop Inb aiqay 4q 9tu pnojddo upnojddv X ll nbe lisu l1ui 4 4ns uu e jUeAsas eddy 1 194 ap yuunou as inb jewiuy nooubn 94 nvaubp quelno d 1uop jewiuy aduvio uollej91 Vo bvwosf q7 720 ap a1edaid 1u uui V 20wW0959 ap suolqdaljy s sop 217109 juawapides sanajas P sassieqe X npiaipul sigalg uognotu uu vx diou nvodnip sap piepueys uou s eorx suon uo q ep 2 Til a r os el suep uo s nbs uojes ssjeueie4qx N ap l
130. sont dans le DiCo aussi fr quentes que les FLSS c est dire appliqu es un nombre de mots cl s similaire Cette fagon d envisager les FL combin es transparait dans les diverses classifications de FL qui ne cherchent repr senter et organiser que les FLSS Nous traitons plus pr cis ment cette question au chapitre 3 3 2 3 Typologie des formules de FL de l encodage traditionnel La typologie de l encodage traditionnel a pour objectif de recenser l ensemble des types de formules de FL et de les organiser selon les statuts qui leur sont attribu s Elle permet galement de souligner la grande h t rog n it et quelques unes des faiblesses de cet encodage La typologie est r sum e dans la figure p 92 1 FL standard simples 2 FL standard combin es FL complexes et configurations de FL Les formules de FL standard simples et combin es soit les FL complexes et les configurations de FL viennent tout juste d tre pr sent es Nous renvoyons donc le lecteur la section pr c dente 3 FL standard avec indication de phase Ce troisi me groupe concerne les formules de FL standard simples ou combin es comportant une indication de phase Les phases repr sentent les diff rentes tapes 86 d une action Ainsi les relations en 10 constituent les deux phases de l action consistant pour un accus r aliser gt son accusation c est dire s en d fendre 10a puis s en bl
131. structure actantielle a un seul actant ont le mot cl pour cible communicationnelle et poss dent une composante s mantique de qualification n gative Ce qui les distingue en revanche c est qu en plus de cette composante s mantique commune chacune d entre elles en poss de une autre qui lui est propre Degrad qualificatif n gatif diminution degradation AntiBonFacty qualificatif n gatif utilisation fonctionnement typique C est donc au moment de la visualisation des r sultats l absence ou la pr sence de certains parametres qui permettra de trancher en faveur d une FL particuli re 6 3 2 Interrogation sous forme de requ tes SQL Afin d exploiter concr tement le syst me de FL et d effectuer des requ tes comme celles que nous venons d exposer on se r f re la base de donn es de FL au format MySQL Prenons un exemple pr cis pour illustrer la fagon dont est form e une requ te SQL on cherche encoder la relation entre les lexies COMPLIMENT A et 230 DEBITER Nous distinguons plusieurs tapes pour illustrer la fois le langage SQL et la fagon dont la s lection de diff rents crit res permet de restreindre le nombre de FL ramen es par la requ te Dans un premier temps on utilise les crit res sur le sens de la FL et sur les par ties du discours de son argument et de ses valeurs on s lectionne la composante semantique lt Qualificatif n gatif gt correspondant au code 4 1 2 du c
132. sur les autres classifications comprend elle m me quelques petites imperfections Nous pensons qu une classe du type 15 Verbes divers devrait tre vit e dans une classification car elle sert r cup rer les FL qui n ont pas trouv de classes ad quates Par ailleurs plusieurs crit res pour d terminer des sous classes sont utilis s sur le m me plan parties du discours pr positions verbes fonctions syntaxiques modification qualificatif sens verbes de r alisation si bien que Cette notion est d finie dans le deuxi me chapitre p 162 divers ph nom nes linguistiques se retrouvent m lang s car confin s dans un seul classement 163 I PARADIGMATIC FUNCTIONS A Substitutions J 2 3 Basic logical relations Syn Anti Conv Derivations So Vo Ao Advo Contrastive terms Contr B Qualifiers of a keyword 001 o 10 Evaluative qualifiers Magn Ver Bon Categorical qualifiers Gener Distributional qualifiers Mult Sing Organization qualifiers Cap Equip Quantitative qualifiers Plus Minus Figurative qualifiers Figur Pleonastic qualifiers Epit C Aspects of a keyword situation 11 12 13 14 15 16 17 Process features Caus Germ Culm Degrad Excess Obstr Pejor Liqu Perf Result Phasal features Incep Cont Fin Attendant features Invov Instr Manif Nocer Perm Prepar Propt Prox Sympt Son Simed S mod
133. tions 1994a Igor Mel uk Fonctions lexicales dans le traitement du langage naturel Dans Andr Clas et Pierrette Bouillon dir Recherches de pointe et applications imm diates pages 193 219 AUPELF UREF FMA Beyrouth Montr al 1994b Igor Mel uk Lexical functions A tool for the description of lexical relations in the lexicon Dans Leo Wanner dir Lexical Functions in Lexicography and Natural Language Processing pages 37 102 Benjamins Amsterdam Philadelphie 1996 Igor Mel uk Vers une linguistique Sens Texte Le on inaugurale College de France Paris 10 janvier 1997 Igor Mel uk Communicative Organization in Natural Language John Benjamins Amsterdam Philadelphie 2001 Igor Mel uk Parties du discours et locution Bulletin de la soci t linguistique de Paris 101 1 29 65 2006 Igor Mel uk Phras ologie dans la langue et dans le dictionnaire Dans Rep res et Applications VI XXIVe Journ es P dagogiques sur VEnseignement du Fran ais en Espagne 2008 Igor Mel Guk Semantics From Meaning to Text John Benjamins Amster dam Philadelphie para tre 273 Igor Mel uk Nadia Arbatchewsky Jumarie Louise Dagenais L o Elnitsky Lidia Iordanskaja Marie No lle Lefebvre et Suzanne Mantha Dictionnaire explicatif et combinatoire du fran ais contemporain Recherches lexico s mantiques IT Les Presses de l Universit de Montr al Montr al 1988
134. total d l ments s l ve a plus de 550 pour environ 700 cadres d crits Nous avons reproduit ci dessous figure 4 4 les vingt l ments les plus fr quents MANNER REASON INSTRUMENT TOPIC TIME DEPICTIVE THEME SPEAKER PLACE AGENT SOURCE MEANS DURATION PATH DEGREE GOAL CAUSE PURPOSE RESULT ENTITY Figure 4 4 Les vingt l ments de cadre les plus fr quents dans FrameNet Les l ments de cadre dans FrameNet sont tr s nombreux Comme nous l avons bri vement voqu les lexies pouvant exprimer les l ments ne sont pas forc ment en relation privil gi e avec le mot cl L analyse de FrameNet constitue un point de rep re et de comparaison int ressant avec notre approche cependant nous souhaitons d finir des attributs seulement partir des collocatifs et d riv s s man tiques Pour permettre une maintenance et un traitement raisonnable des FLNS nous tenterons galement de limiter le nombre d attributs en choisissant des noms suffisamment g n raux pour englober plusieurs sens proches 4 5 2 Organisation des FLNS selon des attributs de descrip tion 4 5 2 1 Pr sentation des diff rents attributs La recherche d attributs permet de faire merger un grand nombre de r gularit s parmi les FLNS et de proposer une normalisation de leur encodage Rappelons que nous appliquons principalement cette m thode aux FLNS adjectivales et plus particuli rement celles repr sentant des collocations Nous avo
135. traitement volume E 1 pages 117 133 De Werelt Amsterdam 2003 Alain Polgu re tiquetage s mantique des lexies dans la base de donn e DiCo Traitement Automatique des Langues 44 2 39 68 2003 Alain Polgu re Structural Properties of Lexical Systems Monolingual and Multi lingual Perspectives Dans Proceedings of the Workshop on Multilingual Language Resources and Interoperability COLING ACL 2006 pages 50 59 Sydney 2006 Alain Polgu re Lessons from the Lexique Actif du Fran ais Dans Proceedings of the Third International Conference on the Meaning Text Theory MTT 2007 2007 276 Alain Polgu re Lexical Function Standardness Dans Selected Topics in Meaning Text Theory in honour of Igor Mel uk pages 43 92 John Benjamins 2007 Alain Polgu re Lexical Systems Graph Models of Natural Language Lexicons Language Resources and Evaluation 43 1 41 55 mars 2009 Springer Stefan Popovic Paraphrasage des liens de fonctions lexicales M moire de maitrise D partement de linguistique et de traduction Universit de Montr al 2004 Bernard Pottier Semantique g n rale Presses Universitaires de France Paris 1992 James Pustejovsky The Generative Lexicon MIT Press Cambridge Mass 1995 Fran ois Rastier Repr sentation du contenu lexical et formalismes de Tintelligence artificielle Langages 87 79 102 1987 Fran ois Rastier Ontologie s Revue des sciences et technologies de l
136. valeur les similitudes ou les aspects communs aux FL tout en soulignant leurs diff rences Il est con u pour tre utilis dans des applications de re cherche d informations l int rieur d une BLEC sous la forme de plusieurs interfaces de consultation Il servira galement de point de r f rence pour le calcul d informations lexicographiques en vue de l automatisation partielle de la r daction de fiches BLEC et pourra tre consult en tant qu outil pour assister les lexicographes dans l encodage des relations lexicales 2 Nature des composantes du syst me Le syst me comprend toutes les FL sans gard leur statut Le travail ef fectu sur les FLNS et pr sent au chapitre pr c dent permet d int grer les FLNS dans des classes aux c t s des FL standard Le syst me inclut donc les FL standard simples et complexes les FL semi standard localement stan dard ainsi que les FL non standard 3 Axes d organisation du syst me Le syst me est organis de fa on modulaire Ces diff rents modules repr sentent les diff rentes perspectives sur le syst me Nous distinguons une perspective s mantique regroupant les FL selon les composantes s mantiques qu elles partagent une perspective centr e sur les parties du discours des unit s lexicales en trant dans une relation lexicale 171 une perspective combinatoire pr sentant les diff rentes configurations syn taxiques des unit
137. verbes d un m me concept en termes de domaine Duvignay 2001 p 161 Tous ces verbes comme lt rescotcher soigner gt recarrosser gt re cr pir gt sont donc rattach s un concept qui constitue pour chacun d entre eux un noyau de sens commun De tels verbes constituent de ce fait des co hyponymes dont on peut distinguer deux types les co hyponymes intra domaine lt fissurer gt l zarder gt se d labrer gt sont des co hyponymes intra domaine car ils relevent d un m me domaine d activit savoir le b timent les co hyponymes interdomaines lt fissurer gt et lt meurtrir gt sont des cohyponymes inter domaines car ils rel vent de domaines diff rents respectivement le batiment et la m decine Duvignau parle de concepts et d organisation mentale Selon elle les mots relev s r alisent un concept et sont unis par une relation de co hyponymie La LEC quant elle dans une perspective linguistique et lexicologique parle non plus d un concept mais d une relation lexicale observable entre plusieurs unit s lexicales Les relations sont orient es d une lexie de base vers une lexie cible qu on appelle d riv s man tique dans le cas des d rivations semantiques et collocatif pour les collocations Dans le cas des exemples pr c demment cit s les relations sont orient es d une lexie de base vers un ensemble de collocatifs Autrement dit une m m
138. 003 distingue trois grandes phases 1 la lexicographie papier assist e par ordinateur 2 l informatisation des dictionnaires papier 3 la confection directe de dictionnaires lectroniques ou bases de donn es L arriv e du support informatique a donn lieu une v ritable r volution de la lexicographie et ouvert la porte de nombreuses r alisations dont la constitution semi automatis e de ressources lexicales la correction syst matique des articles de dictionnaire ou la cr ation d interfaces pour la recherche d informations Notons que la troisi me phase qui vient d tre mentionn e se trouve elle m me en mutation vers une quatri me les bases de donn es lexicales telles que WordNet Fellbaum 1998 FrameNet 2003 le DiCo 2000 etc sont main tenant con ues sous forme de graphes d entit s lexicales interconnect es dont les dictionnaires ne sont qu une vue partielle Ce mode de structuration invite repen ser en profondeur la structuration et la pr sentation des donn es lexicographiques C est pr cis ment cet aspect qui retient notre attention dans cette th se Parmi l ensemble des donn es lexicographiques habituellement pr sentes dans les ressources lexicales nous nous int ressons plus particuli rement aux relations lexi cales Nous entendons par relations lexicales entre lexies ou unit s lexicales les d rivations s mantiques et les collocations telles qu elles sont d finies
139. 199 216 MIT Press 1998 Fran ois Lareau La synth se automatique de paraphrases comme outil de v rifi cation des dictionnaires et grammaires de type sens texte M moire de maitrise D partement de linguistique et de traduction Universit de Montr al 2002 Benoit Lavoie et Owen Rambow A fast and portable realizer for text generation systems Dans Proceedings of the Fifth Conference on Applied Natural Language Processing ANLP97 pages 265 268 1997 Chantal Lemay Marie Claude L Homme et Patrick Drouin Two Methods for Ex tracting Specific Single word Terms from Specialized Corpora Experimenta 271 tion and Evaluation International Journal of Corpus Linguistics 10 2 227 255 2005 Beth Levin English Verb Classes and Alternation A Preliminary Investigation The University of Chicago Press Chicago et Londres 1993 Marie Claude L Homme Fonctions lexicales pour repr senter les relations s man tiques entre termes Traitement Automatique de la Langue 43 1 19 41 2002 Marie Claude L Homme A Lexico semantic Approach to the Structuring of Ter minology Dans Computerm 2004 dans le cadre de Coling 2004 2004 Marie Claude L Homme Conception d un dictionnaire fondamental de l informa tique et de l internet s lection des entr es Le langage et l homme 40 1 137 154 2005 Marie Claude L Homme Dicolnfo le dictionnaire fondamental de l informatique et de l internet OLST
140. 2006 ce qui permet d en isoler deux sens distincts FrameNet ne contient pas d informations phon tiques mor phologiques ni tymologiques On n y trouve pas d informations explicites sur les collocations ni de donn es statistiques sur les occurrences d emploi des unit s lexi cales En revanche la base contient des entr es lexicales individuelles pour les unit s lexicales d crites des descriptions de cadres et d l ments de cadre ainsi que des corpus annot s Chaque entr e lexicale contient une d finition extraite du Concise Oxford Dictionary ou labor e par des lexicographes de FrameNet En outre chaque entr e indique la r alisation syntaxique des l ments de cadre ainsi que les patrons de valence Trois grands types de relations sont trait es 4FrameNet est accessible Tadresse suivante http framenet icsi berkeley edu 35 des informations sur la valence s mantique et syntaxique des relations entre unit s lexicales au sein d un m me cadre des relations entre cadres 1 Valence Les informations concernant la valence semantique d un mot sont exprim es au moyen d l ments de cadre Frame Elements ou FE dans la terminologie de Fra meNet Les informations concernant sa valence syntaxique sont exprim es par les syntagmes impliqu s et leurs fonctions grammaticales FrameNet utilise les cadres et leurs l ments pour d crire les propri t s de combinatoire s mantique e
141. 24 Sinstr gu rison tb m dicament rem de 1 125 Sio abeille ruche rucher Dans les relations 122 123 et 125 les cibles communicationnelles des FL sont des participants ext rieurs aux structures actantielles des lexies BILLET I 2 DEBAT 2 GUERISON b et ABEILLE Enfin le troisi me type de FL paradigmatique sont les FL repr sentant les rela tions telles que la synonymie l hyponymie l antonymie la conversion etc comme illustr es par les exemples ci dessous Syn bicyclette v lo Hypo chanson 1 1 berceuse Anti ami 1l ennemi 11 Convoi craindre effrayer N X Nous consid rons que ces relations ont pour cible communicationnelle le mot cl lui m me Les d riv s semantiques ne servent pas en effet identifier un actant du mot cl ni un participant ext rieur mais fournissent des quivalents antonymes conversifs termes plus g n riques plus sp cifiques etc visant directement le mot cl 221 5 5 3 Structuration des FL selon leurs cibles communica tionnelles Afin d organiser les FL selon les diff rentes cibles communicationnelles qu elles visent nous cr ons huit classes cf figure 5 14 correspondant aux cibles potentielles d une FL La cible d une FL peut tre son mot cl Cible mot cl ou un des actants s mantiques du mot cl Cible n o n 1 2 3 4 5 et 6 un participant ext rieur la structure actantielle du mot cl
142. 469 478 Toulouse 5 8 juin 2007a Anne Laure Jousse Organisation des fonctions lexicales pour un meilleur acc s Tinformation dans le DiCo Dans Mathieu Loiseau et al dir Autour des langues et du langage perspective pluridisciplinaire Papiers s lectionn s du Colloque International des Etudiants Chercheurs en Didactique des Langues et en Linguistique Grenoble juillet 2006 P U G 2007b Anne Laure Jousse et Myriam Bouveret Lexical Functions to Represent Deriva tional Relations in Specialized Dictionaries Terminology 9 1 71 98 2003 Anne Laure Jousse et Alain Polgu re Le DiCo et sa version DiCou be Document descriptif et manuel d utilisation OLST Universit de Montr al Janvier 2005 Anne Laure Jousse Alain Polgu re et Oph lie Tremblay Du dictionnaire au site lexical pour l enseignement apprentissage du vocabulaire Dans Francis Gross mann et Sylvie Plane dir Lexique et production verbale vers une meilleure int gration des apprentissages lexicaux Education et didactiques Presses Uni versitaires du Septentrion Villeneuve d Ascq 2006 Anne Laure Jousse et Oph lie Tremblay Le dictionnaire lectronique un outil pr cieux pour enseigner le lexique Qu bec Fran ais 141 2006 Sylvain Kahane The Meaning Text Theory Dans Dependency and Valency Hand books of Linguistics and Communication Sciences volume 25 1 2 pages 32 De Gruyter Berlin NY 2003a Sylvain Kahane Une bl
143. 67 Fem pour les quivalents femelles ou f minins cf exemples 68 et Petit de pour les noms de petits d animaux cf 69 ou ventuellement de jeunes individus 67 a Male abeille faux bourdon1 b Male de poule coq 68 a De sexe f minin avocat avocate b Femelle de canard cane c Femelle chien chienne d femelle mouton brebis 69 a Petit de chat chaton b Jeune coq coquelet c Larve de grenouille t tard 4 4 2 2 La relation fait entit X discipline tudiant X Dans bien des cas la relation entre un fait ou une entit et son tude scientifique est morphologiquement marqu e par les suffixes logie ou tique ce qui t moigne d une r currence notable de la relation Cependant dans le DiCo cette relation est encod e de fa on h t rog ne cf exemples ci dessous Nous proposons d ho mog n iser les diff rents encodages de cette relation l aide d une FLNS unique tude de 70 a Science qui tudie ce qui rapport crimeZ a criminologie b Discipline qui tudie m dicament pharmacie pharmacologie c Science qui tudie poisson l a ichtyologie d Science qui tudie signe 41 1 s miologie s miotique 139 e tude des signe III horoscope astrologie f Discipline scientifique qui tudie les ph nom nes li s a vie 1 1 sciences de la g tude des astre
144. Alt ration de se veut relativement large il couvre le nom d une affection comme en ou plus largement une chose affectant l entit d not e par le mot cl comme en 75b 75 a Affections de estomac 1 crampe colique gastrite mal d estomac ulc re b Bouton furoncle sur paupi re comp re loriot orgelet La m thodologie fond e sur les marqueurs morphologiques peut ainsi se poursuivre pour d couvrir des relations lexicales r currentes Elle permet galement de pr voir ou d anticiper les liens lexicaux d crire au fur et mesure que le corpus de travail s agrandit Enfin elle s av re tout a fait utile pour expliquer l origine des relations lexicales recens es dans le DiCo et notamment des d riv s s mantiques intimement li s au ph nom ne de d rivation morphologique Nous allons pr sent explorer une autre m thodologie tr s diff rente destin e regrouper organiser et normaliser les FLNS syntagmatiques 142 4 5 Organisation des FLNS selon des attributs de description 4 5 1 Pr sentation A la suite de la m thodologie de rep rage des similitudes entre relations lexicales fond e sur la d rivation morphologique nous pr sentons dans cette section une autre m thodologie consistant d crire les relations Vaide d attributs descriptifs Il s agit d une d marche tout fait diff rente qui vise non plus cr er de nouvelles FL standard ou non standard a
145. Atkins et Duval 1978 vers une base de donn es lexico s mantique l instar de la majorit des dictionnaires bilingues le Robert amp Collins met l accent sur la combinatoire des unit s lexicales 4Se reporter la page 156 pour un relev des diff rentes pr sentations des FL 98 et fournit un grand nombre de collocations Fontenelle constate que beaucoup de dictionnaires se r v lent tr s peu performants pour mettre en valeur et diff rencier les collocations et choisit d utiliser les FL pour les encoder et les organiser Ce faisant il effectue une premi re application de masse des FL Tester les FL sur l ensemble du Robert amp Collins repr sente une t che consid rable jusqu alors ja mais r alis e qui a permis de confronter ce mode de repr sentation un ensemble de donn es et d en v rifier la validit pratique The general conclusions I draw concerning the imprecise nature of some functions and the evaluation of the material would never have been pos sible however if only a fragment of the dictionary had been analyzed in detail Exploiting the whole dictionary and focussing on such a large section of the lexicon had never been attempted and the potential appli cations whether purely linguistic or pedagogical could only have been hinted at if I had decided to focus on a few dozen items and their seman tic environment instead of taking into account the whole metalinguistic apparatus of
146. C MeTeuk et al 1995 Toutefois m me si la LEC se positionne la fois comme un mod le d compositionnel en fournissant des d finitions ana lytiques d taill es en composantes s mantiqued et comme un modele relationnel nous ne traitons dans cette th se que de cette deuxi me facette En psycholinguistique l tude des relations s mantiques entre en jeu dans les tra vaux portant sur la m moire long terme et sur l acquisition du langage Notons que dans cette discipline ce ne sont plus seulement les relations entre unit s lexi cales qui sont concern es mais plus largement les relations entre concepts ceux ci tant directement reli s ou non aux unit s lexicales Les mod les labor s visent 1 trouve ces d finitions dans les quatre volumes du DECFC Mel uk et al 1984 1988 1992 1999 ainsi que dans la base de donn es de d finitions formelles BD f man et Polgu re 2003 14 reproduire l organisation du lexique mental c est dire la fagon dont le lexique est stock dans le cerveau humain et non plus la fa on dont il est employ dans les textes Les observations sur les unit s lexicales ne se font g n ralement pas partir de l tude de corpus mais l aide de recherches du type stimulus r ponse ou encore en tudiant certains dysfonctionnements linguistiques comme l aphasie Les m thodes et objectifs se diff rencient donc tr s clairement de ceux de la linguistique
147. Dajvtego Zagn dag it David a vu le livre J ai laiss David voir le livre CausFunco Productif v ne xa ik xa ik alta ouverture pratiquer une ou verture Real Usitatif Anglais hammer to hammer marteau marteler Fact Usitatif Fran ais buveur boire Labreal 2 3 Usitatif Fran ais colle I coller I la R ciproque R ciproque Kayardilt bala bala tu frapper se frapper r cipro quement Anti Oppositif Esperanto faldi mal faldi plier d plier Able Qual Possibilitif Francais lire lis ible Advo Adverbialisation Anglais mad mad ly folle folle ment Ao Adjectivisation Fran ais aliment aliment aire So Nominalisation Fran ais lever lev age Vo Verbalisation Fran ais danse dans er Sing Singulatif Esp ranto nego neg ero neige flocon de neige Mult Collectif Fran ais feuille feuill age Cap Chef de Esperanto urbo urb restro ville maire A Qui est Fran ais mensonge mensong ter Az Tel qu on le Fran ais bague bagu Adv En tant Fran ais gai gait ement Magn Intensificatif Fran ais sensible ultra sensible AntiMagn Diminutif Fran ais botte bott ine AntiBon Mauvais Esperanto homo fi homo homme m chant homme Pejor D pr ciatif Fran ais vin vin asse 135
148. Dans le domaine de Tintelligence artificielle le lexique occupe une place centrale Il est repr sent dans des ontologies ou des r seaux s mantiques utilis s pour la r alisation d applications en TAL telles que la d sambig isation s mantique l la boration de r sum s automatiques ou la fouille de texte D apr s Sowa 1987 bien qu il existe plusieurs types de r seaux s mantiques ce qui leur est commun est une repr sentation graphique d clarative qui est utilis e pour repr senter la connais sance Dans ces mod les la connaissance linguistique est repr sent e au m me titre que la connaissance du monde Pourtant ces deux types de connaissance jouent des r les tout fait distincts A travers l analyse de plusieurs syst mes de traitement de la langue m dicale ont d montr que plus l analyse lin guistique est fine plus la base de connaissances est riche Par ailleurs les syst mes ne convertissant pas les r seaux linguistiques obtenus par une analyse de texte en format de repr sentation conceptuelle normalis e du type graphe conceptuel ob tiennent des r sultats nettement moins bons pour la recherche d informations dans une base de connaissances Les grands projets de repr sentation des connaissances adoptent g n ralement un mod le ontologique et privil gient les relations de subsomption relation m re fille Ce sont par cons quent les relations paradigmatiques hyponymie synonymie m rony
149. DiCo et un article du LAF travers la description de la lexie ABOIEMENT L encodage vulgaris n est pas propre au DiCo ou au LAF mais concerne galement les autres BLEC On note par exemple que 2006 a tabli un certain nombre de crit res permettant de guider l attribution de gloses aux FL lors de la description des collocations du DiCE 3 3 2 L encodage traditionnel L encodage traditionnel est Pencodage le plus majoritairement utilis Il s agit d une repr sentation des FL au moyen de formules destin es au travail lexicographique formel et con ues de fa on tre manipul es dans des traitements automatiques tels que la g n ration de phrases Nous souhaitons ici en dresser un bilan Pour ce faire nous commen ons par expliquer certains aspects formels pour les lecteurs non familiers avec cet encodage Dans un deuxi me temps nous pr sentons la fa on dont l encodage traditionnel est constitu d un ensemble de FL standard simples pouvant former des FL standard combin es Par la suite nous proposons une typologie de Vencodage traditionnel destin e recenser et organiser l ensemble des formules qu il peut recouvrir La pr sentation de ces divers types nous am nera enfin une discussion critique sur la validit de cet encodage 80 FICHE DICO ABOIEMENT QSyn ouah ouah Cf grognement 1 hurlement I 2 Gener cri 1 3 Vo aboyer S Nom pour X chien I Magn Intense fort lt furieux
150. EVER 254 IL1 Tableau de r gime de BOURRASQUE II 1 dans le DEC xxx 112 Fonctions lexicales et exemples pour BOURRASQUE Z L dans le gs EB eek b poet S s He ood A ous Cae ys E ese Bre 1 2 w 2 xA ct ct o c Q el 5 o T 2 O II 1 Codes associ s aux classes semantiques lvi II 2 Codes associ s aux classes de valences syntaxiques lvii xili II 3 Codes associ s aux classes de couples de parties du discours des liens lexicaux encod s par les FL lviii IIL4 Codes associ s aux cibles communicationnelles des FL lviii BD BLEC BLF DAFA DAFLES DEC DECFC DICE FE FL FLNS FLSS ILEC LAF LEC Lefff SQL TAL TST Liste des abr viations Base de donn e Base de donn es Explicative et Combinatoire Base Lexicale du Fran ais Dictionnaire d Apprentissage du Fran ais des Affaires Dictionnaire d Apprentissage du Fran ais Langue trang re ou Se conde Dictionnaire Explicatif et Combinatoire Dictionnaire Explicatif et Combinatoire du Fran ais Contemporain Diccionario de Colocaciones del Espa ol Frame Element Fonction Lexicale Fonction Lexicale Non Standard Fonction Lexicale Standard Simple Introduction la Lexicologie Explicative et Combinatoire Lexique Actif du Fran ais Lexicologie Explicative et Combinatoire Lexique des Formes Fl chies du Fran ais
151. L permettant plusieurs types d organisation des FL Ce syst me permettra d effectuer des recherches sur les relations lexicales selon diff rents crit res Nous venons de pr senter un certain nombre de lacunes de l encodage traditionnel La plupart de ces lacunes r sultent du caract re relativement flou de cet encodage tant du point de vue conceptuel que formel Cette observation a amen poser la d finition et les fondements d un encodage formel des FL standard travers la proposition de deux nouveaux encodages encodage explicite et l encodage alg brique Nous les pr sentons dans la section suivante 3 3 4 L encodage explicite et l encodage alg brique Afin de pallier certaines lacunes de l encodage traditionnel Kahane et Polgu re 2001 cherchent donner une d finition formelle des FL standard travers deux encodages dont la vocation est de d crire le sens et la combinatoire de chaque FLSS et de mettre en valeur les propri t s formelles des FLSS c est dire les op rations de combinaison naturelles auxquelles elles peuvent se soumettre L encodage explicite L encodage explicite expose les valeurs et r les profonds des FL dans le langage naturel et facilite la compr hension et l utilisation des FL aux non initi s de la th orie Sens Texte Il d crit les FL au moyen de deux formules distinctes l enco dage de son contenu s mantique et l encodage de sa structure syntaxique Le conte
152. L sont distingu es ici selon le r le que jouent les FL vis a vis du mot cl dans les paraphrases Voyons les d finitions donn es par Zholkovsky et Mel uk 11970 Les substitutions quivalentes sont des mots ou des groupes de mots qui dans le texte peuvent tre utilis s la place du mot cl ou se combiner avec lui la phrase conservant exactement le m me sens sans qu on ait besoin de changements auxiliaires autres que les raccords syntaxiques Les substitutions quivalentes peuvent appartenir soit 4 la m me partie 158 du discours que celle du mot cl synonymes ou conversifs soit une autre partie d riv s Zholkovsky et Mel uk 11970 35 Les param tres s mantiques sont des fonctions lexicales dont les va leurs sont des moyens d expression idiomatique pour un mot donn de certains sens r guliers qui peuvent accompagner de nombreux mots en pr sence d un mot i Ces sens ont chacun plusieurs expressions dans la langue en question de plus le choix de l expression d pend enti rement du mot cl ig Zholkovsky et Mel uk 1970 40 Les substitutions regroupent les FL Syn Conv et les quatre les d riv s syntaxiques Ao So Vo et Advo Les FL correspondant aux param tres s mantiques sont Copul Incep Fin Caus Liqu Oper Func Labor Fact Real S Loc Sioc Smoa Sinstr Magn Anti Gener Ver Son Prepar Mult Sing Bon Degrad etc Le classement pr
153. L standard doivent r pondre aux principes de cardinalit de diversit et d universalit cit s plus haut Nous distinguons deux types de FL standard celles entrant en jeu dans la formation de r gles de paraphrasage et celles n y entrant pas 1 Les FL des r gles de paraphrasage Nous avons mentionn plus haut que l objectif premier des FL est de former des r gles de paraphrasage comme celle de la figure p 73 Finalement les FL apparaissant dans les r gles de paraphrasage devraient tre par essence les FL prototypiques puisqu elles seules remplissent v ritablement ce r le Si Pon cherche poser a tout prix un groupe de FL de r f rence nous pensons que c est pr cis ment cet ensemble qui devrait figurer comme tel Les FL entrant dans les regles de paraphrasage nonc es dans Mel uk et al 1992 et 2003 sont les suivantes Syn Real Vo Labor Sres Convy x 1 Anti Oper CausFunco Adv So Funco A Smed 9 Ao Func Sinstr CausOper 76 Gener Loc Pred Fin Minus Figur Sloe Liqu Incep Sing Instr Caus Cont Mult Perm Plus Nous n excluons pas la possibilit que cette liste puisse voluer Il est en effet probable que de nouvelles r gles de paraphrasage puissent tre formul es l aide d autres FL 2 Les FL standard hors r gles de paraphrasage Tr s semblables aux premi res ces autres FL sont distingu es par le seul fait qu elles n entrent pas dans l l
154. Le terme une d nomination au sens r gl Dans Actes du colloque TIA 97 pages 115 127 1997 Myriam Bouveret Fonctions lexicales pour le typage des relations syntagmatiques et paradigmatiques en bioindustries une approche lexicographique du terme 265 Processing of Term in Specialized Dictionaries New Models and Techniques special issue of Terminology 12 2 235 259 2006 Myriam Bouveret et Charles J Fillmore Matching Verbo nominal Constructions in FrameNet with Lexical Functions in MTT Dans Elisenda Bernal et Janet De Cesaris dir Actes d Euralex 2008 pages 297 308 Barcelone 2008 Simon Charest Eric Brunelle Jean Fontaine et Bertrand Pelletier Elaboration automatique d un dictionnaire de cooccurrences grand public Dans Actes de TALN 2007 pages 283 292 2007 Jos Coch Overview of Alethgen Dans Proceedings of the Eighth International Workshop on Natural Language Generation INLG 1996 Demonstrations and Posters pages 25 28 1996 Danielle Corbin Morphologie d rivationnelle et structuration du lexique Niemeyer Tiibingen 1987 David A Cruse Lexical Semantics Cambridge University Press Cambridge UK 1986 Jeanne Dancette et Christophe R thor Dictionnaire analytique de la distribution Presses universitaires de Montr al 2000 Laurence Danlos et Benoit Sagot Constructions pronominales dans Dicovalence et le lexique grammaire Int gration dans le Lefff Linguistic Inve
155. Oper dont Vencodage explicite est pr sent plus haut dans la figure On peut maintenant interpr ter Vencodage explicite de IncepOper de la fa on suivante le contenu s mantique de IncepOper est gal Incep soit 44 commence tant donn que le contenu s mantique de Oper est gal celui du mot cl La partie du discours est gale celle de Oper soit un verbe et la diath se celle de Oper soit T Z On peut donc attribuer IncepOper l encodage explicite suivant Incep IncepOper V L La seconde op ration effectu e sur les FL est la fusion Elle vise a expliciter le lien qui peut exister entre des relations paradigmatiques et syntagmatiques Nous avons d j voqu ce point au chapitre pr c dent p B1 La fusion permet d associer chaque FL syntagmatique f une relation paradigmatique not e f o repr sente la fusion et f L est une paraphrase de L f L La FL Magn par exemple est une FL syntagmatique Magn pluie forte diluvienne torrentielle On peut lui associer la relation Magn qui retourne des valeurs en relation pa radigmatique avec le mot cl L et qui contiennent la fois le sens de L et celui de Magn L On dira en effet qu un d luge est une tr s forte Magn L pluie 1 Magn pluie d luge La fusion entra ne la disparition du mot cl dans la structure syntaxique de f A nsi pour la lexie ZIGZAG la valeur de Oper est
156. Sioc Sres Spatio temporal features LOCin LOCap Loc P Centr Standard names for participants S1 S 93 Standard command to participants Imper Copulas Copul D Qualifiers of actants 18 19 Typical qualifiers of actants A Advi Adv Advs Specific qualifiers of actants Able Able Quali Quals Posi Poss II SYNTAGMATIC FUNCTIONS A Verbal operators 20 21 Verbal operators that are semantically empty Oper Func Labor Verbal operators that have a semantic component Real Fact Labreal B Predicators 22 Predicators Pred Figure 5 1 Classification de Steele et Meyer 1990 164 INVERSE LEXICAL FUNCTIONS Category functions regroupent les FL No So Vo Ao Advo Copula et Pred Simple inverse functions sont constitu es de Sync et Syn Antecedent et Consequent Liqu et State Sympt et Manifest Leader et Organization et son inverse Group et Focus Equip et son inverse Unit et Mass Sing et son inverse Multiple et Individual Mult et son inverse Symmetric inverses functions incluent Syn synonymie exacte Synn Conv et trois vari t s d antonymes Complementarity Antonym et Reversal Clustered inverse functions il s agit de deux FL diff rentes qui ont la m me inverse les FL causatives Caus et Perm ont toutes deux Event pour FL inverse Hierarchical inverse functions Gener et
157. SoPred t tu ent tement A ent tement t tu 6 4 7 Reconstitution de fiches lexicographiques L analyse des relations lexicales encod es par des FL nous permet grace entre autres au syst me de FL de d gager un certain nombre d indices signalant la pr sence de plusieurs lexies distinctes Rappelons que deux lexies sont en relation de 250 co polys mie si elles sont reli es par un l ment de sens appel pont semantiqud l Elles figurent alors sous un meme vocable polysemique En revanche on parle de lexies homonymiques lorsqu on ne peut trouver d element les rapprochant sur le plan semantique Les lexies homonymiques appartiennent a des vocables differents Voyons pr sent la m thodologie que nous allons suivre A partir de Vanalyse d une relation lexicale nous reproduisons une fiche sous forme d une structure de traits l Chaque relation nous permet de recomposer une fiche comprenant quelques elements Nous essayons dans une deuxi me tape de d terminer si parmi l en semble des fiches obtenues certaines sont li es la m me lexie et devraient le cas ch ant tre fusionn es en une seule et m me fiche Pour cela nous tentons de fusionner ou d unifier les diff rentes fiches en envisageant les crit res suivants 1 la partie du discours 2 la marque d usage 3 Petiquette s mantique La partie du discours nous permet d office de distinguer la pr sence de v
158. Te syst me de fonctions Texile 192 po SOD GCM 777 u oe eo ee ee ue 192 ou A eee eee ae a ee ee ee 193 Kr 195 7777777177 202 eee s ns sns 205 54 1 Objectif 205 5 17 Les parties du discours dans T approche Sons Text 206 Tens Texicanx repr sente par Tes fonctions Texicales 210 2227777277 213 777 017 x a eva seva s easla a h a 213 4177 777777 215 221 127777777 777 223 Chapitre 6 Applications d riv es du syst me de fonctions lexicales 224 6 1 HELL v a ae ae ew Bade ee 224 05 225 227 6 3 1 S lection des diff rents param tres 227 6 3 2 Interrogation sous forme de requ tes SQL 229 5057 231 64 ObjJeetil sose xp ren ess Sn Al 231 216000 233 64 3 Parties du discours 235 6 4 4 Marques d usagel 237 6 4 5 Etiquettes semantiquesi 240 6 4 6 Calculs pour l encodage des relations lexicales 244 6 4 7 Reconstitution de fiches lexicographiquesi 249 65 Conclusion ete sl ae Be lar a ae ee es 255 Chapitre 7 Conclusion g n rale 256 LE ie sy s S xz 4S SEEKS wam b n b R b ESE K wa u AS 256 ix 7 2 Perspectives futures _ ____ _ _ _ sua pue lala 259 BibliograpiieEl u y la eis oa ek ate a ew al gb xo eee W W 262 280 Annexe I Li
159. This system covers all LFs even non standard ones for which we have proposed a normalization of the encoding Our system has already been implemented into the DiCo relational database We propose three further applications that can be developed from it First it can be used to build browsing interfaces for lexical databases such as the DiCo It can also be directly consulted as a tool to assist lexicographers in encoding lexical re lations by means of lexical functions Finally it constitutes a reference to compute lexicographic information which will in future work be implemented in order to automatically fill in some fields within the entries in lexical databases Keywords lexical functions system of lexical functions non standard lexical functions lexical relations semantic derivations collocations structuration of lexical databases Table des mati res I iH oe eed lt n Ro eee ome eS 0 03 910 00 9 4 ili iv ce Ae aes P ee ee 59 V Liste des figures xi Liste des abr vlationsi xiv Symboles et conventions typographiques XV D dicacel xvi Remerciements xvii Chapitre 1 Intr duction ee ee 3171707777 56 02 0000 07 Chapitre 2 Ressources et mod les lexic
160. U DE L animal X ENVERS Y 197 5 3 3 2 Identification des diff rents patrons de d pendance syntaxique li s aux liens lexicaux encod s par les FL L analyse des liens lexicaux syntagmatiques du DiCo encod s par les FL a permis de mettre en vidence quarante et un patrons de d pendance syntaxique Nous les avons tri s et classifi s selon deux crit res le type de relation attributive ou actantielle et le nombre d actants en jeu dans le cas des relations actantielles De la m me fa on que pour l organisation s mantique des FL nous avons regroup l ensemble des patrons obtenus dans des classes dont chaque patron constitue une sous classe et vers lesquelles peuvent pointer les FL plus pr cis ment l ensemble des FL syntagmatiques et certaines FL paradigmatiques cf p 200 Nous illus trons ci dessous les diff rentes classes tablies Paide d un exemple de patron Notons qu une liste exhaustive et illustr e est fournie la figure p 1203 Classe 1 Structures actantielles un seul actant La premi re classe regroupe les structures actantielles 4 un actant L actant en question est le mot cl de la FL repr sentant la relation Ce patron est repr sent par la formule Z Les FL Degrad ou Funco par exemple pointent vers cette classe Degrad lait b tourner circuler Degrad TOURNER LAIT b FuncO CIRCULER COMMERAGE a
161. Universit de Montr al et Universit Paris Diderot Paris 7 Modele de structuration des relations lexicales fond sur le formalisme des fonctions lexicales par Anne Laure Jousse D partement de linguistique et traduction Facult des Arts et des Sciences Universit de Montr al et UFR de linguistique Universit Paris Diderot Paris 7 Th se de doctorat effectu e en cotutelle et pr sent e a la Facult des tudes sup rieures de l Universit de Montr al et a l Universit Paris Diderot Paris 7 en vue de l obtention des grades de Philosophie Doctor Ph D et de docteur de l Universit Paris Diderot Paris 7 en linguistique Mai 2010 Anne Laure Jousse 2010 Universit de Montr al Facult des tudes sup rieures et Universit Paris Diderot Paris 7 UFR de linguistique Cette th se intitul e Modele de structuration des relations lexicales fond sur le formalisme des fonctions lexicales pr sent e par Anne Laure Jousse a t valu e par un jury compos des personnes suivantes Lyne DA SYLVA pr sidente rapporteure Alain POLGUERE directeur de recherche Universit de Montr al Sylvain KAHANE directeur de recherche Universit Paris Diderot Paris 7 Margarita ALONSO RAMOS examinatrice externe Marie Claude L HOMME membre du jury Laurence DANLOS membre du jury Lorna HEATON repr sentante du doyen de la FES R sum Cette th se porte sur l laboration d un
162. a arbara Fran ais mourir faire mourir Anglais die make die En d autres termes ces diff rences font en sorte que certaines relations s mantique ment quivalentes sont paradigmatiques dans certaines langues o elles s expriment au moyen de d riv s s mantiques et syntagmatiques dans d autres La notion de d rivat me pr sent introduite nous souhaitons montrer dans le tableau 4 11 la correspondance entre les FL standard et diff rents d rivat mes ex traits de plusieurs langues Nous nous appuyons sur le recensement des d rivat mes effectu par Mel uk 1994a sur la liste de d riv s morphologiques du fran ais pro pos e par Bonnard ainsi que sur nos propres collectes d exemples 134 FL d rivat me exemple Si Nom d agent Basque eros eros dun acheter celui qui ach te S2 Nom de patient Anglais examine examin ee examiner celui qui est examin Sioc Nom de lieu Ev ne tavat tavat ak forger forge Sinstr med Nom d instru Mansi kons kons up peigner peigne ment Smod Nom de moyen Tcherkesse txe txe k e crire fa on d crire Sres Nom de r sultat Mari pun pun em tresser tresse Caus Causatif Abkhase abara arbara mourir faire mourir Perm Permissif Batsbi Dajvten Zagn dagi As
163. a finalit 21 le nombre 22 la cons quence 23 et la nature des actants 24 18 compl tement AntiReal armoire vider ART de N Y 19 temporairement LiquFuncg conversation a interrompre ART 20 en cour Fact2 avocat 1 1 plaider pour N Y 21 pour frapper qqn Labrealya ceinture 1 1 battre N avec ART 22 plusieurs CausFunco t moignage 1 1 collecter ART s 23 issue d favorable Real chance 2 tenter en vain A poss 24 X et Y tant plut t des enfants Caus Oper ami I 1 faire se faire avec N Y sans modificateur La ressemblance entre ce type de FL et le pr c dent entraine parfois quelques confu sions En 22 par exemple on pourrait substituer 4 la FL existante la formule Magn t_CausoFuncg la premi re section de la formule de FL venant justement pr ciser que l on cherche a obtenir plusieurs t moignages 6 FL localement standard Les FL localement standard sont encod es dans la langue de description selon des formules normalis es En voici deux exemples 89 25 De nouveauOperi g t reprendre qqch avoir de nouveau 26 Essayer de 2 demander r clamer ART 7 FL non standard Les FL non standard font office de petites d finitions des relations lexicales cf exemples 27 28 et 29 Elles sont traditionnellement encod es par des gloses formul es dans la langue d
164. a keyword as an element in a lan guage s system of semantic relations The syntagmatic class consists of functions that are based primarly on relations arising from the col locational properties of their keyword as an element in a language s speech system L objectif recherch dans cette typologie est le regroupement des FL dans des ca t gories intuitives ais es retenir Steele et Meyer 1990 41 c est pourquoi les auteurs ont introduit un certain nombre de sous classes Nous reproduisons dans la figure p 163 leur classement tel qu il est pr sent dans l article 1993 228 229 met un certain nombre de critiques vis vis de cette proposition Elle remet en cause le fait de consid rer les FL des classes 4 9 11 12 cf figure 5 1 ainsi que la plupart de celles des classes 13 et 14 comme des relations paradigmatiques dans la mesure o ces FL se combinent tou jours avec le mot cl Sous Petiquette qualifiers of a keyword gt sont regroup es des FL qui ne qualifient nullement le mot cl comme Cap et Equip Mult et Sing etc Elle remarque que la FL Pos modifie le mot cl non pas un de ses actants et ne figure donc pas dans la bonne sous classe La distinction paradigmatique vs syntagmatique ne semble donc pas respect e dans la typologie elle m me ce qui par cons quent la rend invalide Elle critique galement une terminologie impr cise qui tant t utilise le terme actant e
165. a relation Par cons quent les anciennes FLNS seront conserv es titre de gloses pour conserver une explicitation maximale des relations encod es 4 3 2 1 Les relations de mesure D apr s l observation des FLNS nous avons d gag un ensemble de relations par tageant toutes une id e de mesure Ces relations associent un nom d entit ou de fait et le nom que porte un param tre de mesure lorsqu il est associ cette entit Ainsi le param tre taille qui se mesure en m tres pieds etc devient POINTURE s il s applique des chaussures ou des gants FORMAT si l on parle d une feuille de papier HAUTEUR 571 s agit d un immeuble ALTITUDE pour une montagne etc Nous souhaitons cr er une famille de FLNS pour regrouper et encoder l ensemble de ces relations de mesure de fa on homog ne Nous nous inspirons de la FL Metr propos e par Eratsov 1969 Il s agit d une fonction nominale associant un nom un ensemble de noms signifiant param tres quantifi s typiques par exemple Metr room dimension size of ART Metr attack scale of ART Metr inflation rate of Nous proposons d ajouter la formule Metr une notation pr cisant quel param tre mesur est en cause par exemple la mesure de qualit Metrgualite ou de capacit 128 Metrcapacite Cet encodage permet une indexation coh rente des diff rentes relations de mesure Nous l illustrons ci dessous l aide d un
166. aboration de r gles Elles sont pourtant couramment cit es dans les listes de r f rence des FL standard et remplissent tous les crit res requis pour tre consid r es comme telles Ces FL sont tr s importantes pour l identifica tion de collocations et de d riv s s mantiques car elles mod lisent des relations les plus r currentes Parmi elles on trouve les FL de modification Magn Bon Ver Pos Epit les qualificateurs actantiels Able Qual quelques FL pr positionnelles Propt Instr Locapaq un ensemble de FL verbales Sympt Manif Son Involv De grad Obstr Excess Result Perf Prox Prepar des FL paradigmatiques Cf Contr Cap Equip etc b Les FL semi standard Les FL semi standard sont en quelque sorte des extensions des FL standard per mettant d ajouter une composante de sens qui n est pas prise en compte dans les FL standard dont elles sont d riv es Par exemple la description de la relation 5 ayant le sens causer le silence de qqn se diff rencie de la relation 6 par la pr sence de la composante s mantique en change de qqch qui apporte un compl ment au sens de 5 CausOper silence r duire qqn au TT 6 en change de qqch CausOper silence acheter le de qqn c Les FL localement standard Les FL localement standard ont t propos es par Polgu re en tant que classe de FL a statut hybride entre le standard et le non stan
167. agailleuse 82 AntiB Peu cl d brouill h te pagaill 83 Boncontenu Int ressante intelligente int ressante ntiBon ontenu Peu int ressante fade insipide plate terne inint res 84 AntiB P d pide plate t t sante 85 Verbu Productive constructive productive utile fructueuse 86 AntiVerpu Non productive inutile st rile vaine Vercontenu Durant laquelle X et Y disent ce qu ils pensent franche 144 88 89 90 91 Durant laquelle X et Y traitent en d tail un sujet donn suivie Durant laquelle X et Y sont seuls en t te a t te priv e 90 Dont le contenu Z est important grave s rieuse 91 Dont le contenu Z est peu lt n est pas gt important l g re frivole futile insi gnifiante 92 Durant laquelle X et Y interviennent comme ils veulent sans que ait une structure d finie b tons rompus En d composant le sens de ces diff rentes relations on peut d gager des compo 6 santes de sens r currentes comme intense peu intense long court agr a ble d sagr able non structur int ressant inint ressant sans but vide etc On observe donc que certaines de ces composantes correspondent a des FL standard cf figure alors que d autres toutes aussi importantes pour d finir la relation ne sont repr sent es que par des notations associ es aux FL stand
168. age traditionnel 3 3 4 L encodage explicite et l encodage alg brique 3 4 Conclusion a ois lea eurent Chapitre 4 Normalisation des fonctions lexicales non standard 41 Introduction sm ui aA ee ee 4 1 1 Enjeu d une normalisation de l encodage des FLNS 4 1 2 Pr sentation du corpus de travail 4 2 Travaux ant rleursl 05057 57007 777 vi 39 47 51 57 57 62 65 68 68 69 69 73 78 78 79 91 105 109 111 111 112 115 116 117 118 119 120 122 vil 431 FLNS candidates au statut standard 122 4 3 2 FLNS normalis es 4 4 8 127 2220 131 4 4 1 Corr lation entre les fonctions lexicales et la d rivation s epee ae s 131 queurs morphologiques 137 45 O FLNS 1 iption 4 142 451 Pr sentation sus as ee d es eos 142 1210577177 ee ee ee ee ee 152 Chapitre 5 Elaboration d un syst me de fonctions lexicales 155 1 lilik ill oyu e e ras he ua Re BAe oe EE S 155 5 1 1 Regard critique sur les classifications des fonctions lexicales 156 167 5 2 Perspective s mantique sur le syst me de fonctions lexicales 171 5 2 1 D composition des fonctions lexicales en diverses compo 0000000907 172 7 7 2 2 2 Organisation des composantes s mantiques dans des classes 000 177 2202 00 05 0 b 0 187 Perspective combinatoire sur
169. agme concern sont des syntagmes form s d une valeur de FL prenant le mot cl pour actant par exemple 114 SoOperi enveloppe 1IIl allocation versement de ART 115 Locin bateau a bord de dans ART 116 Instr couteau avec ART On d gage de la relation 114 la repr sentation s mantique suivante enveloppez 1117x 2 allocation Les syntagmes form s par les valeurs et le mot cl 217 de la FL sont allocation d une enveloppe et versement d une enveloppe Le test de la paraphrase minimale permet de r duire les syntagmes allocation d une enveloppe et versement d une enveloppe aux noms allocation et versement Ces syntagmes s opposent aux syntagmes enveloppe allou e et enveloppe vers e qui peuvent tre minimalement paraphras s par enveloppe et dont le noeud correspondant dans la repr sentation s mantique est communicativement dominant Dans le cadre de la relation 114 on en d duit donc que allocation et versement constituent les noeuds dominants de la repr sentation semantique Ici encore on remarque que le n ud communicativement dominant correspond au gouverneur syntaxique du syntagme On peut d gager des relations et 116 les repr sentations s mantiques sui vantes situ dans 2 bateau l aide de 2 couteau Le test de paraphrase minimale est plus difficilement applicable ce type de syn tagme car tout com
170. aide ap s i inb ye ins i A 6 Lav 4 nolfu o 9 asqowas 03oejJ1 qvuijnbi7 uopys r yl A Lav sosquos auf puof sod samos 01oejJ1 qvuijsneo 0oun ur4q0s daiquios aboufnou samos 0 gt unjuij N ms Luv 12n0y99 03peqT lqvuiqTsneO N msl abvnoyaa 03984T lqvu 40S N msl s noy s 039e31 lqvu d N Uo 1210259 asrvf d n d l 49780990 09e4u14 prod gt o1do1d woN s y no faod no 1901110 Ve ul4 ut A N ans do abun aupuasd saw D aspuasd_ haod 1J d qanb 949u0 49097 s di s LINDID 0joejd ju q q A LAN 2uawanbinquia Zjeaysedaig A uosiessed QS mv Ins suep pioq 8 anbunqua uabunyo Zjeaysedaig A uosie31e2 quawanbipquia zjesyTieds14 A npiAIpu OS LPp40q 9 MV ins suep pdoq g 497 uow uanbsnquia nb qu s c Luv zjeaypsedaig A npapui Lav op quawaoun g un4sne 0 Lav _nva 9 d n sauv QOuNysne uoryeredaig A S LOHd4SV ASVHd fuoym wnb 397 L 219p0910qU9 219p0910q9p quowaquoddn 1126 101 4201 401121115402 2 q b y op ayoanu s q apps quod 1126 101201 L21 99S 9709 2 09
171. ainsi qu une expression contrastive consacr e par l usage encod e par la FL Contr Anti assentiment interdiction Non d sir 41 d sint r t indiff rence Contr comptoir I 1b salle La seconde sous classe repr sente la conversion d j illustr plus haut La troisi me sous classe repr sente les quivalents masculins ou f minins pou vant correspondre l opposition male femelle dans certains cas Ces compo santes s mantiques sont repr sent es par les FLNS suivantes Fem avocat 1 1 avocate Masc vache taureau b uf 5 2 2 3 Classe L MENT ENSEMBLE Nous regroupons sous la classe L MENT ENSEMBLE plusieurs sous classes relativement diff rentes les unes des autres Ces sous classes ont cependant toutes en commun une mise en relation entre un l ment et son ensemble Les compo santes s mantiques qui y sont repr sent es fonctionnent par paires par exemple partie tout chef quipe g n rique sp cifique etc Les deux premi res sous classes regroupent les FL repr sentant des relations habi tuellement pr sentes dans les ontologies de type terminologique il s agit de composantes servant classifier une unit lexicale dans une hi rar chie c est dire le terme g n rique repr sent e par la FL Gener et l hyponyme souvent repr sent par la FL Hypo ou certaines FLNS par exemple Gener avocat 1 homme de loi
172. anchir 10b Ces phases sont repr sent es par des chiffres romains en exposant 10 a Real accusation 1 2 se d fendre contre ART b Real accusation 1 2 se blanchir se disculper se laver de ART De la m me fa on la FL Reala associ e la lexie CRIME I A se d compose en trois tapes 11 a Reall crime I a instruire ART enqu ter sur ART b Realll crimeziLa lucider ART trouver l auteur de ART c Real crime 1 a punir ch tier r primer venger ART 4 FL standard avec pointeurs vers la d finition Le quatri me type de FL standard regroupe un ensemble de FL comportant des pointeurs vers les composantes s mantiques de la d finition de leur mot cl Ces FL sont r v latrices du lien profond existant entre les d finitions des unit s lexicales et les relations de d rivation s mantique ou de collocation qui leur sont associ es d crit notamment par 2003 2005 Nous dis tinguons deux sous ensembles parmi ces FL selon le type de renvoi qui est fait vers la d finition Premi rement certaines FL comportent des indications sur la quantit la dur e le caract re ponctuel ou habituel d un v nement d not par une unit lexicale et son d riv semantique ou collocatif Dans les formules de FL ces indications sont repr sent es par les notations quant temp usual et actual en exposant La premi re sert a activer la composante de pluralit
173. animal d levage ou esp ce animale correspondante en sont s mantiquement d riv es selon les relations repr sent es par les fonctions lexicales dans les exemples et 1 Solaboyer I aboiement 1 2 Sissr chantzfl a micro 3 Chair de utilis e comme aliment mouton a mouton Lb 4 4 Fourrure peau de utilis e comme mat riau mouton l a moutonl c La notion de d rivation s mantique tant assez large Mel uk et Polguere 2007 19 d terminent trois grandes familles pour mieux la circonscrire Nous les r sumons ci dessous 1 Une premi re famille regroupe les cas oti les deux lexies concern es poss dent approximativement le m me sens Il s agit des relations de synonymie exacte 30 par exemple V LO et BICYCLETTE et approximative par exemple DE FENDRE et INTERDIRE de conversion X precede Y est presque quivalent Y suit X de changement de partie du discours COUP est le nom d action quivalent au verbe FRAPPER ainsi que les termes g n riques COURS D EAU est le terme g n rique pour RIVIERE 2 La deuxi me famille regroupe les relations d antonymie par exemple entre INTERDIRE et AUTORISER 3 La troisi me famille regroupe les cas plus larges o l une des deux lexies d signe un lement de la situation d not e par l autre Il peut s agir d un actant NAGER NAGEUR d un circonstant DORMIR LIT ou d une caract ristiqu
174. antiques Nous nous int ressons particuli rement la repr sentation du lexique et des relations entre unit s lexicales dans les domaines de la linguistique de la psycholinguistique et de l intelligence artificielle Ce qui peut rapprocher ces diff rentes disciplines c est que le lexique y est mod lis selon un m me mode re lationnel Elles rel vent pourtant de traditions diff rentes alors que l intelligence artificielle h rite du mod le aristot licien de la hi rarchisation des concepts le para digme relationnel en linguistique est davantage h rit de la linguistique structurale saussurienne qui voit l unit lexicale comme tant partie int grante d un syst me et n tant d finissable qu au moyen de ses relations avec les autres l ments du syst me 11 Ces disciplines se differencient galement les unes des autres par leurs objectifs et m thodologies En linguistique on distingue couramment deux approches du lexique une approche componentielle galement appel e d compositionnelle et une approche relationnelle Celles ci ne sont pas v ritablement en opposition mais plut t compl mentaires Les mod les componentiels ou d compositionnels defi nissent les unit s lexicales en d composant leur sens en unit s s mantiques plus petites Cette approche regroupe des coles th oriques tr s vari es aussi bien les partisans de l analyse componentielle comme 1992 et 1987 qui d composent l
175. ard du type contenu plaisir but OU simplement d crites dans des FLNS comme dans les exemples a 92 Face a cette h t rog n it il semble l gitime de questionner la pertinence de ce choix d encodage Les fonctions semi standard dans les exemples a 87 donnent l impression d une hi rarchisation parmi les composantes de sens des relations les composantes les plus saillantes semblant tre repr sent es par des FL standard et les autres ajout es sous forme de compl ment au moyen de notations Or dans le processus d encodage rien n indique qu il faille privil gier les composantes repr sentables par des FL standard aux d pens d autres ventuel lement plus saillantes Si l on consid re les exemples 80 81 82 et 84 il semble que les composantes contenu plaisir et clart constituent les l ments majeurs de la relation que les l ments Bon AntiBon Magn et AntiMagn polarisent en leur conf rant une valeur positive ou n gative Cette fa on d encoder les relations contribue renforcer l h t rog n it parmi les formules de FL Certaines sont standard d autres semi standard d autres encore non standard alors que toutes ces valeurs sont tr s semblables les unes aux autres dans leur rapport la lexie CONVERSATION a dont elles donnent une description La solution pour palier ces probl mes d encodage serait de chercher d finir pour les lexies des propri t s ou
176. as pr sentes dans WordNet Il n existe pas non plus d indications pour distinguer les noms propres des noms communs les noms de masse des noms comptables etc Pour ce qui est des relations entre unit s lexicales ou entre concepts les r dacteurs de WordNet avouent avoir pris conscience d un 42 manque de relations s mantiques au fur et mesure que la base de donn es s est largie Organisation en fonction des parties du discours D apr s des tudes psycholinguistiques sur l organisation mentale des relations se lon les parties du discours l quipe de WordNet met l hypoth se que les noms dans l esprit humain ne sont pas organis s comme les verbes ni comme les ad jectifs ni comme les adverbes S appuyant sur ces postulats psycholinguistiques WordNet choisit de diviser le lexique en quatre classes noms verbes adjectifs et adverbes formant quatre r seaux diff rents Chaque classe a sa propre organisa tion et pr sente certains types de relations en ad quation avec la partie du discours concern e Notons que dans le cadre de la LEC nous ne consid rons pas qu une telle distinction soit justifi e nous en exposons la raison un peu plus loin WordNet structure les noms sur la base de l hyperonymie Vingt cinq grandes classes organisent la hi rarchie de noms par exemple act activity animal fauna artifact attribute body cognition knowledge Les relations entre noms sont d ordre hy
177. ase et participant la mise en sc ne d un cadre conceptuel Aussi n importe quelle unit lexicale employ e dans une phrase mettant en sc ne un cadre est susceptible de correspondre un l ment de cadre A titre d illustration nous avons reproduit a la figure 4 3 p 146 le cadre lt ACCOUTREMENTS gt On peut ainsi voir travers les exemples que l l ment de cadre WEARER peut se r aliser par le pronom She l l ment TIME OF CREATION par le syntagme 17th century et que ni l un ni l autre ne sont des collocations ou des d riv s s mantiques des lexies voquant le cadre lt ACCOUTREMENTS gt Beaucoup d l ments sont communs plusieurs cadres par exemple TIME est commun aux cadres lt ARREST gt lt ARRIVING gt lt BEING_BORN gt lt KILLING gt etc Ce pendant certains d entre eux sont tr s pr cis ment li s certains cadres l l ment COPARTICIPANT par exemple n existe que pour le cadre lt ACCOMPANIMENT gt 146 Accoutrements Definition A Wearer wears accessories which are made of some Material and may have a Style Most of the accessories are non essential clothing items Ex She_ Wear wore a black Desc velvet_ Mat HAT on her head Body _loc Core Fe ACCOUTREMENT Acoutl This FE identifies the accoutrement Ex She wore a tiara_ Acout Non Core Fes BODY_LOCATION Body_loc This FE identifies the place on the body where a particu
178. atif de L 2 h L est une paraphrase de gof L f L ot est le symbole d union linguistique et o le symbole de composition Par exemple la FL IncepOper appliqu e l unit lexicale AMOUREUX retourne la valeur tomber qui est un collocatif de amoureux gof L repr sente la composition de g et de f c est dire Vapplication de g f Si l application de Oper amoureux retourne la valeur tre application de Incep Oper amoureuz soit tre retourne la valeur commencer commencer tre amoureux La combinaison de ncepoOper amoureux et Oper amoureuz commencer tre amoureux est synonyme de tomber amoureux Par cons quent IncepOper amoureux est une paraphrase de IncepoOper amoureur Oper amoureux Dans l encodage alg brique le produit de deux fonctions est not par un point soit par exemple Incep Oper Dans l encodage explicite c est le r sultat du pro duit qui est repr sent dans une structure similaire celles de la figure Pour l interpr ter notons que c f est le contenu s mantique de f d f la diath se de f et pos f la partie du discours de f Ainsi le produit de la FL Incep et d une FL f telle que Oper est d fini par la formule de l encodage explicite suivante 108 Incep c f pos f la f Prenons un exemple pour d chiffrer cet encodage Incep f ncepOper mutisme ila s enfoncer tomber dans ART Rempla ons f par
179. ations que l on peut d gager l observation d une relation lexicale soit son sens la dimension combinatoire de ses l ments les parties du discours des lexies en jeu ainsi que l l ment communicationnellement dominant dans la relation Pour chacun de ces modules d organisation nous avons tabli un certain nombre de classes Elles sont pr sent es dans les figures p 148 5 9 p 203 et 5 14 p ainsi que dans le tableau 5 1 p P11 Le syst me a t impl ment sous la d une table de donn es MySQL que nous pr sentons au chapitre suivant section 6 2 Ainsi constitu le syst me va pouvoir tre exploit de plusieurs fa ons Premi re ment nous envisageons dans de futurs travaux la cr ation d interfaces de consul tation de BLEC pousant les quatre perspectives du syst me Deuxi mement il est possible d en d river directement un outil pour guider le processus d encodage des relations lexicales au moyen de FL Enfin il sert de r f rence pour effectuer des calculs sur les informations lexicographiques pouvant entrer en compte pour la g n ration automatique d l ments de fiches lexicographiques Nous consacrons le chapitre suivant la pr sentation de ces deux derni res applications Chapitre 6 Applications d riv es du syst me de fonctions lexicales 6 1 Introduction Le sixi me chapitre de cette th se est consacr a la pr sentation d applications que nous avon
180. aux relationnels 2 1 Introduction Soo 2 1 1 Mod lisation du lexique en linguistique et ses disciplines connexes ae Dh td Es Q MW 4 4 10 2 12 Propri t s des relations lexicales 15 2 1 3 Les diff rents types de ressources lexicales relationnelles 23 2 2 Panorama des ressources lexicales relationnelles 25 DON he WiC Old amp 0 de ek 26 222 BrameNet 44 uu eae HS REE 5 G s aa E ER HS 34 223 VVordNetl 224 MindNetl 2 2 5 Autres ressources lexicales relationnelles 2 3 Deux mod les psycholinguistiquesi 2 3 1 Mod le computationnel de l approximation s mantique par analogie Duvignau 2002 2 3 2 Mod le fonctionnel du lexique mental A tchison 2003 2 4 Conclusion gt hapitre 3 Les fonctions lexicales aspects formels et notionnels 3 1 Introduction 3 2 La notion de fonction lexicalel 3 2 1 Nature et r le des fonctions lexicales 3 2 2 Caract re graduel des fonctions lexicales 3 3 Les encodages de fonctions lexicales 3 3 1 L encodage vulgarisel 3 3 2 L encodage traditionnel 3 3 3 Discussion critique sur l encod
181. avaux qui nous semblent particuli re ment pertinents pour la structuration des bases de donn es lexicales le modele de et celui de 2003 Ces mod les ont en effet pour vocation de fournir une repr sentation du lexique en ad quation avec la fa on dont le lexique mental des locuteurs est organis Les l ments propos s plus ou moins compl mentaires avec approche par fonctions lexicales nous semblent tout fait compatibles avec les interfaces de consultation de BLEC qui seront d velopp es partir de notre mod le de structuration de relations lexicales 2 3 1 Mod le computationnel de l approximation s mantique par analogie Duvignau 2002 Dans sa th se de doctorat 2002 a cherch valider une hypoth se pos tulant une certaine organisation mentale des verbes Elle souhaitait d montrer que la m taphore verbale refl te du moins en partie l existence d une organisation du lexique des verbes selon la relation lexico s mantique d hyperonymie hyponymie et la similarit intra et inter domaine rapprochant par exemple les verbes CABOS SER dans le domaine de la m canique MEURTIR dans le domaine de la m decine et D LABRER dans le b timent Elle nomme ces deux types de relations des relations de proximit s mantique par analogie 2002 138 Pour tester cette hy poth se deux corpus ont t constitu s un premier portant sur des m taphores pr sentes dans des textes de vulgarisation scientifique et
182. but de pr senter des informations tr s riches et compl tes sur chaque unit lexicale mais ne comptent que peu d en tr es Notre int r t dans cette th se porte plus particuli rement sur Petude des relations lexicales Or si Pon parcourt l tat de l art qui vient d tre dress sur les mod les relationnels du lexique et les diff rentes ressources lexicales relationnelles on re marque que peu d entre eux proposent une tude d taill e des relations lexicales Seul le modele th orique de la LEC semble accorder une attention tr s particuli re aux relations qu il mod lise et ce non seulement du fait de leur grand nombre mais aussi en raison de la caract risation qui est faite de chacune d elles dans le syst me formel des donn es lexicales L utilisation de ce mod le comme cadre th o rique nous semble par cons quent tout a fait adapt a notre objectif qui consiste rappelons le 4 proposer un mod le de structuration multi dimensionnelle des re lations lexicales Le choix de la LEC comme cadre de travail pr sente un certain nombre d avantages et suppose certaines positions th oriques vis vis des rela tions num rons les en d tail Tout d abord en adoptant les principes th oriques de la LEC nous restons dans une vision linguistique et lexicologique du lexique Aussi nous cartons d lib r ment les consid rations conceptuelles ou psycholin guistiques pour nous centrer sur une tude des r
183. c est dire dont les composantes s mantiques sont r pertori es dans cette classe sont g n ralement mais non exclusivement verbales Nous divisons cette classe en un certain nombre de sous classes Premi rement la sous classe cr ation apparition regroupe les composantes li es l apparition ou la cr ation d un fait ou d une entit par exemple CausFunco bijou 1 ciseler cr er fabriquer monter ART SoCausFunco bateau lancement de ART Une deuxi me sous classe rassemble les composantes s mantiques exprimant une forme de manifestation qu il s agisse de l expression d un sympt me Sympt ou de la manifestation d un sentiment ou d une motion Manif PermiManif par exemple Sympt moi fr mir palpiter trembler d Manif pleurs couler jaillir La troisi me sous classe permet de regrouper les composantes s mantiques de r alisation fonctionnement ou utilisation illustr es plusieurs reprises dans le chapitre par exemple 186 Realo avocat 1 I individu qui pratique un m tier consulter ART utiliser les services de ART Facto anere mordre tenir Involv plaque I accumulation de mati re recouvrir N Son abeille bourdonner La quatri me sous classe regroupe les composantes s mantiques d augmentation ou d am lioration par exemple CausPredPlus crainte attiser exciter ART La c
184. cales Fontenelle 1997b a r alis un travail de conversion du dictionnaire bilingue Robert amp Collins Atkins et Duvall 1978 vers une base de donn es lexico s mantique Vinstar de la majorit des dictionnaires bilingues le Robert amp Collins met l accent sur la combinatoire des unit s lexicales et fournit un grand nombre de collocations L objectif principal est la construction d un r seau s mantique de l information syntagmatique et paradigmatique contenue dans le dictionnaire bilingue Fonte nelle constate que beaucoup de dictionnaires se r v lent tr s peu performants pour mettre en valeur et diff rencier les collocations et choisit d utiliser le formalisme des FL pour les encoder et les organiser Ce faisant il effectue une premi re application de masse des FL Tester les FL sur l ensemble du Robert amp Collins repr sente une t che consid rable jusqu alors jamais r alis e qui a permis de confronter ce mode de repr sentation un ensemble de donn es et d en v rifier la validit pratique The general conclusions I draw concerning the imprecise nature of some functions and the evaluation of the material would never have been pos sible however if only a fragment of the dictionary had been analyzed in detail Exploiting the whole dictionary and focussing on such a large xxxiii section of the lexicon had never been attempted and the potential appli cations whether purely linguistic or pedag
185. ccord e Je remercie Lyne Da Sylva pour avoir accept de pr sider le jury les deux rap porteures Marie Claude L Homme et Margarita Alonso Ramos ainsi que Laurence Danlos pour leur participation en tant que membres du jury Un grand merci a Lucie Barque Marie Pierre Jousse Marie Andr e Mauger Fr d ric Osterrath et Aur lie Picton qui ont bien voulu relire des sections de ma th se et m clairer de leurs remarques Je dois encore mentionner Myriam Bouveret qui je dois ma d couverte coup de foudre des fonctions lexicales et Marie Claude L Homme qui m a offert mon bap t me lexicographique il y a presque dix ans Je ne voudrais pas non plus oublier Igor Mel uk et sa passion communicative de la linguistique une fois qu on a t contamin par le Virus Explicatif et Combinatoire il semble qu il n y ait pas de gu rison possible En tant qu tudiante en cotutelle j ai eu la chance d tre accueillie dans deux labo ratoires POLST et le Lattice Je remercie les membres de POLST Patrick Drouin Marie Claude L Homme Alain Polgu re et tous les tudiants avec qui j ai lunch autour de la table ronde Mon ann e pass e au Lattice a t tr s stimulante je tiens galement remercier Laurence Danlos et les tudiants latticiens de l poque pour la bonne ambiance et l enthousiasme scientifique qui r gnaient dans le laboratoire Je suis galement reconnaissante la Facult des tudes Sup rie
186. cognitifs tendent davantage a envisager des relations entre concepts Les premiers cherchent a repr senter le lexique en usage tel qu il est exprim dans les textes les seconds a repr senter la fagon dont le lexique est organis dans le cerveau humain Par ailleurs le nombre de relations consid r es varie consid rablement Celles ci ne sont pas identifi es de fa on univoque mais en corr lation avec les objectifs vis s par les modeles Nous avons galement dress une synth se comparative des principales ressources lexicales relationnelles existantes pour l anglais le fran ais et l allemand Ces res sources sont de diff rentes formes dictionnaires informatis s ou non bases de donn es relationnelles et graphes lexicaux Elles ont en commun une philosophie relationnelle dans laquelle une unit lexicale se d finit par les associations qu elle 66 entretient avec d autres Elles diff rent toutefois par leurs arri re plans th oriques par les relations qui y sont identifi es par leurs structures ainsi que par la fa on dont elles ont t cr es alors que certaines sont labor es selon des m thodes au tomatiques cf MindNet et mettent Vaccent sur la quantit de donn es trait es d autres optent pour une approche semi automatis e cf Antidote et privil gient la pr cision parmi les donn es recueillies D autres encore comme le DiCo et Elexico effectuent un relev manuel des donn es dans le
187. ctionary of English hope 11 1 Dictionaries 8 1 54 1986 James Steele et Ingrid Meyer Lexical Functions in an Explanatory and Combi natorial Dictionary Kinds Descriptions and English Examples Dans James Steele dir Meaning Text Theory Linguistics Lexicography and Implications pages 41 61 Ottawa University Press Ottawa 1990 Jacques Steinlin Sylvain Kahane et Alain Polgu re Compiling a classical expla natory combinatorial lexicographic description into a relational database Dans Proceedings of the Second International Conference on the Meaning Text Theory pages 477 485 Moscou 2005 Jacques Steinlin Sylvain Kahane Alain Polgu re et Adil El Ghali De Tarticle lexicographique la modelisation objet du dictionnaire et des liens lexicaux Dans Actes de Euralex 2004 pages 177 186 Lorient 2004 Mathieu Valette Alexander Estacio Moreno Etienne Petitjean et Evelyne Jacquey El ments pour la g n ration de classes s mantiques a partir de d finitions lexi cographiques Pour une approche s mique du sens Dans Piet Mertens C drick Fairon Anne Dister et Patrick Watrin dir Verbum ex machina Actes de la 13 conf rence sur le traitement automatique des langues naturelles TALN 06 volume 1 de Cahiers du CENTAL pages 357 366 UCL Presses Universitaires de Louvain 2006 278 Karel van den Eynde et Piet Mertens Le dictionnaire de valence Dicovalence Manuel d utilisation Universit de Louvai
188. ctionne grace un m canisme montre m canique STATUT Dans lequel il est interdit de fumer wagon non fumeur Telle qu elle n est pas professionnelle comp tition 2 amicale SITUATION LOCALISATION 150 Telle qu elle est sous la terre canalisation souterraine Qui vit a l tat sauvage canard 1 a sauvage TEMPS Qui a lieu le matin concert matin e Valable pour un an enveloppe III annuelle CAUSE Qui est caus par un incendie d g t Fe du feu Qui a lieu malgr la volont de X c libat forc oblig CONSEQUENCE Qui tue l tre Y coup de feu I mortel Qui nuit la r putation de Y peine I1 infamante Enfin deux attributs permettent de repr senter les collocations portant sur les participants d un v nement ou sur les actants d un mot cle PARTICIPANT Qui a lieu entre les chefs de deux partis bataille II 1 de chefs Qui est plut t frequente par des familles restaurant familial CIBLE Qui vise le grand public cin ma 1 1 commercial Pour les troupes d une arm e en guerre th dtre I 1 aux arm es Nous sommes en pr sence d une vingtaine d attributs englobant l ensemble des FLNS adjectivales collocationnelles Cette liste n est toutefois pas d finitive cer tains attributs pourraient tre amen s a se pr ciser se scinder en sous attributs ou au contraire 4 se g n raliser La recherche d attributs s inscrit da
189. ctions lexicales Celles ci indiquent la fois la partie du discours du collocatif la configuration syntaxique dans laquelle il figure avec le mot cl et une br ve caract risation semantique de la relation Par exemple la fonction lexicale Sioc Stoc abeille ruche indique que l unit lexicale ruche est un nom et qu elle signifie approximativement endroit en relation avec les abeilles Les fonctions lexicales sont repr sent es selon un encodage formel Cette formalisation est motiv e a des fins d application en TAL et notamment en traduc tion automatique La formalisation apparait n cessaire lorsque l on fait face un grand ensemble de relations elle permet d apporter une forme de syst matisation et de contr le sur la bonne identification des relations Elle permet galement de 23 rendre compte de fa on explicite du syst me que forment les relations lexicales Nous avons pr cis jusqu pr sent les grands modes de mod lisation des relations lexicales en linguistique et dans ses disciplines connexes Par la suite nous avons discut un certain nombre de propri t s associ es aux relations lexicales Ceci nous conduit donc pr sent d tailler les diff rentes ressources lexicales tir es des modeles du lexique et d crivant lesdites relations 2 1 3 Les diff rents types de ressources lexicales relation nelles Nous appelons ressources lexicales relationnelles les dictionnaires bases d
190. ctures syntaxiques profonde et de surface de Marie casse les pieds a Jean Leblanc en cours Pour traiter le probl me ils distinguent deux types de locu tions les locutions syntaxiquement endocentriques et les locutions syntaxiquement exocentriques 1 Les locutions endocentriques ont un comportement syntaxique d ter min par leur t te Par exemple BAIN DE FOULE CERCLE VICIEUX et SAC A DOS se comportent syntaxiquement comme des noms alors que les lo cutions SE BOUFFER LE NEZ et METTRE LES BOUTS s utilisent comme des verbes Les locutions sont distribu es entre des classes syntaxico lexicales qui sont parall les aux parties du discours de surface des lex mes soit les lo cutions nominales verbales adjectivales adverbiales clausales pr position nelles conjonctionnelles et num rales 2 Les locutions exocentriques ont un comportement syntaxique qui ne peut etre d termin par leur structure interne Par exemple BEC ET ONGLE 1 est une locution nominale c est dire syntaxiquement gouvern e par un nom mais s utilise comme un adverbe ex se d fendre bec et ongle de m me EN MIETTES est une locution pr positionnelle occupant la position syn taxique d un adjectif ex une voiture en miettes Pour r soudre cette ques tion Mel uk propose de fournir la caract risation syntaxique de surface ainsi que sa caract ristique syntaxique profonde sous la forme lt emploi al gt
191. d 12 A partir de ces deux types de n gation on peut formuler deux r gles de paraphra sage 1 X lt gt Neg ANTI2 X He violated the regulations He did not observe the regulations 2 X Y lt gt ANTIL X ANTI2 X He began to observe the regulations He stopped violating the regulations R sum automatique Dans la probl matique de la g n ration de r sum s automatiques fluides et non seulement d extraits de texte et ont r fl chi un modele linguistique pour la reformulation et la condensation dans lequel les FL joueraient un r le important Pour ce faire plusieurs articles de jour naux en frangais et en anglais ont t analys s L tude montre qu environ 70 des substitutions partir de textes complets vers les textes r sum s pourraient tre liii encod es par un ensemble de FL standard ainsi que quelques non standard En plus des nombreux types de synonymes et antonymes les FL les plus fr quentes sont d abord les FL de d rivations Vo So Ao Advo puis les hyperonymes Gener Au contraire les occurrences de paraphrases impliquant des constructions verbes support se sont r v l es relativement peu fr quentes Par ailleurs certaines op ra tions productives de reformulation rep r es ne sont pas d crites en tant que r gles de paraphrase standard dans la TST II arrive que le mat riau pour les phrases du texte r sum vienne de l agr gation de deux phra
192. d e sur le syst me de FL met en vidence un certain nombre d oublis et de manques d homog neit dans les donn es Par exemple mourant dans la relation suivante A1ProxOper mort 1 1 1 mourant X qui est proche de 237 aurait d tre not mourantaa De la m me fa on vainqueur dans les relations ci dessous devrait tre not vainqueurn etc S Reals issue favorable comp tition 2 vainqueur de ART Nom pour Y qui gagne Si couronne I vainqueur Indice pour la distinction de plusieurs vocables On note que la pr sence de deux parties du discours associ es 4 un m me mot forme figurant en tant que valeur de FL constitue un indice de l existence de deux vocables qui devront tre distingu s Par exemple porteur est valeur des FL S3 Nom pour Z et A S3 ch que porteur de ART porteur de ART Dans le premier cas il s agit d une lexie nominale dans le second d une lexie adjectivale De m me malade est valeur des FL Magn A X qui prouve un intense et S Nom pour Y Magn A d go t malade de S2 docteur 1 malade Dans le premier cas MALADE est un adjectif dans le second un nom Le crit re de la partie du discours associ e une valeur sera utilis dans la sec tion 6 4 7 pour d terminer automatiquement le nombre de vocables devant tre distingu s 6 4 4 Marques d usage 6
193. d hoc mais organiser pr senter et normaliser les FLNS associ es 4 une lexie dans leur ensemble Alors que la section pr c dente concernait principalement les d riv s semantiques encod s par des FLNS nomi nales celle ci sera davantage tourn e vers les collocations encod es par les FLNS adjectivales Nous partons de l hypoth se que tout fait ou entit d not par une lexie poss de des attributs tr s g n raux de type temps fonction fonctionnement aspect participants etc susceptibles d tre exprim s au moyen de collocatifs ou de d ri v s s mantiques Ces attributs peuvent tre mis en correspondance avec les compo santes semantiques des definitions des unit s lexicales mais sont conceptuellement plus larges et ne sont pas hi rarchis s contrairement aux composantes semantiques qui sont consid r es centrales ou p riph riques Nous cherchons donc dans cette section d terminer quels sont les attributs mod lis s par les FL Nous pensons que raisonner en termes d attributs va permettre d organiser globalement les FL standard et non standard Plus pr cis ment cette approche vise deux objectifs 1 identifier et normaliser les FLNS en mettant en valeur certaines r gularit s 2 organiser les FLNS dans les bases de donn es lexicales 4 5 1 1 Une perspective nouvelle sur les FL En raisonnant en termes d attributs nous pouvons consid rer les FL standard s
194. dNet an Electronic Lexical Database MIT Press Cambridge 1998 Christiane Fellbaum Grabowski et Shari Landes Performance and Confidence in a Semantic Annotation Task Dans Christine Fellbaum dir WordNet an Electronic Database chapitre 9 pages 217 238 MIT Press 1998 Charles J Fillmore Scenes and frames Semantics Linguistic Structure Processing pages 55 82 1977 Charles J Fillmore Frame semantics Linguistics in the Morning Calm pages 111 137 1982 Charles J Fillmore Christopher R Johnson et Miriam R L Petruck Background to FrameNet International Journal of Lexicography Special Issue on Frame Net 16 3 235 250 2003 267 Thierry Fontenelle Dictionnaires lectroniques et relations lexicales une compa raison entre quelques programmes europ ens Revue Francaise de Linguistique Appliqu e I1 1 65 77 1997a Thierry Fontenelle Turning a Bilingual Dictionary into a Lexical Semantic Data base Max Niemeyer Tiibingen 1997b William Frawley News forms of Specialized Dictionaries International Journal of Lexicography 1 3 89 213 1998 Fran ois Gaudin Socioterminologie Une approche sociolinguistique de la termino logie Champs linguistiques Duculot Louvain la Neuve 2003 Bruno Gaume et Karine Duvignau Pour une ergonomie cognitive des dictionnaires lectroniques DN Fouille de textes 8 157 181 2004 Eli Goldberg Norbert Driedger et Richard Kittredge Using Na
195. dNet est La base de donn es est accessible l adresse suivante http wordnet princeton edu 40 une base de donn es laquelle on peut acc der par des voles s mantiques c est un dictionnaire s mantique con u comme un r seau en partie en raison du fait que la repr sentation des unit s lexicales et des concepts en un syst me inter reli semble correspondre la fagon dont les locuteurs organisent leur lexique mental Structure g n rale de la base de donn es WordNet WordNet est il un dictionnaire ou un th saurus 7 Cette question a t maintes fois pos e pour tenter de d finir la nature de cette ressource Selon 1998 T WordNet n est ni un dictionnaire traditionnel ni un th saurus mais une com binaison des deux types de ressources lexicales de r f rence Sa forme ressemble celle d un th saurus tant donn que ses unit s de description sont des synsets ensembles de synonymes constitu s de toutes les unit s lexicales qui expriment un concept donn et qu il permet d acc der des mots par les concepts Mais WordNet est plus qu un th saurus dans la mesure ot il lie les concepts par des relations explicites et tiquet es Les relations lexicales et les relations s mantico conceptuelles existant respectivement entre les unit s lexicales et entre les synsets sont clairement distingu es Certains concepts peuvent exister sans unit s lexi cales correspondantes On trouve en effet de
196. dages de fonctions lexicales A la suite de la pr sentation de la notion de FL cette section est destin e appro fondir la question de leur encodage Premi rement nous pr sentons les deux en codages les plus commun ment utilis s encodage vulgaris tel qu on le trouve par exemple dans le Lexique Actif du Fran ais ou LAF MeTeuk et Polgu re 2007 et Vencodage dit lt traditionnel gt Bien que Vencodage vulgaris ait t cr post rieurement l encodage traditionnel dans le but d en offrir une vulgarisa tion il est formellement plus simple et plus intuitif Il semble donc plus naturel de le pr senter en premier L encodage traditionnel peut alors tre vu comme une formalisation de la description des relations lexicales telle qu elle est r alis e par Pencodage vulgaris Nous proposons une typologie de l encodage traditionnel pour recenser l ensemble des formules qu il recouvre et souligner sa grande h t rog n it La visualisation des diff rentes formes de l encodage traditionnel nous am ne en dresser un bilan critique Finalement nous montrons comment d passent les insuffisances de cet encodage en proposant une d finition for melle des FL travers un encodage alg brique et un encodage explicite 3 3 1 L encodage vulgaris L encodage des FL dans des formulations claires et accessibles a une tr s grande importance la fois dans une optique p dagogique d enseignement de
197. dans la Lexi cologie Explicative et Combinatoire 1995 Les d riv s s mantiques d une lexie sont d finis comme des lexies gravitant autour d elle au sein d un m me champ s mantique et partageant une composante s mantique forte avec elle Les liens entre une lexie et ses d riv s semantiques sont paradigmatiques Ainsi pour la lexie ABEILLE on observe les d riv s s mantiques suivants ABEILLE APICULTEUR ESSAIM RUCHE etc Les collocations quant 4 elles unissent sur le plan syntagmatique une unit lexi cale et son collocatif s lectionn d apr s certaines contraintes Par exemple pour la lexie ABEILLE on rel ve les collocatifs verbaux suivants ABEILLE BUTINER PIQUER POLLINISER etc Les notions de d rivation s mantique et de collocation seront d finies en profondeur dans le chapitre suivant la section 2 2 1 Dans un dictionnaire ou une base de donn es lexicale la pr sentation des relations lexicales issues d une lexie va tre diff rente selon le lt parcours gt du lexique que Von choisit de repr senter Par exemple il est possible d organiser les relations lexicales associ es 4 ABEILLE en fonction des parties du discours les noms ES SAIM RUCHE etc les verbes BUTINER PIQUER ELEVER etc les adjectifs OUVRIERE etc en fonction des d pendances syntaxiques les verbes dont la lexie ABEILLE est le sujet BUTINER POLLINISER PIQUER ceux dont elle est l objet ELEVER
198. dard Hypo Mero Hollo Compos et Produit d riv Chacune d entre elles sera confront e aux crit res requis pour le statut standard soit le crit re de cardinalit selon lequel une FL doit pouvoir s appliquer un grand ensemble de lexies le crit re de diversit qui impose une diversit parmi les valeurs des FL ainsi que le crit re d int grabilit de 123 la FL au syst me g n ral de FL qui pr conise qu une FL nouvelle ne doit pas tre isol e mais se trouver en relation logique avec d autres FL existantes 4 3 1 1 La relation d hyponymie Hypo Il existe une FL modelisant une relation s mantique tr s proche de l hyperonymie Il s agit de la FL Gener Elle d termine pour une lexie L un mot g n rique pouvant appara tre dans la construction L1 Lo et autres Gener L soit par exemple poire pomme et autres fruits La relation inverse de Gener n existe pas puis ont propos la cr ation de la fonction Spec sans que celle ci soit pourtant retenue R cemment nous avons sugg r la mod lisation de l hyponymie dans le DiCo par la fonction Hypo pour remplacer des FLNS comportant de tr s fortes similarit s comme illustr par les exemples ci dessous 53 a Type de g teau clafoutis b Esp ce de canard colvert c Vari t de cerise griotte Notons que la FL Hypo ne doit pas tre consid r e comme la fonction inverse de Gener dans la mesure o cette derni re est
199. dard pour les relations dont la nature universelle n est pas d montr e mais qui peuvent tre encod es par des FL standard dans le contexte d une langue naturelle donn e Ainsi les fonctions De nouveau et Essayer de illustr es en 7 et 9 sont tr s fr quentes en frangais sans pour autant tre tout a fait standard car leur universalit reste a prouver Elles sont par cons quent consid r es comme des FL standard locales du frangais 7 De_nouveauFunco hostilit reprendre commencer nouveau 8 De nouveauOperi go t reprendre qqch avoir de nouveau 9 Essayer de Oper2 augmentation 2 demander r clamer ART De mander une d Les FL non standard Les FL non standard FLNS quant 4 elles ne satisfont aucun crit re mentionn Par exemple la FLNS suivante Que X porte pour se prot ger du soleil chapeau de soleil ne remplit pas les conditions n cessaires Elle ne s applique qu a deux unit s lexi cales CHAPEAU et LUNETTES et retourne la m me valeur Ces FL n entrent pas non plus dans la composition de r gles de paraphrasage N tant pas de vraies FL on ne devrait pas en principe les appeler fonctions lexi cales Cet abus de langage est d a leur r le elles figurent au m me titre que les FL standard dans les dictionnaires et bases de donn es lexicales pour recenser les d rivations s mantiques et les collocations 78 3 3 Les enco
200. de la LEC n cessaires pour construire un inventaire formalis et exploitable des relations lexicales nous pr sen tons dans cette section trois applications en traitement automatique des langues mettant en uvre les FL soit en synth se de paraphrases traduction automatique et g n ration automatique de r sum s Notons que nous mettons plus particuli rement l accent sur les travaux dans la description desquels le r le des FL est explicit 9Le projet Alfalex Actieve leeromgeving Frans voor anderstaligen lexicon peut tre consult l adresse suivante http www kuleuven be alfalex xlviii Synth se de paraphrases et g n ration de texte Il existe un certain nombre de syst mes informatiques de g n ration et synth se de phrases fond s sur la th orie Sens Texte On peut citer GOSSIP lordanskaja et al 1988 LFS Iordanskaja et al 1992 FoG Goldberg et al 1994 le mod le de re formulation de 1996 RealPro Lavoie et Rambow 1997 AlethGen 1996 MATE Bohnet et al ou encore Sentence Garden Lareaul 2002 Nous en pr sentons tr s bri vement quelques uns ci dessous a propos un modele de reformulation automatique de phrases fond sur la th orie Sens Texte pour le domaine des langues contr l es du milieu documen taire industriel et plus particuli rement des textes de maintenance a ronautique Les langues contr l es imposent aux textes techniques des contraintes diverses don
201. de pour d couvrir et pr voir des analogies entre relations lexicales 4 4 2 4 La relation X qui se nourrit de X Cette relation ne s applique qu aux noms de plantes ou d animaux pour carac t riser ceux qui s en nourrissent Ses moyens d expression sont limit s il s agit principalement des l ments de composition savante vore et phage Nous propo sons la FLNS Qui se nourrit de pour repr senter cette relation Notons que cette FLNS est a la fois nominale et adjectivale elle peut produire en valeur aussi bien des noms que des adjectifs par exemple CARNIVOREX et CARNIVORE g Nous n avons relev qu une occurrence de cette FLNS dans notre corpus 74a Toutefois 141 un bon nombre d exemples pourraient s ajouter cette occurrence unique comme les relations 74b 74c et 74d 74 a Animal qui se nourrit de grain 1 1 1 granivore b Qui se nourrit de viande carnivore c Qui se nourrit de homme anthropophage d Qui se nourrit de fruit carpophage fructivore 4 4 2 5 La relation X alt ration de X La relation entre une partie du corps ou une entit plus g n rale et le nom de Vaffection ou de l alt ration qui lui est associ e est bien souvent marqu e par les l ments algie ou ite qui d signent respectivement une douleur ou une inflam mation Nous proposons la FLNS plus g n rale Alt ration de pour repr senter cette relation Le sens de
202. de pr paration de texte rassembler tous les d riv s s mantiques identifiant ou qualifiant un actant s mantique particulier d un mot cl et les collocatifs d signant les actions dont il est l auteur Par exemple pour la lexie BAGARRE a on r colterait les relations suivantes dans lesquelles le premier actant de BAGARRE a est la cible communicationnelle Ablei bagarrezta bagarreur Qual bagarre la agressif Oper bagarre a participer ART sans le vouloir Oper bagarre a tre pris dans ART CausiOperi bagarrezta se lancer dans ART essayer de CausiFunc bagarrezta chercher la avec N Y Cette perspective sur le syst me est donc particuli rement pertinente pour la consultation d une BLEC en tant qu outil d aide la r daction Dans la suite de cette section section 5 5 2 nous devons d finir la notion de cible communicationnelle d une FL et la fa on dont elle est d termin e Nous montrons par la suite comment la perspective communicationnelle sur le syst me de FL est formalis e travers plusieurs classes section 5 5 3 215 5 5 2 Comment determiner la cible communicationnelle d une FL Pour determiner quelles sont les cibles communicationnelles vis es par les FL nous distinguons trois cas de figure Premi rement nous distinguons les FL dont les valeurs sont des collocatifs non verbaux comme par exemple les FL Magn et SoOper dans les liens le
203. des FL Nous avons choisi ces quatre classifications car dans une certaine mesure elles se r pondent et se corrigent pour tenter d aboutir une meilleure repr sentation Nous souhaitons apporter ici une perspective diachronique et pist mologique sur la conception et la cat gorisation des FL Nous reproduisons une premi re classification de Zholkovskyl 1970 puis vingt ans plus tard et l int rieur d un m me ouvrage deux classifications reposant sur des principes divergents celle de Steele et 1990 qui cherche donner un caract re plus intuitif l organisation des FL et celle de qui sort des sentiers battus et propose une nouvelle voie pour la re pr sentation des liens lexicaux fond e sur des paires de FL inverses Nous exposons par la suite la classification de 1993 raffin e dans 1996 qui repose sur une critique des trois premi res Nous conclurons cette section par un bilan critique de l ensemble des classifications propos es 5 1 1 1 Classification de Zholkovsky et Mel uk 1970 Dans une perspective diachronique cette classification des FL est int ressante puis qu il s agit d une des toutes premi res tre pr sent e La classification repose sur la distinction entre les substitutions et les param tres s mantiques Comme nous Vavons mentionn auparavant dans la these l objectif principal des FL est de par ticiper aux r gles de paraphrasage Les deux classes de F
204. devons pr senter deux travaux ant rieurs dont l initiative rejoint la n tre la gram maire de FL propos e par 1993 et Vencodage explicite Polguerel PU 168 5 1 2 1 Travaux pr liminaires pour l organisation des fonctions lexi cales en syst me Grammaire de FL 1993 1993 232 tente d tablir une grammaire des FL standard simples en formulant des caract ristiques propres 4 chaque FL Cette grammaire vise a fournir une valeur prototypique pour chaque FL faire une description s mantique ou une d finition g n rale de chaque FL tablir les liens s mantiques entre la FL et son mot cl s il s agit d un rapport d quivalence d inclusion de sens ou encore d intersection de sens indiquer sur quelle cat gorie syntaxique s applique une FL et quelle cat gorie syntaxique elle produit en retour expliquer les diff rents r les que jouent les indices num riques actantiels qui accompagnent certaines FL distinguer les types de combinaison des FL et en expliquer les r gles Des fiches descriptives sont labor es pour chaque FL standard simple sur le m me mod le de celle de Sioc que nous reproduisons dans une traduction fran aise la figure 5 4 p 1169 o L encodage explicite et Polguere 2001 L encodage explicite d j pr sent en d tail lors du troisi me chapitre section 834 permet de rendre explicite dans un langage formel di
205. e 145 QSyn mourir I verbe cesser de vivre vulg crever 146 QSyn mourir III verbe prouver un sentiment fam crever Pour chacune de ces relations on reproduit une structure de traits Parmi les quinze relations ci dessus certaines produisent des structures de traits identiques 132 Nous ne reproduisons donc dans la figure que les structures diff rentes soit quatre au total relations 32 753 132 132 130 137 135 nom CREVER pdd verbe usage non marqu Etiq fl relations 140 141 142 et nom CREVER pdd verbe usage familier Etiq fl relation 146 nom CREVER pdd verbe usage familier tiq Q prouver un sentiment QSyn lt mourir III gt relation 145 nom CREVER pdd verbe usage vulgaire Etiq Q cesser de vivre fl QSyn lt mourir I gt Figure 6 4 Structures de traits constitu es 4 partir des relations dont CREVER est la valeur Si deux structures de traits sont identiques rien n indique pour autant qu elles ne repr sentent qu une seule lexie Il est tout fait possible d avoir affaire deux lexies poss dant des caract ristiques communes Ainsi les lexies CREVER transitif 254 par exemple On a crev ce pneu et CREVER intransitif par exemple Ce pneu a crev ne sont pas diff renci es et sont repr sent es par la m me structure A cette tape ci du travail d
206. e frein drag sabot lt m gt de frein degrad brake frein drag frotter finfactO brake frein fail l cher magnfactO brake frein grip mordre soit d interroger la base selon des requ tes plus pr cises la base le collocatif l objet typique une FL etc Il est ainsi possible d extraire les verbes prenant l unit lexicale law comme objet direct et donc le sens correspond la FL Liqu causer la fin de qqch Cette requ te aura pour r sultat les relations suivantes XXX V abolish vt law gt abroger loi liqu annul vt law gt abroger loi liqu do away with vt fus law gt supprimer loi liqu repeal vt law gt abroger loi liqu rescind vt law gt abroger loi liqu revoque vt law gt rapporter loi liqu 1997b 254 271 montre qu une telle base de donn es peut avoir des applications dans le domaine de Vapprentissage des langues assist par ordinateur L utilisation des FL a effectivement donn lieu 4 de nombreuses applications dans ce domaine Nous ne d taillons pas les propositions sugg r es par Fontenelle mais renvoyons le lecteur la section consacr e au d veloppement d outils p dago giques pour l apprentissage du lexique Le projet Papillon Nous pr sentons une seconde ressource lexicale utilisant les FL le projet Papillon d velopp par Mathieu Mangeot et Gilles S rasset II s agit d un projet collabora
207. e On peut reconstituer les tiquettes s mantiques des valeurs des FL d quivalence Syn QSyn Cf et Prenons les trois exemples suivants Syn vaisselle 2 lavage plonge QSyn combat 1 1 confrontation physique duel Cf ciment mat riau de construction chaux Nous pouvons postuler que les trois valeurs plonge duel et chaux ont les tiquettes s mantiques suivantes plonge lavage duel confrontation physique chaux mat riau de construction Cependant la transmission des tiquettes via ces FL doit se faire avec prudence Par exemple si l on peut postuler que les lexies CHAT et MINET sont synonymes la lexie MINET n herite pas enti rement de l tiquette de CHAT qui est double animal de compagnie ou esp ce animale correspondante En effet il est relativement acceptable de dire qu un minet est un animal de compagnie mais absurde de dire qu il s agit d une esp ce animale Il semble par cons quent plus prudent d assi gner un indice de confiance moins fort ces donn es automatiquement g n r es cf 2009 451 On attribuera le statut 0 aux tiquettes inf r es par la FL le statut 1 pour celles inf r es avec Syn et le statut 2 pour les tiquettes g n r es par les FL QSyn et Cf D duction de l tiquette s mantique via les FL de d rivation syn taxique partir des quivalents verbaux nominaux adjectivaux ou adverbiaux on peut galement postuler un
208. e a trois tiquettes cocotte femme qui a un certain comportement cocotte le locuteur dit cette tiquette est employ e pour les non c s directs cocotte oiseau d levage ou esp ce animale Parfois les diff rences entre tiquettes sont tr s fines par exemple yogourt aliment pr par yogourt portion d aliment pr par ce qui permet dans certains cas de rendre compte de la polys mie avec un bon degr de subtilit 244 6 4 6 Calculs pour l encodage des relations lexicales Le syst me de FL r alis au cours de cette th se permet non seulement de formuler des r gles pour la description automatique des champs du DiCo comme les parties du discours ou l tiquette s mantique mais galement de fournir des g n ralisations pour la g n ration et l encodage automatique de FL Nous explorons dans cette section une m thode fond e sur la propri t de r versibilit partag e par certaines FL propri t que nous d finissons ci dessous section 6 4 6 1 Nous montrons par la suite section 6 4 6 2 comment cette propri t peut tre exploit e pour le calcul de relations lexicales 6 4 6 1 R versibilit de certaines fonctions lexicales Les relations repr sent es par les FL sont orient es du mot cl vers la valeur La re lation entre pr cipitations et fortes par exemple va tre encod e par la FL Magn de la fa on suivante Magn pr cipitations fortes La relation est
209. e caract riser bri vement son sens Ainsi dans l exemple ImperLiqu Oper cin ma II comportement lt Arr te ton y l tiquette comportement permet d identifier qu il ne s agit ni de l activit artistique CI NEMA 1 1 ni de l ensemble d ceuvres d un r alisateur 2 ni encore de l tablisse ment de spectacle CINEMA 1 3 mais du comportement CIN MA II sons comme corpus de r f rence les donn es du DiCo notre travail vise n importe quelle BLEC quelle que soit la langue d crite et le type de nomenclature choisi termes d un domaine sp cialis unit s lexicales d un champ s mantique particu lier etc 1 2 Objectifs de la these Les fonctions lexicales dor navant FL constituent un mode d identification des relations lexicales dont la vocation est d en syst matiser le rep rage et la descrip tion Cependant elles ne sont pas organis es en syst me c est dire que leurs correspondances les liens qui les unissent ne sont pas tous syst matiquement ex plicit s Les FL mod lisent plusieurs aspects d une relation lexicale son sens ainsi que la configuration syntaxique du mot cl avec la valeur Par exemple Real dans la relation suivante Real bracelet porter ART indique que porter corres pond une utilisation typique que l on fait d un bracelet qu il s agit d un verbe prenant BRACELET pour compl ment d objet et pour sujet le
210. e commune toutes les FL peu importe leur statut Nous pr sentons cette organisation s mantique ainsi que plus globalement une organisation des FL selon plusieurs perspectives dans le chapitre suivant 11 154 Chapitre 5 Elaboration d un syst me de fonctions lexicales 5 1 Introduction Le quatri me chapitre de cette th se a t consacr a d finir des strat gies de mise en valeur des analogies entre les fonctions lexicales non standard FLNS ainsi qu proposer un cadre pour la normalisation de leur encodage Grace a cette normalisa tion un grand nombre de FLNS peuvent maintenant tre identifi es et manipul es au m me titre que les FL standard et figurer leurs c t s dans une organisation globale des FL Ce cinqui me chapitre porte sur la question de l organisation des FL Dans les bases de donn es et dictionnaires labor s selon les principes de la LEC les FL sont list es les unes la suite des autres ou ordonn es selon des crit res n tant pas toujours tr s intuitifs Cette fa on de pr senter les FL ne met pas en vidence les diff rents types de liens qui les unissent et rend l organisation des donn es peu naturelle et fig e dans une organisation lin aire Nous souhaitons offrir une organisation non plus lin aire mais modulaire c est dire pousant plusieurs axes de structuration ind pendants les uns des autres et int gr s au sein d un m me syst me Avant de poser l
211. e d un actant ou circonstant COMPRENDRE COMPR HENSIBLE Les collocations quant elles sont des expressions syntagmatiques semi fig es compos es de deux unit s lexicales Nous avons expos en d tail plus haut dans le chapitre p les caract ristiques d une collocation et ce qui la diff rencie d une locution selon le point de vue de la LEC Nous en reproduisons la d finition formelle cit e dans Jousse et Polguere 2005 7 Une collocation est une expression L L ou L L1 form e des lexies L et L que le locuteur produit d une fa on particuli re il s lectionne L librement d apr s son sens L alors qu il s lectionne L pour exprimer un sens s en fonction de L La collocation est donc une expression semi idiomatique Voici trois exemples de collocations du fran ais 1 grosse L l tempetel L 2 dormir Li profond ment L 3 pleuvoir Lil des cordes L l On appelle base de la collocation l l ment qui s lectionn librement par le locuteur retient son sens dans la collocation et la contr le Dans les exemples ci dessus les bases des collocations sont les l ments ti quet s L Les l ments tiquet s L sont appel s collocatifs de la base dans la collocation Selon Mel uk et Polgu re 12006 71 les d rivations s mantiques et les colloca tions constituent des liens orient s le d riv s mantique et le collocatif s
212. e description les structures de traits identiques sont uni fi es en une seule et les erreurs potentiellement occasionn es seront corrig es par un lexicographe au moment de la validation des fiches On peut maintenant unifier la structure de la relation 146 avec celles des rela tions 140 141 142 et 144 En effet les champs pdd et usage sont similaires Le contenu des champs tiq et fl de la premi re structure figurera dans la structure finale unifi e Les quinze structures de traits initiales ont t r duites a trois L ensemble des lexies CREVER n est pas enti rement reconstitu mais l on distingue au moins clairement trois lexies potentielles distinctes repr sent es dans la figure CREVER pdd verbe usage non marqu Etiq FL CREVEKFR CREVER pdd verbe pdd verbe usage familier usage vulgaire Etiq prouver un sentiment Etiq cesser de vivre FL QSyn mourir II FL QSyn mourir 1 Figure 6 5 Fiches de trois lexies potentielles CREVER Comme nous le voyons travers ces exemples le calcul que nous venons d effectuer ne permet pas de reconstituer de fagon exhaustive les fiches de lexies du DiCo Il n a pas non plus la pr tention de reconstituer la polys mie d un vocable Il permet toutefois de faciliter de fa on non n gligeable le travail du lexicographe et de r cup rer les donn es internes du DiCo jusqu alors non exploit es 255 6 5 Conclusion Nous avons pr
213. e don n es lexicales graphes ou r seaux mettant en valeur les connexions entre unit s lexicales Toutefois ce n est pas tant la forme d une ressource que son contenu qui en d termine l appellation relationnelle Les dictionnaires papier mettant en valeur les relations lexicales qu il s agisse des dictionnaires de collocations ou des diction naires analogiques peuvent eux aussi tre qualifi s de relationnels La distinction pr c demment mentionn e entre les mod les d compositionnels et les mod les relationnels se mat rialise travers les ressources charg es de d crire le lexique Alors que les dictionnaires classiques sont des mod les componentiels d compositionnels du lexique les ressources lexicales plus modernes con ues sous la forme de graphes ou de bases de donn es relationnelles de m me que les th saurus sont consid r s comme des mod les relationnels ou holistes Comme le souligne 2003 21 les mod les de type dictionnaire papier traditionnel et ceux de type th saurus se situent sur un continuum l extr me componentia liste on retrouve des dictionnaires ne contenant aucune information relationnelle l autre extr me l extr me holiste des mod les de type th saurus ne com portant aucune information de nature d finitionnelle sur les unit s lexicales dont le sens est cens merger des relations avec les autres unit s du r seau lexical 24 On peut distinguer
214. e et de courte dur e caus e par X qui perturbe le calme de Y comme si c tait une bourrasque I 1 qui affecte Y Le DEC fournit galement des informations de type syntaxique en repr sentant la structure actantielle d une unit lexicale et la fa on dont ces actants sont exprim s Un tableau de r gime cf figure sp cifiant les correspondances entre actants s mantiques et syntaxiques profonds la fa on dont les actants syntaxiques profonds peuvent tre exprim s en surface ainsi que les contraintes de compatibilit dans l expression des actants R gime X 1 y 2 1 de N 1 sur N 2 A 1 C1 C2 impossible C1 une bourrasque d inflation lt inflationniste boursi re gt C2 une bourrasque sur le syst me mon taire europ en Figure Tableau de r gime de BOURRASQUE IL 1 dans le DEC XXX Enfin le DEC pr sente l ensemble des relations lexico s mantiques c est a dire les derivations semantiques et les collocations d une unit lexicale Ces relations sont mod lis es au moyen des FL cf figure 11 2 Sync Synn Adv Culm Magn Adv Oper2 ProxFunco Funco ProxFunc essayer Liqu2Reals de Fonctions lexicales temp te II 1 tourbillon 11 2 ouragan I1 1 au plus fort de ART forte antepos dans ART conna tre essuyer subir ART tre pris dans ART s annoncer souffler sur N attendre III 2 N faire face ART r sister tenir t te ART
215. e grande port e p dagogique dans le cadre d une application d aide la r daction Un utilisateur peut par exemple chercher quel collocatif conviendrait le mieux pour s ins rer dans une configuration syntaxique souhait e Notre objectif est d laborer la liste des diff rents patrons de d pendance li s aux Les exposants H et renvoient aux diff rentes phases de l action encod e la FL Reala Q d signe un participant ext rieur c est dire qui n est pas actant de la lexie MEURTRE 193 FL Nous devons toutefois dans un premier temps resituer les composantes syn taxiques l int rieur du mod le Sens Texte et pr ciser les diff rentes relations syn taxiques prises en compte section 5 3 2 Par la suite nous pr senterons la m tho dologie adopt e pour d gager les diff rents patrons de d pendance mod lis s par les FL ainsi que la liste de ces patrons elle m me section 5 5 3 2 Les relations syntaxiques mod lis es par les fonctions lexicales Dans le mod le Sens Texte sept niveaux de repr sentation linguistique se suc c dent cf figure 5 7 ci dessous A ces repr sentations s ajoutent normalement des structures communicatives et rh toriques qui repr sentent les oppositions du type th me rh me explicite sous entendu etc dont nous ne tiendrons pas compte ici Dans cette section nous ne d taillons que les l ments pertinents pour comprendre le f
216. e relation 61 lexicale est exprim e au moyen de syntagmes collocationnels le collocatif variant en fonction de l unit lexicale de base Pour exprimer la relation de r paration par exemple on choisira pour la lexie VERRE le verbe RECOLLER et non les verbes RAPI CER ou REMONTER pour la lexie LIVRE on pr f rera les verbes SCOTCHER RECOLLER et RENOVER RAPIECER RESSOUDER ou encore REPRISER Aussi dans un paradigme lexicologique les fonctions lexicales peuvent se substituer aux concepts de Duvignau Les verbes comme SE DETERIORER ou ECORCER sont en effet reli s des noms particuliers par le biais d une relation lexicale enco d e l aide des fonctions lexicales LiquFunco ou Degrad exprimant respectivement les sens d grader causer la fin et se d grader Gaume et Duvignau 2004 161 donnent plusieurs exemples pour les concepts DETERIORER et REPARER que nous reproduisons dans le tableau Or CONCEPTS D ACTION Objets DOMAINE DETERIORER REPARER verre assiette casser briser br cher f ler recoller ressouder livre papier d chirer d couper friper froisser scotcher recoller r nover bois arbre VEGE TAL couper cisailler fendre tron onner casser entailler traiter v tement habit d chirer trouer d coudre d t riorer rapi cer recoudre raccommoder COUTURE repriser
217. e sens des unit s lexicales en s mes que les linguistes optant pour une d composition en termes de primitifs s mantiques comme VVierzbicka 11996 ou encore ceux proposant des d compositions en termes d expressions typ es pouvant entrer dans des calculs semantiques 1995 Dans toutes ces le sens d une unit lexicale est d fini en termes de composantes isolables au moyen d un ensemble pr d fini de symboles Il peut s agir de m talangues comme celles utilis es dans les dictionnaires classiques ou d ensembles d termin s de primitifs s mantiques comme la M talangue S mantique Naturelle MSN de 1996 Ainsi HAPPY et SAD sont d finies au moyen de propositions crites l aide de primitifs semantiques comme someone something think feel like person etc cf figure p L2 Le Lexique G n ratif d crit quant lui une unit lexicale travers trois structures illustr es l aide de l unit lexicale CAR voiture dans la figure 2 2 P 1 une structure argumentale ARGSTR qui declare les diff rents actants ou participants de la situation d not e par une unit lexicale et leur attribue des types tel que person vehicule thing etc 2 une structure v nementielle EVENSTR qui repr sente les sous v nements de la situation d not e 3 ainsi qu une structure de qualias dans laquelle sont mis en relation les ar guments et v nements des deux prem
218. e similitude entre tiquettes s mantiques En effet la hi rarchie d tiquettes pr voit des formulations en fonction des parties du discours des lexies auxquelles elles s appliquent Par exemple dans l extrait de la hi rarchie 242 d tiquettes reproduit la figure on s aper oit que la formulation verbale pour son expressif est mettre un son expressif Y Son expressif mettre un son expressif Vo b cri ensemble de sons expressifs Figure 6 3 Extrait de la hi rarchie d tiquettes s mantiques En se r f rant aux quivalences pr vues dans la hi rarchie on d duira pour les valeurs des relations suivantes Vo aboiement cri d animal aboyer So crier I 1 mettre un son expressif cri I 1 Ao ami I 1 individu qui a une certaine relation interpersonnelle avec un autre 1 les tiquettes s mantiques de leurs mots cl s reformul es pour correspondre la partie du discours ad quate aboyer mettre un cri d animal cri I 1 son expressif amiaa qui a une certaine relation interpersonnelle avec un autre 6 4 5 2 Exp rimentation L exp rimentation men e pour reconstituer les tiquettes s mantiques des lexies non d crites a d une part mis en valeur certaines lacunes et d autre part apport des indices pour la distinction de plusieurs lexies Diagnostic d erreurs Le remplissage automatique r v le un certain nombre d err
219. ection 5 identifier et classifier les FLNS adjectivales selon des attributs de description En s appuyant sur les composantes identifi es il est possible de regrouper sans dis tinction de statut et sur le seul plan s mantique des FL standard et non standard Ainsi les diff rentes collocations portant sur l aspect d un chapeau par exemple pourront tre regroup es dans la m me classe QUALIFICATIFS 177 AntiBon chapeau caboss Mat riau paille chapeau de paille Mat riau feutre chapeau de feutre feutre Forme rond chapeau rond Forme pointu chapeau pointu De la m me fa on les deux FL suivantes se c toieront sous la classe PARTICI PANTS S1 2 bataille 1I 1 adversaire Participants chefs de deux partis bataille 1L1 de chefs 5 2 2 Organisation des composantes s mantiques dans des classes s mantiques Nous avons cr dix classes s mantiques Le choix de ces classes a t motiv par plusieurs crit res li s 4 la probl matique de la recherche d information Premi re ment nous avons tent de limiter au maximum le nombre de classes cr es pour que l on puisse d une part les visualiser facilement sur une interface de consultation d une base de donn es lexicales par exemple et d autre part les m moriser de fa on a rendre la recherche de FL la plus spontan e et rapide possible Deuxi ment nous avons tent d laborer des regroupement
220. efact et ingr dient typique artefact 57 qui correspondent au deuxi me type de m ronymie propos dans WordNet 56 a Mat riau typique dont sont faites les assiette porcelaine b Mat riau dont on fait des bijou pierre argent or c Mat riau pour corde lin coton nylon d Mat riau dont sont faits les pneu caoutchouc e Mat riau pr cieux dont peut tre fait la vaisselle argent porcelaine 57 a Ingr dient utilis pour faire bi re bl houblon malt 126 b Substance alimentaire avec laquelle on fait pain farine c Ingr dient avec lequel on fait yaourt lait Nous pensons que ces deux relations sont suffisamment proches semantiquement pour tre d crites par un seul et m me encodage II existe une relation inverse aux deux qui viennent d tre pr sent es X produit r alis partir de X Celle ci repr sente ce que l on fait partir d une entit que cette entit soit concr te ou abstraite On peut en observer quelques exemples en 58 58 a Foie produit par gavage canard 1 b foie gras b Gateau fait avec cerise clafoutis c Boisson alcoolis e faite avec cerise cherry kirsch 4 Friandise contenant beaucoup de sucre a sucrerie e Plat base de agneau tb blanquette m chout f Aliment pr par d riv de lait44b fromage beurre Nous proposons de cr er la fonction Produi
221. elations lexicales Par ailleurs la LEC a l avantage de prendre en consid ration des relations syntagmatiques la diff rence de ses mod les concurrents l ventail des relations couvertes est cons quent et permet d avoir travers les relations associ es chaque unit lexicale une couverture du lexique beaucoup plus importante Enfin l aspect le plus important 67 est certainement la mod lisation des relations au moyen d un encodage forme ex ploitable pour des traitements automatis s cette mod lisation portant la fois sur les caract ristiques s mantiques et syntaxiques des relations C est en ceci que le DiCo se distingue particuli rement de toutes les autres ressources La mod lisation des relations lexicales au moyen des fonctions lexicales s av re fondamentale pour la poursuite de notre objectif Nous consacrons le chapitre suivant la pr sentation des fonctions lexicales qui constituent l outil th orique partir duquel nous souhaitons batir notre mod le Ce chapitre consiste plus pr cis ment dresser un bilan sur les fonctions lexicales Nous essaierons de d terminer en quoi elles se r v lent un bon outil pour la structuration du lexique tout en mettant en valeur certaines lacunes que nous tenterons en partie de combler tout au long de la th se Chapitre 3 Les fonctions lexicales aspects formels et notionnels 3 1 Introduction Nous avons consacr le chapitre pr c dent
222. eler ART essayer de Opera augmentation 2 demander r clamer ART FL NON STANDARD Qui a lieu devant les tribunaux bataille 11 1 juridique de proc dure Chair de utilis e comme aliment agneau a agneau b LEXICALISATION DE REGIME X de la v g tation Hypo ceinture 11 de v g tation verte X ensemble d industries Hypo ceinture I1 industrielle Figure 3 4 Typologie de l encodage traditionnel 93 fa on empirique au fur et mesure de la description du lexique Nous ne voyons aucun principe th orique qui emp che la cr ation de nouvelles FLSS si celles ci remplissent les crit res n cessaires Le nombre de FLSS donn dans l affirmation suivante Mel uk et al 1995 129 Les fonctions lexicales standard simples sont au nombre de 56 elles couvrent dans toutes les langues les relations paradigmatiques entre les lexies synonymes antonymes d riv s ainsi que leurs relations syntagmatiques intensificateurs verbes supports doit donc tre interpr t comme tant fix un moment donn lt en synchronie gt et non de fa on irr vocable Nous proposons p 95 une chronologie sommaire de Pevolution des FLSS afin de mettre en valeur les propositions ajouts et suppressions de FL depuis leur cr ation Nous posons comme l un des premiers inventaires des FLSS le texte de Zholkovsky et Mel uk 1970 qui recense les FL pr sent es dans la figure
223. ement 232 de descriptions lt o tout se tient gt Nous pensons qu en termes d informations donn es sur chaque unit lexicale le DiCo est une des ressources les plus d taill es r alis es sur le fran ais cependant le revers de la m daille est qu il n est que tr s peu d velopp au niveau du nombre d unit s lexicales d crites Il est en effet tr s long de cr er les diff rentes fiches d un vocable C est la raison pour laquelle il semble n cessaire d automatiser certaines taches Notre objectif est de mettre profit le syst me de FL constitu et pr sent au chapitre pr c dent afin d effectuer des calculs sur certaines informations lexico graphiques qui aboutiront dans de futurs travaux la g n ration automatique d bauches de fiches de dictionnaire Nous n entendons pas fiche lexicogra phaque une fiche traditionnelle de DiCo au format FileMaker mais plus largement un ensemble de champs associ s une lexie et ce quelque soit le format utilis La m thodologie de r daction que nous souhaitons laborer consiste 4 d velopper la r daction du DiCo non pas fiche par fiche mais plut t champ par champ voire pour ce qui est du champ des relations lexicales FL par FL Chaque information se verra assigner un indice de fiabilit suivant ceux qui existent d ja pour le DiCo 0 1 2 et 3 De cette fa on un utilisateur n aura pas uniquement acc s aux fiches compl tes mais chaque in
224. entation Jousse et Polgu re 12005 t l chargeable partir de l adresse http idefix ling umontreal ca dicouebe DiCoDOC pdf 34 2 2 2 FrameNet FrameNet est un projet de lexicographie computationnelle d velopp l Universit de Berkeley Le projet repose sur la th orie de la s mantique des cadres Frame Semantics et repr sente des r seaux de sens auxquels les unit s lexicales parti cipent Les grandes lignes th oriques remontent aux travaux de Fillmore de la fin des ann es 1970 1982 Le principe central de la s mantique des cadres est que le sens des unit s lexicales doit tre d crit au moyen de cadres s man tiques Ces cadres correspondent des repr sentations sch matiques des structures conceptuelles et des patrons de croyances de pratiques d institution d images etc qui fournissent un fondement pour l interaction compr hensible dans une commu naut linguistique donn e Les informations dans FrameNet Dans FrameNet chaque unit lexicale d crite est associ e ou voque un cadre frame Les diff rents sens li s aux unit s lexicales d un m me vocable cor respondent aux cadres qu elles voquent La polysemie est donc en partie trait e travers l attribution de cadres s mantiques distincts pour les unit s lexicales d un vocable polys mique Par exemple l adjectif GUILTY est associ aux cadres lt CONTRITION gt et lt GUILT OR INNOCENCE gt Barque
225. erbes ainsi que des substantifs adjectifs et adverbes pr dicatifs sur la base de crit res distributionnels et transformationnels Une table correspond une ou deux constructions syntaxiques particuli res et ras semble toutes les unit s lexicales qui entrent dans ces constructions Par exemple la table 1 des verbes contient tous les verbes qui admettent en plus d un sujet un compl ment infinitif Cette ressource lexicale comporte une composante relation nelle dans la mesure o elle permet d expliciter des liens entre les unit s lexicales d une langue donn e selon une perspective syntaxique Rappelons que l une des perspectives du syst me de FL que nous d veloppons dans le cadre cette th se consiste pr cis ment regrouper les FL partageant des propri t s de combinatoire 8Certaines donn es du lexique grammaire et de DicoValence ont t int gr es r cemment dans le Lefff Danlos et Sagot 2009 syntaxique 54 59 SUOTJOUOT Sop u9AOU ne S S TEULTOT s nbueur dequ4s oqeurquro Jo duq 9J TOS Gg suons r oyuextos snjd ed aeondxy rdoyo rx r sresuedy ood JONOUIeLY JONPIOM s Ip o jyuop s mnnep g S QT A 4 s p onbryueures 6661 s uuop aseq s sser rq res ru Jo SO UOIXO 5
226. es cadres unit s lexicales valence l ment de cadre etc Trois interfaces sont disponibles un mode de recherche globale FN2full un mode de recherche orient vers les cadres FN2basic ainsi qu un mode de recherche orient vers les unit s lexicales FN2abc FrameGrapher est un outil de repr sentation graphique des cadres Il repr sente sous forme de sch mas les relations entre cadres ex h ritage utilisation etc dans la base de donn es FrameNet est utilis pour la r alisation de nombreuses applications en TAL L nnekgr Rodman et Baker 2009 On trouve des exploitations de FrameNet pour l annota tion de corpus et des travaux portant sur la compr hension automatique de textes ou encore la d sambigu sation automatique Par ailleurs le grand succ s de Frame 39 Net a donn lieu la cr ation d un FrameNet espagnol un FrameNet japonais un FrameNet allemand ainsi qu un Cross lingual FrameNet groupe de discussion informelle sur la question de Tinter langue qui se r unit pour parler des questions d annotation et de structuration des lexiques ainsi que de l int gration des donn es a travers des langues Les objectifs de FrameNet et les types de donn es qui y sont trait es sont tr s diff rents de ceux des BLEC Les l ments de cadre ne peuvent tre assimil s aux fonctions lexicales tant en raison de leur nature conceptuelle qu en raison des types de valeurs
227. es alors que comme on le voit travers les exemples ci dessous il serait l gitime de les cr er Ables estimer II 2 estimable et Ableg estime estimable mais estimable estimer Il 2 et estimable estime Able hair haineux mais haineuz hair On observe le m me ph nom ne pour les d riv s actantiels adjectivaux 247 Relation FL Exemple Hollonymie Hollo Mero Hollo ballast bateau M ronymie Mero 1 Hollo Mero bateau ballast Terme g n rique Gener 1 Hypo Gener avertissement 1 2b sanction Hyponymie Hypo 1 Gener Hypo sanction avertissement 1 2b Ingr dient typique de Produit d riv de Compos 1 Produit d riv Produit derive 1 Compos Compos clafoutis cerise Produit d riv cerise clafoutis Equivalent f minin Equivalent masculin Fem Masc 1 Fem Fem cog poule 1 Masc poulez 1 coq Unit minimale Sing Mult Sing dialogue 1b r plique Ensemble Sing Mult r plique dialoguezi1b Nominalisation So Vo So abdiquer 1 abdication 1 Verbalisation Vo So Vo abdication I abdiquer I Quasi nominalisation QS 1 QV QSo hair haine Quasi verbalisation Qw 1 QSo QVo haine hair Adjectivalisation A5 Ao se suicider suicidaire Verbalisation Vo Ao Vo suicidaire se suicider Adjectivalisation So Ao fleuve 1 fluvial Nominalisation So
228. es de l anglais et du russe convertis en deux bases de donn es s levant plus de 65 000 entr es chacune Chaque entr e contient les informations suivantes partie du discours traduction standard dans lautre langue de travail caract ristiques syntaxiques caract ristiques s mantiques sch ma de r gime fonctions lexicales ainsi que l ensemble des r gles sp cifiques cette unit lexicale Plusieurs jeux sont cr s directement partir des FL 2006 540 Jeu 1 FL Ce jeu utilise le dictionnaire de FL L utilisateur doit remplir des valeurs d une FL concr te pour chaque argument Par exemple la valeur de CausFacto causer que fonctionne pour les lexies CLOCK et IMAGINATION CausFacto clock wind lt wind up gt start CausFacto imagnation fire somebody s imagination xlv Jeu 2 Definition Le jeu consiste proposer une definition analytique d un lex me et a faire devi ner Putilisateur de quel mot il s agit Par exemple le syst me peut proposer la definition suivante A more favourable position of a person P1 in a certain situa tion as compared with the position of another participant P2 quoi l utilisateur devrait r pondre qu il s agit de la lexie ADVANTAGE Jeu 3 Traduction Le syst me montre l utilisateur un mot vedette et sa d finition analytique et Putilisateur doit fournir une traduction de ce mot vedette Jeu 4 Mot L utilisateur joue avec l
229. es dites unit s lexicales 3 des r gles sp cifiques aux unit s lexicales caract ristiques des unit s lexicales individuelles et qui sont stock es directement dans leur entr e de dictionnaire Dans le syst me de paraphrasage les r gles sont appliqu es dans l ordre suivant a analyse morphologique b analyse syntaxique c interpr tation par FL de la structure syntaxique d normalisation de la structure interpr t e e r gles de canonisation f r gles de paraphrasage g r gles de r interpr tation et de correction h introduction du mat riau lexical comme les pr positions sp cifiques requises par les FL concern es i synth se syntaxique j synth se morpholo gique Apresjan et al 12003 pr sentent deux avantages des FL dans les tapes du processus de traduction automatique 1 Outil de d sambigu sation pour l analyse syntaxique Les FL peuvent servir d outil pour lever les ambigu t s syntaxiques et lexi cales gr ce l analyse des l ments par les FL Par exemple le syntagme support of the parliament peut tre interpr t de deux fa ons dans un pre mier cas parliament est agentif et peut tre paraphras par support given by li the parliament dans la deuxi me interpr tation parliament est objet et sera paraphras par support given to the parliament Les FL de verbes supports sont tr s utiles pour lever les ambiguit s car elles imposent des fortes
230. essure profonde dans le dictionnaire explicatif et combina toire Sur le lien entre la d finition lexicographique et les fonctions lexicales Dans Francis Grossmann et Agn s Tutin dir Les collocations analyse et traitement 270 Travaux et recherches en linguistique appliqu e Revue Fran aise de Linguistique Appliqu e pages 61 73 Amsterdam 2003b De Werelt Sylvain Kahane Les unit s minimales de la syntaxe et de la semantique le cas du frangais Dans 1 Congr s Mondial de Linguistique Francaise Paris 2008 Sylvain Kahane et Alain Polgu re Formal foundation of lexical functions Dans Workshop proceedings COLLOCATION Computational Extraction Analysis and Exploitation pages 8 15 Toulouse Juillet 2001 39th Annual Meeting and 10th Conference of the European Chapter of the Association for Computational Linguistics Karin Kipper Anna Korhonen Neville Ryant et Martha Palmer Extensive classi fications of english verbs Dans Proceedings of the 12 EURALEX International Congress Turin Italie Septembre 2006 Annette Klosa Ulrich Sehn rch et Petra Storjohann Elexiko a lexical and lexi cological corpus based hypertext information system at the institut fiir deutsche sprachemannheim Dans Proceedings of Euralex 2006 2006 Shari Landes Claudia Leacock et Randee I Tengi Building Semantic Concor dances Dans Christiane Fellbaum dir WordNet an Electronic Database cha pitre 8 pages
231. et de s Mult concert s rie de s Cependant ces deux ph nom nes ne doivent pas remettre en cause la r partition profonde des relations lexicales selon les deux axes paradigmatiques et syntagma tiques La relation entre CLOCHE et BOURDON peut tre vue a la fois sous l angle de la relation d intensification c est dire d une relation syntagmatique mais ga lement sous l angle de l hyponymie qui est une relation paradigmatique Concer nant les autres relations donn es en exemple nous dirons que les valeurs s rie de concerts auteur d un crime carnet de ch ques etc sont des synonymes res pectivement de TOURNEE MEURTRIER et CHEQUIER entretenant avec le mot cl une relation paradigmatique Cependant ces unit s lexicales contrairement leurs synonymes n cessitent la r alisation syntagmatique de leur premier actant On ne 33 peut en dehors d un contexte o les unit s lexicales MEURTRE ou CONCERT au raient d j t exprim es employer les unit s lexicales AUTEUR ou SERIE seules Ce ph nom ne tient donc la propri t des valeurs de FL plut t qu aux relations elles m mes Structuration de la base de donn es DiCo et acc s l information Bien que le DiCo soit une base de donn es sous forme lectronique il poss de une structure assez traditionnelle inspir e des dictionnaires papier d usage courant ont d velopp au laboratoire Lattice Talana de Paris 7 une archi
232. et al 2003 ces FL sont pr sent es p 99 2005 PROPOSITION LoCoeiween B langer et Kittredge 2005 LOCbetween bourgeons entre Vel intergemmaire 2007 AJOUT Dans le DiCo apparition des FL Hypo Hyponyme et Mero Meronyme cf Jousse 2007al L ensemble des FL est rest relativement stable au cours des ann es Cependant il est noter que certaines propositions int ressantes n ont pas t prises en compte ni int gr es la liste certainement par manque d un lt comit de validation Il parait donc difficile dans ces conditions de statuer sur un nombre pr cis de FLSS Nous devons pr sent aborder la question du corpus de r f rence Les FL propo s es dans les listes de referened n ont t d gag es que d apr s des chantillons de lexique de plusieurs langues Or nous pensons que l importance du corpus de r f rence c est dire partir duquel on souhaite comptabiliser un nombre de relations ou de FL d termine le nombre de FLSS d couvrir En effet la recherche de FL volue au fur et mesure que le corpus s accroit plus on observe de relations et plus il est probable de voir appara tre des r gularit s parmi ces relations et ventuellement de d couvrir de nouvelles FL standard A ce propos nous devons citer les travaux de Fontenelle 1997b consistant en la conversion du dictionnaire bilingue Robert amp Collins
233. et de ses diff rents champs nous prenons l exemple de la fiche de la lexie ANCRE reproduite la figure Le champ Nom contient le nom de la lexie son num ro d acception et le statut indiquant la validit de la fiche Dans l exemple de la lexie ANCRE on ne trouve pas de num ro d acception puisqu une seule lexie est d crite dans le DiCd La fiche est marqu e au statut ce qui signifie qu elle a t valid e Le champ cg pr sente les caract ristiques grammaticales d une lexie Le champ tiq repr sente l tiquette s mantique de la lexie d crite Il s agit d une br ve caract risation du sens de la lexid Le champ fp pr cise la structure actantielle de la lexie c est dire le nombre de positions actantielles qu elle contr le et le cas ch ant le typage de celles ci Par exemple la lexie ANCRE poss de un actant X de type s mantique bateau Le champ nb contient des notes ventuellement crites par le lexicographe qui a r dig la fiche Le champ tr pr sente le r gime de la lexie c est dire la correspondance entre ses actants s mantiques et syntaxiques et la fa on dont les actants syntaxiques sont exprim s en surface Le champ Syn contient les FL de type synonymique soit les FL Syn QSyn Gener Cf et Le champ fl pr sente toutes les autres FL 5 existe d autres acceptions du vocable ANCRE mais elles rel vent de domaines sp cialis
234. et outil vise galement v rifier la validit des mod les linguistiques Sens Texte pour la g n ration de phrases Traduction automatique le projet ETAP 3 ETAP 3 est un processeur multifonctionnel et multilingue d velopp par le labo ratoire de linguistique computationnelle de l Acad mie Russe des Sciences pour diverses applications en traitement automatique des langues naturelles 1 Les prin Ce projet et les applications reli es sont consultables Padresse suivante http proling iitp ru etap index e html cipales r alisations d ETAP 3 sont la traduction automatique la communication multilingue par le biais d une interlangue et le paraphrasage Notons que l environ nement d apprentissage du lexique CALLex pr sent la section est int gr dans ETAP 3 Le principal syst me d velopp au sein du projet est un syst me de traduction automatique bidirectionnel anglais russe et russe anglais Quelques essais ont galement t propos s sur le fran ais l allemand l espagnol et le cor en ETAP 3 est constitu de plusieurs ensembles de r gles et de dictionnaires Toutes les r gles sont subdivis es en trois types principaux 1 les r gles g n rales qui s appliquent toutes les phrases en cours de traite ment 2 les r gles sp cifiques aux diff rentes classes qui concernent des groupes d uni t s lexicales et qui sont appel es par leur nom dans les entr es de dictionnaires d
235. etc ou encore en fonction du sens v hicul par la relation les actions effectu es par une abeille ESSAIMER POLLINISER BUTINER etc les productions des abeilles MIEL GELEE ROYALE 7 CIRE ALVEOLE etc les parties du corps d une abeille T TE AILES PATTES DARD etc Or du fait de leur structuration la plupart des bases de donn es ne permettent pas de tels modes de repr senta tion dont le potentiel est pourtant tr s riche en mati re de recherche d information Notre travail s articule autour de la probl matique suivante comment peut on mod liser les relations entre unit s lexicales pour mettre en valeur des parcours co h rents et pertinents a travers le lexique Quelle alternative aux simples listes de relations lexicales peut on proposer pour souligner leur organisation au sein d un syst me relationnel Le lexique est en interaction avec d autres champs d tude dont la s mantique la morphologie la syntaxe la phonologie ou encore l analyse du discours Il nous semble donc pertinent d exploiter quelques unes de ces facettes pour proposer une structuration des relations lexicales rendant compte de diverses perspectives sur le lexique On recense quelques travaux de ce type r alis s manuellement c est le cas du DAFLES 2002 par exemple qui propose plusieurs interfaces de consultation en fonction de crit res syntaxiques s mantiques morphologiques etc Toutefois nous pensons qu u
236. etc la notion de d rivation s mantique reste en revanche moins usit e en linguistique Il s agit d une extension de la notion traditionnelle de d rivation morphologique pr sent e notamment dans et 2007 Cette notion est toutefois bien plus large que l id e que l on se fait de la d rivation il s agit plus g n ralement d une relation entre deux unit s lexicales fond e sur une parent de sens 2007 18 donnent trois conditions n cessaires pour qu une relation entre deux lexies L et L soit consid r e comme une d rivation s mantique 1 L entretient une relation s mantique avec Li c est dire que les d finitions de L et L poss dent des composantes de sens communes Dans le cas le plus typique L se d finit en termes de L Par exemple la lexie HACHE L l est d finie l aide de COUPER Lil car HACHE signifie artefact servant couper Cette premi re condition fait r f rence aux d finitions des unit s lexicales On pourrait lui reprocher un manque d objectivit dans la mesure o les d finitions des unit s lexicales ne sont pas donn es mais construites et bien souvent pr cis ment dans le but d expliciter certains liens s mantiques entre unit s lexicales Toutefois il faut entendre cette condition au sens large c est dire que la lexie L ne doit pas forc ment appara tre dans la d finition de la lexie de Ly en tant que telle mais que l on d
237. eurs parmi les tiquettes d j pr sentes dans le DiCo Il permet notamment de rep rer des tiquettes s mantiques trop g n rales Par exemple partir de la relation ci dessous on a pu 243 reconstituer via la lexie BETON Tetiquette s mantique de la lexie CIMENT I mat riau QSyn b ton mat riau ciment I Or la lexie CIMENT I est d crite dans le DiCo par Petiquette s mantique mat riau de construction ce qui met en valeur un manque d homog n it puisque BETON devrait avoir l tiquette mat riau de construction Par ailleurs Petiquette s mantique de la lexie combat I1 2 est reconstitu e comme action sociale alors que son tiquette est lutte sociale qui est Vetiquette fille de action sociale Parfois l cart peut tre plus grand qu un lien direct m re fille la lexie COMPETITION 2 par exemple est tiquet e venement dans le DiCo alors que la reconstitution par le biais d une FL d quivalence lui attribue Petiquette preuve sportive qui semble plus ad quate Indice de Texistence de plusieurs lexies La encore la pr sence d tiquettes diff rentes pour une valeur d une ou plusieurs FL est un indice d une pluralit de lexies Par exemple l exp rimentation de g n ration d tiquettes semantiques via les FL d quivalence a permis de d gager deux tiquettes pour la valeur cinoche cinoche tablissement de spectacle cinoche comportement cocotte est associ
238. expressions est repr sent e par le symbole Oper L L Vo L pousser Oper L un soupir L soupirer Vo soupir mettre Operi L un aboiement L aboyer Vo aboiement se livrer des comm rages L comm rer Vo commerage Figure 3 2 Exemple de r gle de paraphrasage Les FL et les diff rentes r gles de paraphrasage sont utilis es en TAL pour la g n ration de paraphrases 1996 20021 la traduction automatique Apresjan et al 20031 et l laboration automatique de r sum s B langer et Kit redge Parmi ces r alisations certaines ne sont encore qu un stade exp ri tredge 2005 P lisat t t tad mental alors que d autres ont donn lieu a des travaux plus aboutis cf annexe lI 3 2 2 Caract re graduel des fonctions lexicales La notion de FL a un caract re graduel les FL ne se situent pas toutes sur le meme plan mais sont r parties selon plusieurs statuts II existe des FL standard semi standard localement standard et non standard Ces statuts sont d termin s par plusieurs conditions On consid re qu une FL est standard si elle r pond aux exigences impos es par les conditions de cardinalit de diversit et d universalit Nous pr sentons ces conditions ci dessous puis d taillons chacun des statuts de FL 3 2 2 1 Les conditions determinant le caract re standard d une FL a Cardinalit des arguments et valeurs de FL Premi
239. ey sanbid onbsnow 1830N ajquiasuy tuo o2 2772290 NN anbidAjojoid ap JuawaANoW 9113 uns mof 0 q pm llqoyyo ans ly 27904 worpnpfur eyo SWAUOIIN ananb 251199 os yy o yaad n e JaDUaWIWOD udis pnafjinye ye quajsajluew as uajynoo sanad pue su qul sne z A 42zJdwar Tzl nisoisnoyyu TeioqeT use N 4lyeaua X N op Luv g zoapp 2qainq AJOAu u3Se un suep e Joouowuwos x LUV suepliauquos T u tu goqo LadQdasu use ap yelqo s e 7 p X N 428208 uorvaupo lEiogedssuj usen X Ans Jaye un e asuajul K N ssiobun Ta eq use su qul uodey uuolpuoj dub 9304q 015ejJu3e A su qul Ano4d inb x op apnypw qpob p TyuSeyy s2ninou I n f dnoo uenbuSe N sdwa Zuo ind e uorpss auo IUe aquesielq apoorwy euormssonuos spiqoe s4 1405 3 X ll nbe queuing sawwoyfua euornsionuo FueueuSelN su qul arnjd uSey ap s yw j xny arv jo suapsog y urypm uqunoo uuqoo1o juawow ny suv T IZ 21 000q 5oq aed y uoo oq q ooq
240. f et bien que s mantiquement diff rents Syn repr sente la synonymie exacte QSyn la syno nymie approximative Cf rel ve davantage de l association d id e et repr sente la stricte quivalence sont regroup es dans la premi re sous classe Syn abeille mouche miel QSyn barricade barrage barri re d fense Cf abeille frelon gu pe bourdon ceinture 1 2 de s curit La composante s mantique conversif encod e par la FL Conv constitue la deuxi me sous classe d quivalence par exemple Convo craindre effrayer N X La troisi me sous classe regroupe les cas de composantes s mantiques z ro gt li es aux FL dites syntaxiques qui permettent d effectuer des reformulations So Vo Ao et Advo Ces FL servent respectivement nominaliser verbaliser adjectivaliser et adverbialiser une unit lexicale On peut donc les consid rer comme des quivalences s mantiques d un mot cl Vo acclamation acclamer So applaudir 1 applaudissements Ao catastrophe 1 catastrophique Advo exag rer 2 exag r ment 179 5 2 2 2 Classe OPPOSITION Sous la classe OPPOSITION nous avons regroup les composantes s mantiques d opposition Cette classe comporte trois sous classes La premi re sous classe repr sente diff rentes formes d opposition s mantique Vantonymie encod e par la FL Anti absence repr sent e par la FL Non
241. ff rents types d infor mation pour chaque FL leur sens leur valence ainsi que leur partie du discours Pour repr senter le sens des FL des universaux semantiques sont d gag s La va lence quant 4 elle est repr sent e au moyen de codes pr cisant les l ments entrant en jeu dans la relation et leur configuration syntaxique Nous reprendrons une par tie de ce travail dans la suite de ce chapitre Ces deux initiatives posent les bases pour l extraction des propri t s des relations lexicales encod es par les FL Cependant les FL y sont trait es une une selon notamment leurs propri t s relationnelles et leur mode de combinaison aux autres 169 Le Stoc N D finition Nom typique pour d signer le circonstant de lieu de la situation d not e par le mot cl Exemples Sioc boze ring Siocl enterrer cimeti re Sioc patiner patinoire Siocl enseigner cole universit Sioc tennis court de Sioc tauromachie ar ne Sioc vendre march Valeur prototypique lieu Liens s mantiques C C Stoc C A Pr requis s mantiques C doit tre une lexie pr dicative Cat gories syntaxiques Stoc Co n v c M Capacit combinatoire FL regente de FL complexe ou compos es avec des FL verbales est situ e gauche SiocReal4 le on tude salle d tude En d autres termes cette quation indique que le sens de la lexie C est inclus dans celui de
242. fondus recens es dans le DiCo ont t d crites en fonction des diff rentes perspectives du syst me ce qui en fait une solide base de r f rence pour l encodage des liens lexicaux Le syst me ainsi constitu a une utilit fondamentale pour la compr hension de la structure du syst me des FL pour la maintenance de la base de donn es lexicale laquelle il s applique puis qu il permet la recherche d erreurs et d incoh rences d encodage pour le d veloppement futur de la base de donn es lexicale travers Pautomati sation de certaines descriptions et la consultation d un outil d aide l encodage des liens lexicaux pour la popularisation de l acc s au BLEC et leur reconnaissance en tant qu outil d enseignement du lexique Enfin le troisi me volet trait dans la th se porte sur le traitement de la granularit dans la description des liens lexicaux Nous pensons qu il est important de d crire et de regrouper les liens lexicaux d une langue selon diff rents niveaux de granularit Si l on se place au niveau de granularit des FLNS beaucoup de liens lexicaux sont d crits de mani re isol e En revanche si l on relache le niveau de granularit on voit apparaitre des similitudes entre des liens lexicaux qu il devient possible de repr senter sous un m me encodage Notre syst me de FL permet de contourner les obstacles impos s par l encodage traditionnel et ses degr
243. formaliser des associations s mantiques r guli res parmi les paires de mots Il s agit plus profond ment de questionner la fa on dont la struc ture des associations entre FL se couple avec les patrons de coh rence textuelle et de mettre en rapport les FL avec les aptitudes humaines faire des inf rences Cette fagon de raisonner a t propos e par Martha Evens et r sum e dans 1985 Elle est en partie motiv e par les tentatives de simuler les chaines de raisonnement qui doivent tre activ es lorsque l on cherche des l ments dans une base de donn es complexe ou lorsqu on essaie de montrer la fagon dont un mot contribue au d veloppement logique d un texte La recherche de fonctions inverses contribue la cr ation d un grand nombre de FL comme State qui joue le r le de l inverse de Liquidative voire de nouvelles paires de FL en opposition comme les FL Antecedent et Consequent illustr es ci dessous Liquidative mistake erase Causer la fin de State erase mistake error Ce dont on cause la fin Antecedent shutleventl open state Action ant c dente Consequent open state shut event Action cons quente La proposition de Grimes est int ressante car elle bouleverse le sch ma habituel de classification des FL L id e de mettre en valeur les connexions entre FL est une 161 des raisons qui nous poussent constituer un syst me explicite de FL et la notion
244. formation valid e c est dire au statut 0 pour une fiche m me si celle ci demeure incompl te Nous tentons de calculer les diff rents champs d une fiche et utilisons certains de ces champs comme des indices pour d terminer le caract re polys mique ou homonymique d un ensemble de lexies Nous menons une exp rimentation sur toutes les lexies du DiCo y compris sur celles d ja d crites ce qui a l avantage d une part de v rifier si nos inf rences sont exactes et d autre part de permettre une r vision des fiches dans les cas o certaines erreurs sont r v l es L exp rimentation a t r alis e Paide de petits scripts et valid e manuellement cependant elle n est pas quantifi e il s agit d un travail pr alable proposant un algorithme pour la confection d un programme informatique ult rieur la suite de la pr sentation des diff rents champs section 6 4 2 nous expo sons notre m thode d enrichissement endogene du DiCo en pr sentant chacun des 233 champs concern s et la fa on dont on peut calculer leurs valeurs sections 6 4 3 6 4 4 et 6 4 6 Finalement section 6 4 7 nous montrons comment il est possible de combiner un certain nombre de crit res pour tenter de reconstituer par tiellement les diff rentes fiches de lexies en relation de polysemie ou d homonymie 6 4 2 Pr sentation des diff rents champs Pour donner une illustration d une fiche lexicographique
245. forme de codes un assistant l encodage des liens lexicaux Celui ci n est autre qu une mod lisation du processus d encodage des liens lexicaux Il consiste envisager tour tour diff rents param tres associ s aux relations lexicales qui ont t mod lis s dans le syst me de FIF On propose un utilisateur de s lectionner un ensemble de parametres descriptifs pour un lien lexical Chaque fois qu un pa rametre est s lectionn le nombre de FL potentielles diminue jusqu ne conserver que les FL les plus susceptibles de mod liser le lien 6 3 1 S lection des diff rents param tres Pour s lectionner les param tres caract risant un lien lexical on proc de de fa on declarative c est dire qu on r colte un ensemble d informations sur le lien de fa on non ordonn e Illustrons le processus avec le lien entre PISTE 1 2 voie dont la structure actantielle est la suivante UTILIS E PAR L tre anim X MENANT AU lieu Y A PARTIR DU lieu Z et le verbe S ENGAGER par exemple dans Pierre s engage dans une piste impra ticable Crit res li s aux parties du discours Quel couple de parties du discours la relation concerne t elle Il s agit du couple N V 4Notons que Alonso Ramos a mis en vidence des crit res heuristiques pour l encodage des collocations au moyen de FL 228 On limine dans la table de FL toutes les FL qui ne correspondent pas potentiellement
246. gatif Degrad Excess Obstr Nocer 15 Verbes divers Prepar Son 16 Modifieurs adjectivaux et adver biaux Magn Bon Ver Pos Epit Plus Minus Pejor 17 Pr positions li es au mot cl Instr Locin ab aa Propt 18 Noms quasi synonymes Figur Gener 19 Noms quasi m ronymes Sing Mult Cap Equip Centr Culm Germ Figure 5 3 Classification de Alonso Ramos et Tutin 11996 166 5 1 1 5 Bilan sur les classifications propos es Voyons ce qu on peut retenir de ces diff rentes classifications premi rement il apparait que m me avec un principe de base identique pour certaines propositions la distinction entre relations paradigmatiques et syntagmatiques on observe une forte divergence d une classification 4 une autre Ces divergences ne manquent pas d attirer l attention sur la validit de cette distinction On peut en d duire soit que les concepts de relations paradigmatiques et syntagmatiques ne sont pas per us de la m me mani re par les diff rents auteurs soit que les crit res pos s pour la r partition des FL ne sont pas respect s ce qui invalide alors les typologies propos es Si l on veut tre plus radical encore on dira tout comme Grimes que la distinction n est peut tre pas pertinente pour classifier les FL En ce qui concerne la structure des typologies on remarque que certaines d entre elles ne sont pas toujours organis es en sous c
247. gloomful is archaic e adj gloomy grim blue depressed dispirited down downcast downhear ted down in the mouth low low spirited filled with melancholy and despondency gloomy at the thought of what he had to face gloomy predictions a gloomy silence took a grim view of the economy the darkening mood lonely and blue in a strange city depressed by the loss of his job a dispirited and resigned expression on her face downcast after his defeat feeling discouraged and downhearted eS adj blue dark dingy disconsolate dismal gloomy grim sorry drab drear dreary causing dejection a blue day the dark days of the war a week of rainy depressing weather a disconsolate winter landscape the first dismal dispiriting days of November a dark gloomy day grim rainy weather Figure 2 3 Extrait du vocable GLOOMY dans WordNet 45 Deuxi mement on peut acc der aux informations associ es une unit lexicale s lectionn e Les relations avec les autres ensembles sont alors visibles et s lection nables Apports et limites Le projet WordNet de Princeton connait un succ s triomphal dans le domaine du traitement automatique des langues Il sert de ressource support pour de nom breux projets aussi bien pour la cr ation de concordances s mantiques Landes 1998 que pour Pannotation de corpus Fellbaum et al 1998 ou encore Vextraction de textes 1998 WordNet a d
248. hamp sem et on indique que la valeur de la FL est verbale ce qui correspond au code 2 du champ pdd La requ te est donc formul e comme suit SELECT FROM fonction WHERE sem like 4 1 2 AND pdd like 217 La requ te retourne les onze r sultats suivants AntiBon AntiVer Oper1 AntiBonReal1 manifestation AntiBon Oper12 AntiVerFact0 AntiBonFact0 AntiBonFact0 Degrad AntiBonFact1 ncepPredAntiBon usual AntiBonFact3 LiquPredVer AntiBonInvolv Ces FL tant trop nombreuses on cherche dans un deuxi me temps raffiner la requ te On peut alors indiquer par exemple que le lien lexical a pour cible communicationnelle le premier actant du mot cl qui est le sujet grammatical du verbe DEBITER ce qui se traduit par le code 1 du champ cible La requ te devient alors SELECT FROM fonction WHERE sem like 4 1 2 AND pdd like 222 AND cible like 1 Ceci restreint le nombre de FL a trois AntiBon AntiVer Oper1 AntiBon Oper12 AntiBonReal1 manifestation 231 Enfin une troisi me tape pr cisant la configuration syntaxique de la relation c est dire qu il s agit d une relation actantielle trois actants soit le code 3 du champ syntp permet de restreindre davantage les r sultats de la requ te SELECT FROM fonction WHERE sem like 4 1 2 2 AND pdd like 422 AND cible like 1 AND syntp like 32 La requ te ainsi pr cis e permet d liminer deux FL pour ne la
249. i res structures dans les r les assign s l unit lexicale d crite On note quatre r les formal correspond au type 12 HAPPY X feels something sometimes a person thinks something like this something good happened to me I wanted this I don t want anything more now because of this a person feels something good X feels something like this SAD X feels something sometimes a person thinks something like this something bad happened if I didn t know that it hap pened I would say I don t want it to happen I don t say this now because I know I can t do anything because of this this person feels something bad X feels something like this Figure 2 1 D finition des unit s lexicales HAPPY et SAD au moyen de primitifs s mantiques VVierzbicka 180 et 215 de l unit d crite const num re les parties constitutives de l entit d not e telic d crit l utilisation prototypique qui en est faite et agentive l v ne ment causant l existence de cette entit Les mod les d compositionnels n ont pas pour vocation de d crire directement les liens s mantiques entre les unit s lexicales M me si la d composition du sens des unit s lexicales permet d induire un certain nombre de relations lexicales comme la synonymie l antonymie ou encore l hyperonymie l tude des relations s mantiques entre lexies n est globalement pas concern e par ce type de mod les
250. iant la synth se et la s mantique en tout premier lieu Mel uk et al 11995 133 minimisent le lien entre les FL de d rivation So Vo Ao Advo et par ailleurs S Sinstr Smed etc qui mod lisent avant tout des d ri v s s mantiques et les valeurs qu elles retournent Ils pr sentent les trois exemples suivants 64 Vo serment jurer 65 Advo durer pendant 66 Advo absolu tout a fait et les commentent comme suit Comme les exemples le montrent il ne s agit nullement de d rivation morphologique Les FL d riv es ne refl tent que des relations lexi cales pures o les liens morphologiques sont fortuits Il est vrai qu il n existe pas toujours de concordance entre d rivation morphologique et d rivation s mantique Certains d riv s morphologiques s affranchissent de leur base pour d velopper un sens particulier Ainsi comme le montre Corbin 19871 89 alors que les unit s lexicales FAC SIMIL FACTEUR FACILE FA ON FACTOTUM et 132 FACULTE sont fond es sur une tymologie commune elles ne partagent plus de lien s mantique en synchronie Cependant nous pensons qu un lien morphologique apporte un indice de r currence non n gligeable De plus la forte corr lation entre d riv s morphologiques et d riv s s mantiques d montre que la notion de d rivation s mantique s est construite autour de celle de d rivation morphologique S il est vrai que les d r
251. ibue le patron potentiel 16 7 1 illustr comme suit GESTE PAROLE er A2Manif CHARGE 5 3 4 Bilan et illustration La liste des diff rents patrons est repr sent e dans la figure 5 9 chacun d entre eux y est illustr l aide d un exemple Cette r partition des FL offre une perspective nouvelle qui pourra tre exploit e la fois pour Vaide a Pencodage des FL et pour la r alisation d un environnement de consultation d une base de donn es ou d aide la r daction Nous en proposons une illustration dans la figure 5 10 l aide de la lexie RANCUNE et de ses relations lexicales 203 ap ounfop puenty 0 Lav g asodxa d ev s Lav op unu fa0unuuop s0 ey Z G 2000 uoisuayasddn tapy Z T ZN Inod seo suep_ ajqvoyddn I ms d oun4TV e Z A N op pbunyo uogumo yeyoeqly z X N op ydn d Ti 4940 H doey rZ queJ e un amp uoryeogIpolA UT nun uSey ydurs uor eogrpo A red K N Z N 2uawyzsaz e amp Voge z e T snos Z N AN Irr ddo an t ease 7 ez T IINA ASN ms Luv 49894 tnvapsvf cjeaysney 70 X op X N suanos noleq He qsne Z 40 IZ N e Luv wusnof 1 aozpur founysnez
252. icale donn e par plans 53 ELexico Klosa et al 2006 est une base de donn es lexicale de l allemand d veloppee l institut de langue allemande de Mannheim Il combine les traits d un dictionnaire hypertexte et d un syst me d informations sur des donn es lexicales Environ 500 unit s lexicales sont pleinement d crites Elexico se distingue des autres bases de donn es lexicales de Pallemand par la grande vari t d informations qu elle fournit Ces informations sont d ordre morphologique syntaxique s mantique re lationnelle et contextuelle et sont majoritairement extraites 4 partir de corpus Bien qu elles se situent P cart des autres ressources lexicales mettant l accent sur les relations semantico lexicales entre les unit s d une langue donn e nous sou haitons mentionner les lexiques syntaxiques comme le lexique grammaire 1975 DicoValence ou encore le Lefff 2010 qui est la fois un lexique morphologique et syntaxique f Nous donnons Pexemple du lexique grammaire pour illustrer ces types de ressources lexicales Il s agit du premier lexique formel r alis toutes langues confondues Le lexique grammaire repose sur le distributionnalisme delHarrisi et recense a travers un ensemble de tables les structures syntaxiques l mentaires du fran ais Des tables similaires ont t cr es pour d autres langues dont l italien le portugais le grec et le cor en Les tables regroupent des v
253. ictionnaire d Appren tissage du Fran ais des Affaires Dictionnaire de compr hension et de production de la langue des affaires Didier Paris 2000 Igor Boguslavsky Maria Auxialora Barrios Rodriguez et Pavel Diachenko Callex esp a Software System for Learning Spanish Lexicon and Collocations Current Developments in Technology Assisted Education pages 22 26 2006 Bernd Bohnet Andreas Langjahr et Leo Wanner Development Environment for an MTT based sentence generator Dans Proceedings of the First International Conference on Natural Language Generation pages 260 263 Mitzpe Ramon Israel 2000 gnde ere Henri Bonnard Code Du Fran ais Courant et Terminale Grammaire Magnard Paris 1983 Ignacio Bosque Redes Diccionario combinatorio del espanol contempordneo las palabras en su contexto Boadilla del Monte Madrid 2004 Samia Bouchaddakh La d finition dans les dictionnaires bilingues probl mes de polys mie et d quivalences interlangues Dans Elisenda Bernal et Janet de Ce saris dir Actes d Euralex 2008 pages 807 812 Barcelone 2008 Didier Bourigault et Edith Galy Les Voisins de Le Monde Une base lexicale dis tributionnelle du fran ais construite partir d un gros corpus Dans 4 Journ es de Linguistique de corpus Lorient septembre 2005 Didier Bourigault et Monique Slodzian Pour une terminologie textuelle Termi nologies nouvelles pages 29 32 1999 Myriam Bouveret
254. ie CHAPEAU les FLNS en 147a 147b concernent respectivement les attributs ou composantes s mantiques fonction position et forme que l on peut rattacher la d finition de la lexie 257 147 a Equip pour que les passagers y dorment couchette s lit s b Qui est le premier dans un ensemble de W premier de t te c Qui comporte deux niveaux pour les passagers imp riale Le rep rage de ces attributs permet de normaliser l encodage des FLNS selon le modele suivant on identifie Pattribut concern puis on lui attribue une valeur Les relations pr c dentes peuvent maintenant tre crites l aide des formules en Ta ATH A 147 a Fonction dormir couchette s lit s b Position premier premier de t te c Forme a deux niveaux imp riale La r vision de l encodage des FLNS nominales et adjectivales nous a amen e r duire l ensemble de FLNS en regroupant des liens lexicaux qui taient aupara vant encod s sous des formules distinctes Ce nouvel encodage se r v le davantage compositionnel et permet une meilleure recherche dans le DiCo ou les BLEC L encodage propos pour les FLNS adjectivales permet m me d envisager leur utilisation dans une application de TAL comme la traduction automatique ou la g n ration de textes Le second volet trait dans la th se est la structuration de l ensemble des rela tions lexicales dans u
255. ie formelle traitement auto matique et vulgarisation Nous avons port une attention particuli re l encodage traditionnel le plus majoritairement utilis et tent d en tablir une typologie afin de visualiser et d organiser l ensemble des formules qu il peut rev tir Ceci nous a permis de mettre en avant un certain nombre de probl mes dans l encodage tradi tionnel la d termination d un nombre de FLSS la gestion de la granularit dans 110 la description des liens lexicaux l absence de r gles pour la formation de l enco dage ainsi que le manque d organisation des FL en fonction des diff rents types d information qu elles encapsulent L absence de d finition des formules complexes de l encodage traditionnel a conduit proposer deux encodages formels l encodage explicite et Pencodage alg brique Ces encodages sont enti rement d finis au niveau de leur s mantique et de leur syntaxe Notons que nous utilisons l encodage explicite au chapitre Blpour tablir la liste des diff rents patrons syntaxiques associ s aux FL Plusieurs probl mes li s aux FL ont t voqu s dans ce chapitre dont l h t ro g n it de l encodage des FL non standard Nous consacrons le chapitre suivant la normalisation de leur encodage et la d finition de strat gies pour rep rer les analogies parmi les relations lexicales La normalisation des FL non standard va leur permettre de s int grer au syst me
256. iens syntagmatiques relev s par exemple sont avant tout des co occurrents textuels Nous avons d crit dans 2006 la fa on dont il peut tre utilis pour r aliser des applications pedagogiques d enseignement du lexique au primaire Le Dictionnaire du Fran ais Usuel DFU Picoche et Rolland 2002 dispo nible galement en version lectronique est un dictionnaire du fran ais orienta tion p dagogique Il est con u d apr s des travaux men s par Jacqueline Picoche sur les structures s mantiques et les strat gies d enseignement du lexique Picoche 1977 1956 1095 DicoSyn dictionnaire lectronique de synonymes a t con u par 1998 Il est d velopp actuellement au Crisco par Jean Luc Manguin avec la collaboration de Jacques Fran ois et Bernard Victori et accessible l adresse suivante http www crisco unicaen fr Il est con u d apr s la fusion de plu sieurs dictionnaires de synonymes pour servir de support pratique certains tra vaux de recherche sur la construction d espaces s mantiques dont les fondements th oriques ont t formul s par 1996 Pour toute unit lexicale vedette il offre un mode de repr sentation de sa polys mie fond sur le calcul de la distance s mantique entre tous ses synonymes dans un espace multidimensionnel Les synonymes sont regroup s par cliques L interface d utilisation permet gale ment de visualiser l espace semantique d une unit lex
257. ifi est cart e et la polys mie est pr sum e inexis tante au profit de la bi univocit c est dire que pour un terme n existe qu une notion et qu une notion ne peut tre d sign e que par un seul terme En somme le terme n est pas consid r comme tant un signe linguistique comme les autres XXXV11 Or vers la fin du si cle dernier des lacunes dans la m thodologie de description des unit s terminologiques centr e presque exclusivement sur des repr sentations ontologiques ont conduit certains terminologues s int resser de pr s aux mod les de description linguistique Ceux ci posent un nouveau point de vue sur le terme qui n est plus vu comme une simple tiquette d signant un concept mais comme un signe linguistique au sens lt r gl gt 1997 Des courants terminologiques davantage centr s sur les termes en contexte ont fait leur apparition comme la ter minologie textuelle propos e par Bourigault et Slodzian 1999 qui pr ne une tude des termes sp cialis s dans leur contextes d emploi Dans une autre perspective les partisans d une socioterminologie s opposent galement au courant classique en mettant en vidence les variations sociologiques d emploi d un terme et les usages oraux Enfin on peut noter l approche lexico s mantique du terme que l on pourrait galement qualifier de lexicographique et qui met en avant le ph no m ne de polys mie de synonymie ain
258. information S rie Revue d Intelligence artificielle 18 n 1 15 40 2004 Stephen D Richardson William B Dolan et Lucy Vanderwende MindNet ac quiring and structuring semantic information from text Dans Proceedings of the 179 international conference on Computational linguistics Volume 2 pages 1098 1102 1998 Eleanor H Rosh Natural categories Cognitive Psychology 4 328 350 1973 Benoit Sagot The Lefff a freely available accurate and large coverage lexicon for French Dans Actes de LREC 2010 La Valette Malte 2010 Benoit Sagot Lionel Clement Eric Villemonte de La Clergerie et Pierre Boullier The Lefff 2 syntactic lexicon for French architecture acquisition use Dans LREC U6 2006 Benoit Sagot et Darja Fi er Building a free french wordnet from multilingual resources Dans Actes de Ontolex Marrakech Maroc 2008 277 Thiery Selva Serge Verlinde et Jean Binon Le DAFLES un nouveau dictionnaire lectronique pour apprenants du fran ais Dans Actes de Euralez 2002 pages 199 208 Copenhague 2002 Monique Slodzian WordNet what about its linguistic relevancy Dans Pro ceedings of the EKAW2002 workshop on lt Ontologies and texts gt Juan les Pins France Octobre 2000 John F Sowa Semantic networks Dans Stuart C Shapiro dir Encyclopedia of Artificial Intelligence Wiley New York 2 dition 1987 James Steele A Lexical Entry for an Explanatory Combinatorial Di
259. inqui me sous classe compl mentaire de la pr c dente regroupe les com posantes s mantiques exprimant une diminution ou une d gradation soit par exemple CausPredMinus fardeau II all ger ART On note une autre sous classe regroupant les composantes s mantiques ayant trait la destruction la fin ou la disparition d un fait ou d une entit par exemple LiquOper pleurs s cher tarir ART s FinFunco barri re Il 1 tomber voler La septi me sous classe regroupe les composantes s mantiques ayant trait au non fonctionnement d une entit la non r alisation d un v nement ou encore l interdiction ou au refus Ces composantes sont illustr es travers les FL suivantes NonPermFacto zone boucler ART interdire ART N Q NonFacto usine ch mer tre arr t e tre en gr ve AntiRealo ultimatum refuser rejeter repousser ART NonOper tact manquer de Enfin dans la derni re sous classe sont rassembl es les composantes s mantiques exprimant une tentative ou un essai Par exemple Essayer de Oper o victoire 1 disputer ART N Y Essayer de ncepReal fauteuil briguer ART 187 L ensemble des classes propos es est r capitul dans la figure 188 5 2 3 Bilan et illustration Les dix classes qui viennent d tre pr sent es permettent d organiser l ensemble des FL d un point de vue s mantique Cette repr sentation est
260. ion n ieme Num e Qui suit ou pr c de le W en question Position qui suit ou pr c de le voisin adj Dans lequel il est permis de fumer Statut permis de fumer fumeurs Dans lequel il est interdit de fumer Statut interdit de fumer non fumeurs Cat goris comme offrant le meilleur confort aux passagers Statut meilleur confort aux passagers de premi re classe Cat goris comme tant le plus conomique pour les passagers Statut plus conomique pour les passagers de seconde classe Figure 4 6 FLNS adjectivales normalis es de la lexie WAGON 4 6 Conclusion Dans ce quatri me chapitre nous avons cherch traiter les probl mes pos s par les FLNS En raison de leur encodage h t rog ne sans structure d finie ni langage v ritablement contr l elles constituent un obstacle majeur tout traitement au tomatis Par ailleurs le tr s fin degr de granularit choisi pour l identification des relations lexicales conduit une d multiplication des formules de FLNS et com plexifie la recherche d analogies entre liens lexicaux Les aspects formels des FLNS les cartent radicalement des autres FL et contribuent former deux ensembles disjoints de FL Nous avons questionn la pertinence de l tablissement d une fron ti re aussi tanche entre les FL standard et non standard tant du point de vue th orique que du point de vue de leur encodage et pos la n cessit d
261. ion 5 3 2 pour une pr sentation de la structure syntaxique profonde 82 Pour les FL de type Labor et Labreal indice renvoie toujours au sujet grammatical et l indice 7 au premier compl ment du verbe Le mot cl lui prend la fonction de second compl ment Labreal 2 lait a nourrir N Y de avec A poss X L indice L indice est une autre invention du DiCo I ne correspond aucun actant syn taxique profond du mot cl mais repr sente un participant ext rieur la structure actantielle de ce dernier Par exemple dans la relation suivante Reala fleuve 1 naviguer sur ART le sujet du verbe n est pas compris dans la structure actantielle de FLEUVE I QUI COMMENCE AU lieu X PASSE PAR LES lieux Z ET SE TERMINE DANS L tendue d eau Y Il existe galement un indice z ro Il appara t dans les FL dites de d rivation syn taxique So Vo Ao et Advo ainsi que dans certaines FL verbales comme Funcg et Facto Dans les FL de d rivation syntaxique il ne repr sente aucun actant syn taxique profond mais marque le ph nom ne de translation qui permet de passer d une partie du discours une autre sans qu il y ait pour autant de changement de sens par exemple So regretter 1 1 regret 1 1 Vo assassinat tuer Ao chat f lin Advo exag rer la exag r ment Dans les FL verbales il indique le fait que les verbes retourn s en valeur n ont pas de compl ment par exe
262. ion de plusieurs vocables Mis a part les lacunes dans la description des liens la pr sence de deux marques d usage distinctes pour une m me valeur se r v le un indicateur de polys mie du vocable potentiel d crire ou d homonymie entre lexies Ces indices permettent de postuler Vexistence de deux cf tabl6 1 ou trois cf 6 lexies distinctes pour un m me vocable ou pour des vocables distincts La pr sence ou l absence d une marque d usage n est en aucun cas un crit re suf fisant pour d terminer le nombre de lexies distinctes dans la mesure o plusieurs lexies peuvent avoir la m me marque d usage ou tre non marqu es Par exemple expirer non marqu peut aussi bien vouloir dire prendre fin que recracher de etc 240 bo te non marqu contenant fam entreprise cuisiner non marqu faire la cuisine fam interroger qqn chienne non marqu femelle du chien vulg mauvais individu amalgame non marqu ensemble incoh rent sp c plombage bagne non marqu endroit o on purge iron lieu o on est forc de une peine faire un travail p nible expirer non marqu prendre fin contraire litt mourir d inspirer puce non marqu petit insecte affectueux surnom donn a une fillette s teindre non marqu cesser de fonctionner soutenu mourir
263. ion suivante QS hennir cheval Toutefois partir de QS abdiquer souverain on ne peut d duire Son souverain abdiquer dans la mesure o la FL QS peut s appliquer un grand ensemble de verbes qui ne sont pas pour autant des verbes de son typique Les paires de FL concern es sont pr sent es dans le tableau 6 111 Relation FL Exemple Verbe de son typique Son 1 QS Son grenouille coasser Premier actant QSi coasser grenouille Nom de son typique SpSon QS SoSon cheval hennissement Premier actant QS hennissement cheval Nom de dirigeant Cap 1 S Cap quipage commandant Deuxi me actant S2 commandant quipage Nom d quipe Equip 1 S Equip navire quipage Deuxi me actant S dquipage navire Nom d instrument Labreal Labreali2 chiffon a essuyer Verbe d utilisation N Y avec ART Sr essuyer chiffon Tableau 6 111 Paires de FL a inf rence simple Inf rence double II existe des paires de FL qui sont inverses l une de l autre c est dire pour les quelles f t g et 21 f Dans ce cas partir d une relation f L L on peut postuler la relation inverse g L L et vice versa c est dire qu il est gale ment possible partir de la relation g L L d inf rer la relation f L L Par exemple partir de So craindre crainte on peut inf rer Vo crainte craindre
264. ipe Mesure v PARTICIPANTS Actants du mot cl Participants ext rieurs v QUALIFICATIFS Qualificatif de jugement jugement positif jugement n gatif gt Qualificatif d intensit Forte intensit Faible intensit gt Autres qualificatifs portant sur l apparence physique 188 CAUSE Y PHASES ASPECT Pr paration D but Milieu Fin R sultat R it ration Expression de la dur e Y MANI RE Instrument moyen mani re Mani re dont l entit est utilis e exprim e Mani re de r aliser lac tion v nement v LOCALISATION b Lieu typique b Positionnement spa tial temporel v ACTION EVENEMENT Cr ation causation d exis tence Manifestation Utilisation fonctionnement typique Augmentation am lioration Diminution d gradation Disparition Fin d existence Non fonctionnement Refus Tentative Figure 5 5 Liste des classes s mantiques 189 910101 2991008 pdutoo uoynbinu ap avubvduoa sed yodsues np quesiey asudaiuy UNAIDULLD ez ua nb ap auleiaudoid Lav op op dey SIN91199X9 squedis1 184 A us pun sabossod TSuogliuy quowobinyo uosinbivo uabossod abodinba dinb 1Synn ond saruouu assnow yojazou wanu abodinba p TS sr rgueqoe xneururou S ALI Q A SIN VdT LLMVd A pn u
265. ique qui propose une organisa tion des FL en fonction des composantes semantiques qu elles partagent 172 5 2 1 D composition des fonctions lexicales en diverses com posantes s mantiques 5 2 1 1 Objectif Suivant le mod le de la d finition analytique qui d compose le sens d une unit lexicale en diverses composantes semantiques il est possible de d composer le sens d une FL En etudiant le rapport entre les FL et les eventuelles composantes semantiques qu elles recouvrent nous avons distingu quatre situations 1 FL semantiquement vides Il s agit des FL dites syntaxiques So 100 Vo 101 Ao 102 et Advo 103 Elles ne comportent pas veritablement de composantes s mantiques leur r le est de changer une unit lexicale de partie du discours selon le ph nomene de translation 100 So craindre crainte 101 Vo mot s mouvoir 102 Ao chat f lin aaj 103 Advo exag rer 1a exag r ment 2 FL 4 composante s mantique unique a d finition de certaines ne comportent qu une seule composante s La d finit d t FL tent 1 t mantique par exemple les fonctions Magn 104 Real 105 et Sioc 106 encodent respectivement les composantes intensit utilisation et endroit typique 104 Magn aboiement f roce fort furieux 105 Real bateau naviguer sur ART piloter ART 106 Sioc tir 1b champ club stand de 3
266. iquer aux lexies relevant de plusieurs champs s mantiques Ainsi la FLNS l ment du corps de que l on retrouve dans les articles des lexies d animaux pourrait tre fondue avec la FLNS Partie de tr s fr quente dans les articles des lexies d artefact Il est donc n cessaire de confronter les FLNS associ es un champ s mantique donn celles d autres champs s mantiques pour effectuer d ventuelles fusions 4 3 Propositions d apr s l observation des FLNS du DiCo La premi re vague de propositions que nous pr sentons dans ce chapitre suit l ap proche empirique Nous avons tudi les FLNS nominales et adjectivales du DiCo et relev un certain nombre de similitudes entre des liens lexicaux encod s par des formules de FLNS Toutefois ces analogies entre liens lexicaux ne nous ont pas sem bl quivalentes au niveau de leur fr quence et de la diversit de leurs valeurs Par cons quent nous les avons r parties en deux ensembles Le premier ensemble re groupe des relations paraissant de bonnes candidates pour tre encod es par des FL standard elles sont trait es dans la section 4 3 1 Le deuxi me ensemble pr sent dans la section 4 3 2 comporte des propositions de normalisation de Vencodage de FLNS pr sentant de tr s fortes similitudes sans toutefois tre candidates au statut standard 4 3 1 FLNS candidates au statut standard Nous envisageons dans cette section la cr ation de cinq FL stan
267. is e par la relation Les valeurs du champ sont le mot cl de la FL les diff rents actants du mot c 1 2 3 4 5 et 6 un actant ext rieur Q ou la valeur de la FL V Enfin le dernier champ FL inverse pr sente le cas ch ant la ou les FL inverses associ es a une FL donn d Le syst me de codes est tabli en fonction des classes de chaque perspective la bor es et pr sent es au chapitre pr c dent dans les figures et tableaux 5 5 188 203 5 1 et 5 14 p 221 La correspondance entre les classes et les codes est pr sent e l annexe Cette codification refl te la structuration hi rar chique du systeme en classes et sous classes et offre ainsi la possibilite d effectuer 2La table repr sentant le syst me de FL est disponible sur le site de POLST olst ling umontreal ca La notion de FL inverse est d finie plus loin dans ce chapitre 6 4 6 1 p 244 227 des requ tes tr s pr cises ou au contraire plus larges Par exemple si l on inter roge la table sur les parties du discours on peut sp cifier que la valeur sera verbale code pdd 2 sans forc ment sp cifier ce que sera le mot cl Au contraire si l on cherche extraire des FL verbales prenant pour mot cl un adjectif on indiquera le code pdd 2 2 6 3 Assistant l encodage des liens lexicaux Nous pouvons d river directement partir du syst me de FL et de sa repr senta tion sous
268. isser que la FL AntiBon Oper12 que l on s lectionne alors pour repr senter la relation AntiBon Oper12 compliment a d biter En plus d aider les lexicographes encoder les relations lexicales nous pensons que cet assistant peut tre utilis pour l enseignement des FL Les param tres d termin s pour chaque FL apportent une dimension didactique dans la mesure o il devient tr s facile de comparer des FL similaires et plus g n ralement de visualiser ce qui diff rencie ou rapproche un ensemble de FL 6 4 Calculs de donn es lexicographiques pour l bauche automatique de fiches BLEC 6 4 1 Objectif Il existe deux fa ons d enrichir automatiquement une base de donn es lexicale On peut utiliser des ressources ext rieures ou exog nes ou exploiter l information de fa on endog ne c est dire r cup rer toute l information qui est contenue dans une base de donn es sans qu elle y soit explicit e Pour la strat gie exog ne on peut citer les travaux de Wanner et al et 2007 qui cherchent identifier et caract riser syntaxiquement et s mantiquement les collocations en corpus de fa on automatique Nous nous int ressons quant nous l exploitation endog ne des donn es du DiCo d une part parce que le DiCo contient un grand nombre d informations non exploit es d autre part parce que ceci va permettre de contribuer la coh rence d un syst me de relations lexicales et plus larg
269. ites de 2007b S Sioc ex S vendre 1 vendeur ex Sioc mouton l a bergerie sens premier actant du mot cl sens endroit typique o se trouve pos nom pos nom rel paradigmatique rel paradigmatique reg m me r gime que le mot cl moins le pre reg mier actant IncepReal Vo ex IncepReali gare a entrer len ex Vo haine hair sens commencer r aliser l action inh rente sens quivalent verbal de pos verbe pos verbe rel syntagmatique rel paradigmatique reg sujet premier actant de objet reg m mes actants X et Y que Figure 3 6 Fiches d identit des FL S Sioc IncepReal et Vo Or cette encapsulation pose probl me d s lors que l on vise l extraction des l ments encod s de fa on ind pendante Le regroupement d informations de niveaux diff rents dans un seul encodage contribue s parer des FL s mantiquement qui valentes mais relevant de patrons syntaxiques diff rents ou syntaxiquement qui valentes mais avec des sens diff rents Le DiCo et les autres bases de donn es construites avec les FL ne proc dent pas des regroupements de FL en fonction de ces aspects Les FL y sont g n ralement pr sent es en une simple liste organi s e en fonction des diff rentes parties du discours et du statut des fonctions Nous 105 consacrons le chapitre 5 l laboration d un syst me de F
270. iv s s mantiques ne pr sentent pas toujours de parent morphologique avec leur base comme on le voit dans les exemples 64 et 66 on ne doit pas occulter le fait que ces m mes valeurs sont potentiellement synonymes de d riv s morphologiques comme on le voit en et he 64 Vo serment disparu sermenter jurer 65 Advo durer durant pendant 66 Advo absolu absolument tout fait Toute d rivation s mantique peut potentiellement s exprimer par un d riv mor phologique Lorsque la d rivation morphologique n est pas attest e ou qu elle est vieillie et trop loign e de sa base sur le plan s mantique les d riv s s mantiques non morphologiquement marqu s permettent de remplacer le d riv morphologique attendu Par exemple le verbe SERMENTER XII si cle d fini dans par faire pr ter serment le pr ter soi m me a disparu en fran ais contemporain et se voit remplac par la lexie JURER ou l expression collocative pr ter serment A Pobservation des FLNS nous avons remarqu un certain nombre de valeurs mor phologiquement reli es leur mot cl par exemple Appareil servant mesurer l intensit avec laquelle X applaudir 1 applaudim tre Qqch qui a la consistance lt le go t gt de farine farineux Or selon nous l existence m me d une parent morphologique est la preuve d une relation privil gi e entre les deux unit s lexicales dans le sens
271. k 2006 47 Partie du discours profonde N V Adj Adv Claus Partie du discours de surface N V Adj Num Adv Pr p Conj Claus Figure 5 11 Correspondance entre les parties du discours profondes et les parties du discours de surface Nous devons signaler que toutes les parties du discours ne semblent pas universelles Par exemple dans certaines langues asiatiques comme le chinois le vietnamien et le cor en il n existe pas 4 proprement parler de classe d adjectifs Ces derniers sont consid r s comme des verbes qualificatifs qui repr sentent une sous classe de verbes cf 5 4 2 2 Parties du discours et locutions La distinction expos e plus haut est en fait issue de la probl matique d assigner une partie du discours 4 une locution En effet dans une repr sentation syntaxique profonde une locution n occupe qu un seul n ud mais au niveau syntaxique de surface elle va correspondre un sous arbre comme on le voit dans la figure 5 12 repr sentant la phrase Marie casse les pieds Jean Mel uk 2006 31 Ces observations ont t faites par Igor Mel uk Alain Polgu re et Sara Anne Le blanc dans le cadre de l laboration du LAF et du travail de doctorat de Sara Anne 209 Structure syntaxique profonde Structure syntaxique de surface CASSER LES PIEDS FA D UN CASSER MARIE JEAN suj obj di MARIE PIED pl A LE JEAN Figure 5 12 Stru
272. l l ment semi standard rapidement en 38 alors que la valeur manger en n est pas diff renci e de avaler et s enfiler qui auraient pu tre d crites par la FL rapidement Real Le lien lexical en aurait galement pu tre encod la FL rapidement Real 37 Real bi re 1 b boire consommer prendre ART 38 rapidement Real bi re 1 b s enfiler siffler caler ART 39 Reali sandwich 11 avaler s enfiler grignoter manger ART 40 Individu X abaisser et relever rapidement paupi re battre ciller cligner des sl 2 On observe des cas o la granularit choisie pour d crire une relation lexicale est trop lache c est a dire que la relation encod e par la FL est si vague que les valeurs retourn es sont trop nombreuses et trop vari es Dans ce cas il est n cessaire d apporter un l ment de sens suppl mentaire pour distinguer les relations Par exemple il semble difficile de regrouper les actions typiques r alis es par un chat sous un seul encodage On utilise alors les notations semi standard pour les diff rencier Factomouvement chat faire le gros dos s tirer Factonettoyage chat faire sa toilette Factogratter chat faire ses griffes Factochasser chat chasser N Factoboire chat laper 102 Cependant ceci est g nant dans la mesure o dans ce contexte la FL stan dard Facto est tellement g n rale qu elle s ap
273. l Ao So fluvial fleuve Fait que X soit SoPred _ A SoPred c libataire c libat tel que X est SoPred A c libat c libataire Ai consternation constern mais constern consternation Ao consternation consternant mais consternant consternation Tableau 6 V Paires de FL inverses 6 4 6 2 Calculs de relations lexicales partir des FL inverses En s appuyant sur les deux types d inf rences qui viennent d tre pr sent s nous pouvons calculer un certain nombre de relations lexicales Par exemple partir des six relations ci dessous il est possible d inf rer six autres relations r versibles not es droite des premi res 126 Syn abeille mouche m el Syn mouche m el1 abeille 127 Conva craindre effrayer Conv effrayer craindre N X 248 128 So homicideaa homiciden Ao homiciden homicide Aaj 129 130 131 Sinstr fumer 2 fume cigarette Labreali fume cigarette fumer 2 Cap assembl e 2 pr sident S president assembl e 2 128 129 130 131 Son abeille bourdonner S bourdonner abeille Surg n ration de relations lexicales Les r gles de r versibilit des FL s appuient sur une observation empirique des relations encod es dans le DiCo Par cons quent on doit observer une certaine pr caution vis a vis des liens lexicaux g n r s Ces dernier
274. la THEORIE DE LA PHRASEOLOGIE parce qu elles permettent de d crire de fa on rigou reuse et syst matique les collocations Secundo elles sont essen tielles dans la THEORIE DE LA SYNTAXE car plusieurs r gularit s syntaxiques ont besoin du concept de FL pour se pr ter une descrip tion formelle satisfaisante Tertio les FL ont ouvert des perspectives fort prometteuses dans la TH ORIE DE LA LEXICOGRAPHIE Wanner et Alonso Ramos 2005 ont mis en valeur l ambigu t de l entit FL qui sert diff rents types d usages dans le mod le Sens Texte et ses applications Pour la pr sentation de la notion de FL deux points nous semblent importants cla rifier par rapport la nature des FL le fait qu elles sont consid r es comme des m talexies et comme des fonctions 2003 125 126 propose de consid rer les FL comme des m talexies Pour tre bien comprises les FL doivent avant tout tre appr hend es comme des m talexies elles sont caract ris es par des propri t s de sens et de combinatoire mais ne sont pas associ6es de fa on directe a des signes et donc a des signifiants L association des signifiants particuliers se fait de fa on indirecte par l application de la m talexie en tant que fonction une lexie particuli re pr alablement identifi e par le locuteur Ces m talexies universelles devraient tre enseign es comme telles La FL Magn existe m me si c est une no
275. lar Accoutrement is located Ex Tess wore a single RING in her left mostril CREATOR crel The individual or group who created the Accoutrement Ex De Beers_ cre JEWELRY is justly famous DESCRIPTOR Desc This FE identifies a characteristic or description of the Accoutre ment Ex Kim wore an exquisite Desc TIARA MATERIAL Mat This FE identifies the Material from which the Accoutrement is made Ex He wore a gold Mat WATCH NAME nam A name given to an individual Accoutrement to distinguish it from all other objects Ex The RING Narya_ nam was passed to Gandalf PART Part This FE identifies a part of the Accoutrement Ex He bought a leather CAP with sheepskin flaps Part STYLE St1 This FE identifies the Style of the Accoutrement Ex He wore a Jacobean St1 WIG TIME_OF_CREATION timl The time at which the Accoutrement was created Ex What was a 17th century_ tim BROOCH doing in her attic USE Use This FE identifies the purpose for which an Accoutrement is worn or made Ex She was wearing reading Use GLASSES WEARER Wear The Wearer wears the Accoutrement Ex Why must you always wear your Wear HELMET when I m driving Figure 4 3 Le cadre lt ACCOUTREMENTS gt et ses diff rents l ments de cadre 147 MENTAL CONTENT n apparait que sous lt REMEMBERING_INFORMATION gt UNCONFIRMED CONTENT seulement sous lt VERIFICATION gt etc Le nombre
276. lasses Zholkovsky et Mel uk 1970 que l on trouve parfois un grand nombre de sous classes compos es d une seule FL 1990 ou encore qu une case lt fourre tout gt cf lt miscellaneous functions gt 11990 est utilis e pour combler une difficult de classification ce qui ne peut tre consid r comme une sous classe satisfaisante Une autre critique que l on peut formuler l encontre de ces classements est qu ils ne prennent en compte que les FL standard simples compos es d un seul l ment standard Or ce que nous cherchons organiser ce sont les FL qui figurent dans les DEC et les BLEC c est dire les FL standard simples et complexes pouvant combiner jusqu cinq l ments diff rents les FL semi standard localement stan dard ainsi que les FLNS Il semble que les difficult s rencontr es sont la preuve qu on ne peut parvenir un classement satisfaisant s il doit tre cantonn dans une ou deux dimensions Pour mettre profit les diff rents types d information fournies par les FL sans les entre m ler on doit en proposer non pas une classification uni ou bidimensionnelle mais multidimensionnelle Cette repr sentation doit pouvoir fournir un mode d organi sation pour chaque type d information encod Il existe en effet plusieurs fa ons de regrouper un ensemble de donn es Prenons l exemple des relations ci dessous 167 93 94 95 Gener bonne humeur ambiance atm
277. le gt Chaque constituant de FL peut tre une FL simple ou une FL complexe Chacun d entre eux s applique directement au mot cl Mel uk et al 11995 149 en donne la d finition et les exemples suivants Nous appelons configuration de fonctions lexicales une suite de FL simples qui ne sont pas syntaxiquement li es entre elles mais qui ont le m me mot cl cette suite ayant une valeur globale cumulative qui exprime de fa on ind composable le sens de la suite enti re Bon joie Magn joie paradisiaque lt une grande Magn joie qui est tr s bonne Bon gt Magn maladie A maladie terrass par ART qui a A une maladie grave Magn gt Magn orage 1 d cha ner ART X cause exister Caus Funcol un grand Magn orage au sujet de X gt 85 Selon Mel uk et al 1995 148 seules les FLSS sont dites r guli res dans le sens o elles sont consid r es comme tant les plus importantes lt autant quantitativement que qualitativement Par ailleurs les FL complexes et les configurations de FL sont mises sur le m me plan que les FL non standard en tant que FL irr guli res Nous ne partageons pas cette vision des FL Les FL complexes et les configurations de FL nous semblent tout autant standard que les FLSS elles remplissent l en semble des conditions n cessaires au statut standard et nombre d entre elles
278. le l adresse suivante http multivordnet itc it english home php 46 1998 cf section 2 2 5 Malgr Thegemonie de WordNet certains linguistes ont mis quelques r serves quant sa pertinence linguistique Il s agit notamment des d fenseurs d une s mantique textuelle et diff rentielle Notons que ces critiques s adressent autant WordNet que de fagon plus g n rale 4 toutes les approches ontologiques Pour 2000 le choix du paradigme s mantico cognitif conduit consid rer que le signe est linguistique et que le sens est conceptuel ce qui entra ne n cessaire ment une vision r ductrice de la langue Elle formule plusieurs critiques l gard de WordNet Premi rement l unit de base tant l unit lexicale isol e et totalement d contextualis e les propri t s syntagmatiques sont n glig es Deuxi mement la structure hi rarchique renforce l id e d une linguistique uniquement centr e sur le signe et qui ignore la probl matique du sens textuel Or elle pense que le sens ne peut tre d fini que par d autres unit s linguistiques et non pas par un concept Ceci pr suppose un usage en contexte De son point de vue seule une s mantique textuelle diff rentielle est capable d atteindre ces objectifs 2004 15 vient renforcer son point de vue dans une analyse des ontologies contre lesquelles il se positionne radicalement Les lexiques des langues ne sont pas structur s com
279. le les valeurs de la FL Loc en russe varient entre les pr positions v et na Loc institute at the institute Loc institut v institut Loc work at work Loc rabota na rabote etc Pour assurer la production de ces quivalents en traduction automatique il suffit simplement d identifier les arguments et la valeur de la FL pendant Panalyse automatique et de substituer la valeur correcte dans la langue cible Hi pendant la g n ration Les impl mentations r alis es dans les applications en TAL permettent de mettre en valeur certaines lacunes au niveau des FL L quipe du projet ETAP 3 a in troduit une vingtaine de nouvelles FL avec un potentiel paraphrastique plus riche Certaines de ces nouvelles fonctions sont des am nagements de FL existantes dont on a augment la granularit Voyons en un exemple avec la FL Anti Deux types s mantiques d antonymes ont t d gag s qui diff rent l un de l autre par la po sition de la n gation dans leur repr sentation s mantique Apresjan et al 2003 101 The first type of antonyms is based on inner negation Consider the well known pair begin and stop To stop doing P can be explicated as to begin not to do P This type of antonymy is called ANTI1 The second type of antonyms is based on outer negation Consider the pair observe the regulations and violate the regulations to violate means not to observe This type of antonymy is calle
280. le du verbe c est dire un infinitif Une conjonction est grosso modo un adverbe r gissant en tant que compl ment obligatoire soit un verbe fini c est dire la t te d une propo sition c est alors une conjonction subordinative soit une lexie de la m me partie du discours que le gouverneur de la conjonction c est alors une conjonction coordi native On note que les pr positions et les conjonctions ont une distribution assez similaire celle des adverbes elles se rattachent leur gouverneur syntaxique peu pr s par les m mes r gles que les adverbes Au niveau syntaxique profond on les encode comme des adverbes Cependant les pr positions ainsi que les conjonc 208 tions ont tellement de propri t s syntaxiques particuli res et jouent en syntaxe de surface un r le si sp cial et important qu on doit consid rer qu elles repr sentent des parties du discours de surface part enti re Un num ral est un nom de nombre qui s utilise de fagon assez sp ciale pour quanti fier les noms et pour construire les noms de nombres complexes Bien que consid r comme relevant d un adjectif profond il ne partage pas en fran ais suffisamment de propri t s avec l adjectif pour tre consid r comme une sous classe de l adjectif de surface Suite ce qui vient d tre expos on peut tablir une correspondance entre les parties du discours profondes et les parties du discours de surface Mel u
281. le est donc s par en deux lexies dans le dictionnaire monolingue fran ais et reli deux axies interlingues dans le dictionnaire pivot comme Tillustre la figure IL 3 Sa microstructure quant elle repose sur les principes de la LEC et est rela tivement conforme celle du DiCo c est dire que pour chaque unit lexicale sont donn s une tiquette s mantique une structure argumentale le r gime de la lexie ainsi que les liens paradigmatiques et syntagmatiques privil gi s encod s au moyen de FL Beaucoup de donn es sont r cup r es partir de ressources exis tantes et sont int gr es dans le dictionnaire Papillon On a ainsi la possibilit de naviguer dans les dictionnaires monolingues ou de trouver les traductions possibles dans plusieurs articles Par exemple pour le vocable R VER plusieurs articles de dictionnaire sont propos s dont celui de la base ELRA P et celui du dictionnaire trilingue FeM que nous reproduisons dans la figure IT 4 p kxxvi Le projet Papillon est un projet ambitieux qui repose en grande partie sur le prin cipe de la collaboration multiple Pour instant peu de donn es sont pr sent es et la structure globale d interaction interlangue n est pas encore tr s d velopp e http www icp inpg fr ELRA XXXV ELRA dictionnaire allemand anglais espagnol fran ais italien r ver v r ver pendant le sommeil V allemand tr umen v anglais dream v italien s
282. les paradigmatiques soient instanci es par des liens lexicaux syntagmatiques et inversement Ainsi les relations d intensification et d utilisation typique prototypiquement syntagmatiques par exemple Magn cloche grosse Magn admiration sans bornes 1 sans r serve Real frein 41 appuyer sur le sont exprim es dans certains cas par des liens paradigmatiques Magn cloche bourdon 32 Magn admiration adoration a Real frein 1 freiner Dans ces cas la le sens du mot cl et celui de la fonction lexicale sont compris dans celui de la valeur un bourdon est une grosse Magn cloche l adoration est une grande Magn admiration freiner est l utilisation typique Real des freins Dans la LEC lorsqu une valeur comprend 4 la fois le sens du mot cl et celui de la fonction lexicale on parle de fusion Pour en rendre compte dans l encodage des relations lexicales on fait pr c der la valeur d une double barre oblique cf exemples ci dessus A Tinverse il arrive bien souvent que certaines relations lexicales typiquement paradigmatiques par exemple Si abeille apiculteur Nom du premier actant Si meurtre meurtrier Mult ch que ch quier Ensemble de Mult concert tourn e retournent des valeurs en cooccurrence avec les mots cl s par exemple Si abeille leveur de s Si meurtre auteur de ART Mult ch que carn
283. les servant pr ciser la nature du premier actant X 30 a X de la v g tation ceinture Il de v g tation verte b X ensemble d industries ceinture I1 industrielle X une ou plusieurs voies de circulation importantes ceinture I1 rou ti re d X voies de chemin de fer ceinture I1 ferroviaire 31 a X soutien moral encouragement 2 moral b X soutien financier encouragement 2 financier mat riel p cuniaire On note en que plusieurs actants peuvent tre sp cifi s en m me temps 32 X client de restaurant Y cuisinier de restaurant Z bonne qualit d un re pas f licitations b lt Mes au chef gt lt Nos au chef gt au chef gt Ces relations sont l expression du r gime d un mot cl qui se voit lexicalis pour former un syntagme avec ce m me mot cl Bien qu il s agisse de relations lexicales elles ne correspondent pas 4 proprement parler a des liens de FL Toutefois il arrive que le mot cl et la sp cification d un actant soit englob s dans une lexie part enti re La relation devient alors paradigmatique comme en 33 pour la lexie CRI I 1 33 a X ane cri 1 1 braiment hi han b X bovin cri 1 1 meuglement mugissement meuh X canard cri I1 1 nasillement coin coin Lorsque la relation est paradigmatique la valeur est la fois en relation d hypo nymie avec le mot cl un b
284. lexicales l approche visant rechercher des composantes primitives communes aux unit s lexicales est cart e au profit d une approche par r seau selon laquelle le lexique mental serait un graphe connect ayant pour n uds des unit s lexicales reli s par des chemins Les psycholinguistes utilisent fr quemment des tests d association de mots de type stimulus r ponse Or si les r ponses appartiennent tr s souvent au m me champ s mantique que les stimuli on remarque cependant que les diff rentes associations de mots produites constituent des liens de nature diff rente Elle classifie donc ces liens en quatre types principaux dont les deux premiers sont les plus fr quents la coordination par exemple apple pear la collocation par exemple wide awake blissfully ignorant la superordination par exemple bird 64 fish insect animals et la synonymie par exemple wide broad Les structures phon tiques dans le lexique mental il semble que certaines parties des unit s lexicales soient plus saillantes que d autres c est dire plus profond ment marqu es dans l esprit humain Il s agit du d but et de la fin des unit s lexicales ainsi que de leur patron rythmique global En outre l int rieur des unit s lexicales les syllabes ont leur propre structure Ceci peut conduire m langer accidentellement deux unit s relativement similaires du point de vue de leur structure phon tique
285. libre comme soulever un rocher est form d unit s lexicales choisies librement et de fagon ind pendante Son signifi est compositionnel c est a dire qu il r sulte de la composition des signifi s de ses l ments constituants le signifi de soulever un rocher comprend celui de SOULEVER et celui de ROCHER A Vinverse les collocations et les locutions sont soumises une contrainte dans la s lection d au moins un de leurs constituants Les locutions doivent tre interpr t es de fa on globale par exemple la locution MONTER UN BATEAU est interpr t e en un seul bloc comme DUPER Elle constitue une unit lexicale part enti re au m me titre que MONTER ou BATEAU En d autres termes le signifi d une locu tion n est pas compositionnel il n quivaut pas la combinaison des signifi s de ses l ments constitutifs Une autre caract ristique fondamentale d une locution est qu aucun des l ments individuels la constituant ne r sulte d un choix Ainsi dans CASSER SA PIPE la lexie CASSER n est pas choisie par rapport BRISER ou ABIMER tout comme PIPE ne l est par opposition CIGARETTE ou CIGARE De 20 m me les l ments de la locution CHEMIN DE FER 1 ne r sultent pas d un choix FER n tant pas s lectionn parmi un ensemble de lexies comme TERRE ou SABLE ni CHEMIN par opposition ROUTE ou VOIE Au contraire une collocation est compos e d un l ment librement choisi parmi
286. logique et les FLNS Dans le Cours de Morphologie G n rale a la suite des d rivat mes les plus courants que nous venons de mettre en corres pondance avec les FL standard 1994a 377 expose un certain nombre 136 de d rivat mes non classifi s formant un ensemble ouvert et se pr tant mal une syst matisation a X est une personne dispositif qui fabrique utilise Y b X est une personne qui provient de Y c X est une personne qui aime les Ys d X est la femelle moins souvent le m le de Y e X est le mat riau destin fabriquer Y f X est un r cipient un local destin a Y g X est la langue parl e par les Ys h X est la peau la fourrure de Y i X est la viande de Y j X est le renne destin transporter Y etc Nous avons mis ces d rivat mes mis part g et j en correspondance avec des FLNS observ es dans le DiCo a Individu qui fabrique charrette a charron b Habitant de terre III terrien n Individu qui s int resse a curiosit I1 amateur de sl d Femelle du canard cane e Mat riau dont sont faits pneu caoutchouc f Endroit o l on range balai placard sl h Fourrure peau de utilis e comme mat riau mouton l a mou ton l c i Chair de utilis e comme aliment mouton l a mouton L b Il serait bon de chercher v
287. mantique partir de son sens 2 un acc s syntaxique organisant les collocatifs et d riv s s mantiques en fonc tion de leur configuration syntaxique avec la lexie vedette 3 un acc s portant sur les parties du discours des lexies reli es une lexie vedette 4 un acc s portant sur la cible communicationnelle vis e par la relation Par exemple pour la lexie COUP DE FIL le collocatif verbal passer met l accent sur le premier actant de COUP DE FIL alors que recevoir met l accent sur son deuxi me actant Nous esp rons que notre travail constituera un moteur pour le d veloppement de nouvelles structurations parmi les ressources lexicales labor es dans le cadre de la LEC et qu il permettra le d veloppement d applications exploitant toutes les potentialit s que ce mod le th orique peut offrir en mati re d apprentissage du lexique Bibliographie Jean Aitchison Words in the Mind An Introduction to the Mental Lexicon Basil Blackwell Oxford 3 dition 2003 Margarita Alonso Ramos Las functionales l xicales en el modelo lexicografico de I Mel cuk Th se de doctorat Universidad nacional de educacion a distancia Madrid 1993 Margarita Alonso Ramos Crit res heuristiques pour l encodage des collocations au moyen des fonctions lexicales Dans Actes d Euralex 2000 volume 2 pages 222 232 Universit de Stuttgart 2000 Margarita Alonso Ramos Elaboraci n del Diccionari
288. marqu Etiq Vo fait de questionner Etiq So lt interrogatoire gt Hi L encore les fiches ne s unifient pas car les champs usage sont diff rents On peut donc postuler que l on est en pr sence de deux lexies CUISINER et CUISINER Nous prenons un dernier exemple avec la valeur crever pr sente dans les quinze relations suivantes 132 FinFunco abc s I nom masc affection et excroissance cutan e cre ver 133 FinFunco abc s II nom masc situation conflictuelle crever 134 FinFacto paroi pneu nom masc accessoire pour v hicules crever 135 Liqui gt Funco abc s Il nom masc situation conflictuelle crever P 136 LiquFunco abc s l nom masc affection et excroissance cutan e crever ART 137 LiquFacto canalisation nom f m artefact servant de conduit crever ART 138 LiquFacto paroi pneu nom masc accessoire pour v hicules crever ART 139 LiquFacto tuyau I 1 nom masc artefact servant de conduit crever ART Oper faim 1 2 nom f m pas de pl d f situation fam crever de 140 141 Magn Oper d pit nom masc sentiment n gatif fam crever de 142 Magn Oper effroi nom masc motion n gative fam crever de 143 Magn Oper faim I la nom f m pas de pl sensation fam crever de 253 144 Magn Oper honte I 1 nom f m sentiment n gatif fam crever d
289. mation ainsi que l absence d un syst me pour l organisation des FL 3 3 3 1 D nombrement des fonctions lexicales standard simples Pour aborder la question du d nombrement des FLSS nous devons examiner trois facteurs l existence ou non existence d un comit charg de valider les proposi tions de FLSS les corpus de r f rence ainsi que la granularit de description des relations lexicales Premi rement nous insistons sur le fait que le nombre de FLSS n est pas fix dans Vabsolu En effet l laboration d une liste de FLSS ne se fait pas a priori mais de 92 FL STANDARD 1 FL standard simples Oper aboiement 1 mettre pousser lancer ART Ver boisson 1 desalterante rafraichissante 2 FL standard combin es FL complexes IncepPredPlus fardeau I alourdir ART Configurations de FL AntiBon Operj2 compliment a d biter r citer ART N Y 3 FL standard avec indications de phases Real accusation 1 2 se d fendre contre ART Real accusation 1 2 se blanchir se disculper se laver de ART 4 FL standard avec pointeurs vers la d finition Magn coup de feu I nourris soutenus Vermanigre accuser 1 1 ouvertement tout haut FL SEMI STANDARD en cour Fact2 avocat 1 1 plaider pour N Y pour frapper qqn Labreal a ceinture 4I 1 battre N avec ART FL LOCALEMENT STANDARD De_nouveauOper accusation 1 1 reiterer renouv
290. me d organisation des relations lexicales fond sur le formalisme des fonctions lexicales de la Th orie Sens Texte Les relations lexicales et les liens lexicaux qu elles permettent de regrouper consti tuent une part tr s importante du lexique des langues Bien que cet aspect des langues soit encore tr s peu tudi en comparaison avec la grammaire la mod lisa tion des liens lexicaux est pourtant d une importance primordiale pour la lexicologie et plus largement pour la mod lisation des langues naturelles Plusieurs volets ont t trait s dans la th se Premi rement nous avons effectu un travail sur les FLNS qui se situent en marge du syst me que forment les FL standard Nous avons discut de leur statut en tant que FL et avons propos deux m thodologies pour le rep rage des analogies entre liens lexicaux et la r gularisation de leur encodage La premi re m thodologie s appuie sur les liens entre la d rivation morphologique et les FL pour rep rer et m me dans certains cas pr voir certaines r gularit s Par exemple les suffixes logie et tique ont permis de mettre en vidence la relation tude de qui s av re relativement r currente dans le lexique et d homog neiser sa description La seconde m thodologie consiste d gager l attribut d une lexie ou en d autres termes la composante semantique de sa d finition concern e par un collocatif donn Par exemple pour la lex
291. me dans les exemples pr c dents l emploi de Loc L ou de Instr L n cessite la pr sence de L Les paraphrases minimales des syntagmes bord du bateau et avec un couteau bord de et avec ne sont pas compl tes Toute fois dans ces syntagmes la dominance syntaxique de bord de et avec refl te la dominance communicative des n uds situ dans et l aide de dans les deux re pr sentations s mantiques correspondantes Dans les relations 114 et 116 la cible communicationnelle de la FL est donc sa valeur Nous consid rons que la cible communicationnelle des FL dont les valeurs sont des collocatifs non verbaux formant avec le mot cl un syntagme est le gouverneur syn taxique du syntagme puisqu il correspond au n ud communicativement dominant de la configuration s mantique correspondante 5 5 2 2 FL dont les valeurs sont des collocatifs verbaux Pour les FL dont les valeurs sont des collocatifs verbaux on remarque que la valeur de la FL son mot cl et ventuellement les actants du mot cl permettent 218 de construire un nonc Par exemple la FL Operi retourne une valeur verbale dont le sujet grammatical est le premier actant syntaxique profond du mot cl le premier compl ment du verbe le mot cl lui m me et le second compl ment du verbe le deuxi me actant syntaxique profond du mot cl Dans la relation ci dessous 117 Operj2 coup de donner passer ART N v
292. me des ontologies Les relations s mantiques sont en effet plus complexes et variables que ce que pr voient les constructeurs d ontologies Pour construire une d ontologie il faut restituer la diversit des discours et des genres qui rendent illusoires une ontologie unique insister sur le probl me de la diversit s miotique des textes les corr lations complexes entre contenu et expression l incidence constituante du contexte C est l une condition pour remplir des t ches de caract risation notamment en linguistique de corpus Du point de vue de la LEC l absence de relations syntagmatiques dans une res source lexicographique de si grande envergure nous semble une importante lacune qui m riterait d tre combl e On note que ces critiques sont symptomatiques des diff rences de paradigmes par le biais desquels le lexique est trait Les choix m thodologiques op r s dans une 47 approche particuli re ne peuvent apparaitre satisfaisants pour une autre approche s ils vont l encontre de ses principes fondateurs 2 2 4 MindNet MindNet Richardson et al 1998 est un projet de repr sentation des connaissances d velopp par le groupe de traitement automatique des langues de Microsoft La m thodologie d laboration de MindNet visant 4 constituer une base de connais sances de fagon automatique nous semble particuli rement originale Un analyseur syntaxique large couverture est utilis p
293. mie etc qui sont g n ralement repr sent es dans ces mod les La plupart des travaux actuels sont centr s sur le d veloppement de m thodes d acquisition de connaissances lexicales partir de textes crits en langue naturelle On peut citer par exemple MindNet Richardson et al 11998 qui cherche extraire des infor mations relationnelles partir de d finitions et de textes libres 15 Comme nous l avons voqu plus haut bien que diff rentes dans leurs objectifs et m thodologies ces trois disciplines envisagent le lexique selon un mode relationnel Cependant les relations dont il est question ne se situent pas sur le m me plan Nous examinons cette question dans la section suivante 2 1 2 Propri t s des relations lexicales D un domaine scientifique un autre et au sein d une m me discipline les re cherches effectu es sur les relations lexicales reposent sur des principes si divers qu il est parfois difficile d tablir des comparaisons sur les types de relations rete nues Nous t chons donc d expliciter un certain nombre de propri t s associ es aux relations lexicales dans diff rentes approches du lexique soit 1 leur nature c est dire si elles sont conceptuelles s mantiques ou contex tuelles 2 leur dimension paradigmatique ou syntagmatique 3 leur caract re prototypique et idiomatique 4 leur degr de figement 5 les degr s de granularit dans le syst me qu
294. mode de fabrication de facon traditionnelle ou qui en a l apparence pain 1 l ancienne ORIGINE Qui provient d un m lange de races chien 1 b tard Qui provient d un tonneau et non d une bouteille bi re 1 b pression 149 Nous avons recens un certain nombre de valeurs ayant trait au contenu ou plus sp cifiquement aux ingr dients utilis s et cr les attributs CONTENU et INGREDIENT CONTENU Qui a trait la religion juron 1 blasph matoire Dont le contenu Z est important conversation 4a grave INGREDIENT Qui est fait pour ce qui est des ingr dients sans sel painz 1 sans sel Qui est fait pour ce qui est des ingr dients base de farine brute pain 4I complet Nous avons par la suite d gag des relations adjectivales concernant les l ments d une situation d not e par le mot cl c est dire la position l tat la fonc tion le fonctionnement le statut la situation localisation le temps la cause et la cons quence POSITION Qui est le dernier dans un ensemble wagon dernier de queue Qui se trouve en dessous d o l on est tage 1 du dessous TAT Qui a t utilis e assiette a sale Qui a la rage chien 1 enrag FONCTION Equip pour que les passagers y dorment wagon lit Que X porte pour chasser chapeau de chasse FONCTIONNEMENT Qui poss de un carillon horloge carillon Qui fon
295. mple Funco applaudissements cr piter r sonner Facto ancre mordre tenir 83 3 3 2 2 Fonctions lexicales standard simples et fonctions lexicales stan dard combin es Nous devons pr sent d finir ce que l on entend par FL standard simples et FL standard combin es Les FL standard simples FLSS forment un ensemble de primitifs s mantiques d gag s partir de l observation d un grand ensemble de FL De la m me fa on qu il est possible d isoler les composantes semantiques minimales d une d finition analytique il est possible d isoler des FLSS a partir desquelles on peut former d autres FL standard Par exemple dans la relation suivante S Real gouvernail 41 pilote timonier le sens de la FL peut tre d fini comme Individu qui S actionne Real Les FL standard obtenues par la combinaison de FLSS doivent tre interpr t es comme des FL a part enti re mais dont le sens est d composable en termes d l ments plus simples Ainsi la FL AntiBon est une FL standard combin e mais elle constitue une FL unique au m me titre que la FL Anti et que la FL Bon Les FL standard combin es ne s analysent pas toutes de la m me fa on sur le plan s man tique Il existe deux types de combinaisons r gies par des r gles particuli res qui en d terminent Tinterpretation Ces combinaisons sont pr sent es dans Mel uk et al 1995 148 149 Nous les synth tison
296. mployee 50 Typical Object sing song note music praise Typical Subject sing people singer bird chorus Les relations dans MindNet sont de plusieurs ordres On observe en effet un m lange entre d une part des relations syntaxiques par exemple la modification attributive l objet typique ou encore le sujet typique et d autre part des rela tions s mantiques comme les relations d intensification de synonymie ou de but Nous pouvons approximativement mettre certaines de ces relations en correspon dance avec les fonctions lexicales Hyperonymy Gener Typical Indirect Object Certains Location Sioc cas de S gt ou S3 Possessor Certains cas de S Typical Object Certains cas de 5 Source Certains cas de S3 Typical Subject Certains cas de S Synonymy Syn Cependant les instances de relations obtenues par analyse de textes sont exclusi vement retenues selon des crit res de fr quence Par cons quent on retrouve des liens entre unit s lexicales qui seraient radicalement exclus des ressources fond es sur la LEC Certaines valeurs ne peuvent tre consid r es comme des v ritables col locations au sens de la LEC par exemple SUDDENLY n est pas un collocatif de RUN Par ailleurs le lien entre READ et FIND instance de la relation purpose est loin d tre consid r comme un lien prototypique cf section 224 Les donn es de MindNet sont tr s h t
297. n 17 novembre 2006 Serge Verlinde Thierry Selva et Jean Binon The Base Lexicale du Francais BLF A Multifunctional Online Database for Learners of French Dans Actes d Euralex 2006 pages 471 483 Turin septembre 2006 Bernard Victorri et Catherine Fuchs La Polys mie construction dynamique du sens Herm s Paris 1996 Ellen M Voorhees Using WordNet for Text Retrieval Dans Christiane Fellbaum dir WordNet an Electronic Database chapitre 12 pages 285 304 MIT Press 1998 Piek Vossen dir EuroWordNet a multilingual database with lexical semantic networks Kluwer Academic Publishers Dordrecht 1998 Piek Vossen Ontologies Dans Ruslan Mitkov dir The Oxford Handbook of Computational Linguistics Oxford University Press Oxford 2003 Leo Wanner et Margarita Alonso Ramos What Type of Entity is a Lexical Func tion Dans Jury Apresjan et Leo Iomdin dir Fast West Encounter Second International Conference in Meaning Text Theory pages 518 528 Moscou 2005 Slavic Culture Language Publishing House Leo Wanner Margarita Alonso Ramos et Antonia Marti Enriching the Spanish EuroWordNet by Collocations Dans Proceedings of the LREC 2004 Lisbone 2004 Leo Wanner et Bernd Bohnet Towards Automatic Recognition of Lexical Func tion Instances Dans Leo Wanner dir Selected Lexical and Grammatical Is sues in the Meaning Text Theory pages 235 265 John Benjamins Amster dam Philadelphie 2007 279
298. n des classes et sous classes des quatre perspectives du syst me soit la hi rarchie s mantique figure 1 la liste des valences syntaxiques figure 11 2 la liste des couples de parties dicours figure HL3 ainsi que la liste des cibles communicationnelles figure TIT 4 La table peut tre consult e partir du site de POLST l adresse suivante http www olst ling umontreal ca Y Sem 1 EQUIVALENCE gt Sem 1 1 Lexies similaires gt Sem 1 2 Conversifs gt Sem 1 3 Reformulation syntaxique Y Sem 2 OPPOSITION gt Sem 2 1 Opposition gt Sem 2 2 Conversifs gt Sem 2 3 Equivalent masculin f minin Y Sem 3 ELEMENT ENSEMBLE Sem 3 1 Hi rarchiques Sem 3 2 Partie tout Sem 3 3 Petit de Sem 3 4 Unit ensemble r gulier Sem 3 5 Chef quipe gt Sem 3 6 Mesure Y Sem 4 QUALIFICATIFS gt Sem 4 1 Qualificatifs de jugement gt Sem 4 1 1 jugement positif gt Sem 4 1 2 jugement n gatif b Sem 4 3 Qualificatif d intensit gt Sem 4 3 1 Forte intensit gt Sem 4 3 2 Faible intensit gt Sem 4 4 Autres qualificatifs portant sur l apparence physique Y Sem 5 PARTICIPANTS gt Sem 5 1 Actants du mot cl gt Sem 5 2 Participants ext rieurs Y Sem 6 PHASES ASPECT gt Sem 6 1 Pr paration lvi Sem 6 2 D but Sem 6 3 Milieu Sem 6 4 Fin Sem 6 5 R sultat Sem 6 6 R it ration Sem 6 7 Expression de la dur e
299. n tel objectif l chelle du lexique d une langue ne peut se faire sans une bonne formalisation des liens lexicaux En effet la formalisation permet partir d un chantillon de relations lexicales de traiter les relations de fa on syst matique l chelle du lexique d une langue voire d un ensemble de langues La formalisation s av re galement fondamentale dans une optique d impl menta tion pour la manipulation des donn es et la r alisation de nombreux traitements automatiques Le formalisme de description utilis dans la Lexicologie Explica tive et Combinatoire LEC les fonctions lexicales nous semble pour cela tout adapt Celles ci se pr sentent comme des fonctions math matiques mod lisant des relations lexico s mantiques particuli res entre une unit lexicale appel e mot cl et un ensemble d unit s lexicales appel es valeurs Par exemple l antonymie est repr sent e par la fonction Anti ex Anti joyeux triste maussade la relation entre un nom et le verbe d crivant son utilisation ou sa r alisation typique est mod lis e par les fonctions Real Fact et Labrealf par exemple INous devons apporter quelques pr cisions concernant les conventions d criture utilis es pour les fonctions lexicales et les unit s lexicales Les fonctions lexicales sont not es l aide de la fonte suivante Sioc Lorsqu elles ne sont pas expliqu es dans le contexte de citation nous les accompagn
300. ncepts On dira par exemple que le concept VENDEUR est li au concept ACHAT Ces deux concepts peuvent tre exprim s au moyen de diverses unit s lexicales dans un nonc y compris par des noms propres par exemple Pierre a vendu une voiture Mon voisin fait de grosses ventes cette semaine Ce vendeur sait vendre etc Ce n est donc plus l unit lexicale qui est retenue mais le concept appartenant une repr sentation mentale laquelle il renvoie dans la situation de discours Ces rela tions int ressent tout particuli rement les mod les cognitifs dont l objectif est de repr senter le fonctionnement du lexique mental On peut galement observer des relations mixtes conceptuelles et lexicales dans WordNet par exemple o certains ensembles de synonymes synsets peuvent tre associ s des unit s lexicales Ainsi les concepts SEDUCER et POLLUTER sont associ s aux unit s lexicales SEDUCER et POLLUTER et ont pour concept hyperonyme BAD PERSON qui n est pas lexicalis en anglais On parle par ailleurs de relations contextuelles ou textuelles pour d signer les re lations qu une unit lexicale entretient avec les autres unit s au sein d un m me texte ou d un m me paragraphe c est dire les unit s lexicales constituant son contexte d emploi 17 2 1 2 2 Dimension des relations lexicales Les relations entre unit s lexicales se situent sur deux dimensions La p
301. ncts 670 les FLNS adjectivales 727 et les FLNS nominales 820 Avant de d tailler les diff rentes facettes du syst me nous allons pr sent analy ser les classifications des FL propos es ant rieurement Ces classifications portent sur les FL standard simples Rappelons que notre objectif dans ce chapitre est d tendre la probl matique de la classification des FL toutes les FL c est dire des FL standard simples et complexes aux FLNS 5 1 1 Regard critique sur les classifications des fonctions lexi cales Depuis la fin des ann es 60 on recense un grand nombre de textes dans lesquels les FL sont pr sent es dont 1970 1996 1997b etc Certains de ces textes pro posent une classification ou typologie afin de regrouper les FL dans des classes ais ment identifiables Notons bien que ces classifications ne portent que sur les FL standard simples Apr s la parution de PILEC Mel uk et al 1995 la pr sentation des FL s est standardis e en une classification qui est majoritairement 157 reprise dans les articles et m moires portant sur les FL Nous reproduisons trois classifications d ja pr sent es et critiqu es par dans sa th se de doctorat ainsi que celle qu elle propose alors pour pallier les insuffisances des pr c dentes I nous semble que ces quatre tentatives entreprises par quatre auteurs des poques diff rentes illustrent l volution de la perception
302. ne classification multidimensionnelle permettant d atteindre une relation par des requ tes de nature tr s diverses Le mod le d organisation que nous avons propos est une repr sentation des FL sous forme d un syst me mettant en avant leurs diff rences et similitudes de fa on diff rentielle Nous avons d gag quatre dimensions d organisation du syst me la premi re organise les FL en classes s mantiques la seconde les regroupe en fonction des propri t s combi natoires qu elles partagent la troisi me a trait aux parties du discours des lexies en jeu dans une relation et enfin la derni re organise les FL en fonction des cibles communicationnelles vis es par les FL L implementation du syst me de FL a t r alis e sous la forme d une table de donn es MySQL qui s int gre la base de donn es g n rale du DiCo cf chapitre 258 6 Cette impl mentation nous permet d exploiter le syst me pour r aliser deux applications Premi rement nous avons cr un assistant l encodage des liens lexicaux qui partir de la s lection de param tres descriptifs d un lien lexical identifie le ou les FL les plus adapt es pour le repr senter Deuxi mement nous avons pr sent une m thode servant r cup rer et mettre profit les informations lexicales contenues dans une BLEC pour proposer une description automatique de certains champs de fiches lexicographiques Plus de 2 200 FL tous statuts con
303. nn lieu des ressources repr sentant non plus la connaissance mentale mais le sens des unit s lexicales Deux grandes approches sont distinguer l approche par traits s mantiques qui pr sente des unit s lexicales associ es des traits s mantiques ex anim s inanim s permettant de pr dire certains comportements ou structures syntaxiques l approche par r seaux lexico s mantiques dans lesquels les unit s lexicales sont d finies au moyen des relations qu elles entretiennent entre elles Enfin en dernier lieu on distingue les th saurus employ s dans les sciences de l in formation Un th saurus est un ensemble organis de termes repr sentatifs d un domaine de connaissances Le plus souvent il pr sente pour chaque terme un en 25 semble d informations facilitant la recherche documentaire des indications sur les conditions d emploi d un terme ainsi que des termes g n riques et sp cifiques qui permettent d largir ou de restreindre le champ de la recherche Dans la section suivante nous pr sentons plusieurs ressources relationnelles h rit es de ces diff rentes traditions 2 2 Panorama des ressources lexicales relationnelles Le panorama que nous pr sentons pr sent a pour objectif de mettre en perspec tive les principales ressources lexicales relationnelles actuellement disponibles Les ressources que nous avons retenues nous semblent repr sentatives de ce qui
304. normaliser les FLNS 1969 et ont propos quelques nouvelles FL d apr s des r gularit s observ es parmi un en semble de relations lexicales Frawley 1998 L Homme 2002 Jousse 2002 Jousse et ont postul quelques adaptations des FL aux relations terminologiques et ont r fl chi des moyens d homog n iser l encodage de certaines FLNS a travaill sur l ho mog n isation des gloses de vulgarisation des FL standard Cependant la question de l encodage des FLNS dans sa globalit n a pas encore t abord e Sans d tailler l ensemble de ces travaux nous en pr sentons quelques uns pour illustrer les trois grandes approches qui ont conduit la recherche de r gularit s une approche empirique une approche logique ainsi qu une approche par champs s mantiques 118 4 2 1 Approche empirique L approche empirique consiste proposer de nouvelles FL partir de l observation des liens lexicaux Il ne s agit pas d une m thode particuli re ni d une strat gie suivre mais plut t d une d marche visant d gager des analogies d apr s la simple observation d un ensemble de liens Cette m thode est la plus commun ment utili s e pour proposer de nouvelles FL c est galement cette approche que nous suivrons dans la section 4 3 1 Nous illustrons cette d marche l aide des propositions de 1969 d gag es au fur et mesure de l encodage de relations lexicales r c
305. novatrice dans la mesure o elle permet d organiser les FL sur le plan s mantique ind pendamment de la dimension combinatoire et des parties du discours des lexies en mots cl s et valeurs d acc der aux FL de fa on la plus intuitive possible gr ce une structuration souple des donn es les sous classes ne sont pas fig es l int rieur d une classe donn e mais peuvent se trouver sous plusieurs classes de mettre sur le m me plan les FL standard simples et combin es semi standard localement standard et non standard Cette organisation s mantique a un r le majeur jouer dans une optique de re cherche d informations lexicales Un des objectifs du syst me de FL est en effet de servir la confection d interfaces de consultation dans une base de donn es lexicale De cette fa on l organisation s mantique des FL peut donner lieu une interface s mantique dont le r le est de fournir partir d une entr e de dictionnaire une classification de ses collocatifs et d riv s s mantiques selon des classes s mantiques Nous illustrons ce type d interface l aide de la lexie BATEAU dans la figure v EQUIVALENCE b Lexies similaires b Conversifs b Reformulation syntaxique v OPPOSITION gt Contraires Conversifs Equivalent masculin f minin v ELEMENT ENSEMBLE gt Hi rarchiques gt Partie tout Famille Unit r guli re ensemble r gulier Chef qu
306. ns d termin les attributs de fa on empirique partir de l observation des FLNS du DiCo Nous avons tent de respecter au maximum le principe d conomie dans la d termination 148 des attributs afin de contr ler et limiter leur nombre Toutefois lorsqu un attribut potentiel recouvre un certain nombre de sous types diff rents nous le scindons en diff rents attributs Par exemple les relations ayant trait a Paspect d une entit sont r parties entre les attributs COULEUR FORME TAILLE MATERIAU FABRICATION et ORIGINE comme on peut le voir dans les exemples ci dessous L attribut ASPECT a tout de m me t conserv pour repr senter les relations qui n entrent pas dans un de ses sous types ASPECT Qui est orn de plumes chapeau plumes plumet Durci renforc par une armature m tallique b ton arm COULEUR De couleur blanche barbe blanche De couleur grise barbe grisonnante poivre et sel 1 FORME Qui a une forme vas e barbe en ventail Qui comporte deux niveaux pour les passagers wagon imp riale TAILLE Fait pour tre utilis simultan ment par deux personnes drap double Fait pour tre utilis par une seule personne drap simple MAT RIAU Qui est fait de feutre chapeau feutre Qui est fait de paille chapeau de paille FABRICATION Qui est fabriqu par cuisson jambon brais Qui est fait pour ce qui est du
307. ns la mesure o elles in cluent CORPS dans leur d finition bras de X jambe de X t te de X partie du corps de X En revanche la lexie NEZ doit tre consid r e comme une partie du visage plut t que comme une partie du corps Selon ce principe la lexie ROUE n est pas consid r e comme un m ronyme de AVION car elle ne se d finit pas par rapport AVION mais plus largement par rapport un v hicule En revanche la lexie TRAIN D ATTERRISAGE 1 inclut n cessairement AVION dans sa d finition elle est donc consid r e comme un de ses m ronymes La relation de m ronymie peut couvrir selon l approche envisag e un certain nombre de sous types Nous consid rons ici la m ronymie comme une relation partie constituante tout Les relations ingr dient entit et mat riau entit seront repr sent es par une autre FL propos e a la section suivante La FLNS Mero permet de remplacer un certain nombre de FLNS tr s similaires comme illustr en 54 ci dessous 54 a Partie de pingle t te tige pointe b Partie de que l on remplit d eau vier bac cuvette c El ment du corps de abeille dard La relation inverse l holonymie illustr e en 55 n est pas non plus repr sent e par une FL standard dans le DiCo Nous sugg rons la cr ation de la FL Holo 55 Entit g ologique dont fait partie plaque 1 3 terre 1ll corce terrestre lithosphere 125
308. ns la phrase annot e sont associ s des patrons de r alisation grammaticale Les donn es de FrameNet sont disponibles en ligne sous la forme de notices na vigables d un graphe et d une base de donn es dans laquelle on peut faire des recherches On peut avoir acc s plusieurs utilitaires num r s ci dessous 38 Un index de cadres pr sente une liste cliquable de tous les cadres d crits A chacun est associ e une d finition ses diff rents l ments des exemples et une liste d unit s lexicales appartenant ce cadre Un index d unit s lexicales pr sente l ensemble des unit s lexicales Chacune d entre elles poss de une fiche contenant le cadre qu elle voque une d finition une liste des gouverneurs syntaxiques ex pour CAKE BAKE EAT DECORATE etc ainsi que la liste des l ments du cadre et leurs r alisations syntaxiques Des textes annot s En plus du travail lexicographique FrameNet a entrepris un projet d annotation de textes pour d montrer dans quelle mesure le projet peut contribuer au balisage de l information contenue dans les textes L annota tion consiste marquer les l ments des cadres voqu s par les unit s lexicales dans chaque phrase FrameSQL est un mode de recherche expert gr ce auquel on peut effectuer des recherches sp cialis es dans toute la base de donn es Il est possible de faire des requ tes en combinant tous les champs possibl
309. ns le domaine du TAL Nous avons galement retenu MindNet en raison de l originalit de la m thodologie 26 selon laquelle la ressource est labor e et de la vari t de relations qu il propose D autres ressources ne sont que bri vement pr sent es Nous en proposons une syn th se comparative dans le tableau p 55p 2 2 1 Le DiCo Le DiCo est une base de donn es lexicale d velopp e par Alain Polgu re et Igor Mel uk l Observatoire de Linguistique Sens Texte de l Universit de Montr al Il est labor d apr s les principes th oriques de la LEC 1995 Ce modele lexicographique a donn lieu de nombreuses ressources Comme nous l avons mentionn dans l introduction on en distingue deux types les DEC dic tionnaires papier et les BLEC bases de donn es lexicales relationnelles Ces der ni res contiennent quasiment les m mes donn es que les DEC mis a part les d fini tions et fournissent une interface avec des possibilit s de requ tes plus vari es La plupart de ces ressources sont pr sent es en d tail annexe li Dans la pr sente section nous insistons plus particuli rement sur le DiCo Notons cependant que les types de donn es pr sent es ici figurent dans la majorit des DEC et des BLEC Le DiCo compte actuellement 538 vocables soit 1125 unit s lexicales acceptions et 26 093 liens lexicaux d crits Sa nomenclature se focalise avant tout sur la des cription des lexies les
310. ns un cadre plus large que la simple normalisation des FLNS Les attributs sont intimement li s aux classes s mantiques de FL que nous d finirons dans le module d organi sation semantique au chapitre suivant et au sein desquelles ils prendront place Ainsi sous la classe s mantique LOCALISATION on pourra trouver aussi bien des FL standard comme Sioc et Loci que des FLNS du type Qui est le dernier dans 151 un ensemble ou encore Telle qu elle est sous la terre qui auront entre temps subi une normalisation de leur encodage selon le principe que nous pr sentons dans le paragraphe suivant 4 5 2 2 Encodage normalis des attributs dans les FLNS Les FLNS adjectivales collocatives exprimant un attribut particulier peuvent main tenant tre encod es selon un patron bien d fini L encodage que nous proposons rev t la forme d une fonction 4 deux arguments un param tre venant pr ciser ce qui est dit de l attribut ainsi que le mot cl traditionnel des FL Le mod le ainsi obtenu est le suivant Attribut param tre mot cl valeurs par exemple Forme vas e barbe en ventail Cible grand public cin ma 1 1 commercial Ce nouvel encodage permet d organiser les FLNS dans les bases de donn es lexi cales Plut t qu une liste de FLNS non structur e un utilisateur peut rep rer les relations qu il recherche selon ces attributs Voyons un exemple avec les FLNS ad jectivales li es aux unit
311. nt de participer 4 des taches de traitement au tomatique nous pr sentons dans la section IT 5 les recherches qui ont t men es en traduction automatique g n ration de texte et production de r sum s automa tiques II 1 Ressources lexicales g n rales Le Dictionnaire Explicatif et Combinatoire DEC Le Dictionnaire Explicatif et Combinatoire DEC a t d velopp pour le fran ais Mel uk et al 1984 1988 et pour le russe Mel uk et Zholkovsky XXX 1984 Quelques articles de dictionnaire ont t r alis s pour l anglais 1990 le chinois 2006 l arabe 2008 le dene suline Holden para tre et le wolof Bondeelle para tre Nous ne pr sentons ici que le DEC r alis sur le fran ais c est dire le Dictionnaire Explicatif et Combinatoire du Fran ais Contemporain Il en existe quatre volumes d crivant 508 vocables Le DEC est tr s souvent qualifi de dictionnaire de recherche formel Il met directe ment en application les principes th oriques de la LEC Pour chaque unit lexicale d crite le DEC fournit trois types majeurs d information Nous prendrons pour les illustrer l exemple de la lexie BOURRASQUE II 1 Premi rement le DEC fournit des informations de type s mantique sur les unit s lexicales d crites par le biais d une d finition analytique constitu e de composantes s mantiques l mentaires Bourrasque de X sur Y Violente temp te 1L1 soudain
312. nt donner lieu des possibilit s de consultation plus adapt es aux besoins des utilisateurs Les travaux r alis s trouveront galement une utilit dans les domaines de la didactique des langues et des technologies de Pinformation et de la communication au service de Penseignement dans le cadre desquels on pourra d velopper des outils d aide la r daction 1 3 Organisation de la th se Les diff rents aspects trait s dans la th se sont r partis en sept chapitres le pre mier tant la pr sente introduction Le deuxi me chapitre est destin poser le cadre conceptuel de la th se en d finis sant les concepts phares de notre travail notamment les relations lexicales prises en compte Il vise galement situer notre cadre d tude justifier la pertinence de notre d marche et souligner les points forts des autres approches th oriques dont nous pourrions tirer profit Le troisi me chapitre dresse un bilan des FL Nous prenons soin de pr senter de fa on ind pendante la notion de FL et les diff rentes formes d encodage sous lesquelles elle se mat rialise Nous discutons de certains aspects th oriques et for mels qui mettront en avant notre d marche et la contribution apport e par la th se Le quatri me chapitre est destin la normalisation d un ensemble particulier de FL auxquelles on attribue un statut non standard Apr s une discussion sur les diff rents statuts assign s aux FL
313. nt qu un tre humain adulte conna t plus de 50 000 mots et qu il peut y acc der tr s rapidement pour s exprimer 63 elle postule qu il doit exister une organisation systematique du lexique mental A partir d indices tels que les troubles pathologiques de la parole les lapsus ou dis torsions langagi res les exp rimentations psycholinguistiques et les travaux men s en linguistique de corpus il est possible de d gager des indices de la structuration mentale du lexique Cependant un tel niveau de complexit ne peut tre appr hende et mod lis que de fa on superficielle et partiellement valide dans la mesure o il ne s appuie que sur des fonctionnements hypoth tiques et non sur des donn es tangibles Elle compare donc son mod le un plan du m tro londonien c est dire des diagrammes simplifi s encapsulant des traits saillants d un ph nom ne en v rit consid rablement plus complexe Elle distingue plusieurs probl mes d or ganisation du lexique qui devront tre interconnect s pour former l bauche d un mod le du lexique mental Voyons quelles conceptions du lexique sont suppos es dans ses travaux La nature des sens lexicaux le sens des unit s lexicales est envisag selon la th orie du prototype 1973 plut t que d un point de vue discret c est dire en isolant et en d crivant les diff rents sens pour une unit lexicale donn e Les relations entre les unit s
314. ntiReal Dont la fonction n est pas remplie Les autres propositions semblent int ressantes mais n ont pas t retenues dans le DEC ni dans le DiCo Un d savantage de l approche empirique est qu elle consid re des nouvelles FL de fa on isol e Aussi m me si elle offre la possibilit de d couvrir de nouvelles fonctions elle ne se r v le pas toujours pertinente si les FL ne sont pas cr es avec une volont d integration au sein d un syst me plus g n ral de FL Selon 2007 57 There should be at the same time a strong commitment to continuing to consider the set of standard LFs as a system with strict theoretical foundations and therefore to carefully examine how LF candidates can find their place in this system Without such discipline the modeling tool of standard LFs will soon become a huge mess It will lose its elegance and eventually its usefulness Ce principe d int gration un syst me de FL nous semble tr s important Nous Perigeons en crit re pour la validation des FL que nous proposons en 4 3 1 4 2 2 Approche logique L approche logique consiste partir d une observation pr cise du fonctionnement des FL afin d en inf rer logiquement de nouvelles Voyons l exemple des FL in 120 verses suivant une approche logique ou th orique 19901 propose la notion de fonction inverse en faisant remarquer qu un sous ensemble de fonctions pour rait logiquement se voir ass
315. ntique La troisi me approche consiste envisager des r gularit s en traitant les relations associ es des lexies de m me champ s mantique par exemple les relations des lexies d animaux de sentiment etc a effectu une recherche dans le but d tablir une classification de FLNS et FL semi standard en effectuant des regroupements de lexies partageant les tiquettes s mantiques animal et artefact L objectif de ce travail est de d gager parmi toutes les FL associ es ces lexies 121 des classes s mantiques de FL et d en d duire une normalisation en comparant les diff rents encodages Pour les FL des lexies subordonn es Petiquette animal vingt deux classes ont t cr es cf fig 4 1 El ment de la lign e de Connotation li e d une esp ce particuli re Adjectif tir d une connotation nominale Esp ce particuli re de Equipement pour Particularit physique de Nom propre de Trait distinctif de Action ou activit d un individu impliquant El ment du corps de Activit professionnelle li e Nourriture de Personne dont l activit professionnelle est li e Particularit comportementale du mode de vie de Artefact con u par X pour attraper tuer se Quelque chose produit par prot ger de utilis conditionn pour faire quelque Habitat de chose Caract risation du lieu ot l on trouve Produit d riv de Excr ment de Figure 4 1
316. nu s mantique est repr sent par une configuration de la relation pr dicat argument entre des primitifs s mantiques qui correspondent des FL d j identi fi es par la th orie Sens Texte Celles ci sont accompagn es de notations formelles qui r f rent des sens sp cifiques lt gt repr sente le sens du mot cl 1 2 3 renvoient aux premier deuxi me et troisi me actants s mantiques du mot cl et Q a d autres participants s mantiques non sp cifi s Par exemple pour la lexie COL RE 106 Caus 2 3 Y Z cause la col re de X 2 met X en col re Sympt poings de X la col re de X est symptomatis e par les poings de X X sert les poings de col re La structure syntaxique est exprim e au moyen de deux types d information sur les valeurs de la fonction leur partie du discours et leur diath se c est dire la liste de leurs d pendants syntaxiques par ordre croissant d oblicit Les trois exemples de la figure donnent une illustration de l encodage explicite complet pour les FL Funci Oper et Opera Le premier rang repr sente le contenu s mantique le second le contenu syntaxique Les trois verbes tant des verbes support soit s mantiquement lt vides gt le contenu s mantique de la FL est donc quivalent celui du mot cl lt cf figure B 7 Func ve col re habiter N X Oper P col re prouver ART
317. nvois d finitionnels entre verbes Le mod le computationnel travaille a partir d un graphe de dictionnaire et calcule des similarit s entre ses sommets les entr es du dictionnaire en question La m thode choisie pour extraire le graphe du dictionnaire consiste 4 prendre pour sommets du graphe les entr es du dictionnaire et admettre l existence d un arc de sommet A vers un sommet B si et seulement si l entr e B appara t dans la d finition de l entr e A en pr sente une illustration autour du sommet ECORCER A partir de la d finition suivante CORCER ek Rse v tr D pouiller de son corce un arbre D cortiquer peler le grain les fruits et en appliquant la proc dure que l on vient d exposer on arrive au r sultat expos dans la figure En r it rant cette construction pour chacune des entr es du dictionnaire on obtient le graphe du dictionnaire Si l on ne s int resse qu aux seuls verbes apparaissant l infinitif dans les entr es verbales on r cup re l ensemble de verbes repr sent dans la figure Cette m thode permet donc d obtenir des s ries de verbes reli es par approximation s mantique Gaume et Duvignau 2004 251 Texpliquent comme suit Cet algorithme met au jour les structures topologico s mantiques des graphes de dictionnaires parmi lesquelles figurent la prox mie qui 59 fruit e d cortiquer Figure 2 5 Repr sentation du graphe de CORCER
318. o gies entre paires d unit s lexicales Nous traitons en d tail de cette probl matique 22 au cours du chapitre 4 dans lequel nous cherchons explorer deux m thodologies permettant d tudier les m canismes de mise en valeur d analogies entre relations lexicales 2 1 2 6 Identification et mod lisation des relations lexicales Selon les mod les du lexique et les ressources qui en sont issues les relations re pr sent es ne sont pas toujours identifi es de la m me fa on voire ne sont pas identifi es du tout Le Redes dictionnaire des collocations de l espagnol 2004 fournit pour chaque unit lexicale d crite un grand nombre de collocations sans les identifier ni d un point de vue s mantique ni sur le plan syntaxique c est a dire en indiquant la structure syntaxique impliquant le mot cl et le collocatif donn La plupart des dictionnaires de collocations sont construits de cette fa on D autres modeles comme WordNet identifient simplement les relations sur le plan s mantique en les nommant synonymie antonymie hyperonymie etc Certaines ressources proposent une classification selon des patrons de structures de d pen dances syntaxiques N Adj N V etc sans toutefois fournir de description s mantique C est le cas par exemple de la base de donn es lexicale Elexico ou de Antidote Charest et al 2007 La LEC fournit quant 4 elle une modelisation des relations au moyen des fon
319. o la d rivation mor phologique proc de par analogie et non par cas isol s La parent morphologique invite d tecter les autres relations construites analogiquement Ainsi on trouve sur le mod le de FARINE FARINEUX les paires CIRE CIREUX P TE PA 133 TEUX LAIT LAITEUX etc Afin de mettre en valeur le lien existant entre les FL repr sentant des relations lexicales r currentes et les d riv s morphologiques nous introduisons la notion de d rivat me d velopp e par Mel uk dans le Cours de Morphologie G n rale Les d rivat mes ou affixes d rivationnels sont des significations lexicales servant former de nouvelles unit s lexicales qu on appelle d riv s morphologiques Par exemple la lexie ARROSOIR est d riv e de ARROSER par le d rivat me nom d ins trument marqu par le suffixe oir le verbe anglais TO MODERNIZE est d riv de MODERN par le d rivat me transformatif marqu par le suffixe ize etc Se lon les langues les sens port s par les d rivat mes par exemple transformatif ou causatif etc ne s expriment pas tous au moyen d affixes derivationnels Certaines langues n cessitent l emploi d une unit lexicale suppl mentaire Par exemple alors qu en abkhase langue de la famille nord caucasienne il existe un infixe r expri mant la causation le fran ais et l anglais utilisent les verbes FAIRE et MAKE pour exprimer ce sens Abkhase abar
320. o de colocaciones en espanol y sus aplicaciones Dans Paz Bataner et Janet de Cesaris dir De Lexicographia Actas del I Simposio internacional de Lexicografia pages 149 162 Barcelona 2004 IULA Edicions Petici Margarita Alonso Ramos Glosas para un Diccionario de colocaciones del espanol Dans Margarita Alonso Ramos dir Diccionarios y Fraseologta Anejo de la Revista de Lexicograf a pages 59 88 Servicio de Publicaciones de la Universidad de La Coruna 2006 Margarita Alonso Ramos Synthesis of Support Verb Constructions Dans Leo Wanner dir Selected Lexical and Grammatical Issues in the Meaning Text Theory pages 97 137 John Benjamins Amsterdam Philadelphie 2007 Margarita Alonso Ramos Owen Rambow et Leo Wanner Using Semantically Annotated Corpora to Build Collocation Resources Dans Proceedings of the LREC 2008 Marrakesh 2008 Margarita Alonso Ramos et Agn s Tutin A Classification and Description of Lexical Functions for the Analysis of their Combinations Dans Leo Wanner dir Lexical Functions in Lexicography and Natural Language Processing John Benjamins Amsterdam Philadelphia 1996 263 Joel Altman et Alain Polgu re La BD f base de d finitions d riv e du Dictionnaire Explicatif et Combinatoire Dans Actes de la premi re conf rence internationale de Th orie Sens Terte MTT2003 pages 43 54 Paris Juin 2003 Juri Apresjan Systematic lexicography Oxford University Press Oxford 2000
321. ocables diff rents par exemple MORTx ou MORT ag dans la mesure o un vocable ne peut contenir deux lexies ne partageant pas la m me partie du discours Les deux autres crit res en revanche ne permettent pas de d terminer si les lexies sont en relation de co polys mie ou d homonymie Prenons l exemple des deux relations suivantes dont cinoche est la valeur et partir desquelles nous allons reconstituer deux fiches Syn cin ma 1 3 nom masc tablissement de spectacle fam cinoche Syn cinema if11 nom masc comportement fam cinoche TUn pont s mantique entre les lexies L1 et L2 est la composante non triviale commune leurs d finitions qui exprime formellement le lien s mantique direct ressenti entre les deux Mel uk 357 28 Notons qu il peut s agir de n importe quel format de type pr dicat argument Nous optons ici pour une structure de traits car elle offre une meilleure visualisation des donn es 251 Dans la premi re relation la FL Syn nous permet d inf rer que la valeur cinoche est nominale qu elle poss de une tiquette semantique similaire celle de la lexie CINEMA 1 3 soit tablissement de spectacle et qu elle est reli e cette der ni re par la FL Syn Par ailleurs on peut galement d terminer que la lexie est d usage familier Dans la seconde relation nous pouvons galement inf rer par le biais de la FL Syn que la valeur cinoche est nominale qu
322. ocier des fonctions inverses Par exemple la fonction Result Action r sultant de cf Result to buy to have to possess il est possible d associer une fonction inversant la relation Ainsi les valeurs de cette FL Result appliqu e la lexie TO HAVE seraient l ensemble des lexies pour lesquelles la fonction Result produit to have comme valeur soit Result to have to possess to get to obtain to steal to take De m me a partir de la FL Liqu Causer que n existe plus on pourrait logi quement inf rer une FL State pour inverser la relation 51 Liquidative mistake erase Causer la fin de 52 State erase mistake error Ce dont on cause la fin Cette r flexion conduit la cr ation de nouvelles paires de FL fonctionnant selon le principe d inversion comme les FL Antecedent et Consequent Antecedent shut event open state Action ant c dente Consequent open state shut event Action cons quente Un des avantages de l approche logique est qu elle permet de visualiser les FL comme formant un syst me partir duquel il est possible d inf rer de nouvelles FL qui sembleraient y occuper l gitimement une place Nous reprenons le concept de FL inverse dans le chapitre 6 et montrons comment il est possible de s appuyer sur certaines paires de FL pour inferer l encodage de certaines relations lexicales 4 2 3 Approche par champ s ma
323. od L d nu punub ap_ 165 uou uuol1ipe41 uo3e silli mopsym ouow 19108111 n s uno b s gzl lqut ssn ainsaw ap JPUN pn u navu ap ss siA el inod aunsaw ap aux q THonbruyo ap ua i ede ap aunsaw ap JPUN sunofnpo nvazpb ap d s Luv op yoqd q un q ep d yp 3s inb ap uoldudsued auan IZ ua0d N 1inpu ap aysuedy mv op asunoo 22209 auloqoafesy fipu abojad a1612 ap y unsuip ei o Luv op aunvu iuewesedep ua Jed ne ap adejuns ej e ssiel 2221 DD 1H 202000 ap 41 sav 4340q04409 is nb e pu ub u bol poruv g uoroduwuos a jauuolssajoid sed 3s u fl nb ajay IUIDLLIINOS uo yposiyun n n SNOS 459 ll nb 34010914 nvadvsp eouei4 ej 355 Z anb jay qowiof eddojaaua ap ll e L obnq buo O ans ypuejq v uwd yez uo Dane a2ueisqns ep uo d T IZ 9 1z020q anod juiod ne asiw I89 91e41S uayag uornow s eu x sigaig uognotu uu 291470912 J 210 d ap
324. ofonde sans borne vive Magn catastrophe 1 norme pouvantable grosse majeure c Universalit des FL Les FL standard sont consid r es comme des entit s lexicales universelles leur exis tence devant tre prouv e dans toutes les langues Toutefois la notion d universel linguistique doit tre entendue telle que 2003 122 la pr sente Les liens lexicaux tels que la synonymie sont particuli rement int res sants du fait que ce sont des UNIVERSAUX LINGUISTIQUES toute langue naturelle poss de la synonymie et apprendre une langue natu relle consiste aussi 4 apprendre encore une fois de fagon plus ou moins consciente que la synonymie existe Il est essentiel de distinguer un lien de synonymie donn qui lie deux lexies particuli res de la langue 75 et la synonymie elle m me en tant qu entit informationnelle en tant que type de lien universellement pr sent dans toutes les langues Ce que je viens de dire 4 propos de la synonymie s applique a d autres liens bien connus en lexicologie comme l antonymie ou la conversivit Cela s applique aussi de fa on plus g n rale toutes les FL standard 3 2 2 2 Les statuts de FL On accorde un statut aux FL selon qu elles respectent ou non les conditions pr sen t es ci dessus On distingue quatre statuts les FL standard les FL semi standard les FL localement standard ainsi que les FL non standard a Les FL standard Les F
325. ogical could only have been hinted at if I had decided to focus on a few dozen items and their seman tic environment instead of taking into account the whole metalinguistic apparatus of the dictionary 1997 102 L assignation manuelle des FL aux collocations est une t che fastidieuse qui bien heureusement peut tre facilit e par certains types de m talangage mettant en valeur des r gularit s C est le cas des micro d finitions qui dans le Robert amp Collins aident Vutilisateur choisir la traduction appropri e Certaines de ces micro d finitions sont r currentes et correspondent directement des FL Ainsi il est possible par exemple d inf rer la FL Mult ensemble r gulier partir des micro d finitions body of group of set of series of list of cluster of et number of de m me que la FL Sing unit r guli re peut tre inf r e des formules piece of member of flash of et act of Fontenelle 1997b 149 153 la lumi re de ces analogies les FL peuvent donc tre vues comme des d finitions tr s succinctes des relations lexicales La structure de la base de donn es con ue par Jacques Jansen dispose chaque type d information dans des tables s par es Elle permet une grande potentialit de requ tes on a la possibilit soit d interroger la base de donn es de fa on classique par exemple faire une requ te sur l unit brake pour obtenir les r sultats suivants part brak
326. ogique portant sur le vocabulaire de Tinfor matique d velopp e par Marie Claude L homme a POLST depuis 2002 Vis vis des autres ressources terminologiques le DiColnfo tire son origi nalit de son approche linguistique du vocabulaire sp cialis plus particuli rement une approche lexico s mantique directement inspir e du DiCo La m thodologie d laboration du DiColnfo est orient e corpus Les termes d crits et ceux qui leur sont reli s sont extraits l aide d outils d extraction Lemay et al 20051 et valid s selon des crit res lexico s mantiques 2005 Les descriptions reposent en premier lieu sur l observation du fonctionnement des termes dans un corpus sp cialis Un corpus contenant plus d un million de mots a t assembl cette fin Les entr es de la base de donn es comportent quatre types d information 1 le nom du terme ainsi que sa partie du discours et son num ro d acception par exemple Piratage 2a n m 2 la structure actantielle num re les actants s mantiques du terme et d crit ainsi que leur r le par rapport au terme d crit La structure actantielle de piratage 2a est la suivante de PATIENT donn es 1 logiciel 1 par AGENT utilisateur 1 Contrairement au DiCo les actants ne sont pas identifi s par des num ros mais par des r les s mantiques ex patient agent destination support lieu dont l objectif est de typer tr s g n ralement le r
327. ognare v espagnol so ar v r ver v intr imaginer se repr senter dans l esprit V allemand tr umen v intr anglais dream v_intr italien sognare v intr espagnol sonar despierto v_ intr FeM dictionnaire frangais anglais malais v intr faire des r ves anglais dream malais bermimpi d lirer plaisanter malais mengigau melamun imaginer malais membayangkan mengkhayalkan souhaiter malais berangan angan Je r ve de m acheter une maison au bord de la mer malais saya berangan angan hendak membeli sebuah rumah di tepi laut v tr anglais dream malais memimpikan mengidam idamkan Figure 4 Article R VER des dictionnaires ELRA et FeM 11 3 Ressources lexicales sp cialis es Les principes de la LEC ont galement t mis en application pour la cr ation de bases de donn es terminologiques Nous pr sentons dans cette section la fagon particuli re dont l approche lexico s mantique per oit et d crit les vocabulaires sp cialis s L avantage de l utilisation des FL sera pr sent par la suite travers Pexemple d une base de donn es terminologique le DiColnfo Une approche lexicologique de la terminologie L approche classique de la terminologie th oris e par W ster au d but du si cle dernier a donn lieu des courants ontologistes encyclop diques et conceptuels des vocabulaires sp cialis s Le terme y est vu comme un concept d signant un r f rent Toute question de sign
328. oit en trouver un synonyme une unit lexicale plus g n rique ou plus sp cifique Par exemple si la lexie HACHE est d finie comme un artefact servant 29 couper ce qui en fait un d riv s mantique de COUPER elle est galement consid r e comme un d riv semantique des verbes TRANCHER FENDRE etc 2 La relation s mantique entre L et L est r currente dans la langue Par exemple la relation entre HACHE et COUPER artefact servant est r currente en fran ais FRAPPER MARTEAU OUVRIR CL FUMER PIPE etc 3 La relation entre L et L peut s exprimer au moins marginalement de fa on morphologique dans la langue d crite Dans certaines langues cette rela tion s exprime de mani re r guli re par de la d rivation morphologique ou de la polys mie r guli re Par exemple pour la relation artefact servant a on trouve en fran ais les d rivations suffixales suivantes bouch er bouch on ras er ras oir d capsul er d capsul eur etc D apr s cette troisi me condition les d riv s s mantiques d une lexie L peuvent donc tre des d riv s morphologiques de L comme dans l exemple 1 des lexies sans aucune parent morphologique avec L comme en 2 ainsi que des lexies en relation de co polys mie avec L les lexies MOUTON I b viande et MOUTON I c fourrure ou cuir en relation de co polys mie avec MOUTON La
329. om relatif celle en d bute directement par un participe pass de la m me fa on les trois FLNS adjectivales 50c et 50e sont formul es selon trois structures syntaxiques diff rentes 50 a Qui est commis par des soldats pendant une guerre crime de guerre b Commis par Adam et Eve p ch originel c Provoqu volontairement des fins th rapeutiques abc s de fixation d des pirates drapeau noir e Tel que Z est la France drapeau tricolore 4 1 3 Organisation du chapitre La recherche de nouvelles FL et la volont de normaliser l encodage des FLNS n est pas une probl matique nouvelle Certaines m thodes de recherche ont d ja t propos es nous les pr sentons la section Nous consacrons la section 4 3 a la pr sentation de regroupements de FLNS effectu s de fagon empirique sans strat gie particuli re Certains de ces regroupements de FLNS peuvent donner lieu a la cr ation de FL uniques pouvant tre consid r es comme de bonnes candidates au statut standard d autres ne seront que des FLNS normalis es Toutefois m me si la simple analyse des donn es du corpus permet de d gager des similarit s entre relations nous pensons qu il est galement n cessaire d laborer des strat gies la fois pour le rep rage des r gularit s s mantiques et pour la r gularisation de leur encodage Nous avons labor deux m thodologies qui permettront d une part de d finir plus pr
330. on 1834 Douglas J Herrmann Roger Chaffin M P Daniel et R S Wool The Role of Ele ments of Relation Definition in Antonym and Synonym Comprehension Zeitsh rift f r Psychologie 194 2 133 153 1986 Lidja Iordanskaja Myunghee Kim Richard Kittredge Benoit Lavoie et Alain Pol gu re Generation of Extended Bilingual Statistical Reports Dans Proceedings of the 14 International Conference on Computational Linguistics COLING 1992 vol 3 pages 1019 1023 1992 Lidja Iordanskaja Richard Kittredge et Alain Polgu re Implementing a meaning text model for language generation Dans Proceedings of the 199 International Conference on Computational Linguistics COLING 88 pages 22 27 Budapest 1988 Lidia Iordanskaja et Alain Polgu re Hooking up Syntagmatic Lexical Functions to Lexicographic Definitions Dans Proceedings of the Second International Confe rence on the Meaning Text Theory pages 176 186 Moscou 2005 Anne Laure Jousse D rivation morphologique de termes analyse en corpus sp cialis et mod lisation au moyen des fonctions lexicales M moire de maitrise Universit du Maine Le Mans 2002 269 Anne Laure Jousse Normalisation des fonctions lexicales non standard M moire de maitrise Universit Paris 7 Denis Diderot 2003 Anne Laure Jousse Extension de l encodage formel des fonctions lexicales dans le cadre de la lexicologie explicative et combinatoire Dans Actes de TALN 2007 pages
331. on 4 3 2 1 127 par exemple Metrcapacite clinique 1 lit Metrcapacite restaurant couvert 181 5 2 2 4 Classe PARTICIPANTS Nous regroupons sous la classe PARTICIPANTS les composantes semantiques li es a expression d un participant de la situation d not e par le mot cl Il s agit bien souvent des actants du mot cl mais l on retrouve galement des participants ext rieurs Nous distinguons donc deux sous classes La premi re sous classe rassemble les composantes s mantiques li es aux actants du mot cl par exemple Si chanter 1 1a chanteur BonS 2 d bat 2 d batteur AntiBonS compliment a flatteur n complimenteur faiseur de xs Ai angoisse en proie ART saisi de ART angoiss Able bagarre a bagarreur adi Quals haine odieuz La seconde sous classe regroupe les composantes identifiant les participants ex t rieurs dont ceux repr sent s par les FL de la sous classe Chef quipe d crite plus haut par exemple Individu qui a l habitude d essayer de se faire offrir manger par les gens contre leur gr assiette a pique assiette Individu qui aide la femme Y au moment de naissance 1 1 accou cheuse sage femme Cap majorit 1 3 chef leader Equip navire quipage 5 2 2 5 Classe QUALIFICATIFS Le terme qualificatif doit tre ici interpr t au sens large Il ne s agit pas uniquement d adjectifs q
332. onctionnement des FL soit les trois premiers niveaux de repr sentation Nous renvoyons le lecteur aux textes introductifs tels que 1997 1998 ou Kahane 2003a pour une pr sentation plus d taill e de la Th orie Sens Texte Repr sentation s mantique Repr sentation syntaxique profonde Repr sentation syntaxique de surface Repr sentation morphologique profonde Repr sentation morphologique de surface Repr sentation phonologique Repr sentation phon tique Figure 5 7 Niveaux de repr sentation de la Th orie Sens Texte Nous nous servirons de la phrase Paul accuse I 1 Pierre de paresse pour illustrer ces trois niveaux Le premier niveau constituant la repr sentation s mantique d crit la structure s mantique d un ensemble potentiel de phrases quasiment syno nymes Il s agit d un graphe connexe orient dont les n uds sont tiquet s par des unit s s mantiques correspondant des acceptions d unit s lexicales Certaines de 194 ces unit s s mantiques sont des pr dicats comme le verbe ACCUSERZ 1 et le sub stantif PARESSE d autres des noms s mantiques par exemple PAUL CAILLOU Les arcs du graphe sont tiquet s par des num ros distinctifs sp cifiant les diff rents actants s mantiques du pr dicat Par exemple le verbe ACCUSER I 1 contr le trois positions actantielles X accuse Y du fait Z On repr sentera donc la phrase Paul accuse I 1 Pierre de paresse de
333. onn lieu la cr ation d Eu roWordNet 1998 une base de donn es multilingue constitu e de r seaux pour plusieurs langues europ ennes Les diff rents r seaux sont structur s sur le modele de WordNet c est a dire selon des ensembles de synonymes ou synsets reli s par quelques relations s mantiques de base Chacun des r seaux repr sente un syst me interne propre la langue d crite Parall lement ces descriptions in dividuelles les r seaux sont connect s un index interlangue fond sur WordNet permettant d tablir des quivalences d une langue une autre Notons que ont travaill sur l ajout des relations syntagmatiques dans le r seau espagnol d EuroWordNet Il existe galement un autre projet multilingue fond sur le projet de Princeton MultiWordNet Ce projet est d velopp partir d une base de donn es de Titalien dont la structure est rigoureusement identique a celle de WordNet Il existe depuis peu une version WordNet libre d acc s pour le fran ais WOLF 2008 Ce projet a t cr dans le but de combler les lacunes du WordNet francais labor dans le cadre d EuroWordNet non libre d acc s et relati vement peu d velopp La structure de WOLF est tr s proche de celle du WordNet de Princeton Certaines de ces donn es sont par ailleurs li es 4 d autres ressources lexicales du fran ais comme le Lefff 2010 et DicoSyn Ploux et Victorri MultiwordNet est accessib
334. ons de gloses explicatives not es comme suit Nom d endroit typique par exemple pour la fonction lexicale Sioc Les valeurs de fonctions lexicales sont parfois accompagn es d un r gime qui pr cise la fa on dont elles s emploient par exemple Real bateau piloter ART signifie que le verbe PILOTER employ dans ce contexte doit tre suivi d un d terminant ART et du mot cl Les unit s lexicales figurant dans les exemples de fonctions lexicales qu elles soient mots cl s ou valeurs sont not es en italique Hormis ce cas ci elles sont crites en PETITES MAJUSCULES La num rotation des lexies correspond celle utilis e dans le DiCo Comme nous sommes consciente que le lecteur ne peut acc der au DiCo pour v rifier de quelle acception il est question nous citons Reali bateau naviguer sur ART piloter ART Facto ciseaux couper Labreal2 chiffon ta essuyer frotter nettoyer N Y avec ART La motivation initiale des fonctions lexicales est la traduction automatique Tou tefois il s agit galement de donn es essentielles pour la mod lisation des relations lexicales d une langue donn e Les fonctions lexicales sont utilis es dans diverses applications mono ou multilingues de traitement automatique des langues TAL telles que la g n ration de texte et le paraphrasage Nous souhaitons dans ce tra vail leur donner une nouvelle perspective d ordre lexicographique
335. ons entre un nom d en tit et le nom de la marque laiss e par cette entit Les exemples ci dessous montrent que cette relation s exprime au moyen de substantifs diversifi s et propres aux unit s lexicales en mot cl Cependant si la condition de diversit semble sa tisfaite ce n est pas le cas pour les deux autres conditions Le nombre de lexies concern es est relativement restreint et la FL ne s int gre pas avec d autres FL standard Nous proposons donc un encodage normalis la formule Marque Rap pelons que les anciennes formules de FLNS serviront de gloses pour pr ciser le sens de la relation 59 a D p t qui se forme au fond d un contenant de bi re 1 a lie b Trace laiss e a la surface de l eau en d placement navire sillage Sequelle de plaie 1 cicatrice balafre d Marque laiss e dans le sol par un pneu empreinte trace 4 3 2 3 Document associ La relation que nous souhaitons encoder ici unit un fait et un document t moi gnant de ce fait comme illustr par les exemples en 60 Pour cette relation on observe une fois de plus que les valeurs sont diversifi6es et tr s d pendantes des lexies auxquelles la relation s applique La condition de cardinalit semble tre plus difficilement satisfaite Enfin pour ce qui est du crit re d int gration cette FL reste relativement isol e des autres FL existantes Cependant il nous parait utile de mettre en valeur ce
336. ont 31 choisis respectivement en fonction de la lexie source de la d rivation s mantique et de la base de la collocation MALADE se combine avec GRAVEMENT BLESS avec GRIEVEMENT etc Ces relations tant orient es d une lexie de d part vers une lexie cible elles pourront donc tre mod lis es l aide de fonctions lexicales Les fonctions lexicales prennent en tant que mot cl la source d une d rivation s mantique ou la base d une collocation et retournent respectivement un ensemble de d riv s s mantiques ou de collocatifs Les fonctions lexicales sont mat rialis es sous la forme d un encodage forme permettant de les manipuler dans des traitements automatiques Le chapitre suivant tant enti rement consacr leur pr sentation nous ne nous tendons pas plus longtemps sur la question Nous souhaitons apporter quelques pr cisions sur la distinction entre les relations paradigmatiques et les relations syntagmatiques Nous avons introduit plus t t dans le chapitre p une distinction entre les relations lexicales et les liens lexicaux ces derniers constituant des occurrences des premi res De cette fa on la relation lexicale d hyponymie est instanci e 4 travers un grand ensemble de liens lexicaux dont les six suivants Hypo bateau bac Hypo grade 41 capitaine Hypo bateau barque Hypo grade 1 commandant Hypo bateau chaloupe Hypo grade 1 lieutenant Il arrive que des relations lexica
337. opos est relativement sommaire dans la mesure oti mise part la distinction initiale opposant les substitutions aux param tres semantiques aucune sous classe n est propos e Par ailleurs les param tres se r sument une longue liste d sordonn e de FL Dans les classifications qui ont suivi on remarque que la distinction entre param tres s mantiques et substitutions a volu vers une opposi tion entre FL syntagmatiques et FL paradigmatiques Toutefois nous devons bien garder l esprit que ces deux paires de notions ne sont pas quivalentes Les substi tutions ne constituent qu un sous ensemble des FL paradigmatiques et peuvent en outre s exprimer de fagon syntagmatique avec le mot cl Les param tres peuvent se r partir la fois parmi les FL syntagmatiques par exemple Real Magn etc et parmi les FL paradigmatiques par exemple Sioc Gener Anti etc 5 1 1 2 Classification de Steele et Meyer 1990 La classification propos e par Steele et Meyer 1990 vingt ans plus tard repose sur Vopposition entre les FL syntagmatiques et les FL paradigmatiques qui comme nous venons de le mentionner a relay entre temps la pr c dente opposition entre param tres s mantiques et substitutions Ils d finissent ces deux grandes classes de la fa on suivante Steele et Meyer 1990 _ 42 159 The paradigmatic class consists of functions that are based essentially on meanings regularly associated with
338. orpus ou en utilisant celles d ja identifi es dans des dictionnaires de collocations d mettre des hypoth ses sur les FL ad quates pour les repr senter La plupart des outils d extraction de collocations comme Les Voisins de Le Monde Bourigault et Galy 2005 identi 261 fient les patrons syntaxiques d une lexie et de ses collocatifs ce qui r duit d j consid rablement les FL potentielles pour une relation Nous souhaitons galement perfectionner l assistant l encodage de FL pr sent au sixi me chapitre afin d en faire une application plus interactive que les simples requ tes au format SQL Rappelons que cet assistant a pour objectif partir de la s lection de plusieurs param tres d crivant une relation lexicale de d terminer la ou les FL les mieux adapt es pour encoder Parall lement ces travaux pour l aide a la r daction de BLEC nous envisageons la cr ation d interfaces de consultation Nous avons d j voqu ce travail au cours du cinqui me chapitre de la th se ainsi que dans Jousse et al et 2007b Il s agit d offrir aux utilisateurs de BLEC plusieurs types d acc s aux relations lexicales propos es pour une unit lexicale donn e partir du syst me de FL et de ses diff rentes perspectives d organisation il est possible de d velopper directement quatre interfaces proposant 1 un acc s onomasiologique permettant de trouver le bon collocatif ou d riv s
339. orter ART e Qui est un symbole de respect pour le mort N Real cowronne 1 2 d poser ART f pour subsistance Real plume TIL a vivre de A poss X g En tant que carri re Real th tre 1 1 faire du S il est n cessaire d ajouter aussi fr quemment des notations aux FL c est peut tre que l encodage n a pas t suffisamment bien con u en amont et n a 103 pas dans tous les cas pr vu la gestion de diff rents niveaux de granularit 3 3 3 3 R gles de formation de l encodage traditionnel Le troisi me aspect que nous souhaitons aborder est l absence de v ritables r gles de formation de l encodage traditionnel Nous avons pu le constater travers les nombreux exemples de FL semi et non standard cit s dans le chapitre 1 La structuration des formules de FL semi standard Les FL semi standard forment un ensemble tr s h t rog ne Les notations accompagnant les FL standard ne sont pas r dig es selon un patron d fini et ne respectent aucune norme d criture Nous pensons qu il serait utile d tablir une grammaire de formation des FL semi standard qui d une part identifie le type de composantes sur lequel on apporte une pr cision mani re cons quence finalit etc et d autre part permette de r gulariser la syntaxe des notations 2 La structuration des formules de FL non standard Les fonctions non standard quant elles sont encod es selon
340. osne X ap sne A K N uroor suv wayouapap omuvpy Toun4tsneT sinaisnid 11U91q0 p ua A s sav 437291109 T ebvubr0ws97 02uny4Zsnez sinsisnid A eu anb s sne x suv sassnod j nouu0n 075e41sneT sganbuqey ub suv vazquassn T I Z Zg729nbmoq 05ungsneo 4842U2129q uoypubow 6 08 auf uorvurbnunr 0y5e4sneT ne Anou ap s sne yobs ubd sav s n dini ez jHoouans 0ounnesanou aqsnes J uuon uoj nesanou ub sav tuonoq p qsneo XX11 X ap 1070001 A KEN LuV 41000904 if dnos tuedO AIOA 2 1 A Luv 41009001 4nvapvo tsadO aiqns x Z N suep A N LB 9087 Luv vasswoua mf p 66H do sanbiunuwos x A N av auqzawa T yfquowassi19a0 tTisdO x v l 242909 T 1 27104794 H d asies sed au A suv _wassnd 1985107 g oounyo tjesyuon qiss 252e uou ub Luv wajonog auoz 0pe4uaquoyy op LHNO Y z uoypub out jentdQUON 4 1ss Jiueuu sed au x op s nbunu 7907 adQuoyy sed uuol uoJ au 4 tug19 2uasm 015eJuoN 4 1s Jiuetuu j Anoid sues Pu bb aurez x suvs apisow2un TApyuoN ap 2u sqv T 4159p uON anneSou aaSnf uolde aun y
341. osphere Magn abattement 1 profond IncepPredMinus d sir 4I s mousser 97 98 99 93 94 95 96 AntiBon aboiements intempestifs 97 S aboiements chien 1 98 Degrad humeur la s alt rer 99 Real bateau naviguer sur ART piloter ART Deux FL peuvent tre rapproch es en fonction du sens de la relation qu elles mod lisent les FL en et ont toutes deux une composante de sens n gative en fonction du patron syntaxique de la relation les FL en et prennent toutes deux le mot cl en sujet et n ont pas de compl ment en fonction de l lement communicativement dominant dans la relation la FL en 97 exprime le nom du premier actant du mot cl et celle en 99 un syntagme dans lequel le premier actant est le sujet grammatical ou en fonction des parties du discours des lexies en jeu dans une relation les FL en et sont adjectivales si le mot cl est un nom et adverbiales dans les autres cas Notre objectif est donc de rendre compte de ces formes de regroupements en cr ant une organisation des FL qui prenne en compte ces diff rents axes de classement et vise rendre explicite toutes les propri t s des relations lexicales plut t qu a les encapsuler dans une formule synth tique 5 1 2 Vers une organisation syst mique des fonctions lexi cales Avant d noncer les principes de base pour l laboration d un syst me de FL nous
342. ot cl auquel elles sont appliqu es c est le cas de Syn et Anti par exemple Dans le cas des locutions endocentriques la partie du discours profonde associ e a la valeur d une FL correspondra la partie du discours profonde de l l ment t te et dans le cas des locutions exocentriques la partie du discours profonde associ e la valeur d une FL correspondra au type d emploi nominal adverbial etc de la locution 211 Aussi sachant qu il existe cinq parties du discours profondes on dispose poten tiellement de 52 c est dire vingt cinq couples de parties du discours profondes associ s aux liens lexicaux repr sent s par les FL Ces vingt cinq couples forment des classes vers lesquelles pointent les FL Comme nous l avons mentionn plus haut de nombreuses FL pointent vers plus d une de ces classes Nous avons organis les couples de parties du discours en fonction de la partie du discours des valeurs retourn es par les FL Ce choix est motiv par l un des usages qui sera fait du syst me de FL pour lequel on souhaite organiser les d riv s s mantiques et collocatifs d une unit lexicale en fonction de leurs parties du discours Valeur N Valeur V Valeur A Valeur Adv Valeur Claus N N N V N A N Adv N Claus AON AV A Adv A Claus V N V V V A V Adv V Claus Adv N Adv V Adv A Adv Adv Adv Claus Claus N
343. our construire des r seaux s mantiques a partir de dictionnaires de langue d encyclop dies et de textes libres Les r seaux r sultent d un processus enti rement automatis qui prend du texte en entr e le d coupe en phrases tablit un graphe de d pendances s mantiques entre les unit s lexicales de chaque phrase regroupe ces graphes individuels en un grand graphe unique et enfin assigne un poids probable chacun des sous graphes en fonction de leur fr quence dans les corpus Par exemple partir de la d finition suivante de l unit lexicale MOTORIST motorist a person who drives and usu owns a car il est possible d tablir le graphe semantique reproduit la figure car lt Tobj drive Tsub gt motorist person 4Tsub own N Tobj gt car Figure 2 4 Graphe s mantique obtenu partir de la d finition de MOTORIST 48 Richardson et al 1998 d crivent le processus de la fa on suivante une fois les structures s mantiques cr es elles sont propag es travers l ensemble de la base de donn es MindNet et reli es chaque unit lexicale qui la compose Les relations constitu es d un ou plusieurs liens connect s ensemble repr sentent des chemins s mantico relationnels en anglais semrel paths entre unit s lexicales Par exemple le chemin entre CAR et PERSON est le suivant car Tobj drive Tsub motorist Hyp person
344. ous un nouvel angle Il est possible par exemple de percevoir les FL adjectivales 143 comme mod lisant les p les positifs et n gatifs des attributs d importance Magn et AntiMagn d appr ciation Bon et AntiBon et de finalit Ver et AntiVer cf figure 4 2 Importance Magn autopsie m ticuleuse AntiMagn aboiement faible Appr ciation Bon aspiration noble AntiBon aboiement intempestifs Finalit Ver ami fidele _ AntiVer applaudir mollement Figure 4 2 FL standard adjectivales sous l angle d attributs polaris s D une certaine fa on ces attributs et d autres de m me type sont d j pr sents dans certaines FL semi standard et non standard mais de fa on non explicite On observe par exemple pour la lexie CONVERSATION a les collocations adjectivales suivantes 76 Magntemp Qui dure longtemps longue interminable sans fin 77 AntiMagntemp Qui dure peu de temps br ve courte rapide 78 Magne hange Durant laquelle X et Y sont tr s actifs enflamm e grande anim e nourrie 79 AntiMagnechange Durant laquelle X et Y sont peu actifs languissante morne 80 Magnolaisir Plaisante amicale d tendue enjou e gaie agr able char mante 81 AntiMagnpiaisir Peu plaisante fatigante difficile hostile houleuse ora geuse tendue ntiBongare Peu claire d cousue embrouill e incoh rente p
345. ovap eziuopsd anio yxeuoginuy uiKuol1uv lt 2951211 u do juoao inys quepesaquy o 3ueEsilnn ua u 2e d p as x Luv op suas supp TII f3t 991 1 e M Tapy 1ueAnoud ua u3bb aurez x 2000 tapy JaysajlUeW SURG JU9W19991908 jeiqieape quajeainby quowunjosqn njosqv apy 43 e pua inb A ayqnwajysa 112 4 1 Zajqy e pu 1 inb x fuum asiiin sed s u Ind pdnooour T unq Tie MuoN y ap uoljeysajiuew aun 459 inb X ap ajosed 1s 5 op abunyo aurpy jiuey ey I duu 4 sed ysa u In api obf He Mnuyey aanoida X f nbnp asned e A 7uvaazap uordaoap ty aydoud 3s inb x 7uDinow T IZ T1 14otu UadQxoigly un suep 3s inb A auuopungn qz uopungn ly quajeainby uyaf 101 2 Oy pepue3s rur s 6 s eorx SUOTJOUOT queyodui sn d e JaDUaWWOD dupu 52090 sn d4peiddeoul XXI 212 e 2 1 10 pas qdaou su qul SUIOW q lA p 4 qtuo1 jan snulyy pas qdadu
346. peronymique m ronymique antonymique et d rivationnel On note que les formes d rivationnelles ne sont pas forc ment morphologiquement apparent es une unit lexicale donn e en requ te mais n importe quelle unit lexicale du synset Par exemple ARROW appartient au synset arrow pointer et a pour d riv reli le verbe POINT morphologiquement li au nom POINTER L organisation des verbes dans WordNet r pond aux exp rimentations men es sur des locuteurs Les relations de cause et de troponymie sont les relations les plus intuitives observ es sur les sujets test s On dit que V1 est troponyme de V2 si V1 veut dire V2 d une mani re particuli re par exemple POISON est un troponyme de KILL puisque POISON peut tre d fini comme to kill in a certain way Les re lations propos es pour les verbes sont donc la cause la troponymie l implication par exemple SNORE implique SLEEP les locutions verbales contenant le verbe en question par exemple KILL OFF pour KILLy les unit s lexicales morphologi 45 quement d riv es par exemple KILL KILLABLE KILLER et KILLING ainsi que le typage des actants des verbes par exemple KILLy Somebody s something Somebody s somebody Something s somebody Les adjectifs sont r partis en deux grandes classes les adjectifs descriptifs et les adjectifs relationnels C est l antonymie qui r git l organisation des adjectifs des criptifs
347. plique a des valeurs n ayant plus vraiment de parent s mantique Or si les valeurs sont si diff rentes sur le plan s mantique la validit de la fonction doit tre r valu e Il semble que la sous sp cification de certaines fonctions soit un indice d une insuffisance dans leur d finition s mantique profonde ou d une sur utilisation des FL Il semble que Facto soit ici employ e en dehors de son domaine de d finition l inverse on remarque que la volont de pr cision am ne souvent les r dacteurs du DiCo sur sp cifier la description des liens pour souligner des diff rences s mantiques entre les valeurs d une FL ou pour pr ciser certaines composantes de sens apport es une FL Cela se traduit par l existence de FL semi standard Or si les l ments semi standard apportent des pr cisions s mantiques non prises en charge par la fonction standard ils contribuent ga lement donner un caract re brouillon l encodage les fonctions paraissent diff rentes alors qu elles partagent toutes la m me FL standard tel qu on peut le voir en 41 avec les diff rents types de Real Ceci rend l extraction et la manipulation des relations difficiles 41 a pour clairer Real allumette br ler ART b rapidement Real bi re 1 b siffler ART c destin e a fermer un passage Y Real chafnez 1 tendre ART en travers de N Y d tant parure Real couronne 1 2 p
348. ploter pr m diter ART pr paration LiquFunco assembl e 2 clore lever ART suppression Sres labeur fruit r sultat 176 SinstrReal reinz 1 p dale de instrument SiocFacto avocat 1 1 cour localisation La d composition des FL en composantes semantiques n est pas exclusive aux FL standard et s applique galement aux FLNS selon un proc d toutefois diff rent Nous dirons par exemple que la FLNS suivante a trait la composante s mantique fonction Equip pour que les passagers y dorment wagon lit fonction Les deux suivantes concernent une composante s mantique de localisation Qui est le dernier dans un ensemble wagon dernier de queue gt localisation Qui se trouve en dessous d o l on est tage 1 du dessous loca lisation La FLNS suivante a trait a la dur e Valable pour un annuelle dur e On peut d gager et identifier encore bon nombre de composantes s mantiques a travers les exemples suivants Qui est plut t fr quent par des familles restaurant familial gt par ticipant Qui est fait de feutre chapeau feutre mat riau Qui a une forme vas e barbe en ventail forme Etc C est pr cis ment cette d marche qui nous a amen e au chapitre pr c dent cf s
349. plus fr quente nous devons envisager les cas o l assistant renvoie plus d une proposition Deux types d information permettent un utilisateur de choisir entre les r sultats propos s les gloses de vulgarisation et les autres param tres descriptifs Pour la 229 pr sente requ te par exemple deux FL sont propos es PreparReal et IncepReal Les gloses de ces deux FL peuvent aider trancher entre les deux PreparReal est vulgaris e par la glose X pr parer et IncepReal par l ensemble de gloses suivantes X commencer utiliser occuper se trouver dans Ce sont les gloses associ es la seconde FL qui semblent le mieux correspondre la relation qui nous concerne L examen des gloses pousse donc en faveur de la FL IncepReal pour re pr senter la relation Dans d autres cas ce sont les param tres descriptifs qui permettent de trancher entre les diff rentes solutions offertes En effet si les FL propos es ont les crit res demand s en commun rien n indique qu elles partagent l ensemble de leurs pa ram tres descriptifs Prenons pour exemple les deux FL AntiBonFactg et Degrad illustr es ci dessous Degrad maison 1 1 se d labrer tomber en ruine se d grade AntiBonFacto robinet couler fuir fonctionne mal Ces deux FL poss dent beaucoup de param tres communs elles d crivent des liens entre un nom et un verbe NV sont associ es un patron de
350. plus sp cifique que la relation lexicale d hyperonymie Observons les conditions pour la standardit La condition de cardinalit est tout a fait remplie car la FL potentielle concerne l ensemble des lexies nominales et verbales La condition de diversit semble galement satisfaite dans la mesure o les valeurs sont tr s diff rentes selon les lexies auxquelles la FL est appliqu e Concernant enfin l int gration au syst me de FL Hypo s oppose la FL Gener sans en tre pour autant l exacte inverse 4 3 1 2 Les relations de m ronymie et de holonymie Mero et Holo Bien qu elle soit connue et repr sent e dans de nombreuses bases de donn es lexi cales la relation de m ronymie n tait pas normalis e ni standardis e dans le DiCo 124 Cette fonction a d j t propos e par Fontenelle 1997b sous la forme Part mais rejet e par sous pr texte de sa nature davantage encyclop dique que lin guistique Nous avons sugg r l int gration dans le DiCo de la fonction not e Mero mod lisant la relation partie tout plus pr cis ment partie constituante tout Tou tefois les relations m ronymiques encod es c est dire entre un nom d entit et les noms de ses parties constituantes doivent conserver un statut linguistique En d autres termes Mero L doit se d finir par partie de L Par exemple les lexies BRAS JAMBE et TETE sont des m ronymes de CORPS da
351. plusieurs types de ressources chacune d entre elles tant le re flet de la position th orique qui a pr sid son laboration Dans le domaine du TAL et de l intelligence artificielle le terme ontologie est beau coup employ sans que sa d finition ne soit toujours bien tablie Grosso modo on peut le d finir comme un inventaire des diff rents objets et proc s caract risant un domaine et des sp cifications de certaines relations qu ils entretiennent entre eux regroupe sous le terme g n ral d ontologie plusieurs types d objets h rit s de traditions diff rentes Premi rement les ontologies formelles h rit es de la tradition philosophique d finissent des classes sur la base des genres et esp ces et donnent lieu une hi rarchie constitu e de n uds reli s entre eux par subsomption On parle ga lement de taxonomies ou de hi rarchies Deuxi mement Vossen distingue les r seaux et cadres conceptuels Ceux ci pro viennent de la tradition des sciences cognitives et de l intelligence artificielle et ont pour objectif de structurer la connaissance Chaque n ud repr sente un concept et est associ un certain nombre de traits typiques comme les parties constituantes les fonctions ou les propri t s physiques li es au concept En com binant des relations d h ritage ces r seaux servent de syst mes de repr sentation de connaissances La tradition linguistique et la s mantique lexicale ont do
352. positions 3 reliez plusieurs collocatifs verbaux a leurs bases 4 trouvez lintrus parmi les collocatifs propos s 6Ces fiches sont consultables l adresse suivante http olst ling umontreal ca laf La base de donn es est disponible Vadresse suivante http www dicesp com xliv 5 reliez les collocatifs adjectivaux aux bases appropri es Les exercices de compr hension s organisent autour de quatre questions portant sur le sens des unit s lexicales et notamment sur le sens de certains collocatifs Les r ponses aux questions sont comptabilis es sur 100 et permettent ainsi une valuation de TFutilisateur On remarque que les FL ne sont mises en avant mais restent sous jacente la g n ration des exercices CALLex Le syst me CALLex Computer Aided Learning of Lexical Functions a t d velopp VIITPTRAS Institute for Information Transmission Problems of the Russian Academy of Sciences depuis les ann es 90s Diachenko 2006 repose sur deux concepts de la th orie Sens Texte les FL et la th orie de la d com position lexicale d velopp e par 2000 Le projet a t d velopp pour l anglais le russe Pespagnol ainsi que pour l allemand dans une moindre mesure Le syst me s adresse aux apprenants de langue trang re ainsi qu aux locuteurs natifs qui souhaitent am liorer leur vocabulaire Fondamentalement CALLex est constitu de deux dictionnaires combinatoir
353. premier actant de BRACELET Cependant ces informations se trouvent encapsul es dans un m me encodage ce qui ne permet pas de les dissocier les unes des autres Kahane et Pol 2001 ont d velopp un encodage explicite des FL distinguant les structures s mantique et syntaxique associ es aux FL C est dans la continuit de ces travaux que s inscrit notre th se L objectif principal de la th se est d laborer un syst me relationnel des FL pour mettre en valeur les diff rents types de liens qui les connectent Ce syst me vise d une part souligner les rapprochements que l on peut faire entre les FL et d autre part 4 mettre en vidence leur valeur les unes par rapport aux autres selon un point de vue diff rentiel Ceci suppose un certain nombre de sous objectifs plus particuliers 2Une liste illustr e de toutes les FL cit es dans la th se est fournie l annexe I Dans un premier temps il nous faut remettre en question les diff rentes fa ons de consid rer les relations lexicales et de les encoder Il existe plusieurs types de FL distingu s notamment en fonction de la fr quence des relations qu elles encodent Nous op rons des modifications sur l encodage de certaines FL dites non standard de fa on les rendre davantage manipulables Comme nous venons de le mentionner les formules de FL encapsulent diff rents types d information d ordre s mantique et syntaxique Nous cherchons
354. qqn au 45 en change de qqch CausOper silence acheter le de qqnil 112 3 Les FL localement standard sont des FL dont l universalit n a pas encore t prouv e dans toutes les langues mais qui remplissent les autres conditions n cessaires pour tre consid r es comme de v ritables FL Par exemple en fran ais les FL De nouveau 46 et Essayer de 47 46 De nouveauOperi g t reprendre qqch avoir de nouveau 47 Essayer de Opero augmentation 52 demander r clamer ART 4 Les FL non standard FLNS quant a elles encodent des d rivations s mantiques et des collocations cf et 49 mais ne satisfont aucun crit re requis pour tre standard 48 Qui est li e des irr gularit s commises par X faillite frauduleuse 49 Produite a l tranger bi re d importation Ce sont les FL non standard d sormais FLNS qui font l objet de ce chapitre nous exposons ci dessous l enjeu de leur normalisation 4 1 1 Enjeu d une normalisation de l encodage des FLNS Comme nous l avons mentionn au chapitre pr c dent et pr sent en d tail l an nexe li les FL standard ont d j t largement utilis es dans les applications en traitement automatique 2000 que ce soit pour des programmes de paraphrasage et g n ration de texte 2002 de r sum s automatiques 2005 de traduction automatique 2003 ou encore pour d velopper des outils d
355. que des d riv s ad jectivaux potentiels Able Able etc On note galement que les FL Mult et Sing ont r guli rement des valeurs prenant le mot cl en tant qu actant par exemple Mult chien 1 horde meute de s Sing f bon sens dose de La derni re classe de patrons de d pendance syntaxique profonde concerne des liens lexicaux syntagmatiques dont certains sont encod s par des FL paradigmatiques Les valeurs de ces liens particuliers modifient un actant du mot cl et prennent le mot cl comme actant Par exemple dans l exemple ci dessous la valeur de la FL modifie un participant ext rieur la lexie HAINE et prend HAINE pour actant AzManif haine charg de ART Geste ou parole de X qui est une manifestation de Nous avons mentionn au chapitre 8 section p 107 Vop ration de fusion mise en valeur dans les encodages alg brique et explicite qui associe 4 chaque FL syntagmatique f une relation paradigmatique f Dans le syst me de FL nous associons a certaines FL syntagmatiques une relation paradigmatique fusionn e potentielle et certaines FL paradigmatiques un patron de d pendance syntaxique potentiel Ainsi Able habituellement cat goris e comme une FL paradigmatique 202 est potentiellement associ e au patron 1 Mult et Sing se verront attribuer le patron potentiel etc Bien que la FL A2Manif soit consid r e comme une FL paradigmatique on lui attr
356. queinos np suas l suep suv z r an qf ls queinos np suas l suep suv und e T F dupd Pey sav sapon e T F nund Fey sav aunusur e qowu Seay q dn o s ub Luv Zg 14otu Ojeay tuv ap youn as ZT fuowypvsnso0 tuv op as Z uowpsnsov Geay qual l n A uv 7 700000 Zjeay Z 4 on u anod s sin x Z suep wav 4 ssod e 20 0q ET eay A 8 x A N tuy g sod z anbnq eTeay sary sfs q T 493q tesy auewepides x ssod y op auaz e ewnjd tjeay aoueysisqns inod sav sapaq vumiym Tie M 111229 1nod sav augyo Tjeay A Sessed un 4 ull e uns p np auf T IZF944091 1 He M nb ue uq sav 4omod g auuosnos tjeay ainied q e tuy Fo ul u1 ensnlC M A x Z N mod AN g Lav douuop 0 He x sgn x tay 24909 T IZJnoqtumn1 tey A Ano4d e pua uo inb sisaus A zm zpo auspy zjend ewAuou s isend 20qtuoo T 11 2110mWq UASO X ap saynomed addy anbunuow j uonbipgn 1sD jeulwou 13u eAInb ISsen wowows r nwa sO uiKuolue Isen eZqu undauu oo nuyo ap ye
357. quelle unit lexicale CAR est vis e dans les relations expos es plus haut Des poids sont automatiquement assign s aux chemins s mantico relationnels pour refl ter leur saillance Les relations obtenues sont num r es ci dessous notons que certaines tant encore en cours d laboration nous ne pr sentons que les plus abou ties Attributive modification cat domestic wild fierce Causation virus disease AIDS cancer Classifier species type form group Goal school drive hurry tread Hyperonymy bird robin eagle pheasant Intensifier dark very too partially totally Location restaurant serve table meal bill Manner run quickly slowly suddenly Means open key pin switch force Modifier quick mentally relatively unfairly Modals call can shall go need use Meronymy bird feather wing beak leg Possessor brush artist Proposition call return engage present drink Purpose read improve find decide Result change flow suit Source borrow language library friend Synonymy hill slope pile mound Time Duration war damage fight surrender Typical Indirect Object pay person worker e
358. qui les instancient dans les textes Nous devons toutefois mentionner les travaux de ou encore 2008 qui visent int grer les fonctions lexicales de la LEC pour identifier et d crire certaines relations syntagmatiques dans FrameNet Dans notre th se nous nous inspirons des elements de cadre de FrameNet afin d identifier certains types d attributs descriptifs li s aux unit s lexicales et de proposer une normalisation de l encodage de certaines fonctions lexicales L utilisation des l ments de cadre en parall le avec les fonctions lexicales est pr sent e dans le chapitre 4 section 14 5 2 2 3 WordNet WordNet est un r seau lexical d velopp au laboratoire de sciences cognitives de l Universit de Princeton sous la direction de George A MilleiP Le projet repose sur des conceptions psycholinguistiques de la m moire humaine Une des raisons de son d veloppement est de confronter des hypoth ses psycholinguistiques non pas a quelques champs s mantiques mais l ensemble du vocabulaire commun L hy poth se sous jacente postule que si les lexicographes s adaptent mieux la fagon dont l tre humain pense il sera plus facile un utilisateur de naviguer dans le dictionnaire En travaillant sur des associations d unit s lexicales les psycholin guistes ont d couvert des propri t s synchroniques du lexique mental pouvant tre employ es pour un dictionnaire D apr s Miller Fellbaum 11998 7 Wor
359. r cis de les diff rencier Le mod le de FL que nous proposons d laborer dans le chapitre B r alisera une description plusieurs niveaux en r partissant les FL dans des grandes classes semantiques et permettra de regrouper les diff rents types de FL sous le m me plan La question du nombre de FLSS ne peut donc tre r solue sans prendre en compte les trois facteurs qui viennent d tre pr sent s Le nombre de FLSS d pend tout d abord des crit res qu utilise la personne qui le d termine Par ailleurs tant que les relations lexicales du lexique entier d une langue n auront pas t couvertes il semble difficile de pr tendre 4 un nombre d finitif de FLSS Enfin le choix de la granularit a une grande incidence sur la d multiplication des FL et la scission d une FL potentiellement standard en plusieurs FL semi standard ou non standard 101 3 3 3 2 Granularit de l encodage traditionnel Devant l h t rog n it de Pencodage traditionnel et notamment celui des FL semi standard il est l gitime de questionner la pertinence du degr de granularit choisi pour d crire les relations lexicales On observe plusieurs situations 1 Premi rement le degr de granularit n est pas syst matiquement respect dans la description des diff rents liens lexicaux relevant d une relation donn e Par exemple dans les quatre exemples suivants on observe que et sont distingu es par la pr sence de
360. r s une relation on va vouloir en accentuer la granularit Ainsi dans le cadre du projet ETAP 3 cf annexe p xlix Apresjan et al 2003 10 ont d gag deux types d antonymes qui diff rent par la position de la n gation dans leur repr sentation semantique The first type of antonyms is based on inner negation Consider the well known pair begin and stop To stop doing P can be explicated as to begin not to do P This type of antonymy is called ANTI1 The second type of antonyms is based on outer negation Consider the pair 100 observe the regulations and violate the regulations to violate means not to observe This type of antonymy is called 12 A partir de ces deux types de n gation on peut formuler deux r gles de paraphra sage distinctes 1 X lt gt Neg ANTI2 X He violated the regulations He did not observe the regulations 2 X Y lt gt ANTIL X ANTI2 X He began to observe the regulations He stopped violating the regulations II semble que les problemes de gestion de la granularit dans les descriptions sont responsables d une d multiplication de FL qui contribue a disperser des relations similaires et complexifier leur encodage Pour remettre niveau l ensemble des relations une solution serait de d terminer plusieurs niveaux de granularit Un niveau plus large permettrait d englober les relations similaires et un niveau plus p
361. raiment est un type de cri et Vexpression d un actant du mot cl BRAIMENT indique que le premier actant de CRI I 1 est un ne Il semble que ces relations devraient recevoir un double encodage pour refl ter l am bivalence de leur statut du type X ane Hypo cri 1 1 braiment hi han Par ailleurs il nous semble int ressant de distinguer Vhyponymie classique de ce type particulier d hyponymie Nous proposons de repr senter ces relations par la 91 FL Hypo o l indice pr cise l actant de la lexie sp cifi dans la relation De cette fa on les relations suivantes 34 a de transport maritime garez b maritime b X moyen de transport fluvial fluviale 35 a Y soupe assiette 4a creuse soupe b Y nourriture solide assiette 4a plate se verraient remplac es par les formules 34 a X moyen de transport maritime Hypo gare b maritime b X moyen de transport fluvial Hypo gare b fluviale 351 a Y soupe Hypoo assiette 4a creuse soupe b Y nourriture solide Hypoo assiette 4a plate 3 3 3 Discussion critique sur l encodage traditionnel Nous souhaitons discuter quatre aspects de l encodage traditionnel dont certains ont t mis en valeur par la typologie qui vient d tre pr sent e la question du d nombrement des FLSS la granularit de l encodage traditionnel ses r gles de for
362. re yeter bas 1 raser ART LiquFacto air pneu d gonfler ART LiquFacto paroi pneu crever percer ART R PARER CausDe_nouveauFacto vier d boucher ART CausDe nouveauFacto pneu reparer ART CausDe_nouveauFacto tuyau 1 1 d boucher d gorger nettoyer purger r parer ART CausDe_nouveauFunco silence 1 2a ramener r tablir ART CausDe_nouveauFunco soupgon 1 raviver ART Figure 2 7 FL exprimant les relations s mantiques se d t riorer et r parer toutes les lexies d habitation peuvent avoir les m mes collocatifs que MAISON I 1 les lexies d signant des v hicules les m mes collocatifs que VOITURE etc Il s agit d ailleurs d un ph nom ne d h ritage entre champs s mantiques d crit par Mel uk travers l exemple du champ s mantique des motions Notons qu partir de notre mod le d organisation des relations lexicales pr sent au cha pitre 5 il sera possible d acc der des relations s mantiquement quivalentes mais encod es par diff rentes FL 2 3 2 Mod le fonctionnel du lexique mental Aitchison 2003 2003 cherche cerner la fa on dont les locuteurs lt entreposent gt les unit s lexicales dans leur m moire et les processus utilis s pour y acc der L ob jectif g n ral de son travail est de produire l bauche d un mod le fonctionnel de l organisation du lexique mental de l anglais Constata
363. re graduel et les conditions per mettant la distinction de plusieurs statuts 8 2 2 3 2 1 Nature et r le des fonctions lexicales La notion de FL a vu le jour au d but des ann es 60 plus pr cis ment en 1963 64 Leurs premi res descriptions ont t pr sent es dans en russe en frangais et en anglais 19940 194 explique la gen se du concept de FL comme suit Nous avons d couvert les Fonctions Lexicales FL il y a plus de 30 ans lors de notre participation une exp dition g ologique dans la zone 70 montagneuse semi d sertique au sud du Kazakhstan en vue de les utiliser pour la traduction automatique Nous avons eu l id e de ce qui est devenu plus tard avec la collaboration pr cieuse de A Zolkovskij les FL Magn et Oper quand nous tions en train de chercher une m thode simple permettant d viter les milliers de tests ennuyeux n ces saires pour permettre l ordinateur de trouver les quivalents russes d termin s par le contexte lexical de lex mes anglais comme HEAVY IMPORTANT EXTENSIVE HIGH etc d une part et to DO to MAKE to GIVE to GET ete de Fautre l Les FL devaient per mettre d tablir les correspondances n cessaires de fa on directe et lo gique Mais d s que le premier jeu des FL a t propos il s est av r que les FL ont par ailleurs un statut th orique fort important en linguistique Primo elles constituent le chainon manquant de
364. real ca dicouebe 225 autre changement important dans sa structuration 2006 2009 souhaite transformer la base de donn es traditionnelle en un r seau lexical ou syst me lexi cal et d veloppe actuellement une structuration en graphe Nous souhaitons developper des outils pour faciliter la r daction du DiCo et autres BLEC fond s sur le calcul d l ments de fiches lexicographiques et sur les inf rences que l on peut faire en exploitant notre syst me de FL L automatisation devient de plus en plus n cessaire dans le domaine du TAL ot plus aucune ressource ou presque n est labor e enti rement de fagon manuelle Quelques exemples subsistent comme le Dicovalence et le DiCo mais la majo rit est effectu e par extraction automatique a partir de corpus et ce aussi bien pour les bases de donn es morphologiques et syntaxiques comme le Lexique des formes fl chies du fran ais Lefff que pour les bases de don n es semantiques comme le projet Dixem dictionnaires de s mes Valette et al 2006 Nous cherchons donc laborer une autre m thode pour la r daction des BLEC qui n est pas destin e remplacer la m thode actuelle mais qui lui est compl mentaire Le chapitre est structur de la fa on suivante nous pr sentons dans un premier temps section 6 2 la fa on dont le syst me de FL a t impl ment Cette br ve pr sentation nous permet d introduire dans un deuxi me temps l outil d
365. reli PRESIDENT La plupart des adverbes sont des d riv s ou homomorphes d adjectifs Ceux ci h ritent des propri t s des adjectifs dont ils sont d riv s Les adverbes ne sont pas organis s en arbre ou en groupes mais sont li s aux sens adjectivaux dont ils sont d riv s par le marqueur DERIVED FROM 44 Il ne nous semble pas qu une telle distinction entre les parties du discours soit justifi e dans la mesure o l on retrouve quasiment les m mes types de relations pour les diff rentes parties du discours Si la m ronymie semble ne concerner que les noms l antonymie concerne toutes les parties du discours tout comme les rela tions de d rivation morphologique Par ailleurs l hyponymie et la troponymie nous semblent tout fait similaires Les modes d acc s l information Il existe une interface pour naviguer au sein de la base de donn es permettant aux synsets et aux relations d tre dit s au format texte Le navigateur permet d acc der aux donn es en deux tapes Premi rement apr s avoir entr une forme on en visualise les diff rents sens cf figure avec le vocable GLOOMY Les sens sont regroup s par parties du dis cours Un aper u indique galement le nombre de sens de chaque partie du discours repr sent dans les textes annot s Adjective S adj glooming gloomy gloomful sulky depressingly dark the gloomy forest the glooming interior of an old inn
366. rement on entend par cardinalit des arguments de FL le nombre d ar guments auxquels une FL s applique Ce crit re impose une FL de prendre en argument un nombre important d unit s lexicales Le crit re vaut galement pour 74 les valeurs de FL Une FL doit retourner plusieurs unit s lexicales Ainsi dans Vexemple cit plus haut fig 3 1 AntiReal appliqu e l argument BARRICADE peut prendre les formes suivantes ENFONCER FRANCHIR FORCER PASSER SAU TER etc b Diversit des arguments et valeurs de FL La diversit des arguments concerne leur type semantique On considere que les arguments d une FL doivent tre diversifi s et non relever d une classe s mantique sp cifique Selon ce principe la relation entre canard et d levage ou domestique dont le sens peut tre d crit par la formule qui ne vit pas l tat sauvage ne concerne que certains noms d animaux et ne pourra donc tre repr sent e une FL standard La diversit des valeurs de FL tient leur diff rence non plus sur le plan s mantique mais sur le plan formel Une FL appliqu e plusieurs arguments doit en principe mis a part les cas d h ritage retourner des valeurs diff rentes Par exemple Magn correspond un intensifieur et retourne des valeurs diff rentes selon l argument auquel elle est appliqu e Magn aboiement 41 d chain f roce fort furieux Magn admiration folle grande pr
367. remi re di mension est paradigmatique ou associative Elle unit des unit s lexicales ayant la propri t de se substituer l une l autre C est le cas par exemple des relations de synonymie d antonymie ou encore d hyperonymie Toutefois les relations pa radigmatiques ne se situent pas toutes in abstentia De nombreuses relations dites paradigmatiques s expriment au moyen d un syntagme combinant les deux unit s lexicales C est le cas de la relation entre un nom ou un verbe d action et le nom de son premier actant par exemple le premier actant de CRIME peut tre exprim au moyen de la lexie ASSASSIN ou du syntagme auteur du crime La seconde dimension est syntagmatique Elle se situe in praesentia sur l axe li n aire du discours Les expressions form es sur ce plan sont commun ment appel es collocations Cependant le terme collocation recouvre des notions diff rentes selon les th ories linguistiques La tradition anglo saxonne du contextualisme pr sent e dans les travaux de Firth et Halliday consid re les collocations davantage sous Vangle de la simple cooccurrence textuelle si toutefois elle se r v le statistique ment significative Les collocations jouent un r le important dans l interpr tation linguistique dans la mesure o elles d finissent le contexte d emploi des unit s lexi cales et permettent la seule appr hension possible de leur sens dans ce contexte pr cis Dans cette optique c e
368. restric tions sur le comportement syntaxique de leurs mot cl dans les textes Ainsi dans la phrase suivante The president spoke in support of the parliament Le verbe to speak est une forme de Oper du nom support Oper donne des verbes dont le sujet grammatical correspond au premier actant du mot cl tant donn que le premier actant de Oper est d ja donn dans la phrase en tant que sujet grammatical de to speak il n est pas besoin de l exprimer une fois de plus Par cons quent la phrase ne peut tre interpr t e que comme d crivant le support qui a t donn au parlement A l inverse the president enjoyed the support of the parliament sera interpr t e dans l autre sens compte tenu du fait que enjoy est un Oper dont le sujet est le deuxi me actant du mot cl Pointeurs vers les quivalents idiomatiques d une langue cible pour la traduction automatique Les propri t s d universalit et d idiomaticit interlangue font des FL un ou til id al pour la traduction de groupes d expressions dans un syst me de tra duction automatique Par exemple les pr positions locatives utilis es pour former des syntagmes pr positionnels d notant des lieux directions rep res temporels p riodes intervalles etc sont tr s diverses et versatiles dans une langue donn es et m me d une langue une autre L utilisation des FL per met d viter l criture fastidieuse d un grand nombre de r gles Par exemp
369. ri re plans th oriques sp cifiques Pour chacune des ressources nous t chons de d terminer 10 1 les positions th oriques sous jacentes le cas ch ant 2 les choix op r s vis a vis des relations lexicales prises en compte 3 les modes d acc s aux donn es propos s Dans la section 2 3 nous pr sentons deux modeles psycholinguistiques du lexique celui delAitchison et celui delDuvignaul 2002 Bien qu ils n aient pas encore fait l objet d une impl mentation dans des ressources lexicales ils nous semblent pertinents pour la probl matique que nous traitons dans la th se Pour bien comprendre l enjeu de chacun de ces mod les et ressources et la fa on dont ils se positionnent les uns par rapport aux autres nous devons tout d abord discuter certaines notions phares li es la probl matique de la th se Dans la suite de cette introduction nous pr sentons donc les diff rentes fa ons dont le lexique est mod lis en linguistique et dans ses disciplines connexes les propri t s li es aux relations consid r es ainsi que les types de ressources lexicales labor es 2 1 1 Mod lisation du lexique en linguistique et ses disci plines connexes Le lexique int resse plusieurs champs disciplinaires 1980 puis Murphy ont mis en vidence les motivations des disciplines telles que la philosophie Vanthropologie la linguistique la psychologie et l informatique pour Petude des re lations s m
370. ris e par la glose Y surmonter l obstacle que repr sente peut prendre la forme en syntaxe de surface des unit s lexicales enfoncer franchir forcer etc AntiReal2 ENFONCER FRANCHIR FORCER Aa bd PIERRE BARRICADE PIERRE BARRICADE Figure 3 1 Correspondance entre FL et unit s lexicales Les FL permettent galement de modeliser des op rations de paraphrasage On entend par paraphrasage la production de phrases quasi synonymes ou para phrases Le syst me de paraphrasage dans la Th orie Sens Texte a t propos par puis r valu plusieurs reprises notamment par Mili evi En bref un ensemble de r gles sont formul es pour effectuer le passage d une repr sentation syntaxique profonde une autre Par exemple la fonction Vo fournit l quivalent verbal d une unit lexicale nominale la fonction Oper permet quant elle d exprimer une unit lexicale nominale au moyen d un verbe support par exemple Vo soupir soupirer Oper soupir pousser ART On peut alors formuler la r gle suivante fig qui permettra de paraphraser Pierre pousse un soupir par Pierre soupire et vice versa Le chien met un abote ment par Le chien abote La voisine se livre des comm rages par La voisine TLes diff rents modules sont pr sent s la section 2 p 193 296 reporter Mili evi 2007 pour de plus amples Tok 73 comm re etc L quivalence entre les
371. rit res op ratoires pour la description des relations mais ne se r v lent pas toujours suffisantes pour d terminer si une relation doit tre encod e par une FL standard ou une FLNS Selon 2007 48 50 la distinction entre standard et non standard est une affaire de choix Standardnessil is not presented as being an inherent property of some LFs but the result of an estimation made by people in charge The notion of standard LF can be precisely defined and it is only the criteria for standardness that are vague and depend on subjective esti mates This leads Mel uk 1996 91 to say it is immaterial in both practice and theory whether we decide to treat an LF as Standard or Non standard Ces citations viennent appuyer notre propos sur le manque de rigueur et de sys t maticit dans le choix de l un ou l autre des deux statuts Le caract re flou de ces crit res tient galement au choix de la granularit choisie pour le regroupement des liens lexicaux Si l on opte pour une granularit large on aura tendance re grouper sous un m me encodage un grand nombre de liens lexicaux En revanche si l on ressert la granularit on verra appara tre des distinctions s mantiques entre ces liens ce qui conduira l attribution d encodages distincts pour repr senter les liens tudi s Nous ne souhaitons pas remettre en question la distinction entre les statuts standard et non standard
372. rqueurs morphologiques des analogies entre relations lexi cales Nous proposons de nouvelles FLNS pour normaliser sept relations lexicales encod es de fa on h t rog ne Rappelons une fois de plus que ces FLNS sont des tin es remplacer les anciennes FLNS celles ci servant dor navant de gloses pour expliciter plus en d tail le sens de la relation 4 4 2 1 Les quivalences masculine et f minine et les noms de petits Nous avons relev dans le corpus des relations entre unit s lexicales morphologi quement li es cf exemples 68 et 69b plus bas Les suffixes permettant de construire les unit s lexicales d riv es correspondent respectivement aux d riva t mes quivalent f minin et diminutif Ces deux d rivat mes permettent d inf rer une certaine r currence de ces relations lexicales Par analogie la relation d qui valence f minine nous avons postul la relation d quivalence masculine celle ci tant parfois mais non syst matiquement morphologiquement marqu e Les trois relations suivantes peuvent difficilement pr tendre la standardit dans la mesure o elles ne peuvent s appliquer qu un nombre restreint d unit s lexicales 138 les noms d individus de m tiers et d animaux Toutefois leur encodage tant in utilement h t rog ne nous proposons de les regrouper sous trois formules uniques de FLNS Masc pour les quivalents masculins ou m les cf exemples
373. s bri vement ci dessous 1 Les FL complexes Une FL complexe est une combinaison de FL simples syntaxiquement reli es et formant une expression unique Les FL complexes comportent au moins deux FL simples D apr s Mel uk et al 11995 148 une FL complexe n est pas une composition de FL la valeur d une FL complexe ne s obtient pas par l application successive de ses l ments fg L Z f g L Par exemple la relation ncepOper feu ouvrir ART ne peut pas se d composer de la fa on suivante Oper feu faire puis Incep faire ouvrir De m me la relation 84 IncepOperi amoureuz tomber n est nullement le r sultat de la composition de ses composantes Si Operi amoureuz tre Vel est valide en revanche la suivante ne Test pas Incep tre Z tomber la valeur correspondante serait plut t commencer a 1995 148 donnent la d finition suivante des FL complexes Nous appelons fonction lexicale complexe un enchainement de FL simples syntaxiquement li es cet enchainement ayant une va leur globale cumulative qui exprime de fa on ind composable le sens de l encha nement entier Les configurations de FL Une configuration de FL est une cha ne de FL non reli es syntaxiquement et qui ont toutes la m me lexie pour mot cl Dans une configuration de FL les diff rentes FL sont s par es traditionnellement par le symbole et dans le DiCo par le symbo
374. s concepts non lexicalis s ex bad person gt La structure de WordNet r v le donc un inventaire conceptuel qui est seulement en partie reli au lexique de Panglais En cela aussi il diff re d un th saurus qui ne repr sente en r gle g n rale que des concepts lexicalis s WordNet peut tre assimil un dictionnaire dans le sens o il fournit des d finitions et des exemples pour la plupart des synsets Tout comme un dictionnaire il contient galement des informations sur les unit s lexicales morphologiquement reli es Les relations dans WordNet La relation s mantique de base est la synonymie chaque unit lexicale est associ e un synset Il s agit d ensembles d unit s lexicales consid r es comme synonymes stricts ou tr s proches Par exemple joke gag laugh jest jape forment un syn set et laugh laughter en forment un autre Les unit s lexicales figurant dans un 41 synset ne sont pas forc ment synonymes dans tous les contextes Ainsi si GREASE et LARD sont synonymes dans le contexte de la cuisine ils ne le sont pas n cessai rement hors de ce contexte particulier S agit il de liens entre unit s lexicales ou entre concepts Comme nous l avons men tionn pr c demment WordNet distingue les relations entre les unit s lexicales des relations entre concepts Evens 1998 l a montr que les chercheurs aspirant mod liser la m moire et le lexique mental tendent con
375. s d riv es du syst me de FL Ces applications entrent dans le cadre d une nouvelle m thodologie pour Pelaboration du DiCo et plus largement de toute BLEC La m thodologie d laboration du DiCo refl te l volution de la lexi cographie dans la mesure o il a lui m me incarn diff rents formats Cr dans un premier temps en tant que version informatis e du DEC dont il reprend tous les types de donn es mis part les d finitions sa structure a la forme d une base de donn es congue avec le logiciel FileMaker Cependant son syst me de requ te est peu d velopp si bien que le DiCo au format File Maker reste structur comme un dictionnaire textuel informatis avec une distinction des diff rents champs et quelques potentialit s de requ tes cf figure 6 2 p 254 Dans une seconde tape ont proc d une atomisation des champs du DiCo un programme de compilation le DiCompil transforme la structure li n aire de type FileMaker en une base de donn es relationnelle MySQL consultable via l interface DiCou be Jousse et Polgu re 2005 H Le DiCo s affranchit alors de sa structuration par fiches pour devenir une ressource consultable par n importe quelle donn e lexicographique Steinlin et al 2004 7 Aujourd hui nous entrons dans la troisi me phase de d veloppement du DiCo au cours de laquelle il subit un TLa base de donn es est disponible l adresse suivante http olst ling umont
376. s for mel l aide des FL est r alis en parall le mais reste r serv aux utilisateurs initi s xl Explication de la relation s mantique Terme s reli s Synonyme informatique Terme plus g n ral copie la Verbe pirater 2 Un patient qui a fait l objet d un lt mot cl gt pirate 3 Une mesure qui vise liminer ou r duire le lt mot cl gt antipiratage 1 Qui se produit lors d une connexion en ligne 1 L agent fait le mot cl se livrer au L agent fait le lt mot cl gt faire du Qan ou qqch essaie de faire en sorte que le lt mot cl ne se produise pas lutter 1 contre le NOM lutte la contre le Qqn ou qqch fait en sorte qu un lt mot cl gt ne se produise pas sur le patient prot ger 2 contre le NOM protection 2a contre le Le DiColnfo propose une solution originale pour rendre compte du r le s mantique ou th matique des actants d une lexie En effet les num ros d actants habituel lement donn s dans les FL ne permettent pas d indiquer le r le semantique des actants dans un v nement donn Par exemple dans les trois relations suivantes les valeurs de la FL S jouent trois r les diff rents vis vis de leurs mots cl s S3 usine compagnie propri taire de ART S3 timbre 1 1 moyen de paiement colis enveloppe
377. s g n rons nous ne cherchons reproduire que les champs Nom cg Etiq et fl et fusionnons le champ Syn et le champ fl 6 4 3 Parties du discours 6 4 3 1 Pr sentation Le syst me de FL pr sent au chapitre pr c dent attribue chaque FL une ou plusieurs classes repr sentant les parties du discours de son mot cl et de sa valeur Il est donc possible en se r f rant aux classes associ es 4 une FL de d terminer automatiquement la partie du discours de sa valeur Par exemple IncepPredPlus devient plus intense est associ e au sch ma suivant N V Ses valeurs seront par consequent verbales par exemple IncepPredPlus comp tition 1 s intensifier IncepPredPlus abc s 1 m rir Une FL peut tre associ e a plus d un couple de parties du discours C est le cas de So quivalent nominal par exemple qui produit des valeurs uniquement nomi nales mais qui peut tre appliqu e a des verbes ou des adjectifs et ventuellement des adverbes comme on le voit ci dessous So curieux 1 1 curiosit 1 So admirer 1 admiration D autres encore peuvent avoir non seulement plusieurs types de mots cl s diff rents mais aussi plusieurs types de valeurs par exemple Magn intense et AntiBon mauvais ci dessous Magn autopsie approfondie m ticuleuse Magn chanter 1 1a fort a gorge d ploy e AntiBon corde 1 1 effiloch e us e AntiBon chanter 1 1a mal
378. s les plus intuitifs pos sibles du point de vue d un utilisateur d une base de donn es lexicale Par exemple la composante s mantique conversif li e la FL par exemple Convo suivre pr c der N X est pr sente la fois dans la classe EQUIVALENCE et dans la classe OPPOSITION Conv permet en effet une inversion des actants du mot cl et relie deux unit s lexicales la fois semantiquement quivalentes mais oppos es au niveau de leurs positions actantielles Par ailleurs la d composition des FL en composantes s mantiques rend possible la recherche de FL via deux chemins diff rents Par exemple la FL AntiBon Real cit e dans l exemple p 73 comporte deux composantes s mantiques uti lisation et n gativit r pertori es dans deux classes s mantiques diff rentes Il est donc possible d y acc der par l une ou l autre de ces classes Notons que dans 178 notre terminologie nous disons parfois de fa on elliptique qu une FL pointe vers une classe Nous d taillons pr sent chacune des classes cr es et en proposons un sch ma r capitulatif la figure p 188 5 2 2 1 Classe EQUIVALENCE La classe EQUIVALENCE concerne les FL v hiculant une identit s mantique Elle comprend trois sous classes les lexies similaires les conversifs et la reformula tion syntaxique Les composantes s mantiques des FL Syn QSyn et des renvois C
379. s lexicales en jeu dans une relation lexicale une perspective communicationnelle mettant en valeur les cibles commu nicationnelles des relations lexicales Par exemple dans la relation lexicale BOIRE BUVEUR nous dirons que la cible communicationnelle de la re lation est le premier actant s mantique de BOIRE 4 Syst me ouvert et volutif Cette propri t s applique autant au niveau des composantes du syst me c est dire les FL qu au niveau de sa structure Premi rement le syst me est ouvert il doit tre pr t int grer constamment de nouvelles donn es au fur et mesure que des nouvelles FL standard ou non standard appa raissent Les composantes d j pr sentes dans le syst me peuvent tre ame n es tre supprim es corrig es ou compl t es Par ailleurs la structure du syst me elle m me n est pas d finitive Il est encore en cours de mod lisa tion ce qui implique que des classes pourront tre supprim es scind es ou ajout es pour s adapter aux donn es a venir En d autres termes le syst me doit pouvoir s ajuster continuellement pour que ses donn es rentrent dans le canevas d ensemble 5 2 Perspective semantique sur le syst me de fonc tions lexicales Nous passons a pr sent la pr sentation des diff rentes perspectives sur le syst me de FL et des structures d organisation que nous proposons pour chacune d entre elles Nous commen ons par la perspective s mant
380. s notions lexicologiques et dans l utilisation quotidienne d un dictionnaire offert au grand public Cet encodage grand public des FL figure dans le DiCo en tant que vulgarisation des FL de l encodage traditionnel et dans le LAF Les FL y sont encod es de deux fa ons Certaines sont associ es une paraphrase unique par exemple la fonction mod lisant le nom typique du premier actant d une unit lexicale X est not e Nom pour X D autres FL re oivent plusieurs formulations selon les lexies auxquelles elles sont appliqu es Ce principe est expos par Popovic 67 comme suit 79 La vulgarisation est conditionn e la fois par la FL que l on veut enco der et par l tiquette s mantique de la lexie concern e Par exemple si on cherche faire la paraphrase linguistique de la FL Magn repr sen tant Tintensificationl la vulgarisation pourrait tre intense pour une lexie de sentiment par exemple peur intense mais pas pour une lexie d v nement cafastrophe intense vs catastrophe importante Selon ce proc d la FL repr sentant un adjectif ou un adverbe exprimant la qua lification n gative d une lexie soit AntiBon dans l encodage traditionnel est vul garis e par ind sirable pour la lexie ABOIEMENT par mauvais pour la lexie COMPLIMENT 4a par Qui a un mauvais comportement pour la lexie CHIEN etc Nous pr sentons dans la figure p la correspondance entre une fiche
381. s sont en effet parfois tr s g n raux et il n est pas toujours pertinent de les faire figurer dans une fiche lexicographique Par exemple la relation g n r e en est valide cependant si l on applique la r gle de r versibilit Cap L Ly S L L l ensemble du lexique on risque d obtenir un grand nombre de valeurs pour la lexie PRESIDENT S president assembl e 42 conf rence 1 1 parti association conseil republique s ance entreprise universit etc Or il n est peut tre pas pertinent d inclure l ensemble de ces valeurs dans une fiche d di e 4 PRESIDENT Cependant si l on envisage la mise en relation de ces donn es dans un cadre plus large que la seule application lexicographique c est a dire comme formant un r seau de connexions explicites des l ments du lexique ce qui est consid r comme du bruit pour constituer des fiches de dictionnaire ne pose plus probleme Par cons quent lors de Petape de validation des fiches le lexico graphe devra retenir les valeurs qu il juge les plus pertinentes et carter les autres sans pour autant rejeter la r gle qui a permis de les g n rer Diagnostic des erreurs d encodage Les r gles de r versibilit se r v lent utiles pour le diagnostic des erreurs d enco dage Prenons un exemple avec les FL S et Ao qui correspondent aux quivalents nominaux et adjectivaux On doit entendre par quivalent adjectival un adjectif de
382. sation des relations lexicales Les auteurs n ont gard des FL que le concept et rejet le formalisme jug trop aride et trop complexe Le DAFLES est int gr dans un environnement multifonctionnel pour l apprentissage du lexique appel Base Lexicale du Fran ais 2006 La BLF offre plusieurs interfaces de consultation de la base de donn es correspondant plusieurs types d acc s aux unit s lexicales L interface lt Recherche dans la base gt offre un certain nombre de crit res correspon dant aux propri t s s mantiques syntaxiques et combinatoires des unit s lexicales Ils permettent d interroger la base sur les cat gories grammaticales ou parties du discours des unit s lexicales les domaines de connaissance des unit s lexicales les fonctions lexicales la notion de fonction lexicale est tr s simplifi e et r duite quinze relations non formalis es la fr quence des unit s lexicales la compositionnalit du sens des l ments de l unit lexicale les types de composition de mot expression locution proverbe etc recherche directe dans l inventaire des collocations ou compositions recherche par sens exprim Les diff rentes cat gories s mantiques d finies par les fonctions lexicales coupl es aux parties du discours possible exemple un nom exprimant le d but d une action etc le genre et le type de terminaison des unit s lexicales
383. sent dans ce chapitre l impl mentation du syst me de FL sous la forme d une table de donn es En utilisant ce format et les potentialit s de re qu tes qu il sous entend nous en avons d riv un assistant a l encodage des liens lexicaux Cet assistant consiste poser un utilisateur un certain nombre de ques tions destin es le guider dans la s lection des diff rents param tres descriptifs qui caract risent un lien lexical Une fois ces param tres identifi s il suffit d interroger la base de donn es sous forme d une requ te SQL et de recueillir une ou plusieurs FL candidates Nous d velopperons dans nos futurs travaux une interface plus conviviale pour cet assistant Le syst me de FL a galement t exploit dans le but d laborer une m thode endog ne pour l enrichissement du DiCo ou autre BLEC Cette m thode permet en m me temps que de compl ter automatiquement certains champs du DiCo de mettre en vidence les erreurs et d en proposer un diagnostic Cette application a galement l avantage de rendre coh rent et solidaire l ensemble des informations contenues dans le DiCo Les heuristiques pr sent es pourront facilement tre im pl ment es pour constituer un programme informatique et mener l exp rience sur l ensemble des donn es du DiCo et ce chacune de ses modifications Chapitre 7 Conclusion g n rale 7 1 Bilan Au cours de cette th se nous avons r alis un syst
384. ses diff rentes du texte complet Dans ce cas les suppressions sub stitutions synonymiques ainsi que les op rations de paraphrases semblent devoir tre appliqu es Ainsi dans l exemple suivant il doit y avoir une substitution sy nonymique impliquant une FL dans la premi re proposition et une op ration de passivation appliqu e aux deux propositions 1 Texte initial Les feuilles ont un effet inhibiteur de l efflux et peuvent de ce fait L appex au contraire a un effet stimulateur de l effluc 2 R sum l effluax est frein par les feuilles et stimul au contraire par Vappex Les FL en jeu dans ces op rations de transformation sont les suivantes Oper effet avoir So stimuler stimulation Able stimuler stimulateur So inhiber inhibition Able inhiber inhibiteur Syn inhiber freiner Notons que ce projet n est rest qu une tape exp rimentale d tude pr alable sur la faisabilit de l utilisation des FL pour remplir cette tache II n a pas encore donn lieu une impl mentation visant la r alisation d un programme de r sum liv automatique Annexe III Codification des classes du syst me de FL Le syst me de FL est impl ment dans une table de donn es SQL contenant des codes Ces codes renvoient aux diff rentes classes tablies et pr sent es au chapitre Nous pr sentons dans cette annexe la codificatio
385. si que les relations s mantico lexicales entre les termes d un domaine 2004 Plusieurs approches terminologiques se sont tourn es vers des mod les lexicologiques pour l analyse des vocabulaires sp cia lis s ainsi que vers les m thodes lexicographiques pour leur description tel point que le terme terminographie se trouve parfois supplant par celui de lexicographie sp cialis e et que la distinction d avec la lexicographie dite g n rale pourrait tre remise en question Les approches lexicologiques et lexicographiques de la termino logie s int ressent aux propri t s linguistiques des termes en usage et s attachent d crire leur combinatoire syntaxique et lexicale Les ressources descriptives de ce type sont donc radicalement diff rentes des ressources plus traditionnelle et comportent de nombreuses similitudes avec la lexicologie et la lexicographie C est pourquoi le choix d un formalisme de description des relations lexicales semble tout fait adapt aux vocabulaires sp cialis s Nous pr sentons un dictionnaire sp cia lis d velopp POLST qui suit une orientation lexicographique suivant le mod le th orique de la LEC et propose une formalisation des relations lexico s mantiques entre termes au moyen des fonctions lexicales le DiCoInfo 3Se reporter 2004 pour une analyse comparative des principes m thodologiques de ces deux approches XXXVI Le DiColnfo Le DiColnfo est une ressource terminol
386. sions sur cette derni re partie du discours un clau satif profond est typiquement le sommet d une proposition il est syntaxiquement quivalent une proposition qui peut tre compl te comme Oui Non Pas du tout ou incompl te comme N emp che que Les clausatifs peuvent tre galement des phrases enti res comme des proverbes ou des maximes Les parties du discours de surface Les parties du discours de surface ne regroupent que les unit s lexicales monolex miques Elles sont au nombre de huit verbe nom adjectif adverbe clausatif pr position conjonction et num ral cardinal Ce sont des classes disjointes form es partir de trois crit res la valence syntaxique passive des lex mes c est dire les r les de d pendants qu ils peuvent remplir la valence syntaxique active des lex mes c est dire les types de d pendants qu ils peuvent avoir eux m mes ainsi que les cat gories flexionnelles syntaxiques des lex mes Parmi les huit parties du discours de surface les cinq premi res correspondent aux parties du discours profondes du m me nom Quant aux trois autres elles sont consid r es comme des types particuliers d adverbes et d adjectifs profonds mais dont le r le et le comportement est si particulier en surface qu elles m ritent une cat gorie propre Selon 2006 45 47 une pr position est un adverbe qui r git en tant que compl ment obligatoire un nom ou une forme nomina
387. son est l amour crime I b passionnel 5 2 2 9 Classe LOCALISATION La classe LOCALISATION regroupe toutes les composantes s mantiques de loca lisation qu elles soient spatiales ou temporelles On distingue deux sous classes une premi re qui regroupe les composantes s mantiques li es au lieu o se d roule un fait par exemple StocFacto avocat 1 1 cabinet cour SiocPreparOper chant 1 a conservatoire cole la deuxi me sous classe concerne la localisation spatiale et temporelle Elle inclut les quatre premi res sous classes de la classe PHASE ASPECT indiquant les phases de d roulement d un fait soit la pr paration le d but le milieu et la fin 185 ainsi que d autres sous classes permettant de positionner dans l espace ou dans le temps ce qui est d not par le mot cl par exemple Pr paration PreparReal ballez 1 gonfler ART D but IncepFuncz abc s 1 se d velopper se former Loc in N Y Milieu Culm haine paromysme Milieu Loc bataille 1 1 durant pendant au cours de ART Fin SoFinFunco hostilit 11 arr t fin de ART s Dans Loc bateau bord de dans sur ART Depuis Loc balcon de depuis ART du haut de ART 5 2 2 10 Classe ACTION EVENEMENT La classe ACTION EVENEMENT regroupe les composantes s mantiques ayant trait une action un v nement ou une activit Les FL pointant vers cette classe
388. st donc avant tout les notions de contexte et de fr quence d occurrence qui d finissent les collocations Ces travaux ont donn nais sance toute une s rie de dictionnaires de collocations dont le BBI 1997 ou l Ozford Collocations Dictionary for Students of English McIntosh et al 2002 D autres approches notamment la LEC consid rent les collocations comme ob is sant des contraintes d idiomaticit Selon ce principe si la collocation est bien une cooccurrence elle ne l est qu en tant que cooccurrence restreinte la seule fr quence n tant pas un crit re suffisant pour d terminer si un syntagme est collocationnel ou non Nous reviendrons en d tail sur la d finition des collocations dans l approche de la LEC la section 2 2 1 18 2 1 2 3 Prototypicit et idiomaticit des liens lexicaux Examinons pr sent la question de la prototypicit des liens lexicaux Des associa tions entre unit s lexicales semblent tre consid r es comme lt meilleures gt c est a dire plus prototypiques que d autres Cette hypoth se a t maintes fois test e par des cognitivistes au moyen de tests de type stimulus r ponse sur des locuteurs pour certaines relations typiques comme l antonymie la synonymie ou encore l hy peronymie Par exemple les deux unit s lexicales GRAND et PETIT fonctionnent comme une paire lexicale prototypique l adjectif GRAND appelant l adjectif PETIT plus spontan
389. stant Pencodage des relations lexicales Enfin il sert de r f rence pour effectuer un certain nombre de calculs sur les informations lexicographiques qui pourront par la suite tre impl ment s pour automatiser la r daction de certains champs de fiches lexicographiques Mots cl s fonctions lexicales syst me de fonctions lexicales fonctions lexicales non standard relations lexicales d rivations s mantiques col locations structuration des bases de donn es lexicales Abstract This thesis proposes a model for structuring lexical relations based on the concept of lexical functions LFs proposed in Meaning Text Theory 1997 The lexical relations taken into account include semantic derivations and collocations as defined within this theoretical framework known as Explanatory and Combi natorial Lexicology 1995 Considering the assumption that lexical relations are neither encoded nor made available in lexical databases in an entirely satisfactory manner we assume the necessity of designing a new model for struc turing them First of all we justify the relevance of devising a system of lexical functions rather than a simple classification Next we present the four perspectives developped in the system a semantic perspective a combinatorial one another one targetting the parts of speech of the elements involved in a lexical relation and finally a last one emphasizing which element of the relation is focused on
390. ste FL cit es xix Annexe IT Applications realis6es aveclesFL xxix X xxix 5277777 xxii Jou eee eee neds so xlii IL5 Applications des FL en Traitement Automatique des Langues xlvii Annexe Codification des classes du syst me de lv Liste des tableaux 2 1 Comparaison des ressources lexicales relationnellesi 56 2 11 Exemples de concepts d action DETERIORER et R PARER 61 41 FLNS li es aux lexies d animaux avant et apr s normalisation 121 AIT Correspondance entre FL et d rivat mes 135 59 Classes des couples de parties du discours associ s aux liens lexi caux encod s par les FL 4 4 4 4 eee ke ee bass 211 6 1 Distinction de deux lexies l aide des marques d usage 240 G IT Distinction de trois lexies l aide des marques d usagel 240 6 111 Paires de FL inference simple 245 PL r fl chiesS 2 ee ee RR ss sas ee ee 246 de FL inversesl 247 Liste des figures 2 1 D finition des unit s lexicales HAPPY et SAD au moyen de primi Hi s mantiques Wierzbicka 119901 180 et 215 12 2 2 Description de l unit lexicale CAR dans le lexique g n ratif 77 tejovsky 1995 13 2 3 Extrait du vocable GLOOMY dans VVordNetl
391. stigationes 2 32 293 304 2009 Gilles Maurice De Schryver Lexicographers Dream in the Electronic Dictionary Age International Journal of Lexicography 16 2 143 199 2003 Pavel Diachenko Lexical Functions in Learning the Lexicon Current Develop ments Technology Assisted Education pages 538 542 2006 Jean Dubois et Fran oise Dubois Charlier La d rivation suffrale en fran ais Nathan Paris 1999 266 Karine Duvignau La m taphore berceau et enfance de la langue La m taphore ver bale comme approximation s mantique par analogie dans les textes scientifiques et les productions enfantines 2 4 ans Th se de doctorat Universit Toulouse 2 2002 K O Erastov Primery slovarnyx opisanij Some sample lexicographic descriptions Mavsinnyi perevod i prikladnaja lingvistika Automatic Translation and Applied Linguistics 11 36 59 1969 Martha Evens James Vandendorpe et Yih Chen Wang Lexical Semantic Relations in Information Retrieval Dans Stephanie Williams dir Humans and Machines pages 73 100 Ablex Norwood New Jersey 1985 Martha W Evens Bonnie E Litowitz Judith A Markowitz Raoul N Smith et Oswald Werner Lexical semantic relations a comparative survey Linguistic Research Inc Edmonton Alberta 1980 Pamela Faber et Maribel Tercedor Sanchez Codifying conceptual information in descriptive terminology management Meta XLVI 1 192 204 2001 Christiane Fellbaum dir Wor
392. struire des r seaux s mantiques avec des relations semantico conceptuelles tandis que ceux qui travaillent sur les aspects lexicaux se concentrent exclusivement sur les relations entre unit s lexicales Or selon les conclusions d Evens qui reposent sur des exp ri mentations r alis es sur des locuteurs les relations conceptuelles du lexique mental ne coincident pas avec une organisation purement linguistique WordNet propose des concepts non lexicalis s r sultant de la structure relationnelle de la base qui peut lier deux concepts par le biais d un troisi me non lexicalis en anglais Cette structuration refl te des trous lexicaux lexical gaps de la langue Cependant ces lt trous gt ne doivent pas tre consid r s comme des artefacts structuraux ils sont souvent lexicalis s dans d autres langues et r v lent des structures concep tuelles diff rentes des structures lexicales WordNet ne se pr occupe pas des relations syntagmatiques La description est cen tr e sur une s mantique des unit s lexicales plus que sur une s mantique textuelle ou discursive Par cons quent les relations syntagmatiques ainsi que les propri t s de combinatoire des unit s lexicales font d faut dans la base Par ailleurs aucune information d ordre tymologique n est fournie Miller id 35 a observ que cer taines relations de notre lexique mental comme la relation 18 NOT A ex A whale is not a fish gt ne sont p
393. subir ART N Y En 110 les valeurs sont bi actantielles elles prennent pour actant syntaxique profond le premier actant syntaxique profond du mot cl et pour second actant le mot cl lui m me Le deuxi me actant de INTERROGATOIRE n est pas un actant syntaxique profond des valeurs de la FL mais d pend de son mot cl En 111 la valeur est tri actantielle elle a les deux m mes premiers actants syntaxiques profonds que les valeurs en 110 ainsi qu un troisi me actant syntaxique profond 199 correspondant au deuxi me actant syntaxique profond du mot cl Au niveau syn taxique profond les deux relations seraient repr sent es par deux arbres distincts Cette observation a conduit 4 augmenter la granularit de cette FL en proposant une FL Oper pour repr senter les o comme en 111 la valeur prend l actant du mot cl pour deuxi me compl ment Les diff rentes FL Oper pointent donc vers des classes diff rentes selon le type de valeurs qu elles retournent alors que les Oper pointent vers la classe 2 les Oper pointent vers la classe 3 Classe 3 Structures actantielles trois actants Les relations actantielles trois actants sont regroup es dans la troisi me classe On observe un grand nombre de patrons avec plusieurs permutations possibles du mot cl et de ses diff rents actants par exemple 1 2 pour les FL Fact et Func2 2 1 pour les FL Labreal et Labor etc On
394. suivante Adjectifs QSyn cabochardaaj ent t xaj obstin intraitable intransigeant inflexible born QAnti accommodant arrangeant conciliant flexible souple raisonnable Verbes Vo lavoir la t te dure Manif s ent ter Noms So ent tement S t tun cabochardy ent t n t te de mule t te de cochon Adverbes Magn comme une bourrique comme une mule On note pour certaines unit s lexicales la pr sence d interjections parmi les d ri v s s mantiques Par exemple pour FUSIL 1 a 206 Interjections ImperReal fusil 1 4a Feu gt x Tirez lt En joue Dans la suite de cette section nous exposons la fa on particuli re dont la notion de partie du discours est trait e dans la th orie Sens Texte et sur laquelle repose notre travail de classification La TST distingue en effet les parties du discours profondes des parties du discours de surface qui sont respectivement impliqu es dans les repr sentations syntaxiques profondes et de surface cf section p 193 Nous traitons galement la question des parties du discours associ es aux locutions Une fois ces concepts d finis nous passerons l expos des diff rentes classes labor es pour le syst me de FL 5 4 2 Les parties du discours dans l approche Sens Texte 5 4 2 1 Parties du discours profondes et parties du discours de surface Les parties du
395. t des contraintes syntaxiques et lexicales L objectif d A Nasr est d utiliser les ca pacit s paraphrastiques de la th orie pour r aliser la reformulation des structures interdites par des structures autoris es Le mod le propos comporte trois phases principales premi rement une phase d analyse l issue de laquelle une repr sen tation syntaxique profonde de la phrase formuler est construite deuxi mement une phase de transformation consistant modifier la phrase d origine par applica tion de r gles de paraphrasage et finalement une derni re phase de reg n ration qui consiste synth tiser une nouvelle phrase en s assurant de ne pas r introduire de structures interdites Le syst me Realpro Lavoie et Rambovv 1997 est un synth tiseur pour des syst mes de g n ration de texte fond sur la syntaxe de d pendance de la th rie Sens Texte Il prend en entr e des structures syntaxiques profondes et suit tape par tape les diff rents modules de la th orie Sens Textd soit les modules syntaxiques profond et de surface et morphologiques profond et de surface Par la suite un composant graphique ins re la ponctuation Le syst me se r f re une grammaire ainsi qu un lexique pour intervenir aux diff rentes tapes I est principalement d velopp 10Se reporter aux paragraphes p ou 193 pour une d finition des diff rents modules de la Th orie Sens Texte xlix pour l
396. t cl de la FL Participant ext rieur Premier actant du mot cl Deuxi me actant du mot cl Troisi me actant du mot cl Quatri me actant du mot cl Cinqui me actant du mot cl Sixi me actant du mot cl Valeur de la FL Figure II 4 Codes associ s aux cibles communicationnelles des FL lix
397. t cl ou argument de la fonction Nous cartons temporairement Vaspect formel pour nous concentrer sur l invariant conceptuel que l on peut d ga 69 ger de ces diff rents encodages 2003 a d j pr sent l int r t de d v tir les FL de leur formalisme dans un cadre p dagogique o l aridit de la forme n est pas appropri e en tant que support pour l apprentissage de la notion et pour son utilisation S parer la notion de la forme permet une certaine prise de recul pour percevoir les principes sous jacents 4 la conceptualisation des FL et les diff rentes formes qu elles rev tent les critiques que nous formulerons portant sur ces deux facettes Nous pr sentons dans un premier temps section 5 2 la notion de FL en d ve loppant plusieurs aspects th oriques Dans un deuxi me temps section 3 3 nous pr sentons les diff rentes formes d encodage formalisant la notion de FL soit l en codage de vulgarisation utilis dans le Lexique Actif du Fran ais LAF len codage traditionnel ainsi que les encodages algebrique et explicite Nous mettons Paccent sur l encodage traditionnel pour lequel nous proposons une typologie et une discussion critique 3 2 La notion de fonction lexicale Afin de fournir une caract risation compl te de la notion de FL nous envisageons plusieurs aspects li s leur d finition leur nature et le r le qu elles jouent dans le mod le Sens Texte ainsi que leur caract
398. t d riv pour rendre compte de cette relation Observons pr sent les conditions d terminant si les deux fonctions Compos et Produit d riv que nous proposons peuvent tre consid r es comme standard La condition de cardinalit est remplie dans la mesure ot ces relations concer nent au moins un grand ensemble de lexies d notant des entit s physiques La condition de diversit au vu des exemples semble galement satisfaite Concernant l int gration au syst me de FL ces deux FL forment une paire de FL inverses ce qui motive leur cr ation et en fait de bonnes candidates au statut standard 127 4 3 2 FLNS normalis es Les FLNS que nous pr sentons ci dessous n ont pas pour ambition d tre standard soit que le crit re de cardinalit n est pas rempli c est dire que ces relations ne concernent pas un nombre suffisamment important d unit s lexicales soit que le crit re de diversit a chou De plus les formules normalis es que nous proposons ne s int grent pas forc ment au syst me de FL Nous pr sentons titre d illus tration de la d marche empirique cinq formules d encodage normalis es Metr Marque Document associ Axe et V tement typique Notons bien que les formules propos es ont pour objectif de regrouper des relations similaires Il s ensuit donc in vitablement une g n ralisation et par cons quent une perte de pr cision dans la d finition du sens de l
399. t syntaxique des pr dicats Par exemple le verbe GIVE sera d crit au moyen du cadre qu il voque le cadre lt TRANSFER gt dont les l ments sont DONOR THEME et RECIPIENT GIVE peut tre exprim selon deux patrons syntaxiques diff rents comme Tillustrent les exemples ci dessous 1 The teacher gave the student a book 2 The teacher gave a book to the student On d duit de ces phrases deux patrons de r alisation grammaticale 1 l ments DONOR RECIPIENT THEME Syntagmes NP NP NP Fonctions syntaxiques Sujet Compl ment Compl ment d objet 2 l ments DONOR THEME RECIPIENT Syntagmes NP NP PP to Fonctions syntaxiques Sujet Compl ment d objet Compl ment 2 Relations entre unit s lexicales dans un m me cadre Les verbes GIVE et RECEIVE voquent tous les deux le cadre lt TRANSFER gt Ils dif f rent quant aux perspectives qu ils imposent sur l v nement de transfert On observe une diff rence entre les r les th matiques et les l ments de cadre Une 36 analyse selon les r les s mantiques attribuerait deux ensembles de r les distincts TO GIVE et TO RECEIVE TO GIVE Agent Theme Recipient TO RECEIVE Recipient Theme Source Il est vrai que l on peut d duire globalement partir des r les s mantiques des g n ralisations sur les fonctions syntaxiques Par exemple les r les Recipient sont plus susceptibles d tre sujets que les r
400. t tant t le terme participant et emploie indiff remment les termes specific typical et standard 5 1 1 3 Classification de Grimes Dans le m me ouvrage dit par Steele Grimes propose une nouvelle voie pour l organisation des FL Il rejette la distinction traditionnelle entre paradigmatique et syntagmatique jug e non pertinente Like many other things in language lexical functions do divide accor ding to the well established opposition between paradigmatic and syn tagmatic phenomena 160 It fits well with the history of linguistic thought to view the functions in this way but I have not found so far that it does any more for us than that Instead I believe there are more productive ways to relate the functions to each other than by appealing to the opposition between paradigmatic and syntagmatic 11990 350 351 Grimes propose alors de mettre en valeur les liens d inference existants entre les FL Cette fa on de proc der conduit s parer deux types de FL celles qui s as socient naturellement en paires appel es INVERSE LF gt et celles qui d crivent une caract risation ou une action li e au mot cl sans se grouper d autres FL appel es DETAIL LF Dans la figure p 164 nous avons reproduit sa classification avec la terminologie anglaise originale telle qu elle est pr sent e dans 1990 360 Selon son point de vue les FL ne sont plus consid r es comme un simple moyen de
401. tant l l ment qui subit la modification soit ici le mot cl Ce patron s applique aux FL telles que Ver Bon Magn etc par exemple Ver ami 1 1 fid le que l on peut repr senter par le sch ma suivant 1 an an Ver FID LE Classe 6 Relations attributives un actant Les PL paradigmatiques ne sont logiquement pas concern es par l organisation combinatoire des FL puisqu elles ne retournent pas de valeurs formant un syntagme 201 avec le mot cl Cependant comme nous l avons mentionn plusieurs reprises dans la th se aux sections et 3 3 4 il arrive que les liens lexicaux encod s par certaines FL paradigmatiques soient syntagmatiques Par exemple la FL Able repr sente une relation paradigmatique de d rivation adjectivale potentielle du mot cl Or dans l exemple ci dessous Able rancune rancunier port ART on s aper oit que cette FL appliqu e a la lexie RANCUNE a comme valeurs d une part un d riv adjectival en relation paradigmatique rancunier d autre part un adjectif prenant RANCUNE en tant qu actant port la rancune On recense de nombreux cas similaires M me si ces cas ne sont pas syst matiques on observe que certaines FL paradigmatiques ont tendance retourner des valeurs en lien syntagmatique avec le mot cl Il s agit notamment des d riv s actantiels adjectivaux Ai A etc adverbiaux Adv etc ainsi
402. tant que telle le tout respec tant une syntaxe pr d finie Nous avons d j propos un tel mod le pour les FLNS adjectivales Si l on suit ce mod le les FL en et pourraient tre crites comme en 148 et 149 1481 Finalit frapper qqn Labrealja ceinture 1 1 battre N avec ART 149 Dur e temporairement_LiquFunco conversation a interrompre ART Ce travail de normalisation permettrait de mieux g rer et organiser l ensemble des FL semi standard ainsi que de mettre en valeur le lien qui les unit aux d finitions des lexies auxquelles elles s appliquent Pour ce qui est des d veloppements logiciels nous souhaitons mettre l accent sur Vavancement et la popularisation du DiCo Nous pensons qu il est indispensable que le DiCo int gre un processus d automatisation s il veut tre reconnu comme une ressource lexicographique de r f rence et non comme une simple illustration du 260 mod le th orique de la LEC Nous envisageons la r alisation de trois projets pour amorcer l automatisation et assister les lexicographes dans la r daction d articles de DiCo Rappelons une fois de plus que ces projets peuvent aussi bien s appliquer n importe quelle BLEC Le premier projet consiste poursuivre la m thode endog ne d enrichissement du DiCo D autres pistes restent 4 explorer concernant notamment la d termina tion du nombre d actants d une lexie la transmission des tiquettes
403. tarting point finding out about its lexical cor relates and the ways they relate to the starting lexeme and following those paths until there are no more left to follow The number of path to investigate is enormous to be sure but we always know where we are No strategy can reduce the size of the task because the lexicon is innately complex and huge but this way we can be sure of reasonably adequate coverage It does not matter where we start lexical structure is a clear case where tout se tient Nous pr sentons dans cette section les ressources lexicales vis e p dagogique d velopp es dans le cadre de la LEC soit le LAF pour le fran ais et le DICE pour l espagnol Dans le domaine de l Apprentissage Assist par Ordinateur AAO plusieurs projets sont d velopp s autour des FL et de la LEC Nous pr sentons les applications CALLex ainsi que le DAFLES et son environnement d apprentissage Alfalex Le LAF Le Lexique Actif du Fran ais LAF Mel uk et Polgu re 2007 a t d velopp conjointement au DiCo a POLST Les fiches du DiCo sont transpos es vers des xliii article du LAF comme nous l avons montr la figure p avec la lexie ABOIEMENT Les relations lexicales y sont repr sent es au moyen d un encodage vulgaris des FL pr sent la section 3 3 1 Associ es au LAF un certain nombre de fiches p dagogiques sont cr es afin de guider le parcours du lexique ou comme support
404. tecture beaucoup plus riche le DiCobjet permettant d am liorer et d af finer les diff rents modes d acc s aux donn es Le DiCo se consulte actuellement au moyen de Tinterface DiConebdf Le DiCou be permet d effectuer des requ tes pr definies sur une base de donn es SQL Les r sultats sont affich s dans des tables HTML Il est possible d effectuer les requetes Paide d une interface de requ tes ou directement en mode SQL et d exporter les r sultats Un nouveau format de structuration du DiCo est en cours de d veloppement Il s agit d un syst me lexical dans lequel chaque entit est isol e et connect e d autres via un certain nombre de relations 2009 Une des applications du syst me de FL que nous laborons dans la th se est la confection d interfaces de consultation pour le DiCo ou autre BLEC Ces in terfaces doivent permettre plusieurs acc s r pondant diverses motivations qui poussent un utilisateur 4 consulter une base de donn es lexicale recherche ortho graphique onomasiologique en fonction de structures syntaxiques sp cifiques de parties du discours etc Nous aurons l occasion de pr ciser quels types d interfaces pourront tre cr es tout au long du chapitre SL interface DiCou be peut tre consult e l adresse suivante http www olst umontreal Pour une description d taill e du fonctionnement du DiCou be nous invitons le lecteur se reporter la docum
405. the dictionary Fontenelle 1997bi 102 Dans la base de donn es du Robert amp Collins Fontenelle 1997b pr s de 70 000 liens ont pu tre encod s par des fonctions standard et plus de 18 000 liens dont certains sont pourtant tr s fr quents sont rest s sans description D apr s l analyse d un nombre si cons quent de relations Fontenelle sugg re la cr ation de nouvelles FIF De notre point de vue ce n est qu en tendant la description des relations lexicales l chelle du lexique d une langue que l on pourra v ritablement d ter miner un nombre de FLSS On ne peut non plus traiter la question du nombre de FL sans aborder la notion de la granularit dans la description des relations lexicales La difficult principale lorsque l on cherche d crire le sens d une relation lexicale est d opter pour un de gr de pr cision ou de granularit id al Pour que l on puisse parler de FL standard la granularit d une description ne doit pas tre trop restreinte c est dire qu elle doit tre suffisamment large pour concerner un grand ensemble de lexies Ceci est aussi valable pour le cas contraire savoir pour viter la description trop g n rale 5Certaines de ces propositions sont pr sent es au chapitre 4 portant sur les FL non standard 99 d une relation Le d fi est donc de trouver le bon quilibre entre un degr trop fin ou trop large de granularit Consid rons les exemples
406. tion abstraite Elle existe au m me titre que la notion de partie du discours ou de genre grammatical 71 La confusion entre les FL et le formalisme qui permet de les identifier est tr s fr quente L encodage traditionnel des FL jug trop aride tend parfois d courager certains lexicographes ou didacticiens qui pourraient pourtant b n ficier des po tentialit s qu elles ont offrir pour la repr sentation et l enseignement du lexique Dans la suite de ce chapitre nous tentons autant que possible de pr senter la notion de FL en mettant de c t la question de l encodage afin d viter au lecteur de faire l amalgame entre les deux Voyons pr sent pour quelles raisons on consid re les FL comme des fonctions Elles modelisent deux types de relations lexicales la derivation semantique et les collocations Ces deux notions ont t d finies et pr sent es en d tail la section p du chapitre pr c dent Les d rivations s mantiques et les collocations sont orient es d une lexie de d part vers une lexie cible le choix de la deuxi me tant d termin par la premi re Ainsi dans TVexpression collocationnelle admi nistrer un m dicament Vemploi du verbe ADMINISTRER est contraint par celui de la lexie MEDICAMENT Comme ces liens sont orient s ils peuvent tre repr sent s par des fonctions Ces fonctions sont dites lexicales parce qu elles prennent en ar gument ou mot cl et retournent
407. tion ou la qualification d un actant s mantique en correspondance avec l actant syntaxique profond du mot cl Il s agit principa lement des d riv s nominaux ou adjectivaux actantiels qui repr sentent les noms et modificateurs typiques des actants syntaxiques profonds n i tels que S1 S S3 Able Qual etc par exemple 119 Able bagarre a bagarreur 120 Qual2 adoration 4a merveilleux 121 S3 accusation 1 2 motif d 1 d lit m fait Pour ces types de relations nous consid rons que la cible communicationnelle est l actant s mantique du mot cl identifi ou qualifi par la FL Ainsi dans la re lation 119 la cible communicationnelle est le premier actant s mantique de BA GARRE a dans la relation 120 la cible communicationnelle est le deuxi me actant s mantique de ADORATION a et dans la relation 121 la cible communi 220 cationnelle est le troisi me actant s mantique de ACCUSATION I 2 Le deuxi me cas regroupe les FL paradigmatiques notamment les d riv s no minaux circonstanciels ou diff rentes FLNS qui identifient un circonstant ou un participant exterieur la structure actantielle du mot cl de la FL comme dans les quatre relations ci dessous 122 Individu qui v rifie des voyageurs dans les trains billet 1 2 contr leur 123 Individu qui contr le le d roulement d bat 42 animateur de ART 1
408. tions les FL sont num r es par ordre alphab tique Chaque FL est accompagn e d une glose explicative mise 4 part les FL non standard qui sont suffisament explicites et d un exemple Les FL standard semi standard ou non standard marqu es d un petit cercle o sont celles que nous avons propos es dans la th se celles marqu es d un losange ont t propos es par d autres auteurs notamment 1969 Fontenelle 1997b et 2003 enfin celles marqu es d un ast risque sont celles que nous proposons d liminer Bien que les FL aient dans la plupart des cas plusieurs valeurs nous n en reproduisons qu une par exemple afin d all ger la pr sentation XX anb s sne yob Luv T2 720q9 p 0oun qauo sne ap Joy suv op juaprsaud g h piqut sso de gt anod juejez np e nb A X anod woy z 1099p T Tsuog SPOUHP snid x apua Yob ubol suv s y n Z 220 sn qpaigsney uog aquessalaqu euounsionuoo nu syuoouog uaig uog ajqou sijejuaw3ny wop w3nyo su qul uoy tss z THawspisnoyjua uSe A Anuy uoy 274978 ez uonpsd anio i Anuy 21DUIS uou uo3ej q 7u tu l otu upnojddD h Nnuy e a qo sed au A suv wasnfar uumqpuuqyn
409. traire les composantes s mantiques li es aux FL nous avons utilis les gloses de vulgarisation qui leur sont associ es dans le DiCo et dans le LAF Ces gloses font office de petites d finitions des FL Toutefois comme nous l avons mentionn la section une FL est souvent vulgaris e de plusieurs fa ons selon les lexies auxquelles elle s applique Par exemple neuf gloses sont associ es la FL IncepPredPlus se d veloppe devient plus rapide devient plus intense augmente deviennent plus intenses devient plus marqu e devient plus grand devient plus marqu devient plus large Par cons quent nous avons choisi pour identifier les composantes s mantiques un terme g n ral englobant l ensemble des formulations possibles dans les diff rentes gloses Par exemple pour la FL IncepPredPLus nous avons d gag deux compo santes s mantiques augmentation et commencement De la m me fa on vingt neuf gloses sont associ es la FL CausFuncg Qqn Qqch causer Ph nom ne naturel cr er Qqch causer qu il y ait Brebis donner naissance Qqn causer que ait lieu Qqch tre la cause de Qqn mettre en service Qan fabriquer Qqn faire en sorte qu il y ait l endroit N Qqch causer qu il y a Qqn causer qu il y a Qqn rendre possible Qqn cr er Qqch causer causer de X Qqn causer que se d ve loppe l endroit N
410. tte relation lexicale et d homog n iser son encodage l aide d une FLNS commune Document associ 60 a Publication r sultant de congr s actes comptes rendus de ART b Transcription de ce qui est dit durant interrogatoire proc s verbal de ART c Document officiel o les informations sur la de X sont enregistr es nais acte certificat extrait de 130 4 Rapport r dig par X pour rendre compte de autopsie rapport d 4 3 2 4 Axe Cette relation concerne une entit qu elle soit physique ou non ou un fait et le nom exprimant la trajectoire l axe ou encore la direction suivie par cette entit ou ce fait Outre les exemples extraits du DiCo ci dessous en 61 cette relation peut unir des paires de lexies comme HISTOIRE et FIL ROMAN et TRAME etc 61 a Trajectoire de com te 1 course route de ART b Parcours suivi par fleuve I cours de ART c Parcours suivi par rivi re I cours de ART d Parcours suivi par ruisseau cours de ART e Trajectoire de tir 43 aze trajectoire de ART f Strat gie mise au point pour bataille 41 1 plan 2 III 1 de 4 3 2 5 V tement typique Nous proposons la cr ation de la FLNS V tement typique pour formaliser le lien entre un individu occupant un certain m tier ou une certaine fonction et l uniforme qu il rev t cet effet En compl ment des exemples
411. tural Language Processing to Produce Weather Forecasts Dans IEEE Expert 9 2 pages 45 53 1994 Joseph Grimes Inverse Lexical Functions Dans James Steele dir Meaning Text Theory Linguistics Lexicography and Implications pages 350 364 Ottawa Uni versity Press Ottawa 1990 Joseph Grimes Lexical functions across languages Dans Leo Wanner dir Lexical functions in lexicography and natural language processing Studies in Language Companion pages 103 13 Benjamins Amsterdam 1996 B n dicte Grizolle Classification des fonctions lexicales non standard du Dico Rapport de stage OLST Universit de Montr al 2003 Maurice Gross M thodes en syntaxe Le r gime des constructions compl tives Hermann Paris 1975 Yvan Gut Puteri Rashida Megat Ramli Zaharin Yusoff Chuah Choy Kim Sa lina A Samat Christian Boitet Nicolas N dobejkine et Mathieu Lafourcade 268 Kamus Perancis Melayu Dewan dictionnaire Fran ais Malais Dewan Bahasa Dan Pustaka Kuala Lumpur 1996 Zellig S Harris The Elementary transformations Dans Transformations and Discourse Analysis Papers 54 Universit de Pennsylvanie Philadelphie 1964 Franz Joseph Hausmann Tout est idiomatique dans les langues Dans M Martins Baltar dir La Locution entre langue et usages pages 277 290 ENS Editions Fontenay aux Roses 1997 Gabriel Antoine Joseph H cart Dictionnaire rouchi fran ais Lemaitre Valen ciennes 3 diti
412. ualificatifs Certaines FL nominales ou verbales peuvent tout fait entrer en ligne de compte si elles sous entendent un jugement ou une caract risation du mot cl ou de ses participants La classe intensit recouvre quatre sous classes La premi re sous classe regroupe les composantes s mantiques qui ont trait au jugement 182 qu il soit positif par exemple VerFacto montre tre exacte fonctionner bien BonS 2 d bat 2 d batteur ou n gatif par exemple AntiVer piste 11 vague embrouill e AntiBonS th dtre 1 1 cabotin th treur La deuxi me sous classe recouvre les qualificatifs ayant trait a Tintensit qu il s agisse d une forte intensit par exemple Magn aboiement 1 fort furieux f roce Magn lncepOper abattement 1 sombrer dans ART CausPredPlus crainte attiser exciter ART Culm haine paroxysme de ART ou d une faible intensit par exemple AntiMagn p cule modeste petit AntiBon AntiMagn Oper conversation b avoir peu ne pas avoir beaucoup de CausPredMinus fardeau 11 all ger ART La troisi me sous classe regroupe les composantes s mantiques concernant l ap parence physique d une entit d not e par le mot cl De nombreuses FLNS pointent vers cette sous classe Nous les organisons en fonction des attributs labor s au chapitre pr c dent section 14 5 soit taille forme couleur ma t
413. un Buis qeynsay Pnuaf unaqn7 S assed s 1uop uosey g a10 PMS 48511294 USOW p 247707 I asnozra PUS as yospug ayoupw aupuan I Juawnsysu ayopad H urauf Teayt ss uepre Jsodsiq azza1p619 awinf Z uawnf SIS Anagque daajs dn 1 NI S Z anod woy unajuod nb vy A 4nod woy au91ssnod yiq es uSe3 inb A anod woy unanburva 774u02172 9d WO ajqesonej nssi Tyeayts xne3 anbugey inb 14727129 4eANUY eSa perdsneD Ts anbugel inb inje saruna autmuof 0ounysney Is A X anod woy 1 1142 110104 2 7 X anod woy 1 nbid q uos woy 7u tu sszuu 1 uoS0S op dnoo eZuoffinjo t e u3uis0s Luv op juowossyduwuoson ussap He Mos ap uonen1iS 709429 9497092199 peid0S ap uolzediisuaquy Luv op aa7wow 7UaWAazUazUOI9W sn p aqd uq0s leuruou 1u eAInbg fuastwpn 0S jueynsai uoipy aavy o fing 07 1nsay suv uazuowas
414. un ensemble de lexies qu on appelle base par exemple AIMER et d un collocatif choisi en fonction des unit s lexicales associ es pr f rentiellement cette base On choisira ainsi pour exprimer l intensit aupr s de AIMER l un des adverbes ou locution adverbiale suivants A LA FOLIE PASSIONNEMENT PERDUMENT plut t que l adverbe INTENS MENT ce dernier tant moins naturellement ou spontan ment utilis par les locuteurs du fran ais Le comportement des signifi s des l ments d une collocation est d crit par 2008 7 de la fa on suivante Dans une collocation la base poss de son sens usuel tandis que le col locatif est g n ralement d natur et exprime avant tout le sens de la fonction lexicale Il en r sulte que si l on prend une collocation comme une col re aveugle on voit qu il est facile de commuter le collocatif avec de nombreux l ments collocationnels ou non une col re froide une col re sourde une col re hom rique etc et en particulier avec une ex pression p riphrastique une col re qui s exprime sans contr le il est par contre difficile de commuter proprement la base aveugle se com bine surtout avec des noms de sentiments proches de COL RE comme HAINE bien que la fonction lexicale puisse se combiner avec d autres noms de sentiment et donner d autres valeurs comme une peur panique Notons que tout au long de la th se seules les collocations seront tudi es
415. un autre compos d ana lyses de lexicalisations pr coces verbales c est dire au moyen de verbes produites spontan ment par des enfants entre deux et quatre ans Ces derni res s apparentent des m taphores puisqu elles pr sentent elles aussi des combinaisons inhabituelles de termes sur le plan s mantique Ces diff rentes sources se rejoignent dans le sens o les deux types de locuteurs adultes comme enfants se situent dans une d marche explicative visant se faire comprendre par leurs interlocuteurs Associ e Gaume Gaume et Duvignau 2004 Duvignau cherche cr er un lexique m tapho 58 rique mental d apr s un mod le computationnel de l approximation s mantique par analogie Leurs travaux combinent une approche psycholinguistique et linguistique une approche math matique et informatique Leur hypoth se est la suivante Elaborer des dictionnaires lectroniques en s appuyant sur une th orie linguistique qui s av re tre en ad quation avec des processus d acqui sition pr coce du lexique leur conf rera un caract re ergonomique et devrait ainsi am liorer leur utilisabilit Gaume et Duvignaul 2004 p 158 Partant de cette hypoth se leur objectif est de d velopper une m thode math ma tique susceptible de r v ler les traces d une structuration pr coce du lexique mental Le principe de la m thode est de tirer parti de la structure math matique du r seau des re
416. un m talangage naturel qui met l accent sur la lisibilit et la clart de la formulation Ceci a pour cons quence Texistence de variantes synonymiques comme on peut le constater dans les trois exemples suivants Discipline qui tudie m dicament pharmacologie Science qui tudie poisson ichtyologie Etude de signe astrologie Tel quel cet encodage est tr s h t rog ne et inexploitable pour la maintenance des BLEC et les applications en TAL il n est ni rep rable ni analysable de fa on automatique Nous traitons en d tail le probleme des FL non standard dans le chapitre o nous cherchons d terminer des strat gies de norma lisation de l encodage des FL non standard dans le but de les homog n iser et de faire appara tre certaines r gularit s s mantiques 104 3 3 3 4 Absence d un syst me pour l organisation des FL Le quatri me probl me que nous souhaitons mettre en avant est l absence d un syst me d organisation pour les FL Celles ci formalisent plusieurs aspects d une relation lexicale le sens de la relation not e sens dans la figure 5 6 la partie du discours de la valeur pos le r gime syntaxique de la valeur reg la nature paradigmatique ou syntagmatique de la relation rel A partir de cet encodage il est donc possible de d gager des sortes de fiches d identit des relations lexicales comme Tillustrent les quatre exemples de la figure 3 6 extra
417. une norma lisation des FLNS Notre objectif dans ce chapitre tait de proposer deux m thodologies pour le re p rage des analogies entre liens lexicaux et la r gularisation de leur encodage en harmonie avec le syst me plus global de FL La premi re m thode consiste exploi 153 ter le lien troit existant entre les FL et le ph nom ne de d rivation morphologique pour rep rer et m me pr voir des similitudes entre liens lexicaux Elle concerne plus particuli rement les d riv s s mantiques La seconde m thodologie tr s diff rente de la premi re porte sur les FL syntagmatiques et consiste d gager les diff rents attributs concern s par les relations encod es Ces deux m thodologies permettent de pr voir les liens lexicaux d crire au fur et mesure de l volution de la base de donn es Par exemple les relations tude de Discipline tudiant et Qui voque d gag es l observation des suffixes logie et eux ont de fortes chances de s appliquer un certain nombre de lexies non d crites actuellement dans la base DiCo Enfin les encodages propos s principalement ceux de la seconde m tho dologie vont permettre une organisation explicite des FLNS dans le DiCo et les autres bases de donn es du m me type Leur formalisation permettra de les rep rer et de les manipuler automatiquement Les attributs viendront s int grer l int rieur d une organisation s mantiqu
418. ur second actant syntaxique profond le premier actant syntaxique profond du mot cl Par exemple la forme propositionnelle de la lexie ABAT JOUR tant la suivante MIS SUR L artefact X on a comme valeur de Fact Facti abat Jour coiffer N X que l on peut illustrer dans la figure Factl COIFFER Il Il l Premier actant de ABAT JOUR x Figure 5 8 Valence de Fact Nous ne conservons de l encodage explicite que la partie syntaxique sans l indication de partie du discours dans la mesure o nous souhaitons Tisoler des autres types d information contenus dans les FL Pr cisons a pr sent certaines informations pour la lecture de l encodage explicite repr sente le mot cl 1 2 3 4 repr sentent les actants syntaxiques profonds I II III IV du mot cl repr sente un actant ext rieur la structure actantielle du mot cl par exemple dans la FL suivante Facta cri 1 1 parvenir N le compl ment du verbe repr sente un participant de la situation qui ne correspond toutefois pas un actant du mot cl est un signe de modification le symbole pr c d de est l l ment modifi par la valeur retourn e la FL Par exemple pour la FL Aj A haine haineux on aura la formule 1 qui indique que l application de la FL modifie le premier actant du mot cl soit X dans sa structure actantielle de haine DE LA personne O
419. ures au d par tement de linguistique et traduction de l Universit de Montr al et l organisme xviii Egide pour toutes les bourses dont j ai pu b n ficier Je dois encore remercier les tudiants coll gues et amis aux c t s de qui j ai v cu toutes ces ann es notamment Lucie Barque Mathieu Boulanger Ivan Carel et Fanny Lemetayer Sara Anne Leblanc Carolina Navarette tienne Nguyen Syl wia Ozdowska C line Raynal B n dicte et Jacques Steinlin et Oph lie Tremblay ma m re qui m a rendu un grand service pendant le sprint final en s occupant de Marianne et en m all geant de bien des t ches Eric Buist pour son aide pr cieuse en 4TRX et Fran ois Lareau qui a su d crypter pour moi certaines proc dures ca balistiques li es 4 la cotutelle Enfin mes amis de France et de Montr al mes fr res et s urs mes parents Fr d ric et Marianne m ont apport soutien encouragement et r confort tout au long de ma th se je les en remercie infiniment Chapitre 1 Introduction 1 1 Problematique de la recherche Cette th se vise P elaboration d un mod le de structuration des relations lexicales impl mentable dans une base de donn es lexicale La probl matique de la th se s inscrit dans le cadre des nouveaux d fis pos s par l volution de la lexicographie Au cours du si cle dernier celle ci a subi une modification de ses m thodes et objectifs Cerguilini cit dans De Schryver 2
420. urrentes dans la langue mais non couvertes par les fonctions existantes Nous en reproduisons quelques unes ci dessous Matur Commencer a etre pret Matur fruit to ripen Matur cheese to age to mature Cum o Appartenant au m me groupe avec un statut quivalent Cum citizen compatriot fellow countryman Cum teaml member team mate Pel Quelque chose qui couvre et prot ge L Pel bean pod Pel egg shell Pel book cover binding Mobil Etre en mouvement de facon normale prototypique Mobil water to flow to pour to run Mobil bird to fly Prim premier plus important parmi un ensemble de L Prim entrance main Prim door front Prim city capital Vacant Libre vacant qui peut tre utilis Vacant ressources available Vacant seat free vacant 119 Fas Partie avant de L Fas house front frontage of ART Fas ship bow prow of ART LocLim Aux limites de L LocLim country within the borders of ART 2007 met quelques r ticences Pegard de certaines de ces fonctions Matur premi rement ne semble pas satisfaire la condition de cardinalit puisqu elle ne concerne grosso modo que les lexies qui d notent des entit s comestibles Mobil peut tre consid r e comme un cas de Facto Action typique de Vacant est un cas sp cifique de A A
421. us avons trouv parmi les FLNS des relations adjectivales d rivationnelles cor respondant au sens qui a l aspect de ou qui voque dont certaines figurent dans les exemples 73 Ces relations s mantiquement tr s similaires sont la plupart du temps morphologiquement marqu es et nous semblent relativement fr quentes Nous pensons qu elles pourraient tre encod es l aide d une FLNS unique et g n rale comme Qui voque 73 a Qqch qui a l aspect ou la consistance de lait b laiteux b Qqch qui a la consistance lt le go t gt de farine farineux c Qui a l aspect lt la consistance de cire cireux d Qqch qui voque le pelage de tigre tigr e Qui fait penser a l phant I pachydermique l phantesque En compl ment de l observation des d rivat mes parmi des FLNS du DiCo nous sommes galement partie de certaines listes de r f rence de d riv s ou compos s savants et avons v rifi si les relations dont ils sont les marqueurs taient pr sentes et fr quentes dans le DiCo sans pour autant tre marqu es morphologiquement Par exemple les deux relations X qui se nourrit de X et X alt ration de X pr sent es dans la suite de cette section ont t d gag es d apr s les l ments vore et ite extraits d une liste de d riv s et compos s savants du fran ais Bonnard 1983 Une liste de r f rence peut donc servir de gui
422. us que nous utilisons ne couvre pas l ensemble du lexique Nous devons par cons quent pr voir de nouveaux liens lexicaux qui ne sont pas encore d crits actuellement 4 1 2 Pr sentation du corpus de travail Le travail de normalisation porte sur une partie des FLNS du DiCo ses 820 FLNS nominales et ses 727 FLNS adjectivales Les relations valeurs nominales sont presque exclusivement des relations de d rivation s mantique par exemple pois son ichtyologie g teau farine etc Les relations adjectivales quant elles peuvent tre r parties selon deux types d une part un petit nombre de d riv s s mantiques qui tr s souvent prennent la forme de d riv s morphologiques du type barbe barbu bagarre bagarreur aq soup on m fiant s v rit s v re strict etc d autre part de fa on majo ritaire des relations collocationnelles du type barbe poivre et sel bagarre g n rale soup on l ger etc Nous traiterons ces types de relation de fa on dif f rente On remarque que si l h t rog n it parmi les formules des FLNS nominales r side 116 principalement dans le choix du lexique employ et les probl mes de synonymie et d ambiguit qui en d coulent l h t rog n it des FLNS adjectivales tient davan tage la syntaxe de l encodage Il n existe pas de patrons d encodage pr tablis Ainsi tandis que la FLNS en est amorc e par un pron
423. ux langues contr l es These de doctorat Uni versit Paris 7 1996 Etienne Van Tien Nguyen Unit lexicale et morphologie en chinois mandarin Vers l laboration d un Dictionnaire Explicatif et Combinatoire du chinois Th se de doctorat D partement de linguistique et de traduction Universit de Montr al 2006 275 Brigitte Orliac Automatisation du rep rage et de l encodage des collocations en langue de sp cialit Th se de doctorat Universit de Montr al 2004 Jacqueline Picoche Pr cis de lexicologie fran aise Nathan Paris 1977 Jacqueline Picoche Structures s mantiques du lexique fran ais Nathan Paris 1986 Jacqueline Picoche Didactique du vocabulaire fran ais Nathan Paris 1993 Jacqueline Picoche et Jean Claude Rolland Dictionnaire du Fran ais Usuel De Boeck Duculot Bruxelles 2002 Sabine Ploux et Bernard Victorri Construction d espaces s mantiques l aide de dictionnaires de synonymes Traitement Automatique des Langues 39 1 161 182 1998 Alain Polgu re La Th orie Sens Texte Dialangue 8 9 9 30 1998 Alain Polgu re Towards a Theoretically motivated General Public Dictionary of Semantic Derivations and Collocations for French Dans Actes d Euralex 2000 pages 517 527 Stuttgart 2000 Alain Polgu re Collocations et fonctions lexicales pour un mod le d apprentis sage Dans Francis Grossmann et Agn s Tutin dir Les Collocations Analyse et
424. vsky Toward a Functioning Meaning Text Model of Language Linguistics 57 10 47 1970 274 Igor Mel uk et Aleksandr K Zholkovsky The Explanatory Combinatorial Dictio nary of Modern Russian Wiener Slawistischer Almanach Viena 1984 Igor Mel uk et Aleksandr K Zholkovsky The Explanatory Combinatorial Dictio nary Dans Martha W Evens dir Relational models of the lexicon representing knowledge in semantic networks pages 41 74 Cambridge University Press Cam bridge 1988 Ingrid Meyer et John Steele The Presentation of an Entry and Super entry in an Explanatory Combinatorial Dictionary of English Dans James Steele dir Meaning Text Theory Linguistics Lexicography and Implications pages 62 94 University of Ottawa Press Ottawa 1990 Jasmina Mili evi Mod lisation s mantique lexicale et syntaxique de la paraphrase langagi re Th se de doctorat D partement de linguistique et de traduction Universit de Montr al 2003 Jasmina Mili evi La paraphrase Mod lisation de la paraphrase langagi re Peter Lang Bern 2007 Jasmina Mili evi Sch ma de r gime le pont entre le lexique et la grammaire Langages 4 176 94 116 2009 M Lynne Murphy Semantic Relations and the Lexicon Antonymy Synonymy and Other Paradigms Cambridge University Press Cambridge 2003 Alexis Nasr Un syst me de reformulation automatique de phrases fond sur la Th orie Sens Texte application a
425. xicaux suivants Magn gai a comme un pinson SoOper enveloppe II1 allocation versement de ART Le deuxi me cas de figure repr sente les FL dont les valeurs sont des collocatifs verbaux qui avec le mot cl et ventuellement un ou plusieurs de ses actants permettent la formation d un nonc Il s agit par exemple de la FL Oper illustr e ci dessous Oper affection prouver ressentir ART pour N Y o la valeur de la FL le mot cl et ses actants permettent de construire un nonc du type Pierre prouve de Vaffection pour Marianne Enfin le troisi me cas de figure concerne les FL paradigmatiques qui associent deux unit s lexicales sur le plan paradigmatique telles que 51 Sioc et Syn illustr es dans les exemples ci dessous Si boire buveur Stoc abeille ruche rucher Syn bicyclette velo 5 5 2 1 FL dont les valeurs sont des collocatifs non verbaux Pour d terminer la cible communicationnelle d un syntagme collocationnel non ver bal nous introduisons la notion de d pendance communicative Celle ci est d finie dans Mel uk para tre chapitre 6 comme suit In a configuration of semantemes o1 o2 the semantic node o is said to depend communicatively on the semantic node in a direct way if this configuration can be reduced to 01 rather than to 216 o2 such that the meaning conveyed is simply reduced impoveri shed but
426. z np yobb autez x vod apsowsun idoig queyodu sn d 1022002 fo yunuqo x sav aano inb asoyd nbl n pod woaz 2304q 1e do X ap ap asned n 7 Luv ounouvi EiedO Z SP esne2 e X Jed asia n A Z N Ted suv sorgo s aunound s amp tsadO XX1V u lq uuolpuoj pz 94799 auzUOW 03384I9N quasip I T 209oap uog i A L08104 D T JH 4280990 3 out an quawa laano TH 1980990 429 tuetu SA ayouvif epuoypssanuo 2 uos e uuoJuo2 azapyf ruo h N quesen aauf 10 s 1ueoeA o Iequ A 1u eAinb3 Lav s piapunf 0A awhuouks unazosgbrifas saysajiuew x op uzwauf azure Tidufs XXV aun IZfqu tuuno nbi e1 tuu asnjewe aun Jed 251oqua1 IN euornsionuos euuop fns un ie3 p ue queue A X aueinq n44d 9191 0 2191 eZuotqpsi nuoo s n s quos A P X ll nbe aueinq Lsndwo suolpq D eZ uoxupsia nuoo luijj p 21nj2n13s aun ye nb sues 1u n A S L uuuuo32 1u uu lAJ lu P X ll nbe

Download Pdf Manuals

image

Related Search

Related Contents

Manual del Usuario  ー 検体を誤認する リスク、 ・所定の研究又は 治療のため、 通常 使用  Caution!  User Manual - AX New    Dell 2350D/DN Printer User Manual  l`intelligence relationnelle - Alliance des Consultants Industriels  Tecnologias de Construção Associadas aos Sistemas Sustentáveis      

Copyright © All rights reserved.
Failed to retrieve file