Home

annexe i : le système corail - Page Personnelle de Antonio Balvet

image

Contents

1. ce type de n uds est pr sent plus loin il inclut donc entre autres la forme du participe pr sent blessant Le second noeud recouvre tous les articles entre autres le mot plusieurs cf pr c demment 276 ANNEXE I LE SYSTEME CORAIL On devine ais ment qu avec la repr sentation b3 l utilisateur risque fort de r colter beaucoup de document inutiles puisque chacun des deux n uds recouvre lui seul beaucoup d autres mots en plus de celui qui est vis travers lui e Exemple c De mani re analogue l expression fut attaqu peut tre grammaticalement qualifi e de trois mani res diff rentes cl c est la simple succession de deux mots pr cis ment d finis fut et attaqu c2 c est une forme du participe pass de attaquer auxiliaire passif c3 c est la succession d une forme conjugu e du verbe tre fut et d un adjectif attaqu Dans le formalisme des lexigraphes cette diversit de la cat gorisation grammaticale se traduit par la possibilit de plusieurs expressions diff rentes cl c2 217 ANNEXE I LE SYSTEME CORAIL c2 c2 2 278 ANNEXE I LE SYSTEME CORAIL c3 Ces six repr sentations graphiques permettent toutes de reconnaitre les documents dans lesquels se trouve la s quence fut attaqu mais avec des degr s d efficacit in gaux La forme c2 n ud recouvrant toutes les formes conjugu es de la voix passive
2. nous avons consid r le r le de certaines classes de mots dans la simplification d un lexigraphe ces classes tant pr par es dans le syst me Mais l outil offre aussi la possibilit d utiliser des classes suppl mentaires de mots classes cr es de toutes pi ces par l utilisateur lui m me ou par un gestionnaire Examinons la figure 11 Lexigraphe 11 Elle contient un n ud Nationalit s Ce n ud correspond lui m me un lexigraphe qui a t cr et nomm ainsi par un utilisateur particulier pour ses propres besoins Il s agit d un lexigraphe tr s simple qui est montr par la figure 10 et par le truchement duquel sont num r es des nationalit s c est une classe de nationalit s 287 ANNEXE I LE SYSTEME CORAIL Lexigraphe 12 Ici ce lexigraphe agit comme un sous lexigraphe qui d multiplie implicitement les s quences repr sent es par la figure 11 Les noeuds qui repr sentent des sous lexigraphes ou lexigraphes ins r s ont l apparence d une case verte Lors du filtrage de documents le syst me reconnaitra donc les s quences contenant le lemme village donc la forme au singulier comme celle au pluriel suivi de l une ou l autre des nationalit s indiqu es aux genres masculin et f minin ainsi qu aux nombres singulier et pluriel Ce sous lexigraphe peut tre enregistr et tre ensuite rappel et incorpor dans tout autre lexigraphe o de telles indications de nationalit s
3. CORAIL 12 change 222 ANNEXE Il GRAMMAIRES LOCALES POUR LE FILTRAGE D INFORMATION lt gt aVances lt contrepartie boursiere7 crontreproposition gt lt gt lt commerciale7 lt de bienvenue lt gt de csennce coire publique7 d change cote publique7 de vente cpropostion Grammaire locale CORAIL 13 Offre Grammaire locale CORAIL 14 NB repreneur lt gt lt gt lt racheteur Grammaire locale CORAIL 15 N acheteur vendeur Get zrevendeur Grammaire locale CORAIL 16 N vendeur 323 ANNEXE Il GRAMMAIRES LOCALES POUR LE FILTRAGE D INFORMATION oltre publique d achat GEE oltre publique d change oltre publique de vente coffre d achat coffre de vente lt offre gt d change Grammaire locale CORAIL 17 OPX dem quart lt gt lt gt csepti me zhuti me7 gt zdize me Sp artie lt part gt Grammaire locale CORAIL 18 Quantit 324 ANNEXE Il GRAMMAIRES LOCALES POUR LE FILTRAGE D INFORMATION Grammaire locale CORAIL 19 Refl lt MAJT r gle 1 Iesch lt gt ex J P Dupont Abr viation ou sigle ex S N C F Ne pas prendre le final qui peut tre un s parateur de phrases singuli
4. INFORMATION Table des automates patrons utilis s par le systeme CORAIL Automate patron 1 NO acheter const WE ere rp e IS REN DUE 327 Automate patrom2 NO acheter IN ACER au cor 327 Automate patron NO acheter 327 Automate patron 4 NO acheter Nlnom ss 328 Automate patron 5 NO acheter Nl passif aes uet tation 328 Automate patron NO acheter const N1 signatures th matiques quasi fig es mettre a la main sur se porter acqu reur de NO acheter N1 actif signatures th matiques acceptant la _ transformation la voix active signatures th matiques acceptant la NO acheter N1 nom nominalisation avec ou sans verbe support proc der l acquisition de signatures th matiques acceptant la NO acheter N1 passif transformation la voix passive acqu rir e aller signatures th matiques acceptant la NO acheter N1 nom2 transformation la voix active version alternative Table du lexique grammaire pour le th me 19 du corpus Firstinvest Tableau 1 correspondance grammaires locales phrases du 292 Tableau 2 phrases dir COUS oae de piu tue tue ES 292 Tableau 3 base de signatures th matiques du domaine financier esses 10 314 ANNEXE Il GRAMMAIRES LOCALES POUR LE FILTRAGE D INFORMATION Grammai
5. cette phrase Par exemple un document dans lequel ne se trouve que la phrase suivante ne sera pas reconnu des villages serbes ont t attaqu s C est pourquoi nous avons qualifi ce lexigraphe d explicite Le fait que l utilisateur impose ainsi une orthographe particuli re pour un mot c est dire une certaine forme grammaticale est signal par l apparence du noeud correspondant ce mot est indiqu dans une case fond blanc Dans cet exemple c est le cas pour tous les mots La couleur des n uds est donc utilis e comme moyen de codage La r gle de ce codage est constamment rappel e par un bandeau color dispos en haut de l cran cf le carr blanc contenant le terme Mot Lexigraphes complexes et explicites Un lexigraphe peut d crire simultan ment plusieurs s quences apparent es comme le montre la figure 2 Ce qui le rend plus compliqu que le pr c dent localit attaqu arm e croate serbe a t soudainement ville agglom ration des d tachements Lexigraphe 2 271 ANNEXE I LE SYSTEME CORAIL Cette figure illustre aussi le fait que pour des raisons de commodit 11 est permis d inscrire plusieurs mots dans un m me n ud cf localit ville etc Commentaires Ce type de lexigraphes permet donc l utilisateur de sp cifier clairement toutes les s quences au moyen desquelles seront filtr s les documents Cependant s ils r
6. du verbe voir plus loin laissera aussi passer des s quences tr s diff rentes furent attaqu es avaient t attaqu s etes t attaqu es etc Le bruit dans les r sultats sera encore bien plus grand avec la forme Verbe c2 puisque le moteur de filtrage reconnaitra alors aussi une foule de formes verbales sans rapport avec l expression vis e remis avait pouss naviguera pensez On peut tenir des raisonnements analogues propos des repr sentations 2 et c3 La premi re autorise galement le filtrage d expressions tr s diff rentes comme sera attaqu Dans le syst me Corail le participe pass des verbes fait galement partie des A adjectifs le mot attaqu sera donc reconnu mais parmi beaucoup d autres gr ce un lexigraphe tel que celui de la figure c3 Enfin le participe pass en question attaqu fait lui m me partie des formes conjugu es du verbe attaquer et fera donc galement partie des multiples s quences reconnues gr ce au lexigraphe c2 Remarques g n rales et compl mentaires sur ces aspects de l outil Au total on voit que la technique du lexigraphe fournit une grande souplesse d expression Pour des raisons de simplification toutes les cat gories grammaticales de la langue fran aise ne sont pas repr sent es dans la liste des cat gories grammaticales du syst me cf pr c demment dans Principes g n raux C est ainsi qu un utilis
7. forme d un objet graphique sp cial dont nous allons pr senter les propri t s le lexigraphe INTERPR TER UN LEXIGRAPHE Lexigraphes simples et explicites La figure 1 repr sente un lexigraphe simple Examinons en les composantes village serbe a t attaqu r arm e croate 1 lexigraphe repr sente une s quence qui est une phrase un village serbe a t attaqu par l arm e croate Autrement dit le syst me Corail reconnaitra s lectionnera et fournira tous les documents qui contiennent cette phrase au moins une fois On voit que la s quence de mots est pel e dans son ordre naturel d un symbole de d but un symbole de fin Les mots sont contenus dans des cases des fl ches symbolisent 2770 ANNEXE I LE SYSTEME CORAIL l ordre de succession normal dans une phrase fran aise on parlera de noeuds reli s par des transitions Un lexigraphe se lit donc de gauche droite Ce qu on voit aussi dans cet exemple c est que l utilisateur a d crit compl tement tous les l ments de la s quence Les articles les noms l auxiliaire du verbe etc sont tous indiqu s De plus chacun de ces l ments a recu une forme grammaticale bien sp cifi e village est au singulier le verbe attaquer est au participe pass masculin singulier etc Ceci signifie que le moteur de filtrage n est autoris rechercher que les documents qui contiennent exactement
8. qu exposent les parties suivantes REPR SENTATION DE CAT GORIES GRAMMATICALES Principes g n raux Un premier moyen d accroitre le pouvoir de description des lexigraphes est d employer des n uds qui repr sentent des cat gories grammaticales enti res La figure 3 montre comment un n ud peut ainsi repr senter lui seul la cat gorie des articles 212 ANNEXE I LE SYSTEME CORAIL Lexigraphe 3 Les n uds qui symbolisent une cat gorie grammaticale ont l apparence d une case bleue Dans l exemple de la figure 3 est donc implicitement repr sent un ensemble le cr du lexi he ai liciter lui m h d d expressions sans que le cr ateur du lexigraphe ait eu expliciter lui m me chacune de ces expressions un village le village ce village son village chaque village etc Le syst me Corail met disposition les cat gories grammaticales suivantes Nom Commun Verbe Adjectif Adverbe Article Pronom Pr position Conjonction de subordination 273 ANNEXE I LE SYSTEME CORAIL Conjonction de coordination Mot quelconque Nous pr ciserons plus loin la nature et le r le de certaines de ces cat gories Examinons maintenant la figure 4 Lexigraphe 4 Elle pr sente un lexigraphe qui d crit implicitement de tr s nombreuses s quences Il affirme Il le lui dit Il me la prend il leur ach te 274 ANNEXE I LE SYSTEME CORAIL 2 2 Cette vari t r sulte notamment d
9. 21 Grammaire locale 22 Grammaire locale 23 Grammaire locale 24 Grammaire locale 25 Grammaire locale 26 Grammaire locale 27 Grammaire locale 28 Grammaire locale 29 Grammaire locale 30 Grammaire locale 31 Prise EMA ne tn 305 PSS RMI DiS den ae 306 roli n 307 307 e MR 308 SH I ilico 308 oie it aer 309 309 TT A 310 Alo E P M V 310 rm 311 294 Grammaire locale 1 Arm es Grammaire locale 2 Civils 295 plusieurs fois a plusieurs reprises par surprise Grammaire locale 3 Compl ment Mani re plusieurs violemment Grammaire locale 4 Compl ment circonstanciel Grammaire locale 5 Croates 296 Grammaire locale 6 Isra liens Grammaire locale 7 Serbes Grammaire locale 8 Quelqu un Grammaire locale 9 Nationalit s 297 i tee 1 t attaqu arm e croate gt Grammaire locale 10 1 Op rateur O Grammaire locale 11 PriseEnMain2 298 Op rateur de proximit le forcen a policiers Grammaire locale 12 PriseEnMain3 299 Factorisation des formes fl chies conjugaison pour l
10. 9 Grammaire locale CORAIL 20 Sentence 325 Grammaire locale CORAIL 21 Union eese mmn nnnm eres 326 1 8 words reconnait entre 1 et 8 mots grammaire outil accord lex mes associ s accord grammaire locale lex mes associ s association grammaire locale association reconnait les auxiliaires de la Auxiliaire passif grammaire locale voix passive Grammaire 2 Description Type Capital lex mes associ s capital grammaire locale reconnait les auxiliaires de la Auxiliaire actif grammaire locale voix active reconnait des insertions Insertions grammaire outil multiples change lex mes associ s change grammaire locale reconnait des insertions i In grammaire outil multiples associ lex mes associ s associ grammaire locale Offre lex mes associ s offre grammaire locale NB grammaire locale d expression d un ratio classe des noms N acheteur susceptibles d tre sujet de grammaire locale acheter ou synonyme classe des noms N vendeur susceptibles d tre sujet de grammaire locale vendre ou synonyme S reconnait les diff rents types OPX d offre publique achat grammaire locale vente d expression de la quantit R reconnait les pronoms reconnait les marqueurs de Sentence fin de phrase ins re une grammaire outil balise S Union lex mes associ s union grammaire locale 313 ANNEXE Il GRAMMAIRES LOCALES POUR LE FILTRAGE D
11. ANNEXE I LE SYSTEME CORAIL ANNEXE I LE SYSTEME CORAIL ANNEXE I LE SYSTEME CORAIL Interface d dition de filtres en mode client serveur Applet java Table des captures d cran du systeme CORAIL Capture d cran T3 Tenede e en GE 256 Capture decran 2 menu PIE PRE D 257 Capture d cran 3 un nouveau filtre minimal a t cr 258 Capture d cran 4 menu contextuel clic droit sur le fond gris Ajouter un noeud 259 Capture d cran 5 e noeud a ete sement evite ds otra eae etes 260 Capture d cran 6 menu contextuel clic droit sur un noeud Ajouter une transition 261 Capture d cran 7 la transition a t dessin e entre la boite d origine celle sur laquelle on a cliqu au d but et la bo te d arriv e celle sur laquelle on a rel ch la souris 262 Capture d cran 8 menu contextuel clic droit sur la transition Effacer la transition 263 Capture d cran 9 la transition a t effac e on d sire sauvegarder le nouveau graphe 264 Capture d cran 10 fen tre de dialogue permettant de saisir le nom du nouveau graphe 264 Capture d cran 11 menu Filtre Ouvrir pour ouvrir un filtre existant enregistr sur un SEL VUE OISEAU eodeni ementi tni ea 265 Capture d cran 12 fen tre de dialogue permettant de s lectionner un des filtres disponibles sure Serveur xls s se
12. ES e L 1 2 2 1 1 2 NU V NI V Finance nl Automate patron 4 NO acheter N1 nom2 n 1 1 per m sertions 2 23 4 1 2 3 4 N V NJ Automate patron 5 NU acheter N1 passif 328 Z gt Z gt e Z ne D D Entreprise ooo ae Nominalisation gt Z o gt 2 o 2 14445247 nov cost 184522422 rev rene Entreprise ZEN lt gt ZEN gt lt Entreprise Entreprise Entreprise Refl adosser lt gt Entreprise alliance E approche association Capital augmentation E Capital cession E Capital commercialisation E coop ration en bourse cotation E croissance E Capital lt d sengagement gt lt E gt Capital lt d sinvestissement gt lt discussion gt EE EEN Entreprise Entreprise E d croiser lt gt mission engagement affaire E Capital entr e E extension E fermeture E lt finalisation gt lt E gt lt financement gt lt E gt OPX E fusion E investissement E OPX lt gt mariage EE RR AMIE Entreprise E
13. Tableau 2 phrases du corpus 207 Grammaires locales utilis es pour l valuation ergonomique Table des grammaires locales utilis es pour l valuation Grammaire locale 1 Grammaire locale 2 Grammaire locale 3 Grammaire locale 4 Grammaire locale 5 Grammaire locale 6 Grammaire locale 7 Grammaire locale 8 Grammaire locale 9 Grammaire locale 10 Grammaire locale 11 Grammaire locale 12 Grammaire locale 13 Grammaire locale 14 Grammaire locale 15 Grammaire locale 16 Grammaire locale 17 Grammaire locale 18 Grammaire locale 19 Grammaire locale 20 ergonomique utu A UM E 295 Gru TEE 205 Compl ment eb een PPAR NU EET Ende uM EE 296 Compl ment CIECOBSTaBC IE D iocos e RU IIa elu 296 arc mer 296 Irae ENS Re dob UE Loo UM E Ue 297 IU des NNI 297 Onela 297 Ip ise UNIS dd A da die 297 TM 298 SPO ASS nee 298 mp 299 UE UID T LT 300 Prise EnMam DIS anne pete ta reti beue Fete 300 C PriseEOM dii ec eoi PERS NDA 301 dan ota a e lon os 302 SPS TTE 303 TT 303 auia ER rc 304 PSC ER 304 293 Grammaire locale
14. ant aux formes fl chies de tre port repr sente l ensemble des formes passives de ce verbe savoir fut port o eussent t port es suis port etc 282 ANNEXE I LE SYSTEME CORAIL Convention graphique sp ciale Relativement aux principes de base de la constitution des lexigraphes la grammaire fran aise pose des probl mes de repr sentation de certaines expressions verbales dans lesquelles interviennent certaines formes conjugu es Examinons par exemple les expressions ou phrases suivantes il a t tr s t t encourag cette proposition fut fr n tiquement d battue la nouvelle l a attrist profond ment Dans de telles s quences on trouve bien des formes conjugu es de verbes par exemple des formes passives t encourag etc Mais les mots qui constituent ces formes sont parfois s par s les uns des autres par l insertion d un adverbe fr n tiquement profond ment Pour un verbe donn on peut imaginer de tr s nombreuses expressions compos es de ce genre Comment indiquer dans un lexigraphe que les mots constitutifs d une forme conjugu e sont ainsi susceptibles d tre m lang s avec d autres mots pour former une expression mixte ces autres mots appartenant d autres cat gories que celle des verbes sans tre oblig d crire toutes les s quences imaginables comme dans la figure 2 auquel cas on se priverait de la facilit de des
15. ateur averti cherchera en 279 ANNEXE I LE SYSTEME CORAIL vain les d terminants d finis ou ind finis les adverbes compos s les interjections Cependant ceci ne signifie pas que les mots auxquels 1l pense ne puissent tre trouv s dans l une ou l autre ni dans plusieurs des cat gories Corail disponibles D une fa on g n rale les cat gories Corail constituent un sous ensemble et une simplification des notions grammaticales classiques En principe l analyse attentive d un lexigraphe fait transparaitre les intentions de l auteur de ce lexigraphe c est dire le th me qui l int resse son vocabulaire et ses familles d expressions typiques etc Toutefois compte tenu des explications pr c dentes on ne s tonnera pas de constater parfois qu un lexigraphe n est pas aussi bien constitu qu il pourrait l tre certaines variantes de s quences ont t oubli es le contenu de certains noeuds fait que le lexigraphe repr sente implicitement des s quences non frangaises ou non pertinentes nous en avons donn pr c demment divers exemples la sous utilisation des cat gories grammaticales ou d autres classes de mots rend le lexigraphe illisible force d tre dense ramifi ou in galement synth tique Le lecteur d un lexigraphe peut m me rester perplexe face certains ph nom nes de langue par exemple une erreur grammaticale peut ne pas alt rer les capacit s de filtrage de l outil on peut ima
16. auvegarder Capture d cran 11 menu Filtre Ouvrir pour ouvrir un filtre existant enregistr sur un serveur distant 4THEMES urf vRaefarmeEtat arf REFORMEDELETAT drf WARCHESPUBLICS amp mad drf SERVICEPUBLICFRANGCAIS g Antidictiannaire qrf NRaefarmeEtat drf a emen fw aming Applet window Capture d cran 12 fen tre de dialogue permettant de s lectionner un des filtres disponibles sur le serveur distant 265 ANNEXE I LE SYSTEME CORAIL Editeur de filtres OI Filtre Aide MonTest ouvert Capture d cran 13 le filtre choisi a t ouvert la couleur rouge des bo tes autres que l tat final est un essai PESE dition d un noeud NI manager conjugaisons Capture d cran 14 apr s double clic sur une boite dialogue permettant d diter son contenu i e le verbe manger et toutes ses conjugaisons 266 ANNEXE I LE SYSTEME CORAIL Editeur de filtres El Filtre Aide Houveau fi itre Lintitled Capture d cran 15 la bo te contenant toutes les conjugaisons du verbe manger a t ajout e elle est colori e en rouge pour l essai pour la diff rencier d une boite normale 267 ANNEXE I LE SYSTEME CORAIL Editeur de filtres El Filtre Aide Houveau fi itre Lintitled Capture d cran 16 4 types de bo tes diff
17. c de visualiser ses sous lexigraphes Ceci est illustr par la figure 10 voir plus haut Pour afficher un sous lexigraphe 11 suffit de double cliquer sur le n ud qui le symbolise Les utilisateurs du syst me Corail peuvent disposer d une biblioth que de lexigraphes donc de sous lexigraphes Ceux ci sont susceptibles de repr senter des aspects vari s de la langue Dans l exemple pr c dent on a une simple collection de qualificatifs relevant d un concept commun la nationalit Mais certains sous lexigraphes constitueront des ressources g n rales capables de figurer dans de nombreuses descriptions de domaines Ce sera notamment le cas des lexigraphes qui d crivent des parties g n rales de la grammaire ou du vocabulaire Parmi de telles ressources on peut citer la description des noms des jours de la semaine lexigraphe num rant le lundi le mardi etc la description des d terminants num riques crits en lettres lexigraphe d crivant la constitution des mots comme vingt sept vingt et un etc la description des cat gories grammaticales ou celle de certaines constructions grammaticales Le lexigraphe repr sent par la figure 4 est un exemple de ce dernier type de description 1l r sume toutes les r gles d usage des pronoms pr verbaux entre un pronom personnel et un verbe ce titre peut contribuer d finir de vastes ensembles de r alisations litt raires Insertion de compl ments circonstancie
18. cet RE ott ne is ide 265 Capture d cran 13 le filtre choisi a t ouvert la couleur rouge des boites autres que l tat SC PES E 266 Capture d cran 14 apr s double clic sur une boite dialogue permettant d diter son contenu i e le verbe manger et toutes ses 266 Capture d cran 15 la boite contenant toutes les conjugaisons du verbe manger a t ajout e elle est colori e en rouge pour l essai pour la diff rencier d une boite normale ANNEXE I LE SYSTEME CORAIL Capture d cran 16 4 types de boites diff rents tat initial en blanc lemme manger en rouge tat final sous graphe en jaune sur fond noir 268 255 ANNEXE I LE SYSTEME CORAIL 89 Editeur de filtres Capture d cran 1 fen tre de d part 256 ANNEXE I LE SYSTEME CORAIL PES Editeur de filtres Filtre Aide Ouvrir Sauvegarder arming Applet Window Capture d cran 2 menu FILTRE 257 ANNEXE I LE SYSTEME CORAIL Fs Editeur de filtres warming Applet window Capture d cran 3 un nouveau filtre minimal a t cr 258 ANNEXE I LE SYSTEME CORAIL Ps E diteur de filtres Filtre Aide Ajouter un noeud Ajouter un lemme Houveau filtre Untitled arning Applet Window Capture d cran 4 menu contextuel clic droit sur le fond gris Ajo
19. cription qu offre un noeud qui repr sente l ensembles des formes fl chies du verbe correspondant Cette indication est rendue par le moyen d un codage graphique sp cial qu illustrent les figures 7a 7b et 7c fortement Lexigraphe 7 283 ANNEXE I LE SYSTEME CORAIL La figure 7 signale que le moteur de filtrage a pour consigne de chercher les documents qui contiennent une forme conjugu e et active quelconque de uvrer dans laquelle est ins r l adverbe fortement un endroit ou un autre Ceci correspond des s quences comme fortement cuvr n as pas fortement uvr Par contre une s quence comme la suivante ne sera pas reconnue n a que mollement uvr le mot que n est pas pr vu parmi les insertions autoris es La figure 8 rend possible le m me type de filtrages mais repr sente une bien plus grande gamme de s quences possibles Ayant autoris l insertion des mots qui appartiennent une cat gorie grammaticale enti re celle des adverbes l utilisateur a donn pour consigne au syst me de reconnaitre des s quences aussi diverses que il se justifie tr s souvent elle avait clairement justifi elle avait fortement justifi La fl che boucle signifie que le nombre d adverbes ou de pronoms qui peuvent tre m lang s au verbe est d au moins un Lexigraphe 8 De la m me mani re un lexigraphe peut indiquer que des ins
20. djectif que comme participe pr sent c est dire une forme conjugu e de blesser Nous indiquerons plus loin comment un n ud peut repr senter toutes les formes conjugu es d un verbe e Exemple b Le mot Plusieurs a t plac parmi les articles cf pr c demment Mais peut aussi participer d un adverbe compos ou d un article compos comme dans En linguistique on consid re que ces pronoms sont des l ments pr verbaux qui se placent avant le verbe Toutefois l interface du syst me Corail n op re pas cette distinction elle fait appel un jeu de cat gories grammaticales simplifi 215 ANNEXE I LE SYSTEME CORAIL achetant plusieurs expression qui rel ve des deux appellations Dans le formalisme des lexigraphes l utilisateur a le choix entre diff rentes mani res de repr senter cette expression achetant plusieurs 61 b2 Les deux repr sentations bl et b2 sont deux descriptions pr cis ment sp cifi es de la s quence conformes au type de lexigraphes le plus simple cf le paragraphe Lexigraphes simples et explicites S il connait bien sa grammaire l utilisateur saura qu il s agit d un adverbe ou d un article compos s mais 11 aura constat que ces cat gories ne font pas partie des cat gories grammaticales pr tablies dans le syst me b3 Dans la repr sentation b3 le premier n ud color en jaune repr sente toutes les formes conjugu es de acheter
21. e 31 Lisible 9 311 ANNEXE Il GRAMMAIRES LOCALES POUR LE FILTRAGE D INFORMATION ANNEXE GRAMMAIRES LOCALES POUR LE FILTRAGE D INFORMATION Table des grammaires locales utilis es par le syst me CORAIL Grammaire docale CORAIL SORS ettet totes 315 Grammaire Tocale CORAIL 2 5 36 ORG 315 Grammaire locale CORAIL 3 association 316 Grammaire locale 317 Grammaire locale CORAIL 5 Auxiliaire actif 2 2 2 317 Grammaire locale CORAIL 6 Auxiliaire passif 317 Grammaire locale 318 Grammaire locale 8 5 319 Grammaire locale CORAIL 9 Insertions sise 319 Grammaire CORAIL 320 Grammaire locale COR ATL LI sec aoa ing n Eur ru cb 321 Grammaire locale CORAIL 2 echange 322 Granma re Joce ne Nas 323 Grammaire locale CORAIL 14 NB rs 323 Grammaire locale CORAIL ET E EE 323 Grammaire locale CORAIL 16 N vendeur dd ede t e EE Ee dde bero 323 Grammaire loce CORALI ODDO on in ini 324 Grammaire locale CORAIL 18 Quantlle 324 ANNEXE Il GRAMMAIRES LOCALES POUR LE FILTRAGE D INFORMATION Grammaire locale CORAIL 19 Refl 32
22. e l emploi d un n ud repr sente seul tous les verbes du dictionnaire noeud repr sentant la cat gorie grammaticale des verbes A propos de cette derni re cat gorie des verbes pr cisons qu elle recouvre toutes les formes conjugu es de tous les verbes pr sent imparfait pass simple singulier pluriel etc La conjugaison des verbes est trait e plus loin R soudre les probl mes de classement des mots au moyen du formalisme des lexigraphes L examen de la figure 4 et son rapprochement avec ce qui a t dit pr c demment rappellent que certains mots appartiennent diff rentes cat gories grammaticales C est le cas de mots comme Ie leur etc qui dans cette figure sont des pronoms alors que nous les avons pr c demment rencontr s en tant qu articles Autrement dit et tr s normalement dans le cadre des fonctions et des ressources du syst me Corail ces mots sont disponibles la fois dans la cat gorie des Articles et dans celle des Pronoms Remarquons d ailleurs qu en grammaire fran aise scolaire 15 interviennent aussi parfois en tant que d terminants d finis selon le r le jou dans la phrase de nombreux mots sont donc susceptibles d tre class s de mani re variable Comment l interface Corail rend elle compte de cette variabilit Pour s en faire une id e consid rons quelques exemples e Exemple Le mot blessant peut tre cat goris aussi bien comme a
23. eposent sur des principes simples ces objets graphiques pr sentent aussi des limites En effet 1l est loin d tre toujours facile de pr voir ou d imaginer toutes les s quences efficaces toutes les variantes de formulation ou d orthographe etc S1 on tente de le faire on est parfois pris dans un long travail on risque de commettre des erreurs ou des oublis et on aboutit souvent un lexigraphe volumineux et touffu Certaines simplifications qu on est alors conduit introduire peuvent m me les probl mes de lecture ult rieure du lexigraphe comme on le voit dans la figure 2 l utilisateur qui a cr le lexigraphe n a dispos qu une suite de n uds commune pour le syntagme verbal a t ceci a fait apparaitre des phrases inexistantes en frangais comme un village a t attaqu e Ce d faut n aura pas de cons quence sur la recherche documentaire car de telles s quences ne seront tout simplement jamais trouv es dans les documents en principe mais cette anomalie grammaticale alourdit l interpr tation du lexigraphe Il convenait donc de rendre plus ais e et plus a r e la description d ensembles de s quences apparent es Ce qui a t fait en donnant aux noeuds des propri t s suppl mentaires En gros on a accru la puissance de description des lexigraphes en permettant des noeuds de repr senter non plus un seul ou quelques mots particuliers mais des classes de mots C est ce
24. er et pluriel caract res e doivent tre pris en compte l ments de ensembles lettres caract re parties de l ment de sous ensembles ensemble variables lettre partie de sous ensemble variable cas particuliers cf cn gt 4 Le point virgule est toujours un s parateur de phrase 18 d nn Grammaire locale CORAIL 20 Sentence 325 ANNEXE Il GRAMMAIRES LOCALES POUR LE FILTRAGE D INFORMATION alliance pousatlles mariage manage d amour manage de raison manage d argent union manage assorti formatage Noces mariage arrang manage morganatique manage forc manage de convenance manage putatit manage mixte manage l tranger manage blanc fusion concentration r union jumelage Grammaire locale CORAIL 21 Union 326 E pe mi EHE L d Last insertion eat Vue nsertions uxiliaire Passi Insertions DeD 895 1 8888 en y de Automate patron 1 0 acheter const Insertions 4 yo Insertions j EP dl sms 5 1 182 331 L 2 2 Automate patron 2 NO acheter N1 actif Hominalisation Gej sena emm d 1 1 4 4 151 2 40 V NI V Finance nl Automate patron 3 NO acheter N1 nom 327 ANNEXE Il GRAMMAIRES LOCALES POUR LE FILTRAGE D INFORMATION Hornnalisation nsettions nsettionis HE
25. ertions sont autoris es dans une forme passive d un verbe C est ce qu illustre la figure 9 284 ANNEXE I LE SYSTEME CORAIL Lexigraphe 9 Le lexigraphe que montre la figure 9 rend l outil capable de reconnaitre des s quences comme c est vraiment justifi c est r ellement compl tement justifi Dans tous les cas la pr sence d insertions est facultative le syst me pourra aussi bien reconnaitre des formes verbales pures comme dans elle a t habit e que des formes m lang es comme dans elle a souvent t habit e Pour le lemme tre bless le syst me reconnaitra des formes conjugu es pures de la voix passive ont t bless s fut bless e mais aussi des formes passives avec insertion t cruellement bless avaient seulement t bless es Emploi de l ancre On appelle ancre un losange rouge qui peut prendre la place d un noeud L utilit des ancres est simplement de rendre un lexigraphe plus clair Ceci est illustr par la figure 10 voir plus bas 285 ANNEXE I LE SYSTEME CORAIL Lexigraphe 10 Dans cet exemple gr ce au d tour de chemin qui est r alis la s quence la jolie fille se trouve mieux mise en vidence 286 ANNEXE I LE SYSTEME CORAIL INSERTION DE SOUS LEXIGRAPHES REPR SENTANT DES GROUPES DE MOTS PARTICULIERS OU DES DESCRIPTIONS PARTIELLES DE LA LANGUE Principes g n raux Jusqu pr sent
26. es verbes d clinaison pour les noms et adjectifs Grammaire locale 13 PriseEnMain4 Factorisation des formes fl chies et modifieurs violemment Grammaire locale 14 PriseEnMain4 bis 300 Factorisation des mots par cat gorie grammaticale verbe nom etc Grammaire locale 15 PriseEnMain 5 301 Factorisation par insertion de sous graphe la ville croate par Grammaire locale 16 PriseEnMain6 302 L ancre mot vide un outil graphique Grammaire locale 17 PriseEnMain7 Automate dans le mauvais sens croate arm e r par eefa free hage Grammaire locale 18 PriseEnMaing 303 Automate mal form village sans transition entrante village serbe ville arm e croate Grammaire locale 19 PriseEnMain9 Automate bien form mais incoh rent Grammaire locale 20 PriseEnMain10 304 Mise a la volx passive Grammaire locale 21 PriseEnMainl11 305 Mise la voix passive et modifieurs Grammaire locale 22 PriseEnMainl11 bis 306 Grammaire locale 23 Lisiblel gravement l g rement Grammaire locale 24 Lisible2 307 gri vement Grammaire locale 25 Lisible3 Grammaire locale 26 Lisible4 308 Grammaire locale 27 Lisible5 Grammaire locale 28 Lisible6 309 Grammaire locale 29 Lisible7 Grammaire locale 30 Lisible8 310 Grammaire local
27. giner que mettre la classe des Pronoms la place de celle des Articles laisse parfois intacte la possibilit de reconnaitre certaines s quences RECOMMANDATIONS POUR L INTERPR TATION DES LEXIGRAPHES En conclusion l interface du syst me Corail est relativement simple dans ses principes et offre diff rents niveaux de ressources pour traduire les subtilit s de la langue L exploitation de toutes ces ressources n cessite tout de m me de connaitre la grammaire C est pourquoi en annexe de ce manuel a t ajout un r sum de la grammaire fran aise centr sur les composantes de celle ci qui sont l origine des principales difficult s de cr ation ou d interpr tation des lexigraphes On notera toutefois que dans l tat actuel du syst me comme nous l avons d j indiqu le syst me Corail ne reprend pas la totalit de cette grammaire acad mique Le document que vous trouverez en annexe ne vous servira ventuellement que d aide m moire cette aide couvrant partiellement ou imparfaitement les cat gories retenues dans le syst me 280 ANNEXE I LE SYSTEME CORAIL Repr sentation de la cat gorie mot quelconque La figure 5 illustre l emploi d une autre classe de mots la cat gorie grammaticale mot quelconque le forcen policiers Lexigraphe 5 Cette cat gorie conf re aux noeuds qui la repr sentent un pouvoir de repr sentation consid rable puisqu un tel n ud symb
28. ls Les sous lexigraphes n ont pas toujours un contenu aussi homog ne et coh rent en particulier quand l utilisateur applique la m thode de l insertion pour int grer dans son lexigraphe un ensemble de compl ments circonstanciels C est ce qu illustre la figure 13 289 ANNEXE I LE SYSTEME CORAIL la ville croate e les forces serbes X Lexigraphe 13 Dans cette figure on voit r alis e l insertion d un sous lexigraphe symbolis par un n ud appel Compl ment circonstanciel L utilisateur a donn cette d nomination un lexigraphe qui regroupe quelques l ments de s quences possibles ces l ments correspondent quelques uns des tr s nombreux compl ments circonstanciels dont on peut imaginer ou pr voir l existence dans les phrases des documents Il a ainsi rendu le syst me capable de reconnaitre des phrases comme a t attaqu e plusieurs fois par les forces o serbes a t attaqu e violemment par les forces serbes En m me temps cet utilisateur a pu exclure des formules recherch es et donc du lexigraphe d autres phrases comme a t attaqu e de multiples reprises par les forces serbes Cette m thode d insertion offre plusieurs avantages elle peut permettre de compenser les limites des cat gories grammaticales disponibles elle vite de tracer des ensembles de s quences chemin par chemin dans un lexigraphe comme dans les figures 2 ou 4 il n
29. n sp cialiste de cette actualit pourra estimer que les documents dans lesquels se trouvent de telles expressions ont toutes les chances de traiter des sujets qui l int ressent Naturellement les expressions caract ristiques d un th me de recherche peuvent tre tr s nombreuses De plus chacune des s quences auxquelles on peut penser est susceptible de pr senter des variantes plus ou moins diff rentes Par exemple les s quences suivantes se rattachent l actualit boursi re aussi bien que les pr c dentes montant total de l op ration montant estim de l op ration chiffres d affaire annuels publi s comparez avec les premi res s quences 269 ANNEXE I LE SYSTEME CORAIL Autrement dit l utilisateur de Corail sera g n ralement tenu de d finir son th me d int r t travers un ensemble de s quences plus ou moins apparent es du point de vue du vocabulaire ou de l orthographe voire seulement par le simple rattachement un m me domaine c est dire sans mot commun Le syst me Corail est capable de s lectionner filtrer et de fournir les seuls documents dans lesquels est pr sente au moins une des s quences que l utilisateur a d crites L interface de ce syst me permet de d crire sous une forme pratique et relativement synth tique l ensemble des s quences apparent es dont cet utilisateur compte faire les crit res de filtrage des documents Cette description principalement la
30. ntreprise Entreprise E mettre la main nee ee mme ppp em ee ppp Enwepise Envie ren wide amp Eee Eme Ron v I EMI MEDII 2 EIE CIL ONT 38 8 GE Entreprise Entreprise E m contr le mm Entreprise Entreprise Entreprise payer SE EES RD Entreprise Entreprise Entreprise lt E gt Entreprise E prendre prendre Capital lt prise gt Entreprise Entreprise Entreprise lt E gt Entreprise E pr parer MAT 2 Entreprise Entreprise Entreprise lt E gt racheter lt gt seme Entreprise Entreprise lt E gt rater lt e Entreprise Entreprise Entreprise lt E gt mamme lt gt Omm Entreprise Entreprise Entreprise Rel rapprocher lt lt gt lt gt Entreprise Entreprise Entreprise E rationaliser lt gt Entreprise Entreprise Entreprise lt E gt recepiaiser lt lt gt wecmiaisaion mel t EC wem e lt E gt ue
31. olise lui seul n importe quel mot ou ventuellement plusieurs mots de suite n importe lesquels en n importe quelle quantit dans les limites de la m moire du syst me tout de m me Dans l exemple de la figure 5 le lexigraphe permettra d identifier notamment toute s quence dans laquelle au moins un mot quelconque sera ins r entre a et bless Autrement dit le moteur de filtrage reconnaitra les documents qui contiendront des phrases comme le forcen a gravement bless le forcen a tr s l g rement bless le forcen t les mots en gras sont ceux reconnus par l tiquette mot quelconque n y a aucune restriction sur la nature ni sur la forme grammaticale des mots ins r s La fl che boucl e symbolise le fait qu il peut y avoir un ou plusieurs mot quelconque Attention si dans un document aucun mot n est pr sent l endroit indiqu par un noeud mot quelconque la s quence n est pas reconnue par l outil et le document n est pas s lectionn Repr sentation de la classe des formes fl chies d un mot 281 ANNEXE I LE SYSTEME CORAIL Principes g n raux Nous allons maintenant pr senter un autre type de noeuds qui sert repr senter d autres classes de mots les classes des formes fl chies Pour comprendre le r le de ces n uds 11 faut connaitre deux notions de linguistique la notion de et celle de flexion On appelle la fo
32. r t LII E ien eee nee s 2121 1512 SE omm E COND 58 eee 0288 lt gt r organiser E N vendable lt r organisation gt venie lt gt mm ele Entreprise Entreprise Entreprise reier lt gt Cmm sme Entreprise Entreprise Entreprise gt venr lt gt Entreprise Entreprise mreise lt gt revendre lt gt lt gt Entreprise Enewse Emwepr amp e lt E gt E Mense sosse ENER Entreprise s parer lt gt emos Entreprise Entreprise Enreise lt E gt signer lt gt Entreprise Entreprise Entreprise Ex soir lt gt Entreprise Entreprise Entreprise gt asoan ES ERENERERRE RUNE NN RN De Emrepise E waoe lt gt Entreprise Entreprise Enveprse sx vente lt Entreprise Entreprise Entreprise gt veser lt gt seme Emepise Enrepse Entreprise v lt gt we Tableau 3 base de signatures th matiques du domaine financier 330
33. re locale CORAIL 1 1 8 words accorde accord commercial lt accord g n ral sur les tarifs douaniers zaccord tarifaire zcalliance7 atranegemeni Conventions lt dispositit Pnreaegernent entente march lt march terme de marchandises march de gr gr lt gt coffre gt proresse cproposition cprotocole7 lt accord g n ral sur les tarifs douaniers Grammaire locale CORAIL 2 accord 315 ANNEXE GRAMMAIRES LOCALES POUR LE FILTRAGE D INFORMATION f d ration congr zation club partenariat groupement europ en d int r t association alliance collusion commensalisme apparentage cont d ration coalition rassemblement groupement entente fusion Comes agr gation union 1 cartel holding trust pool consortrum cartellisation lconzern conglom rat combiniat entente groupement d int r t conomique Jomt venture cercle Grammaire locale CORAIL 3 association 316 ANNEXE Il GRAMMAIRES LOCALES POUR LE FILTRAGE D INFORMATION croop rateur lt gt cadjomt lt col eue lt acolvte CASSOCI passif lt gt zrollaborateur lt gt Zconfrere SCONSOEUT gt porteur lt petit porteur commanditaire gt lt gt Grammaire locale CORAIL 4 associ aller Hz sa
34. rents tat initial en blanc lemme manger en rouge tat final sous graphe en jaune sur fond noir 268 ANNEXE I LE SYSTEME CORAIL Manuel utilisateur du moteur de filtrage exp rimental CORAIL Version 1 Septembre 2000 Introduction Le syst me Corail est destin aider la recherche s lective de documents C est un moteur de filtrage de documents en ligne En fonction de crit res de contenu qui lui sont donn s 1l transmet ses utilisateurs les documents qui sont susceptibles de les int resser Le manuel que vous tenez en main a pour objet de pr senter les fonctions et l interface utilisateur de cet outil et d indiquer comment s en servir Nous vous demandons de prendre le temps de le lire attentivement du d but la fin PRINCIPES G N RAUX Le syst me Corail est destin des utilisateurs qui recherchent le plus possible de documents se rapportant un domaine ou un th me pr cis en vitant de recevoir des documents hors sujet On part du principe que les documents int ressants contiennent forc ment des expressions ou des phrases caract ristiques du domaine vis Ces expressions ou ces phrases sont par d finition des suites de mots que nous appellerons des s quences Par exemple un document portant sur l actualit financi re contiendra une ou plusieurs s quences de ce genre montant de l op ration b n fice net par action publication du chiffre d affaire semestriel U
35. rme de base d un mot telle qu elle sert d signer ce mot dans le dictionnaire Pour un verbe c est l infinitif prendre imaginer pour un adjectif c est le masculin singulier cru et le singulier pour les noms poisson baleine Sous l effet des conjugaisons ou des d clinaisons qui sont des flexions les mots prennent couramment des formes fl chies par exemple il peut s agir de la mise au futur d un verbe imagineras de la mise au f minin ou au pluriel grands crue Pour simplifier les lexigraphes et rapidement leur pouvoir de description on peut donner un n ud la facult de repr senter implicitement toutes les formes fl chies d un mot donn Un tel n ud a l apparence d une case orange dans laquelle est inscrit le lemme du mot C est ainsi que dans le lexigraphe tr s l mentaire que montre la figure 6 le noeud attaquer permet au syst me de reconnaitre les documents dans lesquels se trouvent des mots mon mo mon comme attaquons attaquer avez attaqu furent attaqu s etc Lexigraphe 6 Toutefois le syst me Corail distingue deux types de lemmes un pour la voix active par exemple porter un autre pour la voix passive par exemple tre port Le noeud correspondant aux formes fl chies de porter repr sente donc l ensemble des formes actives savoir porteras portait avait port es etc Le noeud correspond
36. seraient pertinentes Quand un mot inscrit dans un noeud de ce type est un lemme le syst me tend sa recherche aux formes fl chies de ce mot Par exemple dans le cas des nationalit s l outil sera capable de reconnaitre des formes comme serbes palestiniennne etc Notons que gr ce la souplesse de l interface Corail le cr ateur du lexigraphe aurait pu employer d autres conventions Par exemple 1l aurait pu num rer dans une seule case les qualificatifs des nationalit s vis es comme dans la figure 2 mais alors le syst me aurait restreint ses recherches aux seules formes inscrites dans cette case c est dire sans extension aux autres formes fl chies Pour liminer cette restriction le concepteur du lexigraphe aurait pu indiquer ses nationalit s sous forme de lemmes inscrits dans une case jaune mais dans le cas ou une autre recherche de documents l e t conduit inclure encore les nationalit s dans un nouveau lexigraphe e t t oblig de recomposer ult rieurement ce n ud pour la circonstance 288 ANNEXE I LE SYSTEME CORAIL Dans le filtrage de documents qu il op re l outil Corail fait donc appel aux sous lexigraphes inclus dans le filtre ensemble de lexigraphes reli s par un op rateur bool en ET OU SAUF pour d terminer les variantes de s quences que le concepteur a voulu introduire implicitement dans son lexigraphe global Pour interpr ter un lexigraphe en d tail 11 convient don
37. uter un noeud 259 ANNEXE I LE SYSTEME CORAIL f Editeur de filtres Warning Applet window Capture d cran 5 le noeud a t ajout 260 ANNEXE I LE SYSTEME CORAIL PES Editeur de filtres Fitre Aide Ajouter une transiton Effacer le noeud Houveau filtre Untitled aming Applet window Capture d cran 6 menu contextuel clic droit sur un noeud Ajouter une transition 261 ANNEXE I LE SYSTEME CORAIL Editeur de filtres B gt Filtre Aide Houveau filtre Lintitledd Capture d cran 7 la transition a t dessin e entre la boite d origine celle sur laquelle on a cliqu au d but et la bo te d arriv e celle sur laquelle on a rel ch la souris 2062 ANNEXE I LE SYSTEME CORAIL PES Editeur de filtres Filtre Effacer la transition Houveau filtre Untitled aming Applet window Capture d cran 8 menu contextuel clic droit sur la transition Effacer la transition 263 ANNEXE I LE SYSTEME CORAIL Editeur de filtres Mel x Houveau filtre Untitled Capture d cran 9 la transition a t effac e on d sire sauvegarder le nouveau graphe graph xf Graph name Tata baste Applet window _ Capture d cran 10 fen tre de dialogue permettant de saisir le nom du nouveau graphe 264 ANNEXE I LE SYSTEME CORAIL SS Editeur de filtres Filtre Aide Ouvrir S
38. vor P Grammaire locale CORAIL 5 Auxiliaire actif zavor P Grammaire locale CORAIL 6 Auxiliaire passif 317 ANNEXE Il GRAMMAIRES LOCALES POUR LE FILTRAGE D INFORMATION francs suisses dollars canadiens escudos rands Devise grf Tue Jan 22 09 20 52 2002 Grammaire locale CORAIL 7 318 ANNEXE Il GRAMMAIRES LOCALES POUR LE FILTRAGE D INFORMATION zactibm7 lt gt attp lt patticipation chhale lt avoir in lt partp de march Grammaire locale CORAIL 8 Capital Grammaire locale CORAIL 9 Insertions 319 ANNEXE Il GRAMMAIRES LOCALES POUR LE FILTRAGE D INFORMATION csroupe Sentreprise gt Entreprise grt 18 16 15 46 2002 Grammaire locale CORAIL 10 320 ANNEXE Il GRAMMAIRES LOCALES POUR LE FILTRAGE D INFORMATION Ins grf Mon Jan 21 15 26 38 2002 Grammaire locale CORAIL 11 Ins 321 ANNEXE Il GRAMMAIRES LOCALES POUR LE FILTRAGE D INFORMATION change mon taire n goce commerce activit commerciale commerce de d tail commerce de gros commerce lectronique achat acquisition t l achat vente distance vente par correspondance vente prix r duit vente au d tail vente perte exportation colportage porte porte vente domucile placement financier placement vue placement collectif placement d argent capitaux de placement enchere Grammaire locale
39. y a qu un seul nceud disposer elle vite de recevoir de nombreux documents non pertinents comme c est souvent le cas avec l emploi de noeuds mot quelconque par exemple cf figure 5 290 ANNEXE I LE SYSTEME CORAIL Table des figures du manuel d utilisateur Lexo ADNE oa A 270 Le A O 271 ten de ce done de 273 Eet 2774 281 EE 282 TET 283 284 EE 285 atc utem DE 286 e s E T 287 EE A EAT 288 s 290 291 Evaluation ergonomique Gapes 1 2 3 4 5 6 7 8 9 10 J Lisibe2 Lisibe3 112 14 114 j J Lisibed 171 Lisibe Lisibe isibe Lisibe8B Lisibe Tableau 1 correspondance grammaires locales phrases du corpus Des manifestants ont t gravement bless s Un d l gu syndical a t bless l g rement par une grenade lacrymog ne pendant une manifestation Une vingtaine de personnes ont t tr s gravement bless es au cours des v nements La police a dispers les manifestants blessant plusieurs personnes Le forcen tr s exalt a bless plusieurs policiers

Download Pdf Manuals

image

Related Search

Related Contents

Caractéristiques techniques  SOETAM    EN - User`s manual ()  

Copyright © All rights reserved.
Failed to retrieve file