Home
Planification de textes d`instructions
Contents
1. V texte FrGURE 6 10 Processus de g n ration de SPIN 98 tache plan pl planification de tache semantique pl s lection des l ments s mantiques structure s pl texte plan pl structuration s mantique planification de texte rhetorique pl s lection des relations rh toriques spin pl structurer pl structuration rh torique grammaire pl linguistique pl s lection de la structure grammaticale r alisation linguistique lexi morpho pl r alisation lexico morphologique moteur pl r alisation motrice FIGURE 6 11 Modules hi rarchiques de SPIN structures de donn es utilis es et g n r es sont en italiques tandis que les processus en carac t res gras indiquent l emphase du syst me Finalement les liens pleins indiquent le cheminement de la g n ration tandis que les liens pointill s indiquent les consultations et mises Jour des bases de connaissances SPIN est crit en Prolog et utilise le formalisme de grammaire clauses d finies DCG PW80 Prolog est un langage de choix car l unification et le retour arri re deux m canismes abondamment utilis s pour le traitement de la langue naturelle y sont pr d finies Excluant la repr sentation conceptuelle du domaine et le mod le du lecteur SPIN compte environ 6 000 lignes de code SPIN est compos de 11 modules de processus organis s de fa on hi rarchique Quatre autres modules sont consult s au besoin la repr sentation conceptuelle du domain
2. Roc92 Ros78 R s93 RS89 RS92 RS94 Sac74 Sac77 Saw91 Sco93 SG82 Tat76 TD90 186 E Reiter et R Dale A Fast Algorithm for the Generation of Referring Expres sions Dans Proceedings of the 15 International Conference on Computational Linguistics COLING 92 volume I pages 232 238 Nantes ao t 1992 R Reichman Conversational Coherency Cognitive Science 2 4 283 327 1978 N Reithinger The Performance of an Incremental Generation Component for Multi Modal Dialog Contributions Dans R Dale E Hovy D Rosner et O Stock diteurs Aspects of Automated Natural Language Generation Lecture Notes in Artificial Intelligence pages 263 276 Springler Verlag avril 1992 E Reiter Has a Consensus NL Generation Architecture Appeared and is it Psy cholinguistically Plausible Dans Proceedings of the Tt International Workshop on Natural Language Generation pages 163 170 Kennebunkport Maine juin 1994 E Rosch C Mervis W Gray D Johnson et P Boyes Braem Basic Objects in Natural Categories Cognitive Psychology 8 382 439 1976 E Reiter C Mellish et J Levine Automatic Generation of Technical Docu mentation Applied Artificial Intelligence 9 1995 S Rock Understanding Repetition in Natural Language Instructions The Semantics of Extent Dans Proceedings of the 30 Annual Meeting of the Asso ciation for Computational Linguistics ACL 92 pages 279 281 U
3. a est le corps d un plan P dont le but est 8 e a permet f 30 si a est une pr condition d un plan P et B est le but de P ou si f est le corps de P et a est une pr condition de 8 Ces r gles semblent bien appropri es cependant le projet tant ses d but nous n avons pas pu utiliser leurs r sultats 4 R sum Dans ce chapitre nous avons fait un tour d horizon des travaux en r daction technique psychologie et linguistique informatique s int ressant aux textes d instructions Des travaux en r daction technique peu de notions nous sont utilisables En effet la majo rit de ces travaux donnent des conseils aux niveaux grammaticaux lexicaux et typographiques les niveaux s mantiques et rh toriques ne sont g n ralement pas abord s Des travaux en psychologie nous retenons que la repr sentation conceptuelle d une proc dure est hi rarchique et doit tre utilis e pour structurer le texte Les travaux d interpr tation en linguistique informatique nous ont familiaris avec les rela tions de g n ration contribution permission et abstraction souvent retrouv es dans les textes d instructions Aussi le travail de Di Eugenio nous offre son analyse tr s utile des imp ratifs n gatifs Les travaux en g n ration d instructions nous ont fourni des points de d part et de comparaison qui seront repris tout au long de cette th se Les prochains chapitres traiteront en d tail de la planification
4. echec WLLL hb IS Ie 4 novice_schemas pl WL ede e ele dedo lodo i WLAN end of file Ahhh hh BUE 2 2 Nature de la t che RE Mode Prolog YU UT 4 novice_nature pl modele de l usager pour VCR VA Author Leila Kosseim 4 Created On Tue Aug 18 11 14 23 1992 4 Last Modified By Leila Kosseim Last Modified On Tue Feb 7 15 36 15 1995 VIRIDIS II II II tole te tole tetele tate ote tole te lute IIS IIS tole te Ies tole te ole ta tote to lle lo Do loo doo dod du dud te to a ote to ta hhh III III IURI SIS lelelolelototo tote te tote hh hhh tote te tote ate declarations pour que quintus ne se plaigne pas si le predicat n est pas defini III UII IRI IIT te tote ate VII VIRIDIS operations LALAR Ahhh hhh hhh hhh hhh dynamic base 1 dynamic croit ordre 1 LUE hh dynamic etrange 1 dynamic peut etre mal execute 1 VIWWIWIUUL AAAA etats LR LRU dynamic lecteut sait desirable 1 dynamic lecteur sait equivalente 2 dynamic lecteur sait verifier 1 VIII objets LR TII tote hhh hh dynamic attribut lecteur 3 dynamic utilisation rare 1 AALALA AA hh hh PL UU nature de la tache III IIR de dede e ed dd VITIIS hh operations III IIR de dede e ed dd hh base r gler obj s lecteur de vitesse de bande dest _ base s lectionner obj canal 4 base appuyer dest _ bas
5. 2 FR QUENCE DES L MENTS S MANTIQUES FR QUENCE DES RELATIONS RH TORIQUES CORRESPONDANCES ELEMENT SEMANTIQUE RELATION RH TORIQUE 3 1 R sum 3 2 R sultats d taill s APPENDICE D Entr e de SPIN REPRESENTATION CONCEPTUELLE DU DOMAINE 1 1 Sch mas d op rations 1 2 Nature de la tache MODELE DU LECTEUR NOVICE 2 1 Sch mas d op rations 2 2 Nature de la tache APPENDICE E Textes g n r s par SPIN 147 149 149 149 150 150 151 152 152 153 154 154 155 155 155 156 160 160 161 163 165 166 167 169 1 TEXTES DU CORPUS D ANALYSE 1 1 Programmation d un enregistrement 1 1 1 Version originale vcr p 16 1 1 2 Versions de SPIN 1 2 Soufflage de verre 1 2 1 Version originale verre p 73 1 2 2 Versions de SPIN 1 3 Desserrage d une roue de voiture 1 3 1 Version originale auto p 8 1 3 2 Versions de SPIN 2 TEXTES DU CORPUS TEST 2 1 Friture d oignons 2 1 1 Version originale recette p 360 2 1 2 Versions de SPIN 2 2 Finition d un patchwork 2 2 1 Version originale patchwork p 276 2 2 2 Versions de SPIN 2 3 Utilisation d un lecteur de disques audio num riques 2 3 1 Version originale JVC p 10 2 3 2 Versions de SPIN 2 4 Soupe aux f ves de Dale 2 4 1 Version originale Dal92 2 4 2 Versions de SPIN 2 5 Prise lectrique de Mellish 2 5 1 Version originale 2 5 2 Versions de SPIN R F
6. J Allen Maintaining knowledge about temporal intervals Communications of the ACM 26 11 832 843 1983 J Allen Temporal Reasoning and Planning Dans J Allen H Kautz R Pelavin et J Tenenberg diteurs Reasoning about Plans chapitre 1 pages 2 68 Morgan Kaufmann San Mateo Californie 1991 D Appelt Planning English Sentences Studies in Natural Language Processing Cambridge University Press 1985 E Andr et T Rist Generating Coherent Presentations Employing Textual and Visual Material 1995 a paraitre C Balkanski Action Relations in Rationale Clauses and Means Clauses Dans Proceedings of the 15 International Conference on Computational Linguistics COLING 92 volume 1 pages 266 273 Nantes ao t 1992 C Balkanski Actions Beliefs and Intentions in Rationale Clauses and Means Clauses Proceedings of the Tenth National Conference on Artificial Intelligence AAAI pages 196 301 juillet 1992 L Bates E Hovy et S Senneff panelistes invit s Panel discussion Eva luating Generation Systems 7 International Workshop on Natural Language Generation non publi juin 1994 E Bingham Pocketbook for Technical and Professional Writers Wadsworth Belmont Californie 1986 B K Britton Capturing Art to Improve Text Quality Educational Psycholo gist Special Issue Design of Instructional Text 21 4 333 356 automne 1986 B K Britton L Van Dusen S M Glynn et D Hemphill The Impact of Inferenc
7. avec 129 les donn es correspondantes pour les textes naturels Pour notre travail cette m thode serait tr s efficace cependant elle rel ve d exp riences psychologiques pour lesquels nous ne sommes pas qualifi e Comparaison qualitative Une m thode d valuation moins quantitative que les autres mais plus souvent utilis e consiste comparer globalement des textes g n r s automatiquement avec des textes naturels Dal92 Tut92a Avec cette m thode on g n re un ensemble de textes du corpus d analyse et un ensemble de textes d un corpus test et on value si les deux ensembles de r sultats semblent aussi raisonnables l un que l autre Comparaison aux travaux d j existants Pour mesurer l avancement de la science il est toujours int ressant de comparer les r sultats de l approche courante ceux des approches similaires d velopp es pr c demment Pour valuer nos heuristiques nous avons alors suivi les deux derni res m thodes d va luation d montrer que notre approche est plus ad quate que toute autre m thode existante et mop que des textes g n r s hors du corpus d analyse sont comparables aux textes naturels corres pondants 1 2 Comparaison aux m thodes pr c dentes Deux travaux pr c dents Mel88 Dal92 se sont int ress s la planification de textes d instruction Toutefois le but de ces recherches ne consistait pas d terminer le contenu s mantique et
8. cut e Oy a plu sieurs op rations enfants O et les Ov drent des tats E diff rents O doit tre ex engen cut e et les tats E et E contrai gnent l applica tion de O Oy doit tre ex cut e nature de la t che contrainte cooc currence les E sont com muniqu s dans le texte par des effets E et E sont communiqu es dans le texte par des condi tions mat rielles lecteur Oy est de base sait que O est ef fectuer sous et E Oy est de base le lecteur ne sait pas comment effectuer Oy mais sait effec tuer ses op rations descendants O aj 58 commu but com niquer municatif O Oy doit tre ex cut e Oy est de base os TABLE 4 4 Heuristiques de s lection l op ration s quentielle est trop paisse Ici l op ration exclue est diluer la peinture Ces heuristiques sont r sum es la table 4 4 3 2 Les attributs d objets elle satisfait les heuristiques de ces l ments s mantiques est incluse dans le texte comme op ration s quentielle 36 Si la couleur ne suit pas lorsque l on passe rapidement sur le verre c est qu elle Si le lecteur ne sait pas comment effectuer une op ration de base alors ses op rations descendants enfants ou petits enfants qu il sait effectuer sont incluses en tant qu op rations s quentielles L op ration de base sera incluse en tant qu influence ou effet si Dans
9. droite et g n re le texte correspondant Rappelons que I 25 int r t de Dale tait de produire des expressions r f rentielles et non de planifier des textes Cependant sur ce sujet nous retenons les points suivants e La repr sentation conceptuelle de la proc dure ne contient que l information sur la d composition de la t che op ration sous op ration De ce fait aucun imp ratif n gatif DE93b option ou autres types d information retrouv s dans des textes naturels n est inclus dans le texte Aussi toutes les op rations du plus bas niveau de la hi rar chie conceptuelle et seulement ces op rations sont incluses dans le texte Celui ci ne contient donc que des op rations effectuer les tapes composantes de Dix87b et aucun r sultat information organisationnelle etc e Les op rations sont toujours pr sent es par une s quence d actions Le texte est donc structur en une explication lin aire SG82 Dans le contexte des recettes de cuisine la majorit du contenu est form de s quences d actions VL93b Comme la plupart du temps seules les op rations sont pr sent es par des s quences d actions ces strat gies semblent appropri es dans ce domaine de discours Cepen dant elles ne peuvent tre appliqu es directement dans d autres domaines o la proportion de s quences d actions est plus faible Notre travail s efforce d laborer des strat gies plus justifi es linguistiquement dan
10. mot La comparaison mot mot est effectu e en g n rant un texte de facon automatique par un syst me informatique ou manuellement suivant la th orie valider puis en le comparant avec le texte naturel source Vander Linden par exemple a implant sa th orie dans le syst me IMAGENE puis a com par mot mot les textes produits par IMAGENE avec des textes naturels VL93b Toute 128 echec fort E aiee RE Be faible pu uus de solutions texte naturel domaine FIGURE 7 22 Comparaison mot mot en g n ration de texte divergence entre le texte naturel et le texte g n r est consid r un chec Les checs sont ce pendant classifi s en deux cat gories les checs faibles et les checs forts Lorsque le syst me g n re un texte ad quat au point de vue du ph nom ne valuer en l occurrence la structure grammaticale mais qu il ne s agit pas du choix du r dacteur humain alors l chec est consid r faible soft failure Lorsque le syst me ne peut g n rer un ph nom ne ou g n re un ph nom ne inacceptable il s agit d un chec fort hard failure Cette m thode compte cependant deux points faibles importants D abord elle consid re que le texte naturel est l unique forme cor recte ensuite la distinction entre checs faibles et checs forts semble assez subjective comment d terminer si un ph nom ne est acceptable ou non En fait la reproduction mot mot du t
11. nature de la tache un membre de Se indique l utilisation d un instrument Oe indique l utilisa tion d un instrument les membres Se doivent pas tre ex ne cut s en s quence aucun membre Se n indique l utilisation d un instrument Heuristiques de pr sentation l influence 91 relation pr f r e Se par une ma ni re Op par une s quence Oe par une ma ni re Op par une s quence Oe par une ma ni re Op par une s quence Op par un but Se par une autr relation Op par un but Se par une s quence Op par un but Oe par une s quence a Les op rations enfants ne peuvent tre pr sent es par une mani re car elles ne doivent pas tre ex cut es en s quence C est le cas dans 86c o les op rations enfants rouler et tirer sont reli es par une concurrence Ici l utilisation d une mani re produirait 89 Reformer la pointe en roulant le pinceau tout en le tirant vers soi qui ne semble pas naturel d un instrument C est le cas de 86a c Dans ce cas la relation est vue en amont comme dans 86b Plus d une op ration enfant sont pr senter et aucune ne pr cise l utilisation Une seule op ration enfant Oe est pr senter et Oe est une op ration de base Notons que les deux heuristiques ic et iic encouragent l op ration de base tre vue comme l op ration principale ex cuter en la pr sentant dans le noyau
12. pendante que l agent doit directement effectuer Dans l exemple 35b l expression sp cifier l heure d enregistrement ne communique pas une op ration s quentielle car l op ration n est pas effectu e directement mais est plut t g n r e par l op ration appuyer sur OTR l expression communique un effet D apr s notre analyse l introduction d op rations s quentielles dans le texte est r gie par quatre heuristiques Ces heuristiques mettent en Jeu tous les types de contrainte sauf le but communicatif du texte En effet comme expliqu la section 2 le but communicatif ne semble pas influencer l introduction des op rations s quentielles i Si le lecteur sait effectuer une op ration de base ses op rations enfants ne sont g n ra lement pas incluses dans le texte Cependant si les op rations enfants engendrent des tats diff rents inclus dans le texte en tant qu effets ils satisfont les heuristiques des effets cf la section 3 4 alors l op ration de base et ses op rations enfants sont com muniqu es dans le texte en tant qu op rations s quentielles C est le cas des op rations appuyer et enfoncer dans l exemple 35b ii Si deux conditions mat rielles quivalentes sont incluses dans le texte et que le lecteur connait l op ration effectuer sous ces conditions mat rielles alors cette op ration n est pas incluse dans le texte C est le cas dans iv iii iv conceptuelle Oy doit tre ex
13. un effet ou une influence car il n existe aucune relation de g n ration entre les deux op rations v rifier le commutateur de la douille ou r installez DHP 94 ont tudi le cas d op rations s quentielles pr sent es par des buts et remarquent que ce choix semble d pendre de la langue de communication cf l exemple 15a du chapitre 2 section 3 2 d occurences 20 1 12 3 CUBE 80 resultat elaboration concurrence but c condition mani re sequence d actions 1 2 3 123 attribut d objet operation sequentielle condition materielle 1 2 effet 82 3 textes de comprehension 2 textes hybrides 1 textes d execution 3 123 123 123 123 influence operation co temporelle operation eventuelle element semantique FIGURE 5 9 Pr sentation des l ments s mantiques par rapport au but communicatif 1 23 g g E 3 2 o E 83 la douille et v rifier le commutateur du socle Les deux op rations sont plut t reli es par une permission e une c condition 0 8 96 comme dans les exemples 72a et 72b 72 a Retrait de la lyre sur certaines lampes il faut enlever la douille avant de soulever la lyre D gagement de la douille b Appuyer sur la touche OTR pour sp cifier l heure d enregistrement Lorsque la touche est enfonc e une fo
14. un ensemble d op Oj conceptuelle cooc currence peuvent tre rations soeurs O mal effectu es et doit tre effectu E est externe et engendre l tat E un ensemble d op Oj rations soeurs Oj peuvent tre mal effectu es et doit tre effectu E n est pas interne et engendre l tat E un ensemble d op Oj rations soeurs Oj peuvent tre mal effectu es doit tre effectu et O l tat E un ensemble d op E est externe rations soeurs Oj engendre doit tre effectu et O l tat E un ensemble d op n est pas interne engendre rations soeurs O doit tre effectu et engendre l tat E un ensemble d op rations soeurs Oj doit tre effectu et O l tat E un ensemble d op E est externe engendre rations soeurs Oj doit tre effectu et engendre l tat E un ensemble d op n est pas interne rations soeurs O doit tre effectu et O l tat E un ensemble d op engendre rations soeurs Oj doit tre effectu et engendre l tat E TABLE 4 8 lecteur ne comprend pas l utilit de O ne comprend pas l utilit de O ne comprend pas l utilit de O fausse d duction possible fausse d duction possible fausse d duction possible Heuristiques de s lection l effet 64 but com municatif commu niquer ex cution hybride compr hension ex cution hybride compr hension E E E ex
15. FIGURE 6 17 Liste des l ments s mantiques du texte vcr 5 Le but communicatif Dans notre th se le but communicatif est d fini par l incitation effectuer ou non la proc dure au moment de la lecture du texte Cette notion fait partie des donn es initiales du syst me cf la section 1 Pour r sumer les paragraphes pr c dents SPIN utilise les cinq structures suivantes 111 structure contraintes v rifi es repr sentation conceptuelle de la t che conceptuelles liste des l ments s mantiques s lectionn s cooccurrences d l ments s mantiques mod le du lecteur connaissances du lecteur repr sentation conceptuelle du domaine nature de la t che but communicatif donn en entr e but communicatif En consultant et mettant jour ces diff rentes structures SPIN peut appliquer les heu ristiques de s lection pr sent es au chapitre 4 La sortie de ce processus est une liste lin aire contenant les l ments s mantiques s lectionn s Par exemple la figure 6 17 pr sente cette struc ture pour le texte ver Id alement les l ments s mantiques devraient tre emmagasin s dans une structure arborescente suivant la structure de la repr sentation conceptuelle de la t che La lin arisation des structures de SPIN devraient tre effectu es lors de la r alisation linguis tique et non avant Dans le contexte de petits textes d instructions cette simplification ne pose cependant pas de handicap impor
16. chec cer taines pr conditions sont ni es par d faut Dans SPIN pour nier ces pr conditions leur n gation ont t sp cifi es comme tant vraies Analyse des r sultats La figure 7 23 montre le texte de Mellish et celui de SPIN Le texte de SPIN est bien plus compr hensible que celui de Mellish En effet rappelons que Mellish s lectionne syst matiquement toutes les op rations de la repr sentation de la tache et son choix de relations rh toriques ne permet pas autant de variations que dans un texte naturel Analysons en d tail ces deux textes e contenu textuel Tout d abord on remarque que le syst me de Mellish ne produit pas de titre ces proc dures Les instructions 2 et 3 de Mellish ne sont pas pr sent es dans le texte de SPIN car elles sont trop g n rales pour tre int ressantes L instruction 4 par contre contient les m mes op rations s quentielles dans les deux textes mais SPIN n inclut pas l effet then the fuse holder will be empty SPIN suppose que le lecteur aussi novice qu il soit pourra deviner qu en enlevant le fusible la bo te de fusibles sera vide Avec un mod le du lecteur diff rent SPIN pourrait ventuellement consid rer Vinclusion de cet effet dans le texte L instruction 5 est identique dans les deux textes L instruction 6 de Mellish contient un effet qui n est pas communiqu dans le texte de SPIN Ici aussi SPIN suppose que le lecteur peut le d duire Finalement l
17. instructions comme une s rie de choix entre diff rents niveaux de repr sentations conceptuelles et textuelles Si un syst me n effectue que quelques tapes de la g n ration il est plus facile de supposer que l entr e dont il a besoin pourra tre produite automatiquement et que la sortie produite suffira au prochain module pour g n rer un texte naturel SPIN effectue toutes les tapes de la g n ration ainsi d montrant que la r daction compl tement automatique de courts textes techniques est r alisable 139 Representation Conceptuelle du Domaine I NS V e Representation Conceptuelle de la Procedure ot Il pm M X e Representation Semantique du Texte on III y N e Representation Rhetorique du Texte et IV y x e Representation Grammatico Lexicale du Texte et V y N e Representation Typographique du Texte et FIGURE 7 28 Notre approche a la planification de textes d instructions 140 but Pour programmer un enregistrement Pour une meilleure qualit d image r gler le s lecteur de vitesse de bande sur SP Selectionner le canal 4 en appuyant sur la touche de canal Appuyer sur la touche OTR Lorsqu elle est enfonc e 1 fois PM 10 35 30min Lorsqu elle est enfonc e 2 fois PM 11 05 1 h Lorsqu elle
18. main of Objects and Processes ACL MIT Press Series in Natural Language Processing The MIT Press 1992 A Danto What can we do The Journal of Philosophy LX 15 435 445 juillet 1963 A Danto Basic Actions American Philosophical Quarterly I1 141 148 1965 A Danto Analytical Philosophy of Action Cambridge at the University Press 1973 L Danlos G n ration automatique de terte en langue naturelle Masson 1985 J Donin R Bracewell C Frederiksen et M Dillinger Students Strategies for Writing Instructions Organizing Conceptual Information in Text Written Communication 9 2 209 236 apr 1992 B Di Eugenio Understanding Natural Language Instructions The Case of Pur pose Clauses Dans Proceedings of the 30 Annual Meeting of the Association for Computational Linguistics ACL 92 pages 120 127 University of Dela ware juin 1992 B Di Eugenio Speaker s Intention and Beliefs in Negative Imperatives Dans O Rambow diteur Proceedings of the ACL Workshop on Intentionality and Structure in Discourse Relations pages 11 14 Ohio State University juin 1993 B Di Eugenio Understanding Natural Language Instructions A Computational Approach to Purpose Clauses These de doctorat University of Pennsylvania 1993 B Di Eugenio et M White On the Interpretation of Natural Language Instruc tions Dans Proceedings of the 15 International Conference on Computational Linguistics COLING 92 volume IV pages 1147 1
19. op_seq r gler obj s lecteur de vitesse de bande dest SP option meilleure qualit d image r gler obj s lecteur de vitesse de bande dest SP op_seq s lectionner obj canal 4 influence s lectionner obj canal 4 appuyer dest touche de canal op_seq appuyer dest touche de canal op_seq appuyer dest touche OTR qual 3 fois action op seq enfoncer obj touche OTR qual 1 fois effet PM 10 35 30min enfoncer obj touche OTR qual 1 fois op_seq enfoncer obj touche OTR qual 2 fois effet PM 11 05 1 h enfoncer obj touche OTR qual 2 fois op seq enfoncer obj touche OTR qual 3 fois effet PM 11 35 1 h 30min enfoncer obj touche OTR qual 3 fois op_seq appuyer dest touche TIMER qual dans un d lai de 9 secondes FIGURE 6 18 Structure s mantique du texte ver la proc dure en trois grandes tapes distinctes et s assurer qu une grande tape soit compl t e avant d entamer la suivante Pour r ordonner les op rations temporellement ind pendantes SPIN utilise alors les r gles suivantes i d abord les contraintes de style sont appliqu es les op rations de pr paration sont pr sent es en premier ii parmi les op rations restantes les op rations autonomes sont plac es ensuite iii finalement les op rations restantes sont plac es au hasard tout en gardant adjacentes les op rations ayant un m me parent Ceci permet d viter des changements de f
20. par un r sultat et l tat plus facile v rifier utilise une c condition C est le cas dans 75 et 77 Aussi dans 79 a Au laboratoire INCOGNITO si vous tes sur NIL vous tes sur une station SPARC 10 utilisez la proc dure de ces machines b Au laboratoire INCOGNITO si vous tes sur une station SPARC 10 vous tes sur NIL utilisez la proc dure particuli re cette machine 10 Exemples hors corpus 86 L expression au laboratoire INCOGNITO d finit le contexte dans lequel l quivalence des tats est v rifi e En effet si dans ce laboratoire seule la machine NIL est un SPARC 10 les deux tats vous tes sur NIL et vous tes sur une station SPARC 10 sont quiva lents Dans 79a la condition fondamentale pour utiliser la proc dure des SPARC 10 est d tre sur un SPARC 10 La c condition vous tes sur NIL n est communiqu e que pour faciliter la t che au lecteur d terminer si effectivement il est sur un SPARC 10 Ce dernier tat est donc pr sent par un r sultat et le premier par une c condition D un autre c t dans 79b la condition fondamentale pour utilisez la proc dure particuli re NIL est d tre sur NIL L tat vous tes sur une station SPARC 10 n est communi qu que pour aider le lecteur d terminer si effectivement il est sur NIL ou non C est pourquoi cette derni re condition est pr sent e par un r sultat et la premi re par une c condition ii Une s quence est ut
21. 0 0 0 0 T 4 6 4 9 0 5 2 2 Ncc croco oND DONE he N RH ENDOOG HO kH o w 164 11 158 136 124 45 34 21 1196 9 896 396 296 1 op r vent autre DD OOUNNR FF AN coco cococcooocococonmncoccocococococ c 15 12 1471 HE 5 997 155 2 Fr quence des relations rh toriques source Relation rh torique total s quence c condition laboration but r sultat mani re concurrence mazda t l auto ver ordi souffle peint recette bouche rotin armoire vin photo lec antique M l2 D I OTN e EN e or eo eR rR NN D OR JO 2c 2o MONTOCHOBRALBNOCOCOCSO HATE NO O00 n 00 oO n w N w oo o 96 172 170 119 98 97 45 1471 52 12 1 8 T 7 3 101 3 Correspondances l ment s mantique relation rh to rique 3 1 R sum l ment Relation rh torique total s mantique s quence c condition laboration but r sultat mani re concurrence op s quentielle cond mat rielle attribut d objet effet influence op co temporelle option pr vention op ventuelle autre 3 2 R sultats d taill s mazda s quence c condition 45 op ration s quentielle condition mat rielle attribut d objet effet influence op ration co temporelle option pr vention op ration ventuelle t l s quence c condition 45 op ration s quentielle condition mat riell
22. Dans le cas o les tapes composantes sont plac es avant l information organisationnelle Dixon propose deux strat gies de lecture la strat gie de supposition guessing strategy Le lecteur essaie de deviner com ment les tapes composantes sont organis es avant de lire l information organisation nelle Ces suppositions sont corrig es lorsque l information organisationnelle est lue et qu elle diff re des suppositions la strat gie de tampon buffering strategy Les tapes composantes sont conser v es dans un tampon de facon relativement non interpr t es en attendant l information organisationnelle Dans la strat gie de supposition le lecteur a besoin de temps suppl mentaire lors de la lecture des tapes composantes car c est ce moment que le processus de supposition est ef fectu Dans la strat gie de tampon un temps suppl mentaire est n cessaire lors de la lecture de l information compositionnelle car c est ce moment que les tapes composantes sont orga nis es En partant de ces remarques Dixon a effectu trois exp riences o il demandait des sujets de dessimer des objets en utilisant des instructions comme 8 Ceci sera un dessin d un verre vin Dessinez un triangle sur un T l envers 14 Apr s avoir compar le temps de lecture pour chaque type d information Dixon conclue que les lecteurs utilisent la strat gie de supposition et non la strat gie de tampon pour interpr ter une ins
23. Par exemple 38 a Si le liquide contient des fragments m talliques adressez vous un m canicien qualifi b Si des bulles apparaissent autour de la valve c est qu il y a une fuite cet endroit Faites la remplacer par un m canicien qualifi Les conditions mat rielles comptent pour 11 des l ments s mantiques de notre corpus 60 Pour introduire une condition mat rielle il semble que les contraintes conceptuelles soient primordiales i Toutes les conditions mat rielles qui ne peuvent tre r solues d apr s les connaissances de la repr sentation conceptuelle du domaine sont introduites dans le texte En effet si un tat non v rifi n est pas inclus dans le texte alors celui ci ne transmet pas fid lement la repr sentation conceptuelle de t che et la proc dure sera erron e Ici les connaissances du lecteur ne sont pas consid rer car m me s il sait qu une op ration est contrainte par une condition mat rielle le texte l induirait en erreur si celle ci n tait pas mentionn e ii De plus si la condition mat rielle communiquer est difficile valuer ou que le lecteur ne sait pas comment l valuer alors une condition quivalente dans le contexte de la proc dure mais plus facile valuer est communiqu e Si le lecteur ne peut deviner l quivalence de ces deux conditions alors elles sont toutes deux communiqu es par contre si le lecteur peut deviner leur quivalence seulemen
24. cution E hybride E compr hension E E E E 65 Dans les travaux ant rieurs d cider si une relation hi rarchique doit tre incluse dans le texte est effectu de fa on assez simple En effet Mellish prescrit l inclusion de toutes les rela tions hi rarchiques effets ou influence Mel88 tandis que Dale n en prescrit aucune Dal92 D apr s notre analyse il semble qu une influence est introduite en fonction de tous les types de contraintes sauf le but communicatif On introduit une influence si i Le lecteur requiert des pr cisions sur l ex cution d une op ration de base Oy par exemple il ne connait pas toutes les tapes h site entre plusieurs m thodes Dans ce cas parmi toutes ses op rations enfants Oe un sous ensemble S faisant r f rence aux op rations ou caract ristiques les plus discriminantes est inclus dans le texte pour clarifier comment Oy doit tre ex cut e Par exemple 48 La paraison est centr e en utilisant le marbre Ici Op centrer la paraison Oe d poser la paraison sur le marbre rouler la parai son et S utiliser le marbre L ensemble S ne suffit pas pour effectuer Op mais plut t fait r f rence l ensemble Oe dont les op rations peuvent g n rer Op Ici la relation n est clairement pas une permission cf le chapitre 2 car Oe doit tre ex cut en m me temps que Oy et Oe g n re Op Au pire cas S peut contenir tous les l ments de Oe
25. de pr sentation qui s lectionnent la structure rh torique la plus appropri e dans un contexte particulier Ces heuristiques consid rent que les niveaux s mantiques et rh toriques sont reli s de fa on plusieurs plusieurs comme le conseillent Korelsky et Kittredge KK93 Pour t moigner de ph nom nes linguistiques naturels ces deux ensembles d heuristiques sont bas s sur l tude d un corpus de textes d instructions 3 2 Analyse de corpus notre connaissance aucun travail ne s est directement pench sur la question de s lec tion de contenu et de structure textuelle dans les instructions Pour tudier ces aspects nous avons alors effectu une analyse de corpus Cette m thode est souvent utilis e en linguistique informatique Tut92a VL93b DE93b car elle permet d viter la simplification de probl mes textuels et linguistiques Ainsi Kittredge consid re une telle analyse comme une tape essen tielle pour bien caract riser les ph nom nes de la langue Kit83 Tout syst me op rationnel doit tre bas sur une description empirique com pl te du langage tel qu il est utilis dans le domaine d origine du texte p 45 Lors de la s lection du corpus nous avons pris soin de ne consid rer que des instructions correctes En effet certains manuels sont incompr hensibles du point de vue linguistique Representation Conceptuelle du Domaine I NS V Representation Conceptuelle de la Procedure ha Il
26. et Os l op ration la forme active passive ont les caract ristiques suivantes e Ogp peut tre ponctuelle ou durative tandis que Og est durative e le d but et la fin de Og sont clairs tandis le d but ou la fin de Og n est pas toujours clair e l ex cution de Oap est englob e par l ex cution de Og relation temporelle during de Allen A1183 Par exemple dans 112 Tout en le faisant tourner effleurer la surface du verre on peut visualiser l ex cution de ces op rations par tourner lt effleurer Cependant cette r gle ne semble expliquer qu une faible majorit des cas C est pourquoi SPIN s lectionne au hasard le noyau la forme active passive et r alise les autres noyaux par le g rondif Pour s lectionner la forme active passive les r gles utilis es pour les s quences d actions sont appliqu es cf la section 4 1 2 4 1 9 R sum Gr ce aux observations des sections pr c dentes et l analyse de Vander Linden SPIN utilise des r gles assez g n rales pour r aliser grammaticalement les relations rh toriques Pour le texte vcr les choix grammaticaux effectu s par spin sont pr sent s la figure 6 21 De toute vidence une tude plus approfondie de ces ph nom nes est n cessaire 11 Aucune concurrence du corpus n est form e de plus de 3 noyaux un tel groupe d op rations semble effectivement difficile concevoir et ex cuter
27. installez le couvercle ensuite branchez la prise et la prise fonctionnera 131 Version de SPIN Pour faire fonctionner le syst me Enlever le couvercle Enlever l ancien fusible Installez le nouveau fusible Installer le couvercle Branchez la prise FIGURE 7 23 Fonctionnement de la prise versions de Mellish et de SPIN De fa on globale il semble vident que le texte de SPIN poss de des heuristiques de s lection d l ments s mantiques plus appropri es que le syst me de Mellish En ce qui concerne le choix des relations rh toriques le texte est tel qu aucune conclusion pour ou contre nos heuristiques ne puisse tre formul e 1 2 2 EPICURE de Dale Le travail de Dale aussi est apparent au n tre Pour comparer nos deux travaux nous avons suivi la m me approche qu avec le travail de Mellish Cette fois nous avons pris son exemple de soupe aux f ves retrouv au chapitre 6 de Dal92 La repr sentation conceptuelle de la t che est pr sent e la figure 7 24 Modifications l entr e de Dale Quatre modifications mineures ont t apport es l entr e de Dale pour l adapter SPIN i D abord SPIN a besoin de connaitre certaines caract ristiques de la t che Un mod le de la nature de la tache a donc t d velopp de fa on ce que le r sultat de SPIN se rapproche le plus possible de celui de EPICURE ii Les op rations de Dale semblent tre bas es sur des en
28. langez la farine cr pes l oeuf l huile salade et le consomm Faites chauffer assez d huile frire dans un po lon pour en avoir 1 pouce d paisseur Trempez les anneaux d oignons un par un dans la p te Ne les trempez pas tous en m me temps gouttez les un instant Faites les frire dans l huile frire pendant 3 minutes Retournez les une fois pendant la cuisson Gardez les dans un endroit chaud mesure qu ils sont cuits 176 Lecteur moyen texte hybride Friture des oignons dans la p te cr pes Pr parez les oignons en les tranchant en morceaux d 1 3 de pouce d paisseur et en les d faisant en anneaux M langez la farine cr pes l oeuf l huile salade et le consomm Faites chauffer assez d huile frire dans un po lon pour en avoir 1 pouce d paisseur Trempez les anneaux d oignons un par un dans la p te Il ne faut pas les tremper tous en m me temps gouttez les un instant Faites les frire dans l huile frire pendant 3 minutes Retournez les une fois pendant la cuisson Gardez les dans un endroit chaud mesure qu ils sont cuits Lecteur moyen texte de compr hension Friture des oignons dans la p te cr pes Pr parer les oignons en les tranchant en morceaux d 1 3 de pouce d paisseur et en les d faisant en anneaux M langer la farine cr pes l oeuf l huile salade et le consomm Faire chauffer assez d huile frire dans un po
29. lon pour en avoir 1 pouce d paisseur Tremper les anneaux d oignons un par un dans la p te Il ne faut pas les tremper tous en m me temps Les goutter un instant Les faire frire dans l huile frire pendant 3 minutes Les retourner une fois pendant la cuisson Les garder dans un endroit chaud mesure qu ils sont cuits Lecteur expert texte d ex cution Friture des oignons dans la p te cr pes Pr parer les oignons Pr parer la p te Faire chauffer assez d huile frire dans un po lon pour en avoir 1 pouce d paisseur Tremper les anneaux d oignons un par un dans la p te Les goutter un instant Les faire frire dans l huile frire pendant 3 minutes Les retourner une fois pendant la cuisson Les garder dans un endroit chaud mesure qu ils sont cuits Lecteur expert texte hybride Friture des oignons dans la p te cr pes Pr parez les oignons Pr parez la p te Faites chauffer assez d huile frire dans un po lon pour en avoir 1 pouce d paisseur Trempez les anneaux d oignons un par un dans la p te gouttez les un instant Faites les frire dans l huile frire pendant 3 minutes Retournez les une fois pendant la cuisson Gardez les dans un endroit chaud mesure qu ils sont cuits Lecteur expert texte de compr hension Pour frire les oignons dans la p te cr pes Pr parez les oignons Pr parez la p te Faites chauffer assez d huile frir
30. mais ce ph nom ne n a pas t retrouv dans notre corpus heuris tique s mantique CM et CM sont i i i ii iii iv e un but 29 96 comme dans des conditions mat rielles CM et CM sont des conditions mat rielles CM et CM sont des conditions mat rielles CM et CM sont des conditions mat rielles CM est une condi tion mat rielle CM est une condi tion mat rielle contrainte lecteur sait valuer C M ne sait pas valuer CM ne sait pas valuer CM mais sait va luer CM nature de la t che CM CMb CM est difficile va luer et C M est plus facile CM CMb CM est difficile valuer CM CMb C Mo est facile valuer CM est modifiable CM sp cifie le type d appareil CM est une condi tion mat rielle 8T relation pr f r e CM par une c condition et CM2 par un r sultat CM par une c condition et CM2 par un r sultat CM par une c condition et CM2 par un r sultat CM par une c condition et CM2 par un r sultat c condition c condition ou but c condition TABLE 5 18 Heuristiques de pr sentation la condition mat rielle 81 Pour prot ger les bornes contre la tension nouez les extr mit s s par es du cor e une mani re 4 96 par exemple don 82 Vous pouvez voir le niveau de volume en observant la barre RoUGE sur la gamme de 15 barres affich es sur
31. mantique d pend des choix futurs une note de la forme contrainte Contraintes Choix_si_vraies Faits_si_vraies Choix_si_fausses Faits_si_fausses est prise en compte Cette note indique les contraintes v rifier plus tard les l ments s mantiques s lectionner et les faits affirmer si ces contraintes sont satisfaites ou non Lors de la structuration s mantique les d cisions laiss es sous cette forme seront valu es et remplac es par le choix appropri cf la section 3 2 3 Les connaissances et intentions du lecteur SPIN v rifie ces contraintes en consultant le mod le du lecteur Ce mod le repr sente les op rations que le lecteur sait effectuer et ses connaissances diverses sur la nature de la t che Dans le syst me EPICURE Dal92 le mod le du lecteur est simplement repr sent par une liste d op rations que le lecteur sait effectuer ce qu il appelle les op rations primitives Cependant cette m thode suppose que i les connaissances du lecteur sont toujours correctes par rapport la r alit ii le lecteur conna t les sch mas d op rations au complet iii les connaissances du lecteur sont statiques Cependant ces hypoth ses ne sont pas toujours v rifi es En effet il peut arriver que le lecteur poss de des connaissances inconsistantes par rapport a la r alit il peut s attendre par exemple un certain effet impossible dans les conditions courantes Ainsi l hypoth
32. me lorsque deux r dacteurs humains r digent des instructions naturelles pour une m me proc dure ils peuvent baser leur r daction sur des repr sentations conceptuelles non identiques Par exemple en reprenant le sch ma de la figure 6 14 nous avons choisi de classifier dans obj cassette lieu vid o en tant que pr condition la programmation du ma gn toscope En effet d un point de vue pratique l op ration de mettre une cassette dans le 103 magn toscope peut avoir t effectu e bien avant la programmation Dans ce cas cette tape ne doit pas tre toujours ex cut e et ainsi elle ne peut tre consid r e comme une sous tape de programmer D un autre c t aucune cassette ne devrait rester inutilis e dans un magn toscope pour ne pas risquer de l abimer D un point de vue th orique l utilisateur doit alors toujours ins rer une cassette lors d un enregistrement cette tape pourrait alors tre consid r e dans le corps et non dans les pr conditions Non seulement la structure mais aussi le contenu de la repr sentation conceptuelle peut tre subjectif Avant de programmer un magn toscope est il n cessaire de s assurer qu il y ait pas de panne d lectricit que l appareil soit branch qu il soit fonctionnel que son panneau avant soit accessible Inversement lors de la lecture d un m me texte deux lecteurs peuvent construire diff rentes repr sentations conceptuelles l un de l
33. n ration multilingue 1 3 2 L application des heuristiques d autres genres textuels Le travail pr sent ici ne s est pench que sur les textes d instructions Ce genre textuel exhibent peu de diversit s mantique et rh torique permettant ainsi leur formalisation Nous 147 sp culons que dans la plupart des textes le genre textuel et son but communicatif sont tr s li s au choix du contenu mais bien moins au choix rh torique Dans le cas des textes d instructions ce ph nom ne est illustr par les figures 4 7 4 8 et 5 9 Nous sp culons que dans d autres genres textuels ce ph nom ne est aussi valide Nos heuristique de s lection serait donc presque inutiles dans un autre genre textuel tandis que les heuristiques de pr sentation seraient probablement r utilisables sous r serve d une adaptation 1 3 3 Validation par des m thodes psychologiques Finalement la question d valuation reste peu d velopp e Nous avons v rifi les heuris tiques de s lection et de pr sentation par des comparaisons qualitatives cependant il serait tr s int ressant de valider les heuristiques par des m thodes de psychologie En effet en mesurant le temps de lecture des textes g n r s automatiquement et des textes naturels et le temps et les erreurs d ex cution des proc dures d crites la compr hension et la coh rence de ces textes pourraient tre valu es 2 Discussion et Motivation Au chapitre 1 nou
34. p 44 L appendice C 1 pr sente ces r sultats en d tail pour chaque texte du corpus Les l ments dont nous discutons ici traitent de 99 96 du texte Parmi les autres l ments on retrouve de l information de s curisation d historique 10Nous tenons remercier Massimo Fasciano dont le syst me POSTGRAPHE a g n r les figures 4 7 4 8 et 5 9 57 Telles que pr sent es dans les sections qui suivent les heuristiques e sont reli es par une disjonction e sont exhaustives e sont pr sent es en ordre de pr f rence bien qu elles soient souvent mutuellement ex clusives insi si plusieurs heuristiques sont applicables un contexte particulier on pr f rera s lectionner la premi re cit e Voyons maintenant sous quelles conditions un l ment s mantique est introduit dans le texte Les l ments sont pr sent s par ordre d importance 3 1 Les op rations s quentielles L op ration s quentielle est l l ment s mantique le plus fr quent dans tous les types d ins tructions Dans notre corpus cet l ment forme pr s de la moiti des textes 5196 On retrouve cet l ment dans les phrases telles que 35 a Placez une disquette Ms Dos dans le lecteur A b Appuyer sur la touche OTR pour sp cifier l heure d enregistrement Lorsque la touche est enfonc e une fois PM 10 35 30min sera affich L op ration s quentielle indique une op ration positive obligatoire imm diate et ind
35. sentation conceptuelle de t che de la soupe aux f ves de Dale iii iv cette op ration a t remplac e par ses deux op rations co temporelles sous jacentes 20a et 20b ajouter obj cr me et m langer obj soupe Pour simplifier la g n ration Dale limine de la recette originale tir e de Bean Book de Rose Elliot un certain nombre de ph nom nes que EPICURE ne peut produire Cependant pour le test effectu sur SPIN les conditions et les pr ventions d actions ont t r introduites dans la recette car le syst me est en mesure de les g n rer Le mod le du lecteur de EPICURE a t tendu pour contenir des sch mas entiers d op rations et les connaissances du lecteur sur la nature de la tache plutot que seul le nom des op rations que le lecteur sait d composer Entre autres les op rations de base du lecteur ont t identifi es dans la figure 7 245 celles ci sont pr c d es d un ast risque Ici aussi le mod le du lecteur a t d velopp de fa on minimiser les diff rences entre les r sultats de SPIN et ceux de EPICURE ou dans le cas des conditions et des pr ventions d actions la recette originale Cette structure n indique que les liens hi rarchiques Les op rations d un m me plan sont toutes reli es s quentiellement 133 Analyse des r sultats La figure 7 25 pr sente les instructions g n r es par EPICURE une traduction de ce texte puis la version SPIN
36. si l objet principal de la proc dure ne sert pas d autres proc dures alors cet objet est indiqu dans le titre sous forme d un groupe nominal Dans les autres cas si une nominalisation de l op ration est possible SPIN pr sente g n ralement le titre par un groupe nominal sinon les autres formes sont choisies de fa on al atoire en suivant les proportions de la table 6 28 4 1 2 La s quence d actions Dans les textes d instructions les noyaux des s quences peuvent suivre 4 formes gramma ticales 1 l actif direct r alis par un verbe l imp ratif ou l infinitif ii l actif impersonnel r alis par on pr sent ou il suffit de vous devez il faut infinitif iii le passif de la forme lt sujet gt est doit tre peut tre participe pass iv l actif narratif de la forme l lt agent gt pr sent par exemple l artisan fait O 120 hybride Actif direct Faites O Actif impersonnel On fait O Passif O est fait Actif narratif L agent fait O Toa o 100 io 1o TABLE 6 29 Formes des actions Fam O o o Teal Exempie O Si passif si O est faite Lorsque passif lorsque O a t faite Dans le cas de sur groupe nominal dans tel cas Action explicite de l usager au pr sent si vous faites O Forme impersonnelle si on a fait O Action explicite de l usager au pass compos si vous avez fait O S il y a lieu de infinitif s il y a lieu de faire O
37. sultats Pour ne pas perdre trop de signification dans nos g n ralisations nous avons adopt les pr cautions suivantes e Seules les parties proc durales ont t analys es e Les textes du corpus ont t classifi s selon leur but communicatif cf le chapitre 4 et les r sultats de l analyse prennent ce facteur en consid ration En ce qui concerne le niveau d expertise du lecteur une classification moins rigoureuse a t effectu e mais ce facteur entre tout de m me en jeu lors de la planification textuelle Toute g n ralisation des r sultats par rapport l expertise du lecteur et au but communicatif est justifi e par notre analyse de corpus L analyse d un corpus moins vari aurait sans doute permis de d velopper des heuristiques plus pr cises mais leur application d autres domaines n aurait pas t possible En fait nous suivons l approche d j adopt e par Mellish Mel88 c est dire d avoir des r gles g n rales pour la g n ration d instructions dans tous les domaines puis des r gles particuli res pour ajuster le texte au domaine et au lecteur d sir s Le corpus est constitu de proc dures de e soins d urgences respiratoires bouche e recettes de cuisine recette e assemblage de meubles armoire e utilisation d un magn toscope vcr e utilisation d un t l viseur t l 5 Cette mesure n est pr sent e qu titre indicatif Lorsqu une proc dure est divis e en plusie
38. tapes ou non Les termes techniques sont ils mieux pr sent s en italiques ou en caract res gras Les travaux de Hartley et de Price et Korman Har85 Har86 PK93 discutent de ces choix Cette architecture a t choisie pour sa simplicit d implantation cependant d un point de vue th orique elle fait abstraction d un certain nombre d interd pendances entre les diff rents niveaux de choix Par exemple les choix de mise en page peuvent influencer les choix lexicaux grammaticaux et rh toriques En effet une liste num r e pr f rera un parall lisme lexical grammatical et rh torique entre les l ments num r s tandis que dans un paragraphe 3 Seulement lorsque toute la planification de texte est effectu e de fa on constructive par des op rateurs s mantiques et des op rateurs rh toriques comme dans MP93 alors un lien plusieurs plusieurs peut tre r alis Comme nous verrons au chapitre 6 dans notre implantation les d cisions grammaticales sont g n ra lement prises avant les d cisions lexicales car dans la plupart des cas cette derni re tape ne s occupe que de lexicaliser des concepts et des relations respectivement par des noms et des verbes sans vides lexicaux Dans le cas de changement de cat gorie conceptuelle lexicale ex une relation nominalis e les d cisions grammaticales ont droit de regard sur le lexique vitant ainsi un retour arri re lors de vides lexicaux 39 e
39. valuer les heuristiques de s lection et de pr sentation nonc es aux chapitres 4 et 5 en analysant les textes g n r s par SPIN puis d valuer le projet de fa on globale D abord certaines techniques d valuation en g n ration de texte sont pr sent es De ces techniques deux ont t retenues pour valuer nos heuristiques la comparaison avec des travaux ant rieurs et la comparaison qualitative avec des textes naturels hors du corpus d analyse Pour valuer le projet nous analysons ses points forts et ses points faibles 1 valuation des heuristiques 1 1 L valuation en g n ration de texte Traditionnellement la g n ration automatique de texte ne s est pas pench e activement sur l valuation mais de plus en plus l importance d une telle tape se fait sentir Wal89 BHS94 Actuellement en g n ration automatique de textes il n existe aucune m thode accept e pour valuer une th orie ou un syst me Le probl me est amplifi car l entr e et quelques fois la sortie du processus de g n ration ne sont pas canoniques et il est souvent difficile de d finir l ensemble des r sultats corrects Aujourd hui les chercheurs conscients d valuer leur travail ont leur disposition plusieurs m thodes une comparaison mot mot avec des textes naturels une comparaison plus qualitative une valuation aveugle par des sujets et une comparaison avec les m thodes d j existantes Comparaison mot
40. 11 05 1 h op enfoncer obj touche OTR qual 1 fois precond corps succes ajout C PM 10 35 30min echec ajout PM 10 057 op appuyer dest touche TIMER qual _ precond corps succes ajout activ obj enregistrement echec ajout neg activ obj enregistrement op appuyer dest touche de canal precond corps succes ajout chang obj canal echec ajout neg chang obj canal VIRTUTES IIT contraintes temporelles RAT before _ appuyer dest touche TIMER qual _ before r gler obj _ dest SP appuyer dest touche TIMER qual _ before r gler obj _ dest SP appuyer dest touche OTR qual _ before s lectionner obj canal 4 appuyer dest touche OTR qual _ LT X4 vcr schemas pl end of file IIR de ede e e d d e ld e edu dno Du D Dd e dedu du loe lod e e edu du dedu Du aud edu du du dun uode e hhh 162 163 1 2 Nature de la t che WU x Mode Prolog VALUE 4 vcr nature pl Nature de la tache pour VCR V4 Author Leila Kosseim 4 Created On Thu Jan 12 14 35 46 1995 X Last Modified By Leila Kosseim Last Modified On Wed Mar 15 11 15 38 1995 VIRTUTES HP III III ITE VIII IIR ede de de D dd e d e edu du olo le ld e du e edu lu odo ide declarations pour que quintus ne se plaigne pas si le predicat n est pas defini VIII
41. BE EC 1 TABLE 6 30 Formes des c conditions Le choix de ces formes semble d pendre du but communicatif du texte En effet comme Villustre la table 6 29 les textes d ex cution sont tr s st r otyp s tandis que les autres types de texte utilisent une plus grande vari t de formes grammaticales De fa on g n rale les pr ventions actions n gatives utilisent une forme active directe ou impersonnelle accompagn e des n gations ne pas ou sans par exemple sans faire O il ne faut pas faire O Pour les actions contenu positif la forme active directe est nettement pr f r e Avec cette forme Vinfinitif et l imp ratif peuvent tous deux tre utilis s Dans les m mes circonstances certains manuels pr f rent l infinitif tandis que d autres utilisent toujours l imp ratif Lorsqu il produit cette forme SPIN effectue alors le choix du temps de fa on al atoire au tout d but de la g n ration Lorsqu il s agit d un texte d ex cution SPIN ne g n re que l actif direct cependant s il doit r diger un texte hybride ou de compr hension SPIN choisit de fa on al atoire diff rentes combinaisons de formes tout en suivant les proportions de la table 6 29 4 1 3 La c condition Pour d terminer automatiquement la forme grammaticale d une c condition Vander Lin den a d velopp des r gles assez complexes pour l anglais VVLCM92a VL94 Comme pour l anglais le choix de la forme grammaticale en fran ais
42. III e dee de de d d e e edu du olo RL EIU predicats generaux I ede e ede du du du uoo lo dod d de ed dynamic agent 2 dynamic procedures 2 dynamic type 1 AA AAA AO hhh hhkkk operations RAR dynamic dangereux 1 dynamic dependant 2 dynamic desirable 1 dynamic dont 1 dynamic durative 1 dynamic ensemble_discriminant 2 dynamic erreur 1 dynamic facile_a_mal_executer 1 dynamic facilite tache 1 dynamic fausse deduction 1 dynamic flou 1 dynamic futur 1 dynamic habitude 1 dynamic irreversible 1 dynamic mentale 1 dynamic methode_normale 2 dynamic nefaste 1 dynamic negtc 1 dynamic optionel 1 dynamic preparation 1 dynamic regle_generale 1 LALLA LAAN EN etats LALLA dynamic desirable 1 dynamic difficile 1 dynamic equivalent 2 dynamic externe 1 dynamic interne 1 dynamic materielle 1 dynamic modifiable 1 dynamic option 2 164 dynamic textuel 1 dynamic type_appareil 1 dynamic vrai bientot 1 VIRTUS objets LR TII tote hhh hh dynamic attribut 3 dynamic justifie_operation 2 dynamic plus important 2 AALALA AA hh hh PL UU nature de la tache LALLA LAAN EN LALLA LAAN EN predicats generaux Wh bbb het agent procedures touche OTR programmer autre_chose type
43. L alternative indique plusieurs actions ou situations alternatives mais qui ne sont pas en contraste l une avec l autre Par exemple 66 Si l appareil est amen directement d un endroit froid un endroit chaud ou est plac dans une pi ce tr s humide ans ce projet nous n avons pas consid r que la repr sentation conceptuelle du domaine D t d l tat tuelle du d puisse contenir des disjonctions De plus dans notre corpus on ne retrouve que 18 relations alternative du corpus c est pourquoi nous n avons pas consid r cette relation Dans d alt t 1 d C est d tte relat D notre analyse l exemple 66 n est donc pas d compos et toute l expression est consid r e comme une c condition 1 8 La s quence num r e La s quence num r e de Rosner et Stede se distingue de la s quence standard de la RST En effet ces chercheurs consid rent diff rentes les op rations pr sent es dans une liste num r e et les op rations pr sent es dans des paragraphes mais la distinction entre ces deux relations Exemple hors corpus tir de RS92 Exemple hors corpus tir de RS92 4Une option n est qu un tat v rifier par l agent lors de l ex cution de la proc dure et ne forme pas une disjonction TT Relation rh torique s quence c condition laboration but mani re r sultat concurrence mi 39 TABLE 5 14 Relations rh toriques du corpus n est pas bien
44. Mode d emploi t l viseur couleur CX21349 Toshiba vcr Toshiba Mode d emploi magn toscope cassette M 5100C Toshiba 1 1 2 Textes hybrides mazda Mazda Mazda 323 Conduite et Entretien Mazda Motor Corporation 1988 ordi I Virga Organisez votre disque dur Marabout Belgique 1987 photo H Champollion et D Champollion La photographie Les guides pratiques Ouest France Rennes France 1991 rotin Bauta Technique du rotin Mains agiles H Dessain amp Tolra Paris 1970 1 1 3 Textes de compr hension antique R Le Corre Comment restaurer les meubles antiques Renouveau P dagogique Montr al 1970 peint R Moser Peinture sous verre Savoir Cr er Fleurus Paris 1984 150 souffle J Vali re Le soufflage du verre art perdu et retrouv Lem ac Ottawa 1979 vin A Beaucage Faire son vin soi m me des petits moyens pour de grands vins Les ditions de L homme Montr al 1984 1 2 Corpus test JVC JVC Manuel d instructions Mini chaine compacte patchwork de fils en aiguille Montr al 1975 recette J Benoit La Nouvelle Encyclop die De La Cuisine Les Messageries du Saint Laurent Montr al dition deluxe 1974 2 Caract ristiques des types de textes texte longueur moyenne des dext rit jugement instruments sp cialisation mise en EN C OC M WES IE armoire moyen beaucoup auto beaucoup beaucoup bouche peu beaucoup lec peu beaucoup rece
45. RENCES xi 169 169 171 173 174 174 177 177 178 180 181 LISTE DES FIGURES 1 1 1 2 2 3 3 4 3 5 4 6 4 7 4 8 5 9 6 10 6 11 6 12 6 13 6 14 6 15 6 16 6 17 6 18 6 19 6 20 6 21 7 22 7 23 Exemple simplifi de la repr sentation conceptuelle d une t che Architecture lin aire de la g n ration de texte Strat gies rh toriques forwards et backwards de Mellish Exemple d analyse textuelle par la RST Notre approche la planification de textes d instructions Classification des l ments s mantiques El ments s mantiques non influenc s par le but communicatif El ments s mantiques influenc s par le but communicatif Pr sentation des l ments s mantiques par rapport au but communicatif Processus de g n ration de SPIN Modules hi rarchiques de SPIN Modules non hi rarchiques de SPIN Le texte ver de SPIN Exemple de sch ma d op ration pour le texte vcr Repr sentation conceptuelle de la t che pour le texte ver Exemple de sch ma d op rations du mod le du lecteur pour le texte ver Liste des l ments s mantiques du texte vcr Structure s mantique du texte vcr Liste des relations rh toriques du texte vcr Structure rh torique du texte vcr Liste des structures grammaticales pour le texte vcr Comparaison mot mot en g n ration de texte Fonctionnement de la prise versions de Mellish et de SPIN xii 26 34 40 49 72 73 82 97 9
46. appuyer sur OPEN CLOSE sortir le CD et appuyer de nouveau sur OPEN CLOSE pour fermer le plateau Conserver le plateau ferm sauf pendant le chargement et le retrait pour prot ger le m canisme de la poussi re et des accidents Pour placer un CD l couter puis l arr ter Appuyez sur OPEN CLOSE Mettez le CD face imprim e vers le haut sur le plateau Appuyez sur Lecture pause Ajustez le volume Pour arr ter le CD appuyez sur CLEAR Pour mettre l appareil en mode de pause appuyez sur Lecture pause pendant que le CD est reproduit Si Lecture pause est appuy de nouveau le CD se commence l o il a t laiss Pour le retirer appuyez sur OPEN CLOSE et sortez le CD Appuyez sur OPEN CLOSE de nouveau pour fermer le plateau Conservez le ferm sauf pendant le chargement et le retrait pour prot ger le m canisme de la poussi re et des accidents FIGURE 7 26 Texte jvc versions originale et de SPIN Appuyez sur Lecture pause Ajustez le volume tandis que le texte source est Pour couter le CD appuyer sur Lecture pause et ajuster le volume Le plateau CD se ferme automatiquement L affichage indique la plage reproduite et la dur e coul e depuis le d but SPIN ne produit pas pour couter le CD Cette op ration est obligatoire et n influence pas comment ses op rations enfants sont effectu es I s agit donc d un effet SPIN tente alors de satisfaire les heuristiques d introdu
47. chapitre 2 Par exemple si une op ration O se d compose en 7 2 op rations O dans la repr sentation conceptuelle et que O et plusieurs O sont jug es importants communiquer alors id alement le texte devrait se d composer en une sous proc dure tout comme dans la repr sentation conceptuelle 2 3 Les cooccurrences d l ments s mantiques Dans les textes d instructions l inclusion de certains l ments s mantiques semble co d pendre de l inclusion d autres l ments s mantiques tandis que certaines combinaisons d l ments s mantiques ne se retrouvent Jamais Par exemple lorsque le lecteur sait ex cuter une op ration de base mais ne connait pas les diff rents tats atteints par ses op rations enfants alors typiquement les op rations enfants sont incluses dans le texte accompagn es des tats qu elles atteignent C est le cas dans 34a 34 a Appuyer sur la touche OTR pour sp cifier l heure d enregistrement Lorsque la touche est enfonc e une fois PM 10 35 30min sera affich Lorsqu elle est enfonc e deux fois PM 11 05 1h sera affich Lorsqu elle est enfonc e trois fois PM 11 35 1h 30min sera affich b Appuyer sur la touche OTR pour sp cifier l heure d enregistrement Enfoncer la touche une fois L enfoncer deux fois L enfoncer trois fois c Appuyer sur la touche OTR pour sp cifier l heure d enregistrement PM 10 35 80min sera affich PM 11 05 th sera af
48. choix Le planificateur typique doit donc tenter de satisfaire les pr conditions d une op ration avant de la s lectionner Cependant dans notre cas le plan visant un agent humain peut contenir de nombreux points de choix Le planificateur de SPIN doit donc v rifier les pr conditions au moment du d veloppement du plan cependant si elles ne peuvent tre satisfaites l op ration doit quand m me tre retenue et au moment de l ex cution ses pr conditions seront re v rifi es e Le module doit g n rer une repr sentation de t che en un temps assez court Apr s avoir tudi et test certains planificateurs du domaine public nous avons choisi de d velopper notre propre syst me En ce qui concerne nos pr d cesseurs le syst me de g n ration de Mellish Mel88 utilise une traduction Prolog de la sortie du planificateur NONLIN Tat76 Vander Linden ne fait que supposer l existence d un planificateur de t che VL93b et finalement Dale construit lui m me son planificateur de t che pour EPICURE Dal92 Avant de d crire le fonctionnement du module de planification de t che voyons en quoi consiste son entr e et sa sortie 2 1 L entr e du planificateur de t che Le planificateur de tache de SPIN agit de fa on conventionnelle partir d une description du monde d sir et du monde courant il tente de trouver une suite d op rations pour transformer le monde de l tat courant l tat d
49. de f a g n re f si seulement a doit tre ex cut e 6 Elle signale cependant quelques exceptions dans le cas d actions mentales 22 a permet f si apr s le d but de l ex cution de a les conditions C sont vraies et B peut maintenant tre ex cut e sous C ou une autre action y peut maintenant tre ex cut e sous C et y g n re f e Il existe une relation d abstraction entre a et 8 si a ne contribue pas l ex cution de B Ces quatre relations ont t tr s utiles pour interpr ter les instructions du corpus 3 2 G n ration d instructions Les travaux en g n ration d instructions ne consid rent g n ralement que les textes o le lecteur agit selon les directives du texte le lecteur du texte est donc aussi l agent de la proc dure Nous passons en revue sept syst mes de g n ration s int ressant aux instructions deux syst mes multim dia et cinq syst mes se concentrant sur le texte 3 2 1 Syst mes multim dia COMET de McKeown et al COMET MEF 90 est un syst me multim dia int grant textes et graphiques qui g n re des explications pour l entretien et la r paration d quipement militaire Dans COMET la d termination du contenu de la pr sentation est bas e sur les sch mas rh toriques de McKeown McK85 Ces sch mas pr compil s indiquent quelle information se retrouve typiquement dans un texte pour atteindre un but communicatif particulier 1 un sch ma cho
50. de la relation rh torique la plus appropri e pour communiquer un l ment s mantique particulier d occurences 20 textes de comprehension textes hybrides textes d execution 72 element semantique FIGURE 4 7 El ments s mantiques non influenc s par le but communicatif m EM 2 E g 3 E s 2 oO oO el o BI E D 5 5 a Q S D S o DL o c g E E S 5 g o gt o g 1 a o 72 e o g Q 2 Ez e I E 2 5 S D D 9 E e e 9 D a Bl textes de comprehension textes hybrides textes d execution 25 20 9 15 Oo TD o BU 40 5 0 attribut effet autre element semantique FIGURE 4 8 El ments s mantiques influenc s par le but communicatif CHAPITRE 5 S lection de la structure rh torique Une fois un l ment s mantique s lectionn il faut d terminer le point de vue le plus appropri pour le pr senter cependant la correspondance entre ces deux niveaux n est pas directe En effet un l ment s mantique peut tre pr sent par plusieurs relations rh toriques et inverse ment une relation rh torique peut servir pr senter diff rents l ments s mantiques Dans ce chapitre nous d veloppons les heuristiques pour s lectionner la relation rh torique la plus appropri e dans un contex
51. elles ne sont pas consid r es par nos heuristiques Les heuristiques sont r capitul es la table 4 6 3 4 Les effets L effet sp cifie ce que l ex cution d une ligne d op rations cause l tat actuel du monde C est dire ce qui devient vrai et ce qui n est plus vrai dans le monde L effet permet l agent de v rifier si une ligne d op rations a t bien ex cut e ou simplement satisfait sa curiosit Pr s de 9 96 des l ments s mantiques de notre corpus sont des effets Par exemple 41 a Amener bullition et laisser mijoter doucement pendant 2 3 minutes en remuant sans arr t la cr me paissira et changera de texture b Faites rouler l automobile 20 minutes pour r chauffer le moteur 62 c Si la lumi re du jour reste pr pond rante l effet peut tre agr able si c est l clairage artificiel qui l emporte un filtre bleu clair sera suffisant pour corriger le rendu des couleurs Notons que l op ration qui engendre un effet peut tre nulle Par exemple dans 41c l op ration implicite est ne faites rien et l effet pourra tre agr able Un effet semble inclus dans le texte en fonction de la nature de la t che des connaissances du lecteur et de son but communicatif En effet i Si une ligne d op rations peut tre mal effectu e alors un effet est introduit comme point de contr le pour permettre l agent de v rifier s il a bien ex cut les op rations et peut cont
52. enfoncer obj touche OTR qual 3 fois appuyer dest touche OTR qual 3 fois resultat PM 11 35 1 h 30min enfoncer obj touche OTR qual 3 fois point nl point item action appuyer dest touche TIMER qual dans un d lai de 9 secondes point FIGURE 6 20 Structure rh torique du texte ver probl me simple voir par exemple DH93 SPIN ne consid re pas cette question et pr sente g n ralement chaque noyau par une phrase distincte La figure 6 20 illustre la structure rh torique du texte vcr Notons que dans cette struc ture le but meilleure qualit d image a t plac avant son noyau car il indiquait un but optionnel De plus la structure rh torique inclut maintenant la ponctuation du texte final 4 La r alisation linguistique Une fois la structure rh torique construite celle ci est pass e au module de r alisation linguistique qui se charge de s lectionner la structure grammaticale et la r alisation lexicale Ces tapes ne font pas partie de l emphase du syst me mais ont t ajout es pour v rifier que la sortie du planificateur de texte est suffisante pour qu un module plus complet puisse ven tuellement produire un meilleur texte en langue naturelle La r alisation linguistique s occupe de i s lectionner les formes grammaticales ii s lectionner les lex mes et effectuer les flexions morphologiques Comme il a t mentionn au chapitre 3 les choix grammaticaux et lexicaux
53. est assez large cf la table 6 30 et ne semble pas varier en fonction du but communicatif Ne voulant pas se commettre des choix complexes dont la validit pour le fran ais est encore v rifier SPIN ne produit que les formes les plus fr quentes s passif si la condition peut tre fausse ou vraie imm diatement et 121 Subordonn e infinitive pour faire O Subordonn e circonstancielle pour que O soit fait Pour m tonymie de but pour O ceci Autre Toa fon 1 TABLE 6 31 Formes des buts lorsque passif si la condition peut devenir vraie dans quelque temps 1 une autre forme est plus ad quate celle ci est donn e de fa on textuelle dans la repr sentation conceptuelle 4 1 4 L laboration La forme de l laboration n est pas tr s vari e En effet la majorit de ces expressions sont r alis es par une proposition au pr sent avec comme sujet l objet d crit par exemple 103 Un des charmes de la peinture sous verre ancienne est son dessin des contours souple et volontaire d un seul jet Dans SPIN l laboration est r alis e simplement par la forme lt attribut gt de objet est valeur 4 1 5 Le but En anglais une expression de but peut tre exprim e par 4 formes grammaticales VL93b i la forme infinitive ex to adjust volume ii la pr position for suivie d une m tonymie de but ex for frequently busy numbers iii la pr position for suivie d une nominal
54. est enfonc e 2 fois PM 11 05 1 h Lorsqu elle est enfonc e 3 fois PM 11 35 1 h 30min Appuyer sur la touche TIMER dans un d lai de 9 secondes sequence sequence but maniere Appuyer sur la touche OTR r gler le s lecteur de S lectionner c conditi c condition c condition Asper SEFIT MUS vitesse de bande sur SP le canal 4 ppuyer sur la touche dans un d lai Pour une meilleure en appuyant sur la de 9 secondes qualit d image touche de canal Lorsqu elle est Lorsqu elle est Lorsqu elle est enfonc e 1 fois resultat enfonc e 2 fois rebultat enfonc e 3 fois resultat PM 10 35 PM 11 05 PM 11 35 30 min 1h 1 h 30 min FIGURE 7 30 Structure rh torique du texte vcr tel que consid r par SPIN 2 2 2 La longueur des textes Les textes d instructions g n r s par SPIN sont assez courts ils comptent en moyenne 12 relations rh toriques Les textes plus longs que nous avons analys s consistent en fait en une s quence de courts textes d instructions Ces courts textes sont reli s entre eux par une relation de s quence et sont r gis par les m mes r gles textuelles globales Cependant les r gles locales pour s lectionner leur contenu et leur structure rh torique semblent ind pendantes de leur appartenance un texte global plus large Nos heuristiques de s lection et de pr sentation semblent donc applicables dans le cas de textes plus l
55. est enfonc e 3 fois PM 11 35 1 h 30min Appuyer sur la touche TIMER dans un d lai de 9 secondes sequence lt me sequence Pour une meilleure qualit d image S lectionner le 7 b i Appuyer sur la touche OTR Appuyer sur la touche r gler le s lecteur de vitesse de bande sur SP canal 4 en appuyant Lorsqu elle est enfonc e 1 fois PM 10 35 30min TIMER dans un d lai sur la touche de canal Lorsqu elle est enfonc e 2 fois PM 11 05 1h de 9 secondes but Lorsqu elle est enfonc e 3 fois PM 11 35 1h 30min Say Pour une meilleure r gler le s lecteur de Wiani re qualit d image vitesse de bande sur SP S lectionner en appuyant sur la le canal 4 touche de canal resultat Appuyer sur la touche OTR Lorsqu elle est enfonc e 1 fois PM 10 35 30 min Lorsqu elle est enfonc e2 fois PM 11 05 1 h Lorsqu elle est enfonc e3 fois PM 11 35 1 h 30 min S quence iEn U Lorsqu elle est enfonc e Lorsqu elle est enfonc e Lorsqu elle est enfonc e 1 fois PM 10 35 30 min 2 fois PM 11 05 1 h 3 fois PM 11 35 1h 30 min c conditign c condition c condition T ES ORA O Lorsqu elle est PM 10 35 Lorsqu elle est PM 11 05 Lorsqu elle est PM 11 35 enfonc e 1 fois 30 min enfonc e 2 fois 1h enfonc e 3 fois 1 h 30 min FIGURE 7 29 Structure rh torique du texte vcr par la RST 2 2 Points faibles Bien s r notre recherche poss de certains points faibles 2 2 1 Les structures s m
56. et Hemphill 15 144 Carcagno 4 Corter Gluck et Bower 51 Dahlgren 32 Dale 24 26 36 65 101 106 107 125 129 131 141 145 Dalianis et Hovy 117 Danlos 38 Danto 52 De Smedt et Kempen 6 Delin Hartley Paris Scott et Vander Lin den 17 29 81 84 86 Delin Scott et Hartley 29 37 146 Di Eugenio 7 20 25 36 39 65 68 69 93 Di Eugenio et Webber 46 47 Di Eugenio et White 20 Dixon 12 13 14 15 25 78 144 Dixon Faries et Gabrys 12 14 115 118 Donin Bracewell Frederiksen et Dillinger 15 78 Faries et Gabrys 78 Fikes et Nilsson 24 Friedland 99 Glynn Andre et Britton 10 Goldman 16 52 103 Gregory et Carroll 3 Grosz et Sidner 32 Hammond 100 Hartley 38 126 189 Hayes Roth 100 Hervey et Higgins 145 Hobbs 32 Hovy 6 32 35 Hovy et McCoy 35 Karlin 144 Kay 4 Kempen et Hoenkamp 6 Kempen 6 Kittredge 3 31 39 118 146 Klare 11 Konoske et Ellis 4 15 Korelsky 52 Korelsky et Kittredge 35 39 Kosseim et Lapalme 7 46 Kosseim Tutin Kittredge et Lapalme 125 Maier et Hovy 32 Mann et Thompson 7 23 32 33 77 McDonald 6 McKeown 4 6 22 32 138 McKeown Elhadad Fukumoto Lim Lom bardi Robin et Smadja 22 Mellish 25 36 61 65 101 129 141 Mellish et Evans 25 36 145 Moore 35 Moore et Paris 35 38 Moore et Pollack 32 35 Paris 32 54 Paris et Scott 29 Paris Swartout et Mann 5 Paris Vander Linden Fischer Hartley Pem berton Power et Scott 4
57. et que g n ralement 37 seules les op rations aux feuilles de la repr sentation conceptuelle sont pr sent es par des s quences d actions cette strat gie semble appropri e Cependant elle ne peut tre directement appliqu e d autres domaines o la proportion de s quence d actions est plus faible En ce qui concerne l organisation textuelle EPICURE effectue un choix rh torique tr s simple toutes les op rations sont pr sent es par une s quence d actions Comme nous venons de voir cette strat gie est tr s appropri e dans les recettes de cuisine cependant dans d autres domaines les op rations ne sont pas toujours pr sent es par cette relation rh torique Dans le syst me IMAGENE VL93b la question de s lection de contenu n a pas vraiment t abord e mais la s lection de la structure rh torique a quelque peu t tudi e l inverse de Mellish et de Dale Vander Linden consid re que les niveaux s mantique et rh torique sont reli s de fa on plusieurs plusieurs Cependant son tude effectu e pour l anglais ne peut tre utilis e telle quelle car comme le remarque Scott et son quipe Sco93 et DSH93 le choix des relations rh toriques pour pr senter une m me information peut diff rer d une langue l autre De plus cette question n tant pas l emphase de son projet ses crit res pour s lectionner la structure rh torique restent assez simples 3 Notre approc
58. fants de Oy les contrainte cooc currence Oy est commu niqu e par une op ration s quen plus discriminantes tielle Oy est enfant uni que et son ex cution d pend de Oy est commu niqu e par une op ration s quen but com municatif lecteur Oy est de base et n cessite des pr cisions sur com ment tre ex cut e Oy est de base 66 commu niquer l ex cutiondeson tielle op ration parent Op O doit fectu e et Oe sont commu Oe sont de base niqu es par des tre ef est divis e en une op rations s quen dizaine d op ra tielles tions enfants Oe TABLE 4 9 Heuristiques de s lection l influence c On dispose alors de l objet clisser de telle sorte que le fond se trouve plac en haut Dans le corpus 27 96 des influences satisfont ce cas ii Finalement une influence est aussi introduite si une op ration est divis e en 7 2 op rations enfants Oe de base Dans ce cas une sous proc dure est utilis e comme dans 51 Une fois form e la paraison est centr e Ce travail s effectue au banc de la fa on suivante le souffleur place la canne sur les bardelles et saisit Ici l op ration parent centrer la paraison influence l interpr tation des op rations enfants placer saisir Seulement 3 96 des influences du corpus se trouvent dans cette situation La table 4 9 r capitule ces heuristiques 3 6 Les op rations co te
59. h Lorsqu elle est enfonc e 3 fois PM 11 35 1 h 30min Appuyez sur la touche TIMER dans un d lai de 9 secondes FIGURE 6 13 Le texte ver de SPIN par cas Ham89 RS89 ou opportuniste HR80 Cependant depuis le syst me ABSTRIPS Sac74 la majorit des planificateurs g n raux ont suivi une technique hi rarchique pour construire des plans non lin aires Un plan est un ensemble ou s quence d op rations a ex cuter par un agent unique pour atteindre un but A1191 Un plan est lin aire s il est produit par un planificateur qui ordonne les op rations de fa on totale Un tel planificateur est en fait sur contraignant car il impose artificiellement un ordre de succession entre toutes les op rations m me celles dont l ordre d ex cution est ind pendant Un plan est dit non lin aire si le planificateur qui l a produit n ordonne que les op rations qui sont obligatoirement contraintes par un ordre Dans un tel plan les op rations suivent alors un ordre partiel Un planificateur est hi rarchique s il g n re une hi rarchie de plans o le niveau le plus lev est un plan abstrait ne contenant que les op rations importantes tandis que les niveaux inf rieurs contiennent des op rations plus d taill es Les planificateurs hi rarchiques plans non lin aires poss dent de nombreux avantages e Du point de vue op rationnel ces planificateurs sont plus efficaces En effet en ne sur contraignant pas l ordo
60. il n est pas clair si le tapis a t sali ou non 4Balkanski note que ce n est pas toujours dans le cas des phrases RC 20 G n ralement une RC est introduite par la pr position pour et une MC par en Bal kanski utilise la relation de g n ration de Goldman quelque peu modifi e et les relations de permission enablement et contribution pour expliquer les MC et les RC e une action permet une action f ssi le temps d ex cution de pr c de le temps d ex cution de f il existe un ensemble de conditions contextuelles C et une troisi me action y tels que x une des conditions de C devient vraie apr s l ex cution de a et le type d action de y g n re conditionnellement le type d action de 9 sous C Par exemple si a remplacer l ampoule d fectueuse y lever Vinterrupteur et 8 allumer la lumi re alors a permet f e une action a contribue une action f ssi B est un l ment de la fermeture transitive des relations de g n ration et de permission de a et des constructeurs d actions complexes par exemple la s quence Pol86 Nous utiliserons les notions de RC et de MC et les relations de g n ration permission et contribution lors de l analyse de corpus aux chapitres 4 et 5 3 1 3 L tude de Di Eugenio Di Eugenio a tudi fond l interpr tation des propositions de but purpose clauses et s est aussi attard e sur les imp ratifs n gatifs dans les textes d instructions D
61. informationnel ou s mantique et le niveau intentionnel ou rh torique ces deux niveaux n tant pas reli s de fa on directe mais plut t de plusieurs plusieurs KK93 36 2 2 2 Organisation textuelle par la RST Bien que la planification enti re par la RST soit tout fait appropri e pour la g n ration de textes d instructions il nous semble pr f rable de n utiliser la RST que pour l organisation textuelle En effet comme ces textes d crivent de fa on plus ou moins stricte une proc dure effectuer il semble pr f rable de planifier la proc dure accomplir de s lectionner le contenu textuel partir de la repr sentation de la proc dure et enfin de faire correspondre ce contenu textuel une structure rh torique Dans les travaux de Mellish Mel88 ME89 Mel90 de Dale Dal92 et de Vander Linden VL93b un planificateur de t che est utilis pour d terminer la repr sentation conceptuelle de la proc dure comme une hi rarchie de plans le contenu textuel est ensuite s lectionn suivant certaines r gles les relations de discours ne sont utilis es que pour l organisation textuelle Les travaux de Mellish et de Dale n utilisent pas explicitement les relations de la RST mais des relations quivalentes quelques fois implicites Dans le travail de Mellish Mel88 ME89 Mel90 la planification du contenu transmet dans le texte toutes les op rations et les relations hi rarchiques retrouv es da
62. introduction d effets cf la figure 4 8 p 73 Pour expliquer ceci nous avons d abord classifi les effets en 3 cat gories e les effets externes un appareil c est dire visibles ou facilement mesurables par l agent Par exemple HTI ne faut pas confondre l effet dans cette phrase avec une condition mat rielle pr sent e par une relation de r sultat comme dans 42 Si des bulles apparaissent autour de la valve c est qu il y a une fuite cet endroit Faites la remplacer par un m canicien qualifi 63 type de texte types d effets externe externe interne interne Bs 3 1 hybrides 69 96 26 96 5 B 1X 45 TABLE 4 7 Types d effets par rapport au type de texte 44 Le voyant reste teint e les effets internes un appareil et invisibles l agent par exemple 45 Par contre s il surgit plus tard c est qu il existe un probl me quelconque au niveau de votre carte contr leur e les effets la fois internes et externes comme dans 46 celui ci signale sa disponibilit par la pr sence d un petit tiret Ici la disponibilit est un effet interne tandis que la pr sence d un petit tiret est un effet externe Ensuite nous avons not la fr quence de chaque type d effet dans les diff rents types de textes Comme l illustre la table 4 7 on remarque que dans les textes d ex cution la grande majorit 83 96 des effets sont externes il y a un peu moins d effet externes dans le
63. la description g n rale de ce qu il faut accomplir le niveau inf rieur sp cifie les tapes composantes majeures le niveau inf rieur d compose ces tapes en op rations plus sp cifiques et ainsi de suite Un sch ma d op ration est une descrip tion prototypique de l op ration contenant des variables qui permettent d adapter le sch ma diff rentes situations La construction d un plan consiste i trouver de l information dans le texte concernant les composantes principales de la t che ii utiliser cette information en parall le avec d autres processus de lecture pour activer des sch mas dans la m moire du lecteur iii adapter ces sch mas la t che courante en instanciant les variables Ce processus est r p t chaque niveau de la hi rarchie Etant donn ce processus mental de lecture Dixon remarque que pour un lecteur inexp ri ment dans la proc dure d crite l interpr tation d instructions d pend du niveau de parall lisme entre le texte et la structure de la repr sentation mentale d velopper Dixon a observ exp D 49 rimentalement que les instructions sont plus faciles interpr ter quand l information de plus haut niveau d abstraction pr c de l information de plus bas niveau Par exemple dans 5 a Pour monter Vindicateur gamma au dessus de 20 tenez le bouton gauche enfonc b Tenez le bouton gauche enfonc pour monter l indicateur gamma au dessus de 20 L
64. modifi ses r sultats pour les adapter notre contexte D apr s notre corpus la r alisation grammaticale dans les deux langues se ressemble beaucoup ce qui d apr s les observations de Kittredge n est pas surprenant Kit82 Le style crit de l anglais et du francais tend tre plus similaire dans les textes techniques sp cialis s que dans les textes en langue g n rale les sous langages parall les en anglais et en francais sont bien plus similaires struc turellement que diff rents sous langages de la m me langue On peut donc conclure que les textes techniques en anglais et en francais sont tr s parall les parce que le but du texte est bien plus similaire ici que dans des textes descrip tifs p 108 135 Dans ce qui suit nous pr sentons la r alisation grammaticale des titres et des relations rh toriques dans notre corpus En aucun cas nous ne justifions le choix de l expression gram maticale Ce choix est effectu dans SPIN en se basant autant que possible sur les r sultats de VL93b et le cas ch ant par des d cisions al atoires suivant les proportions pr sent es ici 4 1 1 Le titre Le titre d une proc dure indique toujours son but Comme l illustre la table 6 28 les ex pressions de but dans les titres peuvent tre r alis es par un plus grand ventail de formes grammaticales que les buts dans les instructions cf la section 4 1 5 Dans le titre le but peut indiquer explicitement u
65. motiv linguistiquement et ses points faibles les structures s mantiques et rh toriques lin aires de SPIN et la petite taille des textes consid r s CHAPITRE 8 Conclusion Dans cette th se nous avons tent de r pondre deux questions fondamentales en planification automatique de texte e Quelle information doit tre communiqu e dans un texte et quelle information doit tre laiss e implicite e Comment l information communiqu e doit tre structur e pour construire un texte coh rent Pour r pondre ces questions nous avons d fini un ensemble d l ments s mantiques qui sont pr sent s dans le texte par des relations rh toriques Pour les textes d instructions nous avons d fini 9 l ments s mantiques les op rations s quentielles co temporelles et ventuelles les conditions mat rielles les options les effets les influences les pr ventions et l information g n rale Ces l ments s mantiques sont pr sent s par 7 relations rh toriques les s quences temporelles les buts les c conditions les r sultats la concurrence la mani re et l laboration Gr ce une analyse de corpus nous avons constat que le choix des l ments s mantiques et des relations rh toriques d pend de plusieurs facteurs le contenu et la structure des repr sentations conceptuelles du domaine et de la tache des contraintes de cooccurrences d l ments s mantiques et de relations rh toriques
66. n ralement aux actions physiques d un agent humain ex cut es avec des parties de son corps Dans la litt rature il existe donc deux extr mes la notion d op rations de base En philosophie l ensemble des op rations de base n inclut que les op rations physiques les plus sp cifiques que l agent peut effectuer de fa on volontaire Cet ensemble est donc ind pendant du domaine et est plus ou moins universel tous les agents l autre extr me en psychologie on retrouve la notion de Pollack qui consid re les op rations de base comme tant d pendantes du domaine et du niveau de connaissances de l agent Il s agit alors d op rations plus g n rales que des op rations physiques de plus bas niveau De son c t la notion de Rosch semble supposer qu une op ration de base est universelle tous les agents Cependant le domaine de son exp rience est si restreint qu il ne laisse pas de place diff rents niveaux d expertise de la part des agents de plus dans ses exp riences avec des objets concrets RMG 76 elle indique que les cat gories de niveaux de base d pendent des connaissances de l agent Aussi pour Rosch une op ration de base ne correspond pas aux op rations physiques de plus bas niveau 6 Kor94 remarque que dans le domaine bureaucratique certaines op rations souvent effectu es ensemble sont regroup es en une op ration de base C est le cas par exemple de remplir et faire circuler des formulair
67. nii 136 137 Aussi pour les m mes raisons les effets Le plateau CD se ferme automatiquement et L affichage indique la plage reproduite et la dur e coul e depuis le d but ne sont pas s lectionn s par SPIN Communiquer ces effets pourrait tre justifi cependant nous croyons que ne pas les communiquer ne cr e pas un texte incorrect L instruction 4 contient la m me information dans le texte source et le texte de SPIN mais pour les raisons pr c dentes l effet la reprise de la lecture du CD celle ci commence partir de la plage 1 n est pas inclus par SPIN Finalement les instructions 5 et 6 contiennent la m me information dans les deux textes e Analyse de la structure rh torique En ce qui concerne les choix rh toriques SPIN n a pas toujours s lectionn les m mes relations que celles utilis es dans le texte source En effet SPIN a d cid d introduire l op ration ventuelle et son effet par une c condition et un r sultat Si Lecture pause est appuy de nouveau le CD se commence l o il a t laiss tandis que le texte naturel utilise une mani re et un r sultat en appuyant de nouveau sur Lecture pause le CD commence l o il a t laiss Rappelons de la section 3 9 du chapitre 5 que les op rations ventuelles sont pr sent es soit par une c condition soit par une mani re Ces deux relations semblent interchan geables s il s agit d une r gle g n rale mais si
68. objet La table 5 14 r sume les relations retrouv es dans notre corpus et leur proportion Le lecteur attentif remarquera que certaines relations rh toriques correspondent de tr s pr s certains l ments s mantiques C est le cas par exemple de la s quence et de la concurrence tr s apparent es aux op rations s quentielles et aux op rations co temporelles En fait vu 78 l importance de l aspect temporel des op rations dans les instructions cet aspect est presque toujours pr sent par les m mes strat gies rh toriques et celles ci sont choisies pour que le lecteur le d duise de fa on non ambigue Les sections suivantes expliquent comment le choix de la relation rh torique est effectu 2 Crit res des heuristiques Tout comme pour la s lection des l ments s mantiques la s lection des relations rh to riques se base sur un certain nombre de contraintes e le contenu et la structure de la repr sentation s mantique e les cooccurrences de relations rh toriques e les connaissances et intentions du lecteur e la nature de la tache Le but communicatif du texte ne semble pas influencer comment un l ment s mantique est pr sent 2 1 Le contenu et la structure de la repr sentation s mantique Le crit re le plus important pour d terminer le choix d une relation rh torique est l identit des l ments s mantiques pr senter Par exemple une condition mat rielle n est jam
69. par une s quence d actions et les effets des membres de S seront inclus par des r sultats C est le cas de 72b Dans ce cas chaque membre de S est pr sent par une c condition ii On utilise un but comme dans 71 si O est une op ration s quentielle de base dont l ex cution est contrainte par un ensemble de conditions modifiables E Une condition est modifiable si l agent doit la v rifier ou faire en sorte qu elle devienne vraie en Ce ph nom ne est appel par Vander Linden la r trogradation rh torique VLCM92b heuris tique ia s mantique O1 et O2 sont des op rations tielles a s quen ex cuter dans un certain ordre O est une op ration s quentielle Op est une op ra tion s quentielle et contrainte cooc currence l une des 2 op ra tions sera pr sent e par une s quence lautre par une c condition un r sultat ou une s quence suivra O dans le texte Op est incluse dans le texte par une s lecteur croit que O1 et O2 sont ex cuter dans l ordre inverse nature de la t che l agent de O n est pas n cessairement l agent de la proc dure 84 relation pr f r e c condition et s quence c condition chaque membre de S par une c S est un ensemble quence et les effets condition d op rationss quen tielles enfants de de chaque membre de S seront pr sen t s par des r sultats O est de base E est modifiable par O par
70. peu de points de choix et g n ralement ex cut es chaque fois de la m me fa on ou des taches plus complexes poss dant plusieurs options KE91 Ces textes exhibent les caract ristiques int ressantes suivantes e Ils poss dent une uniformit de structure les rendant facilement formalisables RS94 VLM95 e Ils sont couramment utilis s et sont facilement compr hensibles par une grande com munaut de lecteurs Tut92b On pensera par exemple des instructions d assemblage recettes de cuisine assemblage d un meuble d installation d utilisation de r paration ou d entretien e Par rapport des textes plus narratifs ils peuvent tre repr sent s objectivement l aade de relations entre op rations et tats De plus bien que cet outil ne soit pas suffisant une grande partie d une telle repr sentation conceptuelle peut tre construite de fa on automatique l aide d un planificateur de t che Sac77 AKPT91 2 La g n ration de texte La g n ration de texte tente de produire de fa on automatique des textes bien form s partir d une repr sentation conceptuelle brute L emphase est mise sur la production de phrases en contexte plut t que des phrases isol es 2 1 Applications La g n ration de texte a de nombreuses applications D abord dans un grand nombre de domaines de l industrie diff rents types de textes tels que des documents techniques et commerciaux des rapports ou des m mos doiven
71. planification textuelle ce plan est lagu en fonction du mod le du lecteur mis Jour 4 La nature de la t che La nature de la tache fait partie de la repr sentation conceptuelle du domaine et le lecteur en poss de un mod le personnel Dans SPIN cette base de connaissance est repr sent e par une liste de pr dicats sp cifiant les caract ristiques des op rations des tats et des objets impliqu s dans la t che Les tables 6 25 et 6 26 pr sentent les listes compl tes des pr dicats disponibles pour caract riser la t che et les connaissances du lecteur 4En effet plusieurs m thodes peuvent exister pour r aliser une m me op ration Pr dicats Op rations before 01 02 dangereux 0 dependant 01 02 dont 0 durative 0 during 01 02 ensemble discriminant Op 0e erreur 0 facile a mal executer 0 facilite tache 0 fausse deduction 0 flou 0 futur 0 habitude 0 irreversible 0 mentale 0 methode normale 0 E nefaste 0 negtc 0 preparation 0 regle generale 0 optionnel 0 desirable E difficile E equivalent Ei E2 externe E interne E materielle E modifiable E option E P textuel E type appareil E vrai bientot E attribut 0B A V justifie operation A 0 plus important 0B 0 109 Description l ex cution de O finie avant l ex cution de O relation temporelle de A1183 O est une op ration dangereuse l ex cution de O4 d pend de O2 O est une pr v
72. plucher l oignon Le hacher plucher la pomme de terre La hacher Gratter les carottes Les hacher Trancher le c leri Faire fondre le beurre Ajouter les l gumes Les faire revenir Ne pas les faire brunir Ajouter les f ves le bouillon et le lait Faire mijoter Liqu fier la soupe En la m langeant ajouter la cr me Ajouter les assaisonnements R chauffer la soupe Ne pas la faire bouillir Texte hybride Comment faire la soupe aux f ves Tremper les f ves Les goutter Les rincer plucher l oignon Le hacher plucher la pomme de terre La hacher Gratter les carottes Les hacher Trancher le c leri Faire fondre le beurre Ajouter les l gumes Les faire revenir Il ne faut pas les faire brunir Ajouter les f ves le bouillon et le lait Faire mijoter Liqu fier la soupe En la m langeant ajouter la cr me Ajouter les assaisonnements R chauffer la soupe On ne la fait pas bouillir Texte de compr hension Comment faire la soupe aux f ves Tremper les f ves Les goutter Les rincer plucher l oignon Le hacher plucher la pomme de terre La hacher Gratter les carottes Les hacher Trancher le c leri Faire fondre le beurre Ajouter les l gumes Les faire revenir Il ne faut pas les faire brunir Ajouter les f ves le bouillon et le lait Faire mijoter Liqu fier la soupe En la m langeant ajouter la cr me Ajouter les assaisonnements R chauffer la
73. pr ventions utilisent diff rentes strat gies rh toriques d pendant du type de texte Cependant ces variations sont trop faibles pour d terminer s il s agit de cas isol s ou de tendances g n rales De son c t l op ration ventuelle est g n ralement pr sent e par une mani re dans les textes de compr hension tandis que dans les autres types de textes une c condition est toujours utilis e Cependant le corpus ne contient que 1 96 de cet l ment s mantique 15 occurrences une tude plus approfondie est donc n cessaire pour v rifier s il s agit d un cas g n ral ou pas 3 Heuristiques de pr sentation Nous discutons maintenant des crit res pour s lectionner la relation rh torique la plus appropri e pour communiquer un l ment s mantique Tout comme au chapitre 4 notons que les heuristiques pr sent es poss dent les caract ristiques suivantes e elles sont reli es par une disjonction e elles sont exhaustives e elles sont pr sent es en ordre de pr f rence 3 1 Les op rations s quentielles Une op ration s quentielle est pr sent e par 3 relations rh toriques e une s quence d actions 98 96 du temps comme dans 70 Mettre le magn toscope sous tension et placer le s lecteur TV VCR sur VCR e un but 0 1 96 par exemple 71 V rifiez le commutateur de la douille ou r installez la douille pour fensuite v rifier le commutateur du socle Ici on n a pas affaire
74. qual 2 fois appuyer dest touche OTR qual 3 fois resultat PM 11 05 1 h enfoncer obj touche OTR qual 2 fois c condition enfoncer obj touche OTR qual 3 fois appuyer dest touche OTR qual 3 fois resultat PM 11 35 1 h 30min enfoncer obj touche OTR qual 3 fois action appuyer dest touche TIMER qual dans un d lai de 9 secondes FIGURE 6 19 Liste des relations rh toriques du texte vcr Choix si fausses Faits si fausses peuvent maintenant tre r solues Dans l exemple vcr aucune contrainte n tait laiss e non r solue cette tape ne modifie donc pas la structure s mantique 3 3 Le choix des relations rh toriques Une fois la structure s mantique construite il faut d terminer sa r alisation rh torique La structure s mantique est alors travers e et pour chaque l ment s mantique la relation rh torique la plus appropri e est choisie Cette tape est effectu e en appliquant les heuristiques de pr sentation du chapitre 5 Ici aussi pour satisfaire les contraintes des heuristiques les diff rentes structures de SPIN pr sent es la section 3 1 sont consult es et mises Jour La figure 6 19 illustre le r sultat de cette tape pour le texte vcr Cette liste contient les relations rh toriques du texte final mais les noyaux et les satellites ne sont pas n cessairement ordonn s correctement Les relations multi et mono nucl iques sont respectivement repr sent es par Relation r
75. que dans le domaine des recettes de cuisine les textes de EPICURE auraient t plus naturels En effet ses strat gies sont optimis es pour ce domaine tandis que SPIN utilise des strat gies g n rales La strat gie de Dale de ne communiquer que les op rations de plus bas niveau en temps que s quences d actions s applique bien aux re cettes de cuisine o 90 100 des ces textes est compos ainsi VL93b Cependant dans une recette requ rant un plus grand nombre d tapes EPICURE ne pourra diviser le texte en sous recettes dans le cas de SPIN une d composition sera automatiquement effectu e car les op rations interm diaires ne sont pas syst matiquement rejet es 1 3 Comparaison avec des textes naturels hors du corpus d analyse Le second type d valuation effectu consiste a s lectionner des textes hors du corpus d ana lyse a les g n rer et a effectuer une comparaison qualitative entre les r sultats de SPIN et les 4Nous ne pr sentons pas la liste des ingr dients Version de EPICURE Butter bean soup Soak drain and rinse the butter beans Peel and chop the onion Peel and chop the potato Scrape and chop the carrots Slice the celery Melt the butter Add the vegetables Saute them Add the butter beans the stock and the milk Simmer Liquidise the soup Stir in the cream Add the seasonings Reheat Traduction Soupe aux f ves Tremper goutter et rincer les
76. qui d termine comment le dire Tho77 Plus r cemment Zock a introduit une troisi me tape la r alisation motrice qui s occupe de le dire Zoc90b Ce processus est illustr la figure 1 2 La planification du texte d termine le contenu s mantique et la structure textuelle partir d une repr sentation conceptuelle de la situation d crire par exemple un graphe conceptuel ou des formules logiques ce processus s lectionne l information communiquer et l information laisser implicite et d cide jusqu quel niveau de d tail d velopper un aspect particulier Du rant cette tape le contenu est organis de facon former un texte coh rent En utilisant des crit res de rh torique on d cide par exemple dans quel ordre l information doit tre communi qu e et quels aspects doivent tre mis en valeur La planification de texte construit ainsi une repr sentation s mantique du texte annot e par des relations rh toriques Cette repr sentation est ensuite utilis e par un module de r alisation linguistique qui s lec tionne les structures grammaticales les proc d s r f rentiels les lex mes et les transformations morphologiques pour former un texte linguistiquement correct aussi nomm e g n ration strat gique profonde ou conceptuelle 5aussi nomm e g n ration tactique ou de surface Aux deux composantes cit es ci dessus Zock ajoute une derni re tape la g n ration de texte la r alisation mo
77. repr sentation conceptuelle de la t che est parcourue Lorsqu un n ud est rencontr pour la premi re fois les heuristiques de s lection sont appliqu es sur chaque champ du sch ma d op ration la pr con dition le corps Pour introduire les l ments s mantiques non proc duraux les attributs d objets d s qu un l ment s mantique proc dural est s lectionn les heuristiques de s lection des attributs sont appliqu es sur l op ration et les objets impliqu s Dans SPIN la repr senta tion de la tache est parcourue en largeur d apr s les liens hi rarchiques de fa on consid rer un plan la fois Cependant un autre ordre de parcours aurait t tout fait ad quat Comme pr sent aux chapitres pr c dents la s lection des l ments s mantiques appliquent des heuristiques bas es sur 5 types de contraintes 1 Le contenu et la structure de la repr sentation conceptuelle Comme nous verrons la section 3 1 notre notion d op ration primitive diff re de celle de Dal92 107 Pour v rifier ces contraintes SPIN consulte la repr sentation conceptuelle de la t che construite par le planificateur de t che 2 Les cooccurrences d l ments s mantiques Ces contraintes sont v rifi es en consultant la liste des l ments s mantiques d j s lec tionn s ou en posant des contraintes sur les l ments s mantiques communiquer plus tard En effet si le choix d un l ment s
78. rh torique sugg r e au champ iii le satellite et leur combinaison iii un noyau et un satellite deux s quences d op rateurs qui lorsqu ex cut s peuvent atteindre l effet i Le noyau obligatoire peut tre un acte de parole ou un tat a atteindre par raffinement successif Les satellites eux sont optionnels Par un processus de planification de t che comme celui de NOAH Sac77 le planificateur de texte recherche un op rateur dont l effet champ i satisfait le but communicatif du texte et utilise le noyau et le satellite champ iii pour d velopper le reste du contenu et de la structure textuels Cette approche a l avantage d tre concise d indiquer comment les parties de discours sont reli es entre elles et quel but communicatif chaque partie de texte atteint Cette approche ef fectue la s lection du contenu et la s lection des relations rh toriques en une seule tape mais il est tout fait possible de permettre un lien plusieurs plusieurs entre ces deux questions En effet un op rateur s mantique croyances du lecteur peut se r aliser par diff rentes combinai sons de noyaux satellites champ iii La liste des contraintes champ ii vient alors diriger la strat gie rh torique la plus appropri e Cette approche est en accord avec les travaux de Moore et Pollack MP92 qui ont d montr de fa on convaincante que la planification textuelle doit faire la distinction entre le niveau
79. sir Les op rations disponibles sont d crites par des sch mas d op rations faisant partie de la repr sentation conceptuelle du domaine cf la figure 6 10 La figure 6 14 illustre un sch ma d op ration tir du fichier ver_spec pl pr sent int gralement l appendice D Comme l illustre la figure 6 14 et l appendice D les sch mas contiennent un certam nombre d expressions lexicales toutes faites Les sch mas indiquent e le nom de l op ration par exemple programmer un objet X e les pr conditions l tat requis pour effectuer l op ration par exemple une cassette doit tre dans l appareil vid o C est ce que Sac77 appelle des execution time conditionals 102 op programmer obj X qual d ih 30 min par une touche incr mentielle precond dans obj cassette lieu vid o corps r gler obj s lecteur de vitesse de bande dest SP s lectionner obj canal 4 sp cifier obj heure d enregistrement d 1h 30 min appuyer dest touche TIMER qual dans un d lai de 9 secondes succes ajout programm obj X qual d ih 30 min par une touche incr mentielle echec ajout neg programm obj X qual d ih 30 min par une touche incr mentielle FIGURE 6 14 Exemple de sch ma d op ration pour le texte ver e le corps les op rations enfants accomplir pour ex cuter l op ration courante par exemple r gler le s lecteur de vitesse de bande sur SP s lectionner le canal 4 sp c
80. son tude des c conditions La table 6 33 montre les observations de notre corpus On remarque que e La forme avec l aide de par suivie d un groupe nominal est utilis e lorsque le satellite sp cifie l utilisation d un instrument particulier Par exemple 109 Retirez les crous avec une cl en croix Dans ces cas l instrument est consid r plus important que le verbe et celui ci est alors omis En effet sans ellipse l exemple 109 se lirait 110 Retirez les crous en utilisant une cl en croix e Dans les autres cas le g rondif est utilis Par exemple 111 S lectionner le canal r gler en appuyant sur le s lecteur de canal SPIN utilise donc ces deux r gles pour s lectionner la forme grammaticale des mani res 124 G rondif en faisant O4 Actif direct en faisant O1 faites O5 Passif en faisant O1 O2 est fait Actif narratif en faisant O4 l agent fait O2 Toa ES EE TABLE 6 34 Formes des concurrences 4 1 8 La concurrence La concurrence est toujours form e d une action l actif direct narratif ou au passif et d un ensemble d actions au g rondif La table 6 34 montre les diff rentes formes retrouv es dans le corpus Il ne semble pas vident de d terminer quels noyaux de cette relation multi nucl ique utilisent le g rondif et quel noyau utilise la forme active passive prime abord il semble qu entre 2 op rations co temporelles O l op ration au g rondif
81. suivi d un infinitif et d autres formes r sultat num rique groupe nominal L utilisation du pr sent et du futur ne semble pas justifi e comme en anglais En effet un 19TLe symbole d note l ellipse 123 Avec l aide de par groupe nominal 46 96 avec l objet OB G rondif 41 96 en faisant O Autres 13 96 Toa OOH TABLE 6 33 Formes des mani res r sultat ex cut par l appareil est presque aussi souvent indiqu au pr sent qu au futur Par exemple dans un texte on retrouve 107 Appuyer sur la touche TIMER La minuterie est affich e et le voyant s teint ou le r sultat est au pr sent et dans un autre manuel on retrouve le m me type de r sultat mais cette fois au futur 108 presser le bouton MUTE Le mot MUTE sera affich sur l cran Il semble que dans un m me manuel l utilisation d un des deux temps soit pr f r e Dans SPIN le choix de forme grammaticale d cide alors de fa on al atoire entre le temps futur et le temps pr sent au tout d but de la g n ration avec les proportions retrouv es dans le corpus 1 par contre une autre forme est pr f r e alors celle ci est sp cifi e textuellement c est le cas de PM 11 35 1 h 30min dans le texte vcr Les formes avec le verbe devoir ne sont pas produites 4 1 7 La mani re Pour la mani re le travail de Vander Linden ne peut nous guider car il inclut la mani re dans
82. suivies que rejet es C est le cas de 92 En effet la c condition rend le choix de l agent bien plus explicite en utilisant des expres sions comme si vous voulez tandis que le but exprime l option de fa on moins explicite ainsi rendant la possibilit de rejet moins vidente 3 8 Les pr ventions La pr vention peut tre communiqu e par 15 ne faut pas confondre la relation de concurrence et la relation de mani re qui en fran ais sont toutes deux r alis es grammaticalement par un g rondif ex en soufflant Dans le cas d une concurrence il est possible d ajouter l adverbe tout devant le g rondif ex tout en soufflant sans alt rer le sens de l expression tandis que la mani re ne peut se r aliser par tout g rondif En anglais la distinction est plus frappante car la mani re est r alis e par un g rondif tandis que la concurrence est r alis e sans la pr position by et avec une pr position while meanwhile VL93b 93 heuris contrainte relation tique s mantique cooc lecteur nature de pr f r e currence la t che i OP est une option OP sera probable but ment suivie par le lecteur ii OP est une option OP ne sera pas c condition probablement suivie par le lecteur TABLE 5 22 Heuristiques de pr sentation l option heuris contrainte relation tique s mantique cooc lecteur nature de pr f r e currence la t che P est une pr vention P est detype DONT P est une p
83. te noire en bo te de verre ou l utilit des structures interm diares comme moyen d explication du fonctionnement du fran ais Dans M G S r et A Weil Barais diteurs Proceedings of the Jour n es de Cachan L explication dans l enseignement et l E I A O pages 131 140 Editions Paris Onze 1991 M Zock SWIM or Sink The Problem of Communicating Thought Dans Bridge to International Communication Intelligent Tutoring Systems for Second Language Learning Springer New York 1991 M Zock La g n ration automatique de texte Trente ans d ja ou presque Dans J Anis diteur Num ro Sp cial sur la g n ration Langue no 106 pages 8 35 Larousse 1992 M Zock Is content generation a one shot process or a cyclical activity of gra dual refinement the case of lexical choice Dans H Horacek et M Zock di teurs New Concepts in Natural Language Generation Planning Realisation and Systems Communication in Artificial Intelligence Pinter London 1993 A M Zwicky et A D Zwicky Register as a Dimension of Linguistic Variation Dans R Kittredge et J Lehrberger diteurs Sublanguage Studies of Language in Restricted Semantic Domains chapitre 9 pages 213 218 Walter de Gruyter Berlin 1982 Index d auteurs Allen 100 124 Allen Kautz Pelavin et Tenenberg 4 Andr et Rist 23 Appelt 6 Balkanski 7 19 Bates Hovy et Senneff 127 Bingham 9 14 118 Britton 11 Britton Van Dusen Glynn
84. textes d instructions administratifs et de manuels de logiciels Dans un contexte multilingue il semble qu une m me repr sentation s mantique est pr sent e par diff rentes relations rh toriques d pendant de la langue de communication DHPt94 Par exemple dans 15 a The stepping load can be altered by loosening the locking lever and changing the position of the cylinder foot La charge d appui peut tre modifi e en desserrant le levier et en changeant la position des v rins b Pour modifier la charge d appui desserrer les leviers puis d placer le pied des v rins c Nach Lockern der Klemmhebl kann durch Verschierben des Zylinderfufes die Tret belastung veradert werden Apr s avoir desserr les leviers en poussant les v rins la charge d appui peut tre modifi e ce qui en anglais est pr sent par une relation de mani re by loosening est pr sent en fran ais par un but pour modifier et en allemand par une circonstance Nach Lockern Les chercheurs concluent qu une repr sentation s mantique des instructions n est donc pas bien d finie en termes de relations rh toriques car ceux ci ne sont pas universels Une repr sentation par plan semble mieux appropri e En utilisant un formalisme tendu de STRIPS Delin et ses coll gues utilisent les relations de g n ration et de permission qu ils adaptent la planification de t che de la fa on suivante DHP 94 e a g n re p si
85. un but pourquoi appuyer en consid rant la relation en amont tandis que la seconde pr sente l information comme une mani re comment r gler en consid rant la relation en aval En oubliant ces questions un syst me de g n ration automatique pourrait choisir de com muniquer dans le texte toute l information disponible et pr senter l information toujours de la m me facon Par exemple la repr sentation conceptuelle de la figure 1 1 indique comment utiliser un magn toscope pour enregistrer un programme d une heure et demi sur le canal 4 partir de maintenant jeudi 10 05 PM en mode SP slow play Pour atteindre le but n1 les op rations n2 n3 n4 et n5 doivent tre ex cut es de la m me fa on pour ex cuter n3 n6 doit tre ex cut e et ainsi de suite Aussi la figure indique l effet pr c d du symbole de certaines op rations partir de cette repr sentation un syst me non intelligent produirait le texte suivant 2Nous sommes consciente que cet exemple comporte quelques d fauts entre autres le calcul des heures d enregistrement partir de l heure actuelle Nous l avons cependant pr sent ici car parmi les textes de notre corpus il illustre le mieux la diversit rh torique de textes naturels Pour enregistrer un programme d 1 heure 30 R glez le s lecteur de vitesse de bande sur SP SP s allumera S lectionnez le canal 4 le canal 4 sera s lectionn Sp cifiez l heure d enregis
86. va maintenant consid rer la question sous un angle plus pratique En effet ce chapitre d crit le syst me informatique SPIN un syst me de g n ration de texte qui implante le mod le de g n ration d instructions pr sent aux chapitres pr c dents Il suit le mod le illustr la figure 3 5 et les heuristiques de s lection et de pr sentation d velopp es aux chapitres 4 et 5 partir d une repr sentation conceptuelle du domaine SPIN utilise une technique hi rar chique de planification de t che pour construire une repr sentation conceptuelle de la tache accomplir Le syst me utilise ensuite un ensemble de r gles pour appliquer les heuristiques de s lection et de pr sentation et ainsi s lectionner le contenu et la structure rh torique du texte SPIN effectue ensuite les r alisations linguistiques et motrices pour produire un texte en langue naturelle Dans ce chapitre nous d crivons d abord l architecture g n rale du syst me puis chaque tape est d taill e et illustr e l aide d un exemple de texte g n r L analyse des r sultats de SPIN sera discut e au chapitre T 1 Description g n rale de SPIN SPIN a t d velopp afin de v rifier les heuristiques des chapitres 4 et 5 c est pourquoi l emphase du syst me a t mise sur la s lection du contenu et de la structure rh torique Les autres tapes de la g n ration ont galement t implant es afin d viter de simplifier le ph no
87. ventuelle Par exemple 59 Presser 3 et 8 Si le second chiffre n est pas press dans les deux se condes le canal 3 sera s lectionn iii Toute op ration obligatoire qui satisfait les heuristiques des op rations s quentielles mais qui ne doit pas n cessairement tre ex cut e tout de suite est communiqu e par une op ration ventuelle C est le cas dans 58b La premi re heuristique compte pour 65 96 des cas du corpus la seconde pour 30 et la derni re pour 5 96 Celles ci sont r sum es la table 4 13 4 R sum Dans ce chapitre nous avons discut de la s lection du contenu des textes d instructions c est dire comment choisir les l ments s mantiques communiquer dans le texte Les 9 l ments s mantiques les plus fr quents dans les textes instructions ont t pr sent s Nous avons 71 remarqu que leur introduction dans le texte d pend de 5 types de contraintes des contraintes conceptuelles des cooccurrences d l ments s mantiques les connaissances et intentions du lecteur la nature de la t che et le but communicatif du texte Nous avons galement d fini la notion d op ration de base comme tant les op rations les plus facilement accessibles chez un agent particulier et dans un domaine particulier Finalement pour chaque l ment s mantique les heuristiques de s lection ont t sp cifi es Le prochain chapitre s int resse la s lection
88. 125 titre gn programmer obj enregistrement qual d ih 30 min par une touche incr mentielle paragraphe item forme_pour meilleure qualit d image virgule actif_direct r gler obj s lecteur de vitesse de bande dest SP point item actif_direct s lectionner obj canal 4 gerondif appuyer dest touche de canal point item actif_direct appuyer dest touche OTR qual 3 fois point nl espace lorsque enfoncer obj touche OTR qual 1 fois virgule forme_textuelle PM 10 35 30min point nl espace lorsque enfoncer obj touche OTR qual 2 fois virgule forme_textuelle PM 11 05 1 h point nl espace lorsque enfoncer obj touche OTR qual 3 fois virgule forme_textuelle PM 11 35 1 h 30min point nl point item actif_direct appuyer dest touche TIMER qual dans un d lai de 9 secondes point FIGURE 6 21 Liste des structures grammaticales pour le texte ver 4 2 La r alisation lexico morphologique Une fois le choix des formes grammaticales effectu il faut s lectionner les mots et les d cliner correctement L emphase de SPIN n est certainement pas la r alisation lexicale c est pourquoi dans le syst me un concept est directement reli une entr e lexicale De plus comme on peut voir a la figure 6 14 certaines expressions sont entr es directement dans la repr senta tion conceptuelle Pour effectuer la r alisation morphologique SPIN consulte un dictionnaire d
89. 151 Nantes aug 1992 B Di Eugenio et B L Webber Pragmatic overloading in Natural Language instructions soumis pour publication 1995 disponible aupr s des auteurs P Dixon J Faries et G Gabrys The Role of Explicit Action Statements in Understanding and Using Written Directions Journal of Memory and Language 27 6 649 667 dec 1988 H Dalianis et E Hovy Aggregation in Natural Language Generation Dans Proceedings of the Fourth European Workshop on Natural Language Generation pages 67 78 Pise Italie avril 1993 J Delin A Hartley C Paris D Scott et K Vander Linden Expressing Pro cedural Relationships in Multilingual Instructions Dans Proceedings of the T International Workshop on Natural Language Generation pages 61 70 Kenne bunkport Maine juin 1994 P Dixon Actions and Procedural Directions Dans R S Tomlin diteur Cohe rence and Grounding in Discourse pages 69 89 John Benjamins Amsterdam 1987 P Dixon The Processing of Organizational and Component Step Information in Written Directions Journal of Memory and Language 26 1 24 35 feb 1987 J Delin D Scott et T Hartley Knowledge Intention Rhetoric Levels of Varia tion in Multilingual Instructions Dans O Rambow diteur Proceedings of the DSK91 FN71 Fri79 GAB86 GC78 Gol70 GS86 Ham89 Har85 Har86 HH92 Hob79 Hob82 Hob85 Hob90 Hov90a Hov90b Hov93 HR80 Kar88 183 ACL Worksh
90. 29 Pereira et Warren 98 Peter et Rosner 27 54 Peters et Rapaport 51 Polanyi 32 Pollack 20 51 Price et Korman 10 31 38 Puscas 9 R sner 4 Rosner et Stede 27 32 58 74 75 76 Reichman 32 Reiter 6 Reiter et Dale 125 Reiter Mellish et Levine 9 147 Reithinger 6 Riesbeck et Schank 100 Rock 76 144 Rosch 51 53 Rosch Mervis Gray Johnson et Boyes Braem 52 Sacerdoti 4 35 101 103 105 144 Sawyer 11 Scott 4 29 37 146 Smith et Goodman 14 25 55 Tate 25 101 Thompson 5 115 118 Thorndike 11 Timbal Duclaux 9 Tutin 4 32 39 112 125 129 Vander Linden 7 25 28 32 36 37 39 44 58 61 74 83 86 92 101 115 118 119 127 133 Vander Linden et Martin 4 Vander Linden Cumming et Martin 28 120 Wahlster Andr Finkler Profitlich et Rist 23 Walker 127 Weiss 9 Zock 4 5 6 Zock et Laroui 4 Zwicky et Zwicky 3 190 191 Typeset by A14S IATEX 192 Document Log Manuscript Version 0 Typeset by AU4S IATEX 12 September 1995 Planification de textes d instructions S lection du contenu et de la structure rh torique LEILA KOSSEIM D partement d informatique et de recherche op rationnelle Universit de Montr al C P 6128 succ Centre Ville Montr al E mail address kosseimQIRO UMontreal CA
91. 3 2 La th orie de structure rh torique RST La RST a initialement t d velopp e par des linguistes et des informaticiens dans le cadre de l analyse de discours MT88 La RST est actuellement bien d velopp e en tant que th orie descriptive et aussi en tant que th orie constructive pour la g n ration La RST a pour but d identifier les relations s mantiques et pragmatiques entre portions adjacentes de texte tous les niveaux de la structure textuelle Une description textuelle par la RST s effectue partir de sch mas de relations e les relations Une relation sp cifie comment deux portions adjacentes de texte sont reli es La majo rit des relations sont d finies entre une partie principale le noyau et une partie auxi liaire le satellite Cependant dans certaines relations toutes les portions de textes sont consid r es au m me niveau il s agit alors de relations multi nucl iques Par exemple dans 16 Pour mettre le poste de TV hors tension presser le bouton de nouveau il existe une relation de but purpose entre le satellite pour mettre le poste et le noyau presser le bouton Dans 17 enlevez ampoule d connectez les fils de la douille et passez l tape 6 une s quence relie trois noyaux La RST est applicable de nombreux domaines de discours et genres textuels cepen dant lorsqu elle est appliqu e un nouveau contexte de nouvelles relations ou des mises Jou
92. 3 La ponctuation La ponctuation est mise dans le texte au niveau des relations rh toriques En effet dans les textes d instructions la ponctuation semble peu d pendante de la forme grammaticale SPIN utilise les r gles de ponctuations suivantes action point virgule r sultat but virgule toute relation reli e c condition virgule toute relation reli e toute autre relation point Dans le corpus les noyaux des s quences d actions peuvent faire partie d une m me phrase ou de phrases diff rentes D terminer comment effectuer l agr gation d actions n est pas un 117 titre but programmer obj enregistrement qual d ih 30 min par une touche incr mentielle _ paragraphe item but meilleure qualit d image r gler obj s lecteur de vitesse de bande dest SP virgule action r gler obj s lecteur de vitesse de bande dest SP point item action s lectionner obj canal 4 maniere appuyer dest touche de canal s lectionner obj canal 4 point item action appuyer dest touche OTR qual 3 fois point nl espace c_condition enfoncer obj touche OTR qual 1 fois appuyer dest touche OTR qual 3 fois virgule resultat PM 10 35 30min enfoncer obj touche OTR qual 1 fois point nl espace c_condition enfoncer obj touche OTR qual 2 fois appuyer dest touche OTR qual 3 fois resultat PM 11 05 1 h enfoncer obj touche OTR qual 2 fois point nl espace c_condition
93. 3 fois Il s agit d une r trogradation rh torique ainsi le satellite est plac apr s son noyau L laboration L tude de Vander Linden ne consid re pas la relation d laboration Dans notre corpus le noyau d une laboration est g n ralement plac e apr s son noyau Ce pendant dans 15 96 des cas le satellite est apr s son noyau Ces laborations communiquent habituellement une justification pour la ligne d op rations sp cifi e dans le noyau Le but Dans le corpus de Vander Linden la majorit des satellites de buts sont exprim s apr s leur noyau Son syst me place donc toujours le satellite apr s le noyau sauf dans des cas bien particuliers Comme le montre la table 6 27 le frangais aussi place g n ralement les satellites des buts apr s le noyaux 59 96 versus 41 96 Tout comme IMAGENE SPIN place par d faut les satellites apr s leur noyau sauf si le but est consid r optionnel ou s il s applique plusieurs actions Le r sultat En anglais et en francais le satellite des r sultats est toujours positionn apr s leur noyau cf la table 6 27 La mani re Ici l tude de Vander Linden ne peut nous aider car il ne consid re pas cette relation G n ralement le satellite d une mani re est plac apr s son noyau Cependant dans le corpus 23 96 des satellites pr c dent leur noyau Ces cas ne nous semblent pas toujours justifi s c est pourquoi SPIN place toujours le satellite apr s le noyau 3 4
94. 5 heuris contrainte relation tique s mantique cooc lecteur nature de pr f r e currence la t che i A est un attribut laboration d objet TABLE 5 17 Heuristiques de pr sentation l attribut d objet 3 3 Les conditions mat rielles Une condition mat rielle peut tre pr sent e par 4 relations rh toriques e la c condition 91 du temps comme dans l exemple 75 Si des bulles apparaissent autour de la valve c est qu il y a une fuite cet endroit Faites la remplacer par un m canicien qualifi e le but 4 96 voir l exemple 76 76 Pour v rifier un commutateur ordinaire touchez la vis de la borne de cuivre avec la pince du v rificateur e le r sultat 4 96 par exemple 77 Si des bulles apparaissent autour de la valve c est qu il y a une fuite cet endroit Faites la remplacer par un m canicien qualifi e la s quence 2 96 comme dans 78 Introduire la cassette v rifier que la languette de la vid ocassette n a pas t enlev e On remarque que tous les types de contraintes s mantiques de cooccurrences les connais sances du lecteur et la nature de la t che influencent le choix de la relation rh torique En effet 1 Un r sultat et une c condition sont utilis es si 2 conditions mat rielles quivalentes sont communiquer L tat difficile valuer pr sente la condition fondamentale jus tifiant la prochaine ligne d actions Cet tat est toujours pr sent
95. 8 99 100 102 104 108 110 113 114 117 125 128 131 7 24 7 25 7 26 7 27 7 28 7 29 7 30 Repr sentation conceptuelle de t che de la soupe aux f ves de Dale Soupe aux f ves versions de EPICURE et de SPIN Texte jvc versions originale et de SPIN Repr sentation conceptuelle de la t che pour le texte jvc Notre approche la planification de textes d instructions Structure rh torique du texte vcr par la RST Structure rh torique du texte vcr tel que consid r par SPIN xii 132 134 135 136 139 140 141 LISTE DES TABLES 2 1 4 2 4 3 4 4 4 5 4 6 4 7 4 8 4 9 4 10 4 11 4 12 4 13 5 14 5 15 5 16 5 17 5 18 5 19 5 20 5 21 5 22 5 23 5 24 Types de g n ration de Goldman l ments s mantiques du corpus Caract ristiques des diff rents types de textes du corpus Heuristiques de s lection l op ration s quentielle Heuristiques de s lection l attribut d objet Heuristiques de s lection la condition mat rielle Types d effets par rapport au type de texte Heuristiques de s lection l effet Heuristiques de s lection l influence Heuristiques de s lection l op ration co temporelle Heuristiques de s lection l option Heuristiques de s lection la pr vention Heuristiques de s lection l op ration ventuelle Relations rh toriques du corpus Pr sentation des l ments s mantiques Heuristiques de pr sentation l op ration s quentielle Heuristiqu
96. EW92 DE92 DE93a DE93b Di Eugenio a classifi les imp ratifs n gatifs en 2 cat gories e DONT les n gations propres caract ris es par l auxiliaire ne pas don t en anglais ou des l ments polarit n gative comme jamais Par exemple 10 Ne jamais m langer des nettoyants contenant de l acide ou de Vammoniaque avec un javellisant au chlore Les imp ratifs n gatifs DONT indiquent un mauvais choix que l agent risque d effectuer dans une situation particuli re Dans ce cas un avertissement direct est donn e neg TC les n gations de la forme prenez garde take care Par exemple 5 Pol90 aussi discute de la diff rence d intention et de croyance entre les relations de permission et de g n ration 21 11 Pour nettoyer charger les v tements dans le bassin en s assurant de ne pas trop le remplir Les n gations neg TC identifient un point de choix que l agent ne va probablement pas remarquer Souvent le point de choix est identifi par le r sultat qu une mauvaise d ci sion entraine Les neg TC restreignent le degr de libert de l agent lors de l ex cution de l instruction La notion de DONTS et de neg TC est assez importante dans notre tude En effet comme nous le verrons au chapitre 5 elle permet de d terminer quelle relation rh torique est plus appropri e pour pr senter une action n gative En ce qui concerne les propositions de but PC Di Eugenio les classifie en 3 ca
97. En effet d autres crit res comme le domaine de discours et la langue de communication peuvent influencer ces choix Cependant notre corpus est trop restreint pour tirer des conclusions justifi es sur d autres crit res 2 2 Le contenu et la structure de la repr sentation conceptuelle Comme le prescrivent les travaux en psychologie pr sent s au chapitre 2 le contenu et la structure conceptuels d une proc dure sont essentiels pour d terminer le contenu d un texte d instruction facile interpr ter Dans notre corpus le contenu de la repr sentation conceptuelle influence le choix des l ments s mantiques En effet comme l illustre la figure 4 6 p 49 un tat et une op ration donnent lieu un ensemble diff rents d l ments s mantiques D terminer si on a affaire un tat ou une op ration est donc essentiel pour d terminer les l ments s mantiques communiquer 9 Tl est int ressant de constater que dans les recettes de cuisine 80 96 des l ments s mantiques sont des op rations s quentielles tandis que la moyenne pour les textes d ex cution est de 60 cf la figure 4 7 p 72 54 Aussi la structure de la repr sentation conceptuelle est n cessaire pour s lectionner un l ment s mantique En effet pour faciliter l interpr tation du texte ses l ments s mantiques doivent tre structur s de facon similaire la structure de la repr sentation conceptuelle voir le
98. La repr sentation conceptuelle de la tache utilise donc des blocs d information correspondants un l ment s mantique La question de s lection de contenu id alement ne devrait pas supposer des blocs d information bien pratiques inclure ou non dans le texte mais plut t devrait consid rer des blocs d information bien plus petits de fa on construire un l ment s mantique partir de blocs primitifs Ceci permettrait 145 de g n rer de fa on naturelle des ph nom nes comme les r p titions En effet la repr sentation conceptuelle d une r p tition doit bien identifier sa port e et son cas d arr t Pourtant les ins tructions pour un lecteur humain n ont pas tre aussi strictes C est le cas par exemple dans des instructions pour utiliser un shampooing 113 Appliquer sur les cheveux mouill s faire mousser rincer et r p ter Ici bien que la repr sentation conceptuelle doit sp cifier la port e et le cas d arr t de la r p tition le texte ne les sp cifie pas 1 2 4 L influence du domaine de discours Notre modele ne consid re que des heuristiques g n rales tous les domaines de discours Pourtant les recettes de cuisines semblent exhiber un contenu et une structure rh torique bien plus st r otyp s que les autres textes analys s Nous avons expliqu ce ph nom ne par le but communicatif du texte pourtant Mellish ME89 et Dale Dal92 semblent justifier certains choix de la p
99. Les pr ventions Les op rations ventuelles 4 R SUM CHAPITRE 6 Implantation le syst me SPIN 1 DESCRIPTION G N RALE DE SPIN 2 LA PLANIFICATION DE T CHE 2 1 L entr e du planificateur de t che 2 2 La sortie du planificateur de t che 2 3 Le processus de planification de t che 3 LA PLANIFICATION DE TEXTE 3 1 Le choix des l ments s mantiques 3 2 3 3 3 4 La structuration s mantique 3 2 1 3 2 2 Le r ordonnancement des l ments s mantiques La r solution des contraintes de cooccurrence Le choix des relations rh toriques La structuration rh torique 3 4 1 3 4 2 3 4 3 La r solution des contraintes de cooccurrence Le positionnement des satellites La ponctuation 4 LA REALISATION LINGUISTIQUE 4 1 La r alisation grammaticale 4 1 1 4 1 2 4 1 3 4 1 4 4 1 5 4 1 6 4 1 7 Le titre La s quence d actions La c condition L laboration Le but Le r sultat La mani re vill 86 89 92 92 92 93 94 96 96 99 101 103 105 106 106 111 114 115 117 118 4 2 4 1 8 La concurrence 4 1 9 R sum La r alisation lexico morphologique 5 LA R ALISATION MOTRICE 6 R SUM CHAPITRE 7 valuation 1 EVALUATION DES HEURISTIQUES 1 1 1 2 1 3 L valuation en g n ration de texte Comparaison aux m thodes pr c dentes 1 2 1 Le syst me de Mellish 1 2 2 EPICURE de Dale Comparaison avec d
100. N CLOSE sortir le CD et appuyer de nouveau sur OPEN CLOSE pour fermer le plateau Conserver le plateau ferm sauf pendant le char gement et le retrait pour prot ger le m canisme de la poussi re et des accidents 178 2 3 2 Versions de SPIN Texte de d ex cution Comment placer un CD l couter puis l arr ter Appuyez sur OPEN CLOSE Mettez le CD face imprim e vers le haut sur le plateau Appuyez sur Lecture pause Ajustez le volume Pour arr ter le CD appuyez sur CLEAR Pour mettre l appareil en mode de pause appuyez sur Lecture pause pendant que le CD est reproduit i Lecture pause est appuy de nouveau le CD se commence l o il a t laiss Pour le retirer appuyez sur OPEN CLOSE sortez le CD Appuyez sur PEN CLUSE de nouveau pour fermer le plateau Conservez le ferm sauf pendant le chargement et le retrait pour prot ger le m canisme de la poussi re et des accidents Texte hybride Pour placer un CD l couter et l arr ter Appuyez sur OPEN CLOSE Mettez le CD face imprim e vers le haut sur le plateau Appuyez sur Lecture pause Ajustez le volume Pour arr ter le CD appuyez sur CLEAR Pour mettre l appareil en mode de pause appuyez sur Lecture pause pendant que le CD est reproduit Si Lecture pause est appuy de nouveau le CD se commence l o il a t laiss Pour le retirer appuyez sur OPEN CLOSE sortez le CD Appuyez sur OPEN CLOSE de nouveau pour fe
101. OTR 3 fois Appuyer sur la touche TIMER dans un d lai de 9 secondes Lecteur expert texte de compr hension Programmation d un enregistrement d ih 30 min par une touche incr mentielle Pour une meilleure qualit d image r gler le s lecteur de vitesse de bande sur SP S lectionner le canal 4 Appuyer sur la touche OTR 3 fois Appuyer sur la touche TIMER dans un d lai de 9 secondes 1 2 Soufflage de verre 1 2 1 Version originale verre p 73 La premi re bulle Avant que le verre ne devienne trop froid on y souffle une premi re bulle d air En tenant la canne horizontalement ou l g rement inclin e vers le sol on y envoie un jet d air rapide Imm diatement on glisse le pouce sur l embout pour emprisonner l air 1 2 2 Versions de SPIN Lecteur novice texte d ex cution Comment cr er la premi re bulle Avant que le verre ne devienne trop froid souffler la bulle en soufflant l air dans la canne et en l emprisonnant En tenant la canne horizontalement ou l g rement inclin e vers le sol envoyer un jet d air rapide Glisser le pouce sur l embout Lecteur novice texte hybride Pour cr er la premi re bulle Avant que le verre ne devienne trop froid il faut souffler la bulle en soufflant l air dans la canne puis en l emprisonnant En tenant la canne horizontalement ou l g rement inclin e vers le sol envoyez un jet d air rapide Glissez le pouce sur l embout pour emprisonner l air 172 Lect
102. PIN Nous avons cependant adapt ses r sultats pour le frangais et pour des textes plus explicatifs Pour le choix rh torique m me si Vander Linden suppose l existence d un planificateur de t che pour construire la repr sentation conceptuelle de la proc dure il n utilise pas la distinction faite dans ce domaine entre tats et op rations En effet Vander Linden consid re tout comme des op rations Il d veloppe alors un ensemble de crit res pour s lectionner le statut rh torique 29 en se basant fortement sur la distinction d j faite par le planificateur de t che et par cons quent les r gles semblent un peu simples Comme nous verrons au chapitre 5 nos crit res de s lection de statut rh torique prennent avantage de la distinction d j faite par le planificateur de t che et rajoute un niveau suppl mentaire de crit res de s lection ce point de vue nous croyons que nos heuristiques sont plus raffin es que celles de Vander Linden De plus comme le note DSH93 Sco93 la s lection des relations rh toriques semble d pendre de la langue de communication Les crit res de Vander Linden ne peuvent donc tre directement utilis es pour des instructions en fran ais DRAFTER et GIST de Scott et al Les projets DRAFTER et GIST Sco93 DSH93 DHP 94 PS94 PVLF 95 actuellement en d veloppement Brighton s int ressent la g n ration multilingue anglais fran ais italien allemand et portugais de
103. PIN sont pr sent es la figure 7 26 partir du texte source nous avons identifi un ensemble de sch mas d op rations que le planificateur de tache de SPIN a ensuite s lectionn et organis tel que pr sent la figure 7 279 Encore une fois le mod le du lecteur a t d velopp de facon mini miser les diff rences entre les deux textes Comparons maintenant leur contenu et leur structure rh torique e contenu textuel Le titre et les instructions 1 et 2 sont identiques dans les deux versions La troisi me instruction cependant diff re SPIN produit simplement 5 Les recettes du corpus d analyse proviennent aussi de ce livre ci aussi la figure n indique que les liens hi rarchiques Les op rations d un m me plan sont toutes reli es s quentiellement 135 Version originale Pour placer couter et arr ter un CD Appuyer sur OPEN CLOSE Mettre un CD face imprim e vers le haut sur le plateau Pour couter le CD appuyer sur Lecture pause et ajuster le volume Le plateau CD se ferme automatiquement L affichage indique la plage reproduite et la dur e coul e depuis le d but Pour arr ter le CD appuyer sur CLEAR A la reprise de la lecture du CD celle ci commence partir de la plage 1 Pour mettre l appareil en mode de pause appuyer sur Lecture pause pendant que le CD est reproduit en appuyant de nouveau sur Lecture pause le CD commence l o il a t laiss Pour retirer le CD
104. Text Nichols New York 2 edition 1985 J Harltey Planning the Typographical Structure of Instructional Text Educa tional Psychologist Special Issue Design of Instructional Text 21 4 315 332 automne 1986 S Hervey et I Higgins Thinking Translation Routledge London 1992 J Hobbs Coherence and Coreference Cognitive Science 3 1 67 90 janvier mars 1979 J Hobbs Towards an Understanding of Coherence in Discourse Dans W Leh nert et M Ringle diteurs Strategies for Natural Language Processing cha pitre 8 pages 223 244 Lawrence Erlbaum Associates New Jersey 1982 J Hobbs On the Coherence and Structure of Discourse Rapport technique CSLI 85 37 Centre for the Study of Language and Information octobre 1985 J Hobbs Litterature and Cognition Center for the Study of Language and Information Stanford Californie 1990 E Hovy Pragmatics and Natural Language Generation Artificial Intelligence 43 153 197 1990 E Hovy Unresolved Issues in Paragraph Planning Dans R Dale C Mellish et M Zock diteurs Current Research in Natural Language Generation Cognitive Science Series chapitre 2 pages 17 45 Academic Press 1990 E Hovy Automated Discourse Generation Using Discourse Structure Relations Artificial Intelligence 63 1 2 341 385 octobre 1993 B Hayes Roth Human planning process Rapport technique R 2670 ONR Rand Corp Santa Monica Californie 1980 R Karlin Defining the Semantics of Verb
105. U IIR TUBIS IUIUS IUIUS III ISI ISI IIIS IIIS II ISI III II III TI 1 1 Sch mas d op rations RU Mode Prolog 44h 4 vcr schemas pl schemas d operations pour VCR VA Author Leila Kosseim 4 Created On Tue Aug 18 11 14 23 1992 4 Last Modified By Leila Kosseim 4 Last Modified On Tue Feb 7 10 00 35 1995 VIRIDIBUS III TIT ITI IIR ISI IIS II ISI ble AAAA A tatetetetelolelolotetotetetote te tele lelelolelototo tote te tote hh hhh tote te tote ate declarations pour que Quintus ne se plaigne pas si le predicat n est pas defini III III IURI SIS lelelolelototo tote te tote hh hhh tote te tote ate dynamic op 1 dynamic during 2 dynamic before 2 AALALA A h hhh IUIUS IURI hht hhh bitte ttl schemas d operations III IIR ne ede e ded dolo h op mettre obj cassette lieu vid o precond corps succes ajout dans obj cassette lieu vid o echec op programmer obj X qual d 1h 30min par une touche incr mentielle precond dans obj cassette lieu vid o corps r gler obj s lecteur de vitesse de bande dest SP s lectionner obj canal 4 sp cifier obj heure d enregistrement d 1h 30min appuyer dest touche TIMER qual dans un d lai de 9 secondes succes ajout programm obj X qual d ih 30min par une touche incr mentielle echec ajout neg p
106. Universit de Montr al PLANIFICATION DE TEXTES D INSTRUCTIONS SELECTION DU CONTENU ET DE LA STRUCTURE RHETORIQUE Leila Kosseim D partement d informatique et de recherche op rationnelle Facult des arts et des sciences Th se pr sent e la Facult des tudes sup rieures en vue de l obtention du grade de Philosophi Doctor Ph D en informatique ao t 1995 Lema KossEIM MCMXCV il Universit de Montr al Facult des tudes sup rieures Cette th se intitul e PLANIFICATION DE TEXTES D INSTRUCTIONS SELECTION DU CONTENU ET DE LA STRUCTURE RHETORIQUE pr sent e par Leila Kosseim a t evalu e par un Jury compos des personnes suivantes Paul Bratley pr sident rapporteur Guy Lapalme directeur de recherche Richard Kittredge co directeur Jacques Malenfant membre du jury C cile Paris examinateur externe Th se accept e le il SOMMAIRE Cette th se traite d un probl me fondamental en g n ration automatique de texte comment s lectionner l information communiquer et comment la pr senter en un texte coh rent Tout r dacteur humain ou automatique s lectionne parmi toute l information disponible ce qu il communiquera dans son texte puis choisit parmi toutes les possibilit s rh toriques comment il pr sentera l information en un texte coh rent Ces deux questions d pendent d un grand nombre de facteurs par exemple l audien
107. Versions de SPIN NOTE Pour v rifier l inclusion de certains l ments s mantiques deux l ments ont t ajout es la repr sentation conceptuelle de SPIN e l option pour une meilleure qualit d image et e l information g n rale le s lecteur est gauche de l appareil Lecteur novice texte d ex cution Programmation d un enregistrement d ih 30 min par une touche incr mentielle Pour une meilleure qualit d image r glez le s lecteur de vitesse de bande sur SP S lectionnez le canal 4 en appuyant sur la touche de canal Appuyez sur la touche OTR 3 fois Lorsqu elle est enfonc e 1 fois PM 10 35 30min Lorsqu elle est enfonc e 2 fois PM 11 05 1 h Lorsqu elle est enfonc e 3 fois PM 11 35 1 h 30min Appuyez sur la touche TIMER dans un d lai de 9 secondes 170 Lecteur novice texte hybride Programmation d un enregistrement d ih 30 min par une touche incr mentielle Pour une meilleure qualit d image r glez le s lecteur de vitesse de bande sur SP S lectionnez le canal 4 en appuyant sur la touche de canal Appuyez sur la touche OTR 3 fois Lorsqu elle est enfonc e 1 fois PM 10 35 30min Lorsqu elle est enfonc e 2 fois PM 11 05 1 h Lorsqu elle est enfonc e 3 fois PM 11 35 1 h 30min Appuyez sur la touche TIMER dans un d lai de 9 secondes Lecteur novice texte de compr hension Pour programmer un enregistrement d ih 30 min par une touche incr mentielle P
108. a phrase 5a est plus facile interpr ter que 5b car l information de plus haut niveau d abstraction en 1talique y est plac e avant Dixon remarque aussi que les actions de plus haut niveau sont g n ralement exprim es explicitement comme dans 6a tandis que les actions plus pr cises sont exprim es implicitement comme dans 6b 6 a D marrer le moteur notion mesur e par le temps de lecture 13 b Le moteur doit tourner Cette strat gie serait utilis e par les r dacteurs pour indiquer aux lecteurs le niveau des actions dans la hi rarchie Aussi dans Dix87b le chercheur fait la distinction entre deux types d information i les tapes composantes component steps qui num rent les actions requises pour effectuer la t che ii l information organisationnelle organizational information qui indique comment les tapes composantes sont reli es ensemble Par exemple dans T Vous pouvez faire un wagon en dessinant un long rectangle avec deux cercles en dessous L information en italique est organisationnelle tandis que l autre indique une tape com posante Dixon a remarqu que les instructions sont plus facilement interpr t es lorsqu elles com mencent par de l information organisationnelle plut t que par des tapes composantes Ceci confirme l hypoth se que le r le de l information organisationnelle est d aider la construction du plan mental pour y ins rer les tapes composantes
109. acewell Frederiksen et Dillinger Donin et ses collaborateurs ont tent de d terminer comment la repr sentation conceptuelle d une proc dure est utilis e lors de la r daction d instructions pour structurer le texte Ils supposent tout comme de nombreux chercheurs en psychologie Dix87a BVDGH90 que les proc dures sont organis es conceptuellement de facon hi rarchique et non lin aire m me si l on peut organiser la s quence d actions requises de facon temporelle conceptuellement les proc dures sont organis es hi rarchiquement DBFD92 p 215 16 Leurs exp riences montrent que le contenu d un texte d instructions est inad quat pour permettre une autre personne d ex cuter la proc dure c est dire d en construire une re pr sentation conceptuelle lorsque le contenu ne porte que sur de l information de haut niveau et que l organisation textuelle n est pas reli e la structure hi rarchique de la proc dure Les chercheurs concluent alors qu une bonne r daction de textes d instructions exige de i produire et utiliser la repr sentation hi rarchique de la proc dure ii utiliser des strat gies efficaces pour s lectionner et organiser ces connaissances pour un lecteur particulier iii les exprimer en des structures textuelles ad quates Ces trois tapes r sument bien le but de notre th se automatiser ces trois types de stra t gies pour r diger des textes d ins
110. action a la propri t de causer la seconde tandis que la seconde 17 ne cause pas la premi re Les 2 actions n ayant pas les m mes propri t s elles ne peuvent donc pas tre identiques Goldman d finit ensuite un type d action act type et une instance d action act token Un type d action est simplement une propri t comme tondre le gazon ou donner une conf rence tandis qu une instance d action est une exemplarisation d un type d action o l agent et le moment d ex cution sont instanci s par exemple Julie a tondu le gazon hier Ex cuter une action consiste donc exemplariser un type d action Pour d finir la relation de g n ration entre deux instances d action Goldman d finit des type d actions et des instances d action de base Une propri t est un type d action de base pour l agent G au temps T si et seulement si dans des conditions normales e G peut exemplariser T grace sa volont et e le fait exprim au point pr c dent ne d pend pas des connaissances de G sur la g n ration ni sur les relations de cause effet l exception de sa connaissance que l exemplarisation de est caus e par sa volont Plus simplement cette d finition accepte comme niveau de base les types d action les plus d taill s que l agent peut ex cuter de fa on volontaire c est dire que l agent peut exemplariser s il le d sire mais cette exemplarisation ne d pend pas des connaissances de l a
111. ais com muniqu e par un r sultat ou une mani re Pour communiquer un l ment s mantique particulier il existe donc un ensemble de relations rh toriques ad quates Les liens entre relations rh to riques et l ments s mantique sont pr sent es la table 5 15 Comme l illustre cette table les ensembles de relations rh toriques pour pr senter les l ments s mantiques ne sont pas mutuel lement exclusifs Il est clair de cette table que certaines relations rh toriques sont privil gi es lorsqu il s agit de pr senter un l ment s mantique particulier Ce ph nom ne ne contredit pas l approche de s parer les questions s mantiques et rh toriques En effet sans cette distinction aucune diversit rh torique ne serait possible L appendice B 3 2 pr sente les r sultats en d tail Nous voyons la repr sentation s mantique comme ayant une structure arborescente res semblant la structure de la repr sentation conceptuelle D apr s les tudes en psychologie Dix87b DFG88 DBFD92 cette repr sentation doit influencer la structure textuelle pour fa ciliter l interpr tation du texte Dans notre corpus nous avons effectivement remarqu ce ph nom ne car la structure s mantique influence le choix d une relation rh torique Par exemple pour pr senter une influence deux relations rh toriques sont disponibles le mani re et le but La 6l ensemble des l ments s mantiques communiquer l ment s manti
112. al Modifiers in the Domain of Cooking Tasks Dans Proceedings of the 26 Annual Meeting of the Association for Com putational Linguistics ACL 88 pages 61 67 State University of New York at Buffalo juin 1988 Kay92 KE91 Kem87 KH82 Kit82 Kit83 KK93 KL82 KL94 KL95 Kla63 Kor94 KTKL93 McD84 McK85 ME89 MEF 90 Mel88 Mel90 184 M Kay Industrial potential of text generators Dans Expert Systems Confe rence Avignon 1992 Table ronde Automatic text generation A tool for the business world P Konoske et J Ellis Cognitive Factors in Learning and Retention of Proce dural Tasks Dans R Dillon et J Pellegrino diteurs Instruction Theoretical and Applied Perspectives chapitre 3 pages 47 70 Praeger New York 1991 G Kempen diteur Natural Language Generation NATO ASI Series Martinus Nijhoff Publishers Dordrecht 1987 G Kempen et E Hoenkamp Incremental sentence generation implications for the structure of a syntactic processor Dans Proceedings of the 9 International Conference on Computational Linguistics COLING 82 pages 151 156 1982 R Kittredge Variation and Homogeneity of Sublanguages Dans R Kittredge et J Lehrberger diteurs Sublanguage Studies of Language in Restricted Se mantic Domains chapitre 4 pages 107 137 Walter de Gruyter Berlin 1982 R Kittredge Semantic Processing of Texts in Restricted Sublanguages Com puters an
113. anguage Text Ar tificial Intelligence 21 1 41 1985 C Mellish et R Evans Natural Language Generation From Plans Computa tional Linguistics 15 4 233 249 d cembre 1989 K McKeown M Elhadad Y Fukumoto J Lim C Lombardi J Robin et F Smadja Natural Language Generation in COMET Dans R Dale C Mel lish et M Zock diteurs Current Research in Natural Language Generation Cognitive Science Series chapitre 5 pages 103 139 Academic Press 1990 C Mellish Natural Language Generation from Plans Dans M Zock et G Sa bah diteurs Advances in Natural Language Generation Communications in Artificial Intelligence Series chapitre 7 pages 131 145 Pinter Publishers Lon don 1988 C Mellish Generating Natural Language Explanations from Plans Dans L Sterling diteur The Practice of Prolog chapitre 6 pages 181 223 The MIT Press Cambridge 1990 MH93 Moo95 MP88 MP92 MP93 MT88 Par91 Par93 PK93 Pol86 Pol88 Pol90 PR90 PR94 PS94 PSM91 Pus89 PVLF 95 PW80 185 E Maier et E Hovy Organising Discourse Structure Relations Using Metafunc tions Dans H Horacek et M Zock diteurs New Concepts in Natural Language Generation Pinter London 1993 J Moore Participating in Explanatory Dialogues Interpreting and Responding to Questions in Context the MIT Press Cambridge Massachusetts 1995 J Moore et C Paris Constructing Coherent Text u
114. antes ont des interpr tations tr s diff rentes 9 a Jean a sali le tapis en traversant la pi ce b Jean a travers la pi ce pour salir le tapis Dans 9a le r dacteur implique que le tapis est maintenant sale mais n implique pas que Jean a fait expr s de le salir Dans 9b on interpr te que Jean avait l intention de salir le tapis mais on ne sait pas si cet tat a t atteint La phrase 9a est en fait une proposition de moyen car elle indique comment une action est effectu e et 9b est une proposition de raison car elle indique le but de l action Les RC et les MC entre deux actions expriment g n ralement la relation de g n ration de Goldman mais le r dacteur et le lecteur en d duisent diff rentes croyances et intentions En effet soient R le r dacteur G l agent a l action g n rante ex traverser la pi ce et B l action g n r e ex salir le tapis on a croyance R croit que a s est produit oui oui R croit que 8 s est produit oui pas n cessairement R croit qu il existe une relation de g n ration entre a et 8 oui pas n cessairement R croit que G souhaitait la r alisation de 8 pas n cessairement oui R croit que G souhaitait la r alisation de a comme une fa on de pas n cessairement oui g n rer 8 Par exemple dans les deux phrases 9a et 9b le r dacteur croit que Jean a travers la pi ce Par contre dans 9a il croit que Jean a r ussi salir de tapis mais dans 9b
115. antiques et rh toriques de SPIN Alors que dans le mod le th orique les structures s mantiques et rh toriques sont consid r es arborescentes dans SPIN ces structures sont implant es en tant que listes lin aires En effet dans le mod le les repr sentations conceptuelle s mantique et rh torique sont arborescentes tandis que le texte est lin aire Il est donc n cessaire de lin ariser les structures arborescentes avant la construction du texte final Pour simplifier implantation SPIN effectue la lin arisation d s la construction de la structure s mantique En effet seuls les l ments s mantiques et les relations rh toriques aux feuilles des repr sentations sont consid r s Par exemple dans le texte ver l analyse RST la plus juste notre avis est illustr e a la figure 7 29 Pourtant pour ne consid rer que les feuilles de la structure tout en analysant chaque expression linguistique SPIN utilise la structure large et peu profonde de la figure 7 30 Cette strat gie est acceptable pour des petits textes d instructions mais ne l est probablement dans d autres genres textuels ou dans des textes d instructions plus complexes 141 Pour programmer un enregistrement Pour une meilleure qualit d image r gler le s lecteur de vitesse de bande sur SP Selectionner le canal 4 en appuyant sur la touche de canal Appuyer sur la touche OTR Lorsqu elle est enfonc e 1 fois PM 10 35 30min Lorsqu elle
116. autre Il ne peut donc pas exister une unique repr sentation conceptuelle mod lisant une proc dure particuli re Notre but n est pas de construire et d utiliser l unique repr sentation concep tuelle permettant au syst me de g n ration de reproduire un texte source mot pour mot mais plut t de produire des textes possiblement naturels partir d une repr sentation conceptuelle possiblement naturelle 2 2 La sortie du planificateur de t che Le r sultat de la planification de t che la repr sentation conceptuelle de la t che est un r seau proc dural Sac77 Les noeuds du r seau font r f rence au sch ma d une instance d op ration act token comme d finies par Goldman Gol70 cf le chapitre 2 En effet un nceud fait r f rence une op ration effectu e par un agent pr cis un moment pr cis et non un type g n rique d op ration Cette distinction est importante par exemple si une t che se d compose de la fa on suivante 1 presser sur le bouton OPEN CLOSE 2 mettre un disque compact 2 1 ouvrir le bottier du disque 2 2 sortir le disque 2 3 placer le disque 3 presser sur le bouton OPEN CLOSE elle requiert 6 instances d op rations mais 5 types d op rations car le type d op ration presser sur le bouton OPEN CLOSE est ex cut aux instances 1 et 6 Dans ce cas la re pr sentation conceptuelle de la t che est form e de 6 n uds distincts faisant r f rence aux 6 instances d op ra
117. c dure Dans notre tude nous avons alors consid r tout l ment s mantique ex cut par l agent de la proc dure exclusivement dans le cadre de la proc dure comme une op ration dans les autres cas nous avions affaire un tat S il s agit d un tat celui ci peut tre engendr par une op ration ou bien peut contraindre une op ration Par exemple dans 19 Appuyer sur la touche PLAY La lecture normale appara t l op ration appuyer cr e l tat lecture normale appara t Il s agit alors d un effet Nous verrons plus tard qu un effet peut aussi communiquer une op ration Par contre si l tat contraint l application d une op ration alors il communique une condition mat rielle comme dans 20 L enfant a moins de 2 ans Placez le sur votre avant bras ou sur votre cuisse Ici l op ration placer ne doit tre ex cut e que si l tat enfant a moins de 2 ans est vrai Les pr ventions Une expression communiquant une op ration peut tre positive par ex Faites ceci ou n gative par ex Ne faites pas ceci Une op ration n gative communique toujours une pr vention Les options et les op rations ventuelles Une op ration positive peut tre obli gatoire ou facultative 1 l op ration communiqu e est facultative la d cision de l ex cuter ou non peut tre prise par l agent de fagon volontaire ou involontaire Par exemple dans 21 Pour monter un dispositif de s curi
118. ce vis e l habilet linguistique du r dacteur le domaine de discours et le genre textuel Malgr leur importance ces questions n ont pas re u toute l attention qu elles m ritent en g n ration automatique de texte En effet les travaux ant rieurs en planification textuelle traitent globalement de ces deux questions soit par un m me processus de d cision ou en liant directement les deux niveaux r duisant d autant la diversit rh torique Or la langue naturelle fournit un ventail de possibilit s rh toriques pour pr senter une m me information I s av re donc int ressant de consid rer les questions de s lection de contenu et de choix rh torique s par ment tout en motivant linguistiquement les liens entre eux La m thodologie suivie dans cette th se est empirique Nous avons d abord effectu l analyse d un corpus de textes pour bien capturer les ph nom nes linguistiques naturels Pour restreindre le projet nous nous sommes concentr e sur un genre textuel particulier les textes d instructions L analyse de corpus nous a permis d identifier 9 l ments de sens ou l ments s mantiques typiquement communiqu s dans les textes d instructions et 7 relations rh toriques utilis es pour pr senter ces l ments s mantiques L analyse de corpus nous a aussi permis de d velopper des heuristiques r gissant la s lection des l ments s mantiques communiquer et des relations rh toriques utilis
119. ckwards de Mellish strat gie g n rale d organisation est de construire une structure introduction corps conclusion L introduction indique comment une t che est d compos e en sous t ches le corps explique comment ex cuter ces sous t ches et la conclusion rappelle qu en ex cutant les sous t ches la t che de plus haut niveau est ex cut e Pour accomplir cette strat gie Mellish se base sur la structure hi rarchique de la proc dure produite par NONLIN pour d abord expliquer le plan de fa on tr s abstraite ensuite expliquer l expansion des taches de ce niveau puis du niveau inf rieur Une fois le niveau le plus bas atteint des strat gies rh toriques d terminent comment cette partie du plan sera pr sent e Mellish a d velopp trois strat gies rh toriques forwards backwards et lump qui se basent directement sur la structure du plan Les strat gies rh toriques forwards et backwards et les textes correspondants produits plus tard sont illustr s la figure 2 3 2 La simplification du message limine les redondances qui cr eraient un texte lourd Cette tape correspond l op ration d optimisation de Dale Ele est effectu e d abord par des r gles de r criture g n rales tous les domaines puis par des r gles sp cifiques au domaine 3 La construction d une structure compositionnelle d veloppe une structure linguistique du message sous forme de description fonctionnelle de la grammaire 4 La lin ar
120. corpus Au chapitre 4 nous identifions quels l ments s mantiques se retrouvent dans les textes d instructions et quels crit res semblent contraindre leur introduction dans le texte Finalement les heuristiques de s lection sont explicit es Au chapitre 5 un travail semblable est effectu pour les heuristiques de pr sentation e Le chapitre 6 d crit l implantation du syst me SPIN SPIN est un syst me de g n ration de textes d instructions d velopp exclusivement pour d montrer la validit des heuristiques d introduction et de pr sentation e Le chapitre 7 value les heuristiques et la recherche La validit des heuristiques est valu e en comparant les r sultats de SPIN aux r sultats d autres syst mes de g n ration 9 KL94 offre un aper u des ces chapitres 10 Syst me de Planification d INstructions de texte et des textes naturels hors du corpus d analyse La recherche est ensuite valu e globalement en d montrant ses points forts et ses points faibles e Finalement le chapitre 8 r sume les id es maitresses de la th se et pr sente des avenues de recherche future CHAPITRE 2 Travaux ant rieurs et domaines connexes Plusieurs domaines de recherche ont abord l tude des textes d instructions en particulier la r daction technique la psychologie et la linguistique informatique Nous verrons dans ce chapitre quelques uns de ces travaux en nous attardant plus particuli rement la lingu
121. couleur b Pour vous aider poussez fermement le flanc du pneu avec votre pied On compte environ 2 d options dans le corpus L introduction d une op ration optionnelle et de ses op rations enfants ne semble d pendre ni du but communicatif cf la figure 4 7 p 72 ni des contraintes de cooccurrences En effet i Si une op ration indique une r gle g n rale on pr f rera l introduire par une op ration ventuelle cf section 3 9 ii Par contre on introduit une option s il s agit d une op ration facultative qui facilite la tache ou qui atteint un but g n ralement d sirable De plus si l op ration avait t obligatoire elle aurait t communiqu e dans le texte en tant qu op ration s quentielle c est dire qu elle satisfait les heuristiques de la section 3 1 De plus une fois qu une op ration optionnelle est incluse dans le texte ses op rations enfants deviennent dans un environnement localement obligatoire les heuristiques de s lection des op rations s quentielles y sont donc applicables En particulier si l op ra tion optionnelle est de base et que le lecteur ne sait pas l effectuer alors ses op rations enfants sont incluses dans le texte en tant qu op rations obligatoires s quentielles co temporelles ou ventuelles heuris tique autre si l op ration O tait obligatoire elle satisferait les heuristiques des conceptuelle O doit tre ex
122. ction de cet l ment s mantique cependant le syst me ne le consid re pas n cessaire car ses op rations enfants appuyez sur Lecture pause et ajustez le volume ne peu vent pas vraiment tre mal ex cut es le lecteur peut comprendre pourquoi les op rations enfants doivent tre ex cu t es le lecteur ne peut supposer une mauvaise raison d effectuer les op rations enfants ni n0 n2 n3 nO ni n2 n3 n4 nS n6 n7 n8 n9 n10 nii n12 n13 ni4 n15 n16 n17 n18 n19 n20 placer obj CD couter obj CD arr ter obj CD placer obj CD couter obj CD arr ter obj CD ouvrir obj plateau mettre obj CD man face imprim e vers le haut dest plateau appuyer dest Lecture pause ajuster obj volume appuyer dest CLEAR mettre obj appareil mod en mode de pause commencer obj CD man l o il a t laiss retirer obj CD appuyer dest OPEN CLOSE appuyer dest Lecture pause man pendant que le CD est reproduit appuyer man de nouveau dest Lecture pause appuyer dest OPEN CLOSE sortir obj CD fermer obj plateau prot ger obj m canisme man de la poussi re et des accidents appuyer man de nouveau dest OPEN CLOSE conserver obj plateau man ferm sauf pendant le chargement et le retrait FIGURE 7 27 Repr sentation conceptuelle de la tache pour le texte jvc
123. cut e O doit tre ex cut e et un tat E de type si l agent le d sire op rations s quen contraint O contrainte nature lecteur de la t che O est une r gle cooc currence g n rale O facilite la tache ou O est g n ra lement d sirable but com municatif 68 commu niquer O et appliquer les heuristiques d op rations s quentielles sur les op rations tielles enfants comme si elles taient obligatoires TABLE 4 11 Heuristiques de s lection l option Ces heuristiques sont r capitul es la table 4 11 M me s il est possible de d terminer si une op ration optionnelle sera volontairement ex cut e l tat la contraignant doit tre exprim En effet ne pas introduire une telle expression changerait le sens de la proc dure car l op ration optionnelle serait maintenant vue comme une op ration obligatoire Les intentions du lecteur ne sont donc pas consid rer 3 8 Les pr ventions Une expression de pr vention communique une op ration ne pas effectuer Par exemple 54 Secouez doucement le capuchon pour le d gager sans le tourner Les pr ventions se r alisent par des imp ratifs n gatifs DE93b Rappelons du chapitre 2 que Di Eugenio divise les imp ratifs n gatifs en deux classes les neg TC take care et les DONTs Bien que tr s appropri e dans l analyse d instructions cette caract risation ne nous a pas t utile pour s lectionner les
124. d Mathematics with Applications 9 1 45 58 1983 T Korelsky et R Kittredge Towards stratification of RST Dans O Rambow diteur Proceedings of the ACL Workshop on Intentionality and Structure in Discourse Relations pages 52 55 Ohio State University juin 1993 R Kittredge et J Lehrberger diteurs Sublanguage Studies of Language in Restricted Semantic Domains Walter de Gruyter Berlin 1982 L Kosseim et G Lapalme Content and Rhetorical Status Selection in Instruc tional Texts Dans Proceedings of the T International Workshop on Natural Language Generation pages 53 60 Kennebunkport Maine juin 1994 L Kosseim et G Lapalme Choosing Rhetorical Relations in Instructional Texts The Case of Effects and Guidances Dans Proceedings of the 5t European Work shop on Natural Language Generation Leiden Hollande mai 1995 G Klare The Measure of Readability Iowa State University Press 1963 T Korelsky communication personnelle 1994 L Kosseim A Tutin R Kittredge et G Lapalme Generating Anaphora in Assembly Instruction Texts Dans Proceedings of the Fourth European Workshop on Natural Language Generation pages 43 54 Pise Italie avril 1993 D McDonald Natural Language Generation as a Computational Problem an Introduction Dans M Brady et R Berwick diteurs Computational Models of Discourse chapitre 4 pages 209 269 MIT Press Cambridge 1984 K McKeown Discourse Strategies for Generating Natural L
125. de la relation La table 5 20 r sume les heuristiques 92 heuris contrainte relation tique s mantique cooc lecteur nature de pr f r e currence la t che RE et O2 sont des op rations co concurrence pee ele TABLE 5 21 Heuristiques de pr sentation l op ration co temporelle 3 6 Les op rations co temporelles Comme l illustrent les tables 5 15 p 79 et 5 21 l op ration co temporelle est toujours pr sent e par une concurrencel Par exemple 90 a Rouler le pinceau en le tirant vers soi de facon reformer la pointe b En tenant la canne horizontalement ou l g rement inclin e vers soi on y envote un jet d air rapide c En soufflant il tourne la canne en la tenant un angle de 45 degr s 3 7 Les options Les options peuvent tre pr sent es dans le texte par e un but 79 des cas comme dans 91 Tirer la roue et le pneu pour vous aider poussez fermement le flanc du pneu avec votre pied e une c condition 21 96 comme dans 92 Si l on souhaite une ligne plus large alors s attarder sur le verre de fa on laisser s couler plus de couleur Comme l illustre la table 5 22 il semble que le choix de relation rh torique ne d pende que de contraintes s mantiques et de la nature de la t che 1 Un but est utilis si l option sera probablement suivie par l agent comme dans 91 ii D un autre cot une c condition pr sente les options qui ont autant de chance d tre
126. des relations de circonstance et de condition de la RST En effet comme le notent R sner et Stede dans les instructions de nombreuses expressions tendent autant vers la condition que la circonstance Par exemple dans 61 Remplir le r servoir de r serve jusqu la marque MAX avec le moteur froid il n est pas clair quelle relation est exprim e par avec le moteur froid Pour ce genre d expressions une relation combinant la circonstance et la condition a t cr e la pr condition Dans notre projet pour viter la confusion entre les pr conditions au niveau de la planification de t che et cette nouvelle relation rh torique nous appelons cette derni re une c condition 1 3 Le but Le but pr sente une situation r aliser par l interm diaire d une autre activit celle pr sent e dans le noyau Par exemple 62 Pour ne pas perdre l crou capuchon revissez le sur la lyre 1 4 Le r sultat Le r sultat inclut les r sultats d sir s et non d sir s de la RST volitional et non volitional results Dans un r sultat le noyau exprime une situation qui a pu causer la situation B ex prim e dans le satellite Cependant est plus importante que B pour l intention du r dacteur ce qui distingue les relations de r sultat et de cause 1 5 La concurrence La concurrence n est pas incluse dans la liste des relations de la RST La concurrence est multi nucl ique comme la s quence mais les noyaux sont rel
127. desirable E O est une op ration de base pour le lecteur le lecteur croit que O4 et O2 doivent tre effectu es dans cet ordre le lecteur trouve O trange le lecteur peut mal ex cuter O le lecteur sait que E est un tat d sirable lecteur_sait_equivalents E1 E2 le lecteur sait que F1 et E sont deux tats quivalents lecteur sait verifier E attribut lecteur 0B A V utilisation rare 0B le lecteur sait v rifier l tat E connaissances du lecteur sur l objet OB l objet OB est rarement utilis TABLE 6 26 Pr dicats du mod le du lecteur titre programmer obj enregistrement qual d ih 30 min par une touche incr mentielle op seq r gler obj s lecteur de vitesse de bande dest SP option meilleure qualit d image r gler obj s lecteur de vitesse de bande dest SP op seq s lectionner obj canal 4 influence s lectionner obj op seq appuyer dest touche op seq appuyer dest touche op seq appuyer dest touche op seq enfoncer obj touche canal 4 appuyer dest touche de canal TIMER qual dans un d lai de 9 secondes de canal OTR qual 3 fois OTR qual 1 fois effet PM 10 35 30min enfoncer obj touche OTR qual 1 fois op seq enfoncer obj touche OTR qual 2 fois effet PM 11 05 1 h enfoncer obj touche OTR qual 2 fois op seq enfoncer obj touche effet PM 11 35 1 h 30min OTR qual 3 fois enfoncer obj touche OTR qual 3 fois
128. devraient id alement tre effectu s en m me temps Dans SPIN les d cisions lexicales sont assez simples En effet les concepts et des relations sont g n ralement lexicalis s respectivement par des noms et des verbes sans vides lexicaux Ainsi les d cisions grammaticales sont g n ralement prises avant les d cisions lexicales Seulement en cas de nominalisation d une relation les d cisions Si une c condition contraint une op ration O non communiqu e alors les op rations enfant de Op sont pr sent es dans une m me phrase 118 objet op ration Groupe nominal Expressions de but comme dans les instructions Comment infinitif TABLE 6 28 Formes des titres grammaticales ont droit de regard sur le lexique vitant ainsi un retour arri re lors d un vide lexical 4 1 La r alisation grammaticale Plusieurs travaux en psychologie DFG88 en r daction technique Bin86 et en linguis tique Tho85 ont tudi l effet de diff rentes structures grammaticales dans les instructions cependant encore une fois le travail de Vander Linden VL93b reste le plus complet L tude de Vander Linden ne peut tre utilis e telle quelle car elle porte sur la r alisation grammaticale anglaise De plus son travail ne porte que sur les textes d ex cution cependant les s quences d actions dans les textes hybrides et de compr hension exhibent de nombreuses variations du point de vue grammatical Nous avons donc quelque peu
129. do oun jureijuoo ey uorye1odo oun ied gipuasue syo qo p o einpoooid _ synqri33e uou Classification des l ments s mantiques 90 Dans le cas d options et d op rations ventuelles la syntaxe et la pragmatique nous sont aussi d un grand secours En effet les options pr sentent g n ralement une op ration parent suivie de ses op rations enfants indiquant le but d une op ration tandis que l op ration ventuelle utilise l ordre inverse la cons quence d une op ration De plus l op ration ventuelle consiste g n ralement en une erreur un oublie ou une op ration qui s est ex cut e toute seule sans que l agent n est pu la pr venir Dans le cas d une option l agent est tout fait conscient qu il doit ex cuter la suite d op rations Finalement certains l ments s mantiques ne sont identifiables que par des connaissances pragmatiques de la proc dure elle m me Par exemple comme nous avons vu la section pr c dente la distinction entre influences et effets n est pas d voil e par des indices syntaxiques mais bien en mod lisant la proc dure Dans notre analyse s mantique plusieurs l ments s mantiques semblent quelques fois tre communiqu s par une m me expression Par exemple dans 33 Pour pallier cet inconv nient peindre ces surfaces transparentes avec les couleurs l huile et attendre qu elles s chent il n est pas clair si l expression en italiqu
130. du texte Ces r sultats montrent bien qu avec un mod le du lecteur et une repr sentation de t che appropri s les deux syst mes g n rent des textes quivalents en ce qui concerne le contenu s mantique et la structure rh torique En fait les diff rences entre les deux textes sont e contenu textuel Le contenu des deux recettes sont identiques mais les pr ventions d actions Ne pas les faire brunir et sans la faire bouillir instructions 9 et 15 se retrouvent dans la recette originale et la version de SPIN mais pas dans celle de EPICURE Aussi l instruction 13 EPICURE consid re l op ration 20 comme tant s quentielle tandis que SPIN introduit les op rations co temporelles en m langeant la soupe ajouter la cr me e structure rh torique Tous les choix rh toriques de SPIN EPICURE et du texte original sont identiques Seule ment la phrase en m langeant la soupe ajouter la cr me est pr sent e par une relation de concurrence plut t qu une s quence pour la raison cit e ci haut De facon globale l tape d optimisation de Dale rend le texte plus lisible en fusionnant en une proposition les op rations cons cutives ayant un verbe ou un compl ment d objet direct commun par exemple soak the butter beans drain the butter beans and rinse the butter beans soak drain and rinse the butter beans SPIN n effectue pas cette tape et produit donc un texte plus lourd A priori on aurait pu croire
131. e Jean r veille Marie en allumant soulignent cependant que la g n ration peut tre g n ralis e aux types d actions 3 DHP 94 lignent dant la g n rati t tre g n ralis t d acti 18 g n ration Exemple a 0 Oef causale Julie bouge son bras Julie ferme la porte par convention Julie sort son bras de la fen tre de la Julie signale un virage voiture simple Julie court le 100 m tres en 11 secondes Julie gagne la course par augmentation Julie sort son bras Julie sort son bras de la fen tre de la voiture TABLE 2 1 Types de g n ration de Goldman la lumi re il allume la lumi re en levant l interrupteur il l ve Vinterrupteur en bougeant son bras Plus formellement e une action a g n re une action f ssi a et B sont ex cut es par le m me agent a et B sont ex cut es en m me temps mais ne sont pas co temporelles voir plus loin il existe un ensemble de conditions contextuelles C par exemple l ampoule est viss e tel que la conjonction de a et C implique l occurrence de et si C n tait pas vrai alors l ex cution de o n aurait pas caus f De plus a ne doit pas faire partie d une s quence d instances d actions qui g n re Par contre il peut y avoir g n ration entre toute la s quence S et 5 et si l agent n avait pas ex cut a alors il n aurait pas ex cut f Deux instances d actions sont co temporelles si elles sont ind pendantes et ex c
132. e attribut d objet effet influence op ration co temporelle option pr vention op ration ventuelle op ration s quentielle condition mat rielle attribut d objet effet influence op ration co temporelle option pr vention op ration ventuelle s quence c condition op ration s quentielle condition mat rielle attribut d objet effet influence op ration co temporelle option pr vention op ration ventuelle Relation rh torique laboration but r sultat Relation rh torique laboration but r sultat Relation rh torique laboration but r sultat Relation rh torique laboration but r sultat 156 total mani re concurrence total mani re concurrence 46 total mani re concurrence 83 s quence c condition op ration s quentielle condition mat rielle attribut d objet effet influence op ration co temporelle option pr vention op ration ventuelle souffle s quence c condition 28 op ration s quentielle condition mat rielle attribut d objet effet influence op ration co temporelle option pr vention op ration ventuelle autre peint s quence c condition 30 op ration s quentielle condition mat rielle attribut d objet effet influence op ration co temporelle option pr vention op ration ventuelle recette s quence c condition 94 op ration s quentielle condition mat rie
133. e dans un po lon pour en avoir 1 pouce d paisseur Trempez les anneaux d oignons un par un dans la p te gouttez les un instant Faites les frire dans l huile frire pendant 3 minutes Retournez les une fois pendant la cuisson Gardez les dans un endroit chaud mesure qu ils sont cuits 177 2 2 Finition d un patchwork 2 2 1 Version originale patchwork p 276 Finitions Lorsque tous les morceaux sont assembl s repasser sur l envers Si l endroit a aussi besoin d tre repass enlever les fils de b ti et repassez sans appuyer Retirer ensuite les gabarits de papier et b tir les bords sur l endroit pour maintenir les coutures Repasser de nouveau sur l envers pour effacer les marques des b tis Le repassage est important il facilitera par la suite le lavage et le repassage 2 2 2 Versions de SPIN Texte d ex cution Comment faire les finitions Lorsque les morceaux sont assembl s repassez sur l envers i l endroit a aussi besoin d tre repass enlevez les fils de b ti repassez N appuyez pas Retirez les gabarits de papier B tissez les bords sur l endroit pour maintenir les coutures Repassez de nouveau sur l envers pour effacer les marques des b tis Texte hybride Comment faire les finitions Lorsque les morceaux sont assembl s repassez sur l envers Si l endroit a aussi besoin d tre repass enlevez les fils de b ti repassez Le repassage est important il fac
134. e mots dico pl et un sp cialiste des verbes bescherelle pl SPIN s attarde g n rer des expressions anaphoriques Ce m canisme est essentiel dans les textes d instructions car ces textes introduisent peu de r f rents mais s y r f rent plus souvent que dans d autres genres textuels Pour produire des textes naturels il est donc n cessaire d inclure des expressions r f rentielles Pour faire ceci nous avons implant un sous ensemble des r gles de Tutin Tut92a KTKL93 sur les anaphores grammaticales et lexicales dans les textes d instructions Par exemple dans le texte ver ces r gles ont permis SPIN de g n rer Appuyez sur la touche OTR 3 fois Lorsqu elle est enfonc e 1 fois PM 10 35 30min o le pronom elle fait r f rence l objet touche oTR d j introduite dans le texte SPIN sait produire des pronoms personnels ex la touche OTR elle des r p titions partielles ex la touche OTR la touche et des ellipses de groupes nominaux ex la touche OTR Pour d autres r f rences sur les proc d s r f rentiels voir Dal92 et RD92 126 5 La r alisation motrice Une fois les mots choisis SPIN proc de finalement la r alisation motrice cette tape certains ajustements lisions mises en majuscules sont effectu s puis le texte est mis en page Pour cette derni re tape SPIN s inspire de certains travaux en r daction technique sur la typographie dans les tex
135. e appuyer dest _ qual _ base mettre obj cassette lieu vid o etrange appuyer dest touche OTR qual _ WALLA etats WALLA Ahhh hhh hh hh LULL rA lecteur sait desirable sp cifier obj heure d enregistrement d 1h 30 min VIRTUS hhh hhhh objets 167 IAA hhh connu canal connu agent connu vid o connu s lecteur de vitesse de bande connu canal 4 connu heure d enregistrement connu touche de canal connu C touche OTR connu touche TIMER connu C touche REC utilisation rare touche OTR LEAT end of file AAA hh hhh hh fe dodo tte JAN AA Ahhh hhh hh hhh hth X5 novice nature I ede e dede dudo lodo EA 168 APPENDICE E Textes g n r s par SPIN 1 Textes du corpus d analyse 1 1 Programmation d un enregistrement 1 1 1 Version originale vcr p 16 Programmation d enregistrement par une touche incr mentielle 1 R glez le s lecteur de vitesse de bande sur SP 2 S lectionnez le canal 4 en appuyant sur la touche de canal 3 Appuyez sur la touche OTR pour sp cifier l heure d enregistrement Lorsque la touche est enfonc e une fois PM 10 35 30mn Lorsque la touche est enfonc e deux fois PM 11 05 1 h Lorsque la touche est enfonc e trois fois PM 11 35 1 h 30mn 4 Appuyez sur la touche TIMER dans un d lai de 9 secondes 1 1 2
136. e autre concep nature cooc lecteur but com niquer tuelle de la tache currence municatif i l op ration O sa O est applicable premi re intro tisfait une heu maintenantmais duction de O ristique des options est aussi une r gle dans le texte g n rale l op ration O est O peut facile l effet de la n n gation de O ex cuter ment tre mal gation de O sera ex cut e incluse dans le texte l op ration O sa O peut tre ex tisfait les heu cut e plus tard ristiques des op rations s quentielles TABLE 4 13 Heuristiques de s lection l op ration ventuelle 58 a En tenant le pinceau la verticale dress sur la pointe on obtient des lignes fines b V rifiez le de nouveau lorsque la voiture aura roul L introduction d op rations ventuelles n est influenc e que par la nature de la t che et les cooccurrences d l ments s mantiques En effet 1 Si une op ration facultative satisfait les heuristiques des options mais en plus forme une r gle g n rale non seulement effectuer maintenant mais se rappeler tout au long de la proc dure elle est incluse la premi re fois comme op ration ventuelle C est le cas de l exemple 58a ii S il est facile d ex cuter une op ration obligatoire en faisant une erreur L erreur ven tuelle est alors sp cifi e suivie de son effet Dans ce cas c est la n gation de l op ration effectuer qui est communiqu e comme une op ration
137. e communique une op ration optionnelle si vous voulez pallier ou obligatoire vous devez pallier Dans le premier cas on a affaire une option dans le second cas il s agit d un effet Dans notre analyse de corpus nous avons consid r l l ment s mantique qui nous pa raissait le plus saillant dans le contexte Il serait int ressant cependant de consid rer tous les l ments possiblement communiqu s et v rifier si une combinaison des heuristiques de s lection et de pr sentation est applicable Pour donn un aper u de notre analyse l appendice B pr sente un exemple de texte analys 2 Contraintes des heuristiques Pour s lectionner quels l ments s mantiques doivent tre inclus dans le texte les heu ristiques de s lection se basent sur cinq types de contraintes la structure de la repr sentation conceptuelle les cooccurrences d l ments s mantiques la nature de la t che les connaissances du lecteur et le but communicatif du texte Certains de ces crit res se basent fortement sur la notion d op ration de base c est pourquoi nous tenons d finir ce terme avant de pr senter les contraintes 2 1 Les op rations de base Pour d cider quelles op rations communiquer dans le texte et quelles op rations laisser implicites il semble n cessaire d introduire la notion d op ration de base Informellement les 51 op rations de base sont les op rations les plus g n rales effectu es di
138. e et le mo d le du lecteur sont charg s dynamiquement L organisation des modules est sch matis e aux figures 6 11 et 6 12 Ce syst me prototype a t test sur 9 versions diff rentes de 3 textes du corpus d analyse et sur diff rentes versions de 5 textes d un corpus test Ces r sultats pr sent s l appendice E seront discut s au chapitre 7 Sur une station SPARC 10 la version Quintus interpr t e prend un maximum de 2 secondes pour g n rer ces textes d une dizaine de propositions 99 filtre pl filtreur des connaissances du lecteur dico pl lexique bescherelle pl conjugueur de verbes utilitaires pl pr dicats utilitaires FIGURE 6 12 Modules non hi rarchiques de SPIN Le lancement d une requ te s effectue par le pr dicat principal spin 6 o les arguments sont respectivement 1 l tat du monde d sir 2 l tat du monde actuel 3 le fichier contenant la repr sentation conceptuelle du domaine 4 le fichier contenant le mod le du lecteur 5 le but communicatif du texte et 6 le mode de d verminage allum ou teint Par exemple la requ te spin programm obj enregistrement qual d ih 30 min par une touche incr mentielle dans obj cassette lieu vid o gt Specifications vcr_spec pl Modele Lecteur VCR novice pl execution non g n re un texte d instructions pour programmer un enregistrement supposant que dans l tat courant il y a une cassette dan
139. e la tache Le but communicatif vi 16 16 21 29 31 31 33 34 34 3T 37 39 42 43 43 43 48 50 50 53 54 54 55 55 3 HEURISTIQUES DE S LECTION 3 1 3 2 3 3 3 4 3 5 3 6 3 7 3 8 3 9 Les op rations s quentielles Les attributs d objets Les conditions mat rielles Les effets Les influences Les op rations co temporelles Les options Les pr ventions Les op rations ventuelles 4 R SUM CHAPITRE 5 S lection de la structure rh torique 1 LES RELATIONS RH TORIQUES DANS LES INSTRUCTIONS 1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 La s quence La c condition Le but Le r sultat La concurrence La limite L alternative La s quence num r e La mani re 1 10 L laboration 2 CRITERES DES HEURISTIQUES 2 1 2 2 2 3 2 4 2 5 Le contenu et la structure de la repr sentation s mantique Les cooccurrences de relations rh toriques Les connaissances et intentions du lecteur La nature de la t che Le but communicatif 3 HEURISTIQUES DE PR SENTATION 3 1 3 2 3 3 Les op rations s quentielles Les attributs d objets Les conditions mat rielles vil 56 57 58 59 61 63 66 67 68 69 70 74 74 75 75 75 75 75 76 76 76 TT 77 78 78 80 80 80 80 8l 81 84 85 3 4 3 5 3 6 3 7 3 8 3 9 Les effets Les influences Les op rations co temporelles Les options
140. e lecteur ne sait pas comment programmer un objet X ne sait pas qu il faut avant tout ins rer une cassette dans le vid o mais sait qu en ex cutant correctement l op ration l objet X sera programm sinon il ne le sera pas Finalement l hypoth se iii de Dale ne semble pas non plus justifi e car au fur et mesure que le lecteur lit le texte ses connaissances se d veloppent Le mod le du lecteur est donc une entit dynamique Par exemple apr s avoir mentionn dans le texte l effet d une certaine op ration on peut supposer que le lecteur a appris ce lien causal Dans SPIN le mod le du lecteur est donc mis Jour d s qu un l ment s mantique est s lectionn pour tre communiqu dans le texte Comme le niveau de d tail du plan de la tache est d termin en fonction des connaissances du lecteur id alement ce plan devrait aussi profiter des connaissances acquises lors de la lecture du texte Cependant SPIN ne connait l identit d une nouvelle connaissance du lecteur que lorsque la planification textuelle est abord e et par cons quent une fois que le plan a t d velopp La fa on id ale pour rem dier ce probl me consiste effectuer la planification de t che et la planification textuelle de fa on simultan e Dans SPIN cependant une fa on plus simple mais tout aussi efficace est utilis e En effet le plan de la t che est d velopp en fonction des connaissances initiales du lecteur puis lors de la
141. e m moire et l aide interactive Ici aussi la majorit des conseils donn s se situent aux niveaux linguistique et typographique et quelques uns au niveau structu rel Par exemple pour les textes d instructions Price et Korman PK93 donnent des conseils au niveau de la structure textuelle ex sectionner la proc dure en groupes de 7 2 tapes au niveau de la r alisation linguistique ex viter la forme passive et au niveau de la typographie ex num roter les tapes de la proc dure Ces conseils ont t retenus lors des r alisations linguistique et motrice de SPIN mais ces travaux discutent tr s peu de la s lection du contenu et de la structure discursive 2 Psychologie En psychologie un texte d instructions n est pas restreint aux textes de proc dures mais d signe plut t tout texte d enseignement Un tel texte est donc r dig par un expert et demande au lecteur une compr hension et une m morisation du contenu Ces textes peuvent prendre la forme de livres de cours de manuels de journaux de revues ou de brochures GAB86 11 Nous n avons consid r que les travaux sur des textes d crivant une proc dure Ces travaux peuvent tre classifi s en deux groupes les travaux en r vision de texte et les travaux portant sur la repr sentation conceptuelle de proc dures et sur le contenu structurel de textes d instructions 2 1 R vision textuelle De nombreux travaux en psychologie te
142. e sur la s lection de contenu la s lection de la structure rh torique et peu sur la r alisation grammaticale Pour son tude Vander Linden a effectu une tude de corpus de textes d instructions aussi en utilisant la RST Les relations rh toriques retrouv es le plus fr quemment sont e les s quences d actions ex Faites O4 et Oo e les concurrences d actions ex Faites O4 tout en faisant Oo e les buts ex Pour faire Op faites Oe e les pr conditions ex Dans ce cas faites O e les r sultats ex Faites O ceci se produira Vander Linden a identifi un certain nombre de crit res influengant la forme grammaticale des relations rh toriques leur position dans la phrase et les connecteurs utilis s Par exemple l agent de l op ration la probabilit de v racit d une condition le type d une op ration ou d un r sultat sont tous des facteurs influen ant la r alisation grammaticale De facon g n rale les s quences d actions sont exprim es par des s quences de propositions imp ratives Les buts et les pr conditions sont communiqu s par des propositions avant l action qu elles d crivent tandis que les r sultats sont exprim s par des phrases d claratives apr s l action Le travail de r alisation grammaticale de Vander Linden nous int resse particuli rement et ses observations sur la r alisation anglaise ont t retenues lors de l implantation du module de r alisation linguistique de S
143. e un effet ou une influence consiste relire le texte en liminant l op ration parent 8 Si l instruc tion est interpr t e de la m me fa on alors il s agit d un effet sinon l expression communique une influence On peut aussi tenter de connecter les deux expressions par les locutions de fa on ou de sorte que Si l interpr tation de l instruction est la m me alors il s agit d une influence sinon d un effet Dans les exemples pr c dents la phrase 26 Revissez l crou capuchon sur la lyre est suffisante pour g n rer ne pas perdre tandis que 27 tourner cette touche droite et gauche n est pas suffisante pour minimiser les parasites Aussi 28 Revissez l crou capuchon sur la lyre afin de ne pas le perdre laisse croire qu il faut revisser l crou d une fagon particuli re ce qui n est pas indiqu dans la phrase originale Cependant 29 tourner cette touche droite et gauche afin de minimiser les parasites a une interpr tation quivalente la phrase originale 24 1 Cette m thode semble aussi tre utilis e par Di Eugenio et Webber DE W95 48 Les op rations ventuelles Si l op ration communiqu e n est pas g n r e par une autre op ration communiqu e dans le texte elle peut tre ex cut e au moment de l ex cution du reste de la proc dure ou beaucoup plus tard Dans ce dernier cas l expression communique une op ration ventuelle comme da
144. e verre 2 si l on souhaite une ligne plus large 3 alors s attarder sur le verre 4 de fa on laisser s couler plus de couleur 5 Pour r aliser la ligne tourbillonnante rouge 6 le trainard est id al 7 puisqu il contient assez de couleur pour tracer toute la ligne 8 d faut 9 un pinceau n 1 poils longs fera l affaire 10 En tenant le pinceau la verticale dress sur la pointe 11 on obtient des lignes fines 12 lorsqu on le couche doucement sur le verre 13 la ligne s paissit progressivement 14 2 Analyse textuelle 153 s mantique option op ration s quentielle option op ration s quentielle influence option op ration s quentielle autre non analys e condition mat rielle op ration s quentielle op ration ventuelle effet op ration ventuelle effet ado 4 o 70 1 3 5 6 10 12 11 13 8 10 7 9 expression rh torique but s quence c condition s quence but but s quence autre non analys e c condition s quence mani re r sultat mani re r sultat APPENDICE C R sultats complets de l analyse de corpus 1 Fr quence des l ments s mantiques El ment s mantique influ op r option pr ven co temp tion source attribut effet d objet op r cond s q ence mazda t l auto ver ordi souffle peint recette bouche rotin armoire vin photo lec antique 762 x 0
145. en documentation informatique 2 PSYCHOLOGIE 2 1 R vision textuelle 2 2 Repr sentation conceptuelle et contenu structurel 2 2 1 Le travail de Dixon 2 2 2 Les travaux de Smith et Goodman et de Konoske et Ellis 2 2 3 Le travail de Donin Bracewell Frederiksen et Dillinger ii xvi xvii 10 10 11 12 3 LINGUISTIQUE INFORMATIQUE 3 1 Interpr tation d instructions 3 1 1 L tude de Goldman 3 1 2 L tude de Balkanski 3 1 3 L tude de Di Eugenio 3 2 G n ration d instructions 3 2 1 Syst mes multim dia 3 2 2 Syst mes de g n ration de textes 4 R SUM CHAPITRE 3 Planification d instructions 1 LES TEXTES D INSTRUCTIONS EN TANT QUE GENRE TEXTUEL 2 LA TH ORIE DE STRUCTURE RH TORIQUE RST 2 1 2 2 La RST en tant que th orie descriptive La RST en tant que th orie constructive 2 2 1 Planification enti re par la RST 2 2 2 Organisation textuelle par la RST 3 NOTRE APPROCHE LA PLANIFICATION TEXTUELLE 3 1 Mod le g n ral 3 2 Analyse de corpus 4 R SUM CHAPITRE 4 S lection du contenu 1 ANALYSE S MANTIQUE DES INSTRUCTIONS 1 1 1 2 Les l ments s mantiques Probl mes li s l analyse s mantique 2 CONTRAINTES DES HEURISTIQUES 2 1 2 2 2 3 2 4 2 5 2 6 Les op rations de base Le contenu et la structure de la repr sentation conceptuelle Les cooccurrences d l ments s mantiques Les connaissances et intentions du lecteur La nature d
146. ent influenc e par la langue de communication Kittredge note que l organisation textuelle d un sous langage tech nique est virtuellement identique en fran ais et en anglais Kit82 Cependant Scott et son quipe remarquent que la structure textuelle pr f r e pour exprimer une m me repr sentation s mantique varie d une langue l autre DSH93 Sco93 DHP 94 Par exemple dans 114 a The stepping load can be altered by loosening the locking lever and changing the position of the cylinder foot La charge d appui peut tre modifi e en desserrant le levier et en changeant la position des v rins b Pour modifier la charge d appui desserrer les leviers puis d placer le pied des v rins c Nach Lockern der Klemmhebl kann durch Verschierben des Zylinderfufes die Tret belastung veradert werden Apr s avoir desserr les leviers en poussant les v rins la charge d appui peut tre modifi e ce qui en anglais est pr sent par une relation de mani re by loosening est pr sent en fran ais par un but pour modifier et en allemand par une circonstance Nach Lockern Le niveau rh torique tant le pr d cesseur imm diat du niveau grammatical il n est pas tonnant de retrouver des variations entre les langues Bien que g n ralement les choix rh to riques se ressemblent beaucoup entre langues voisines nos heuristiques de pr sentation devraient tre ajust es pour tre applicables la g
147. ention de type DONT O est une op ration durative O est ex cut e pendant l ex cution de O1 relation temporelle de A1183 Oe est l ensemble des op rations discriminantes et plus importantes pour effectuer Op l op ration O ne doit pas tre ex cut e O est une op ration facile a mal ex cuter O facilite la t che le but de O peut tre faussement d duit O est une op ration floue O ne doit pas tre ex cut e imm diatement O est une op ration habituelle O est une op ration irreversible O est une op ration mentale O est la m thode normale pour atteindre l tat O est une op ration n faste O est une pr vention de type neg TC O est une op ration de pr paration l op ration O est une r gle g n rale O est une op ration optionnelle E est un tat d sirable E est un tat difficile valuer EA est un tat quivalent E E est un tat externe E est un tat interne E est une condition mat rielle E est un tat modifiable E est une option avec probabilit de d sir P E doit tre pr sent de fa on textuelle E sp cifie le type d appareil manipul l tat sera bient t vrai l attribut de l objet OB a la valeur V l attribut justifie l op ration O l objet OB est plus important que l op ration O TABLE 6 25 Pr dicats de la repr sentation de la tache 110 Pr dicats Description base 0 croit ordre 01 02 etrange 0 peut etre mal execute 0 lecteur sait
148. er pour cr er un texte coh rent et naturel Ces heuristiques sont bas es sur des contraintes conceptuelles s mantiques et rh toriques sur la nature de la t che accomplir et sur les connaissances et intentions du lecteur Pour v rifier les r sultats de l tude de corpus le syst me informatique SPIN a t con u Ce syst me effectue toutes les tapes de la g n ration automatique de texte mais l emphase a iv t mise sur la d termination du contenu et de la structure rh torique Les textes g n r s par SPIN ont ainsi t utilis s pour raffiner et valider les heuristiques de s lection et de pr sentation Cette th se a permis d explorer le domaine de la planification textuelle en d finissant les entit s retrouv es au niveau s mantique et au niveau rh torique et les liens entre ces niveaux dans un genre textuel particulier De plus les heuristiques d velopp es ont permis la construc tion du syst me SPIN qui nous l esp rons ouvrira la voie vers la r daction et la mise jour automatique de manuels techniques TABLE DES MATI RES SOMMAIRE LISTE DES FIGURES LISTE DES TABLES TERMINOLOGIE ET NOTATION REMERCIEMENTS CHAPITRE 1 Introduction 1 BUT DE LA TH SE 2 LA G N RATION DE TEXTE 2 1 Applications 2 2 Architecture 3 CONTRIBUTIONS 4 STRUCTURE DE LA TH SE CHAPITRE 2 Travaux ant rieurs et domaines connexes 1 R DACTION TECHNIQUE 1 1 Travaux g n raux 1 2 Travaux
149. es TPour rester fid le leur terminologie nous utilisons ici le terme action plut t que op ration 8 G n ralement tous les agents humains peuvent effectuer les m mes op rations physiques moins d une impossibilit exceptionnelle ex un handicap 53 Nous utiliserons alors le terme op ration de base dans le sens de Pollack et de Rosch La notion de Goldman et de Danto s apparente mieux a la notion d op ration primitive en planification de tache cf le chapitre 6 La notion d op ration de base peut expliquer l introduction de certaines op rations dans les textes d instructions les op rations de base sont incluses dans le texte car les r dacteurs en poss dent une repr sentation mentale facilement accessible Ros78 et car elles facilitent la m morisation du lecteur puisque ceux ci peuvent facilement construire une repr sentation mentale de la proc dure En expliquant les contraintes consid r es par nos heuristiques le role des op rations de base sera mieux d fini Voici maintenant les types de contraintes prises en compte par les heuristiques d introduc tion le contenu et la structure de la repr sentation conceptuelle e les cooccurrences d l ments s mantiques e les connaissances et intentions du lecteur e la nature de la tache e le but communicatif du texte Ces cing types de contraintes ne forment pas une liste exhaustive des crit res influen ant le choix du contenu
150. es textes sont caract ris s par des paragraphes expliquant les tapes suivre Les op rations effectuer demandent plus de jugement et de dext rit de la part de l agent et ne sont pas mises en vidences par des marqueurs typographiques Les proc dures requi rent plus d instruments et utilisent des termes plus sp cialis s On inclut ici les explications structurelles et fonctionnelles de Smith et Goodman e les textes hybrides pouvant satisfaire les deux buts communicatifs pr c dents 4 textes 96 type de longueur des dext rit jugement instruments sp cialisation mise en texte proc dures mots requis requis des termes page ex cution 120 820 moyenne 440 moyen grand grand moyen grand peu moyen hybride 120 255 moyenne 200 peu moyen peu moyen peu moyen moyen compr hension 50 370 moyenne 150 peu moyen peu moyen peu moyen grand TABLE 4 3 Caract ristiques des diff rents types de textes du corpus La table 4 3 r sume les caract ristiques des textes de notre corpus L appendice A 2 en donne les d tails Nous avons ensuite calcul la fr quence des l ments s mantiques dans chacun de ces types de texte Comme le montrent les figures 4 7 et 4 8 pp 72 et 73 le but communicatif semble influencer 3 l ments s mantiques les attributs d objets les effets et les autres l ments tous les trois plus pr sents dans les textes de compr hension Deux l ments s mantiques les
151. es de pr sentation l attribut d objet Heuristiques de pr sentation la condition mat rielle Heuristiques de pr sentation l effet Heuristiques de pr sentation l influence Heuristiques de pr sentation l op ration co temporelle Heuristiques de pr sentation l option Heuristiques de pr sentation la pr vention Heuristiques de pr sentation l op ration ventuelle xiv 18 44 56 58 59 61 63 64 66 67 68 69 70 TT 79 84 85 87 89 91 92 93 93 94 6 25 6 26 6 27 6 28 6 29 6 30 6 31 6 32 6 33 6 34 Pr dicats de la repr sentation de la t che Pr dicats du mod le du lecteur Positions des satellites par rapport leur noyau Formes des titres Formes des actions Formes des c conditions Formes des buts Formes des r sultats Formes des mani res Formes des concurrences XV 109 110 115 118 120 120 121 122 123 124 XVI TERMINOLOGIE ET NOTATION op ration action ssi RST O ou O Op Oz E OB SYST ME code citation anglais exemple en italique exemple en italique expression acte physique aux niveaux conceptuels et s mantiques acte physique aux niveaux rh toriques et linguistiques si et seulement si Rhetorical Structure Theory op ration op ration parent op ration enfant tat objet les petites capitales indiquent les syst mes informatiques la police courrier est utilis e pour les entr es les s
152. es experts diff rent d opinion sur ce qui constitue une bonne fa on de r diger par exemple certains experts pr f rent r p ter l information essentielle alors que d autres pr f rent viter les redondances certains n expliquent pas les ph nom nes en d tail mais d autres vitent d tre trop brefs de peur de n tre pas assez clairs e Les experts semblent se fier des trucs relevant presque de la superstition pour r diger des textes de bonne qualit Les travaux en strat gies expertes de r vision ne semblant pas offrir des conseils judicieux pour la r daction automatique d instructions cette m thode d acquisition de connaissance n a donc pas t suivie dans notre projet voir Kla63 pour une revue des travaux 12 2 2 Repr sentation conceptuelle et contenu structurel Certains chercheurs en psychologie se sont pench s sur la repr sentation mentale d instruc tions construite par le lecteur ou utilis e par le r dacteur 2 2 1 Le travail de Dixon Un travail tr s important en psychologie est celui de Dixon sur les textes d instructions ou directives proc durales Dans Dix87a DFG88 Dixon propose qu un lecteur interpr te des instructions en construi sant une repr sentation mentale ou un plan pour effectuer la t che d crite Ces plans sont organis s en une hi rarchie o chaque n ud correspond une op ration repr sent e par un sch ma Le sommet de la hi rarchie indique
153. es instructions 7 et 8 contiennent les m mes op rations s quentielles L effet and the plug will be working n est pas communiqu par SPIN car il s agit du but de la proc dure le lecteur peut donc deviner qu en effectuant la proc dure son but sera atteint e structure rh torique Du point de vue rh torique les deux versions pr sentent les m mes l ments s man tiques par les m mes relations rh toriques En fait les op rations s quentielles sont toujours pr sent es par des s quences d actions 1Le format de ces textes a t modifi pour pouvoir num roter les instructions Version de Mellish in order for you to get the plug to be working you must have installed the new fuse in order for you to install the new fuse the cover must be off and the fuse holder must be empty remove the cover and remove the old fuse then the fuse holder will be empty install the new fuse however now the cover is nott on install the cover then plug the plug in and the plug will be working Traduction pour faire en sorte que la prise de courant fonctionne vous devez avoir install le nouveau fusible pour faire en sorte que vous installiez le fusible le cou vercle doit tre t et la bo te du fusible doit tre vide enlever le couvercle et enle ver l ancien fusible ensuite la bo te du fusible sera vide installez le nouveau fusible cependant maintenant le cou vercle n est pas mis
154. es on Instructional Text The Psychology of Learning and Motivation 25 53 70 1990 D Carcagno Text generation in industry the technological transfer is still to come Dans Expert Systems Conference Avignon 1992 Table ronde Automatic text generation A tool for the business world J Corter M Gluck et G Bower Basic Levels in Hierarchically Structured Categories Dans Proceedings of the 10 Annual Conference of the Cognitive Science Society pages 118 124 Montr al ao t 1988 K Dahlgren Naive Semantics for Natural Language Understanding Kluwer Academic Publishers 1988 K Dahlgren Coherence Relation Assignment Dans Proceedings of the 1 Annual Conference of The Cognitive Science Society pages 588 596 Michigan ao t 1989 yeh Dal88 Dal89a Dal89b Dal92 Dan63 Dan65 Dan73 Dan85 DBFD92 DE92 DE93a DE93b DEW92 DEW95 DFGS8 DH93 DHP 94 Dix87al Dix87b DSH93 182 R Dale Generating Referring Expressions in a Domain of Objects and Pro cesses Th se de doctorat University of Edinburgh 1988 R Dale Cooking up Referring Expressions Proceeding of the 27 Annual Mee ting of the Association for Computational Linguistics juin 1989 R Dale Generating Recipes An Overview of Epicure Extended Abstracts of the Second European Natural Language Generation Workshop avril 1989 R Dale Generating Referring Expressions Constructing Descriptions in a Do
155. es textes naturels hors du corpus d analyse 2 EVALUATION DU PROJET 2 1 2 2 Points forts 2 1 1 La distinction entre le contenu et la structure rh torique 2 1 2 Un syst me motiv linguistiquement 2 1 3 Un syst me complet Points faibles 2 2 1 Les structures s mantiques et rh toriques de SPIN 2 2 2 La longueur des textes 3 R SUM CHAPITRE 8 Conclusion 1 AVENUES DE RECHERCHE 1 1 1 2 1 3 Extensions l implantation Extensions au mod le th orique 1 2 1 Les r p titions et les alternatives 1 2 2 Une repr sentation conceptuelle de la t che plus labor e 1 2 3 La s lection de contenu comme question non binaire 1 2 4 L influence du domaine de discours Extensions g n rales 1 3 1 L application des heuristiques d autres langues 1 3 2 L application des heuristiques d autres genres textuels 125 126 126 127 127 127 129 133 137 137 140 141 143 143 144 144 145 2 1 3 3 Validation par des m thodes psychologiques DISCUSSION ET MOTIVATION APPENDICE A Corpus 1 3 BIBLIOGRAPHIE 1 1 Corpus d analyse 1 1 1 Textes d ex cution 1 1 2 Textes hybrides 1 1 3 Textes de compr hension 1 2 Corpus test CARACT RISTIQUES DES TYPES DE TEXTES R F RENCE DES EXEMPLES APPENDICE B Exemple d analyse de corpus 1 2 TEXTE SOURCE ANALYSE TEXTUELLE APPENDICE C R sultats complets de l analyse de corpus 1
156. est enfonc e 1 fois PM 10 35 30min Lorsqu elle est enfonc e 2 fois PM 11 05 1 h Lorsqu elle est enfonc e 3 fois PM 11 35 1 h 30min Appuyer sur la touche TIMER dans un d lai de 9 secondes Lecteur moyen texte de compr hension Programmation d un enregistrement d ih 30 min par une touche incr mentielle Il ne faut pas appuyer sur la touche REC Pour une meilleure qualit d image r glez le s lecteur de vitesse de bande sur SP Le s lecteur est gauche de l appareil S lectionnez le canal 4 en appuyant sur la touche de canal Appuyez sur la touche OTR 3 fois pour sp cifier l heure d enregistrement d ih 30 min Lorsque la touche est enfonc e 1 fois PM 10 35 30min Lorsqu elle est enfonc e 2 fois PM 11 05 1 h Lorsqu elle est enfonc e 3 fois PM 11 35 1 h 30min Appuyez sur la touche TIMER dans un d lai de 9 secondes 171 Lecteur expert texte d ex cution Programmation d un enregistrement d ih 30 min par une touche incr mentielle Pour une meilleure qualit d image r gler le s lecteur de vitesse de bande sur SP S lectionner le canal 4 Appuyer sur la touche OTR 3 fois Appuyer sur la touche TIMER dans un d lai de 9 secondes Lecteur expert texte hybride Programmation d un enregistrement d ih 30 min par une touche incr mentielle Pour une meilleure qualit d image r gler le s lecteur de vitesse de bande sur SP S lectionner le canal 4 Appuyer sur la touche
157. est une op ration O est une r gle c condition ventuelle g n rale ou mani re O est une op ration O est une erreur de c condition ventuelle l agent TABLE 5 24 Heuristiques de pr sentation l op ration ventuelle 95 a Si vous s lectionnez un num ro de canal qui n est pas dans la capacit de ce poste de TV le poste s lectionnera automatiquement le canal m moris le plus inf rieur b En tenant le pinceau la verticale dress sur la pointe on obtient des lignes fines lorsqu on le couche doucement sur le verre la ligne s paissit progressi vement e une mani re 27 96 comme dans 96 En tenant le pinceau la verticale dress sur la pointe on obtient des lignes fines lorsqu on le couche doucement sur le verre la ligne s paissit progressivement Pour pr senter une op ration ventuelle le choix ne d pend que de la repr sentation s mantique et de la nature de la t che 1 La c condition et la mani re se chargent toutes deux des op rations ventuelles qui expriment des r gles g n rales Ces deux relations semblent interchangeables mais si l op ration ne doit pas tre ex cut e imm diatement alors la c condition est pr f r e car elle permet de mieux exprimer les notions temporelles Par exemple dans 95b et 96 on retrouve deux r gles g n rales pr sent es par les deux relations rh toriques ii La c condition est toujours utilis e si l op ration indique une err
158. et les modifieurs free adjuncts peuvent mettre en jeu une surcharge pragmatique Plus pr cis ment 3 KL95 discute de ces 2 l ments s mantiques 47 la surcharge pragmatique joue deux r les elle communique explicitement la relation de contribution R g n ration permission ou une combinaison de ces relations entre a et B et implicitement elle contraint l interpr tation de a ou de R Par exemple dans 25 a Tenir la tasse sous le bec verseur pour la remplir de caf b Tenir la tasse sous le robinet pour la laver Il existe une relation de permission entre tenir la tasse a et la remplir 8 et entre te nir la tasse a et la laver 8 Cependant dans 25a le lecteur d duit des contraintes suppl mentaires sur son comportement En effet il d duit de que la tasse doit tre en position verticale avec sa concavit vers le haut Dans le cas de 25b 8 n influence pas l interpr tation de o L analyse Di Eugenio et Webber porte sur la relation de contribution tandis que la n tre ne porte que sur la g n ration L influence peut donc tre vue comme un cas particulier de la surcharge pragmatique et l effet comme un cas particulier de non surcharge lorsque R g n ration Dans notre exemple 24 le lecteur inf re de l information suppl mentaire de minimiser les parasites 8 pour bien ex cuter tourner cette touche droite et gauche a Une m thode simple pour d terminer si une expression communiqu
159. eur de l agent C est le cas dans 95a La table 5 24 r sume ces heuristiques de pr sentation 4 R sum Dans ce chapitre nous avons discut de la s lection de la structure rh torique comment choisir la relation rh torique la plus appropri e pour pr senter un l ment s mantique Les 7 re lations rh toriques retrouv es dans les textes d instructions fran ais ont t pr sent es il s agit de la s quence la c condition l laboration le but la mani re le r sultat et la concurrence En suite nous avons identifi les 4 types de contraintes influen ant leur utilisation des contraintes 95 s mantiques des cooccurrences de relations rh toriques les connaissances et intentions du lec teur et la nature de la t che Nous avons aussi d montr que malgr son influence sur le choix des l ments s mantiques le but communicatif ne change pas le choix des relations rh toriques Finalement les heuristiques de pr sentation ont t pr sent es en d tail pour chaque l ment s mantique Au prochain chapitre nous verrons comment les heuristiques de s lection du chapitre 4 et les heuristiques de pr sentation de ce chapitre ont t implant es dans le syst me SPIN pour g n rer des textes d instructions CHAPITRE 6 Implantation le syst me SPIN Jusqu a pr sent cette th se a analys la question de planification de textes d instructions d un point de vue th orique Ce chapitre
160. eur novice texte de compr hension Pour cr er la premi re bulle Avant que le verre ne devienne trop froid on souffle la bulle en soufflant l air dans la canne puis en l emprisonnant En tenant la canne horizontalement ou l g rement inclin e vers le sol envoyez un jet d air rapide Glissez le pouce sur l embout pour emprisonner l air Lecteur moyen texte d ex cution Comment cr er la premi re bulle Avant que le verre ne devienne trop froid soufflez la bulle En tenant la canne horizontalement ou l g rement inclin e vers le sol envoyez un jet d air rapide Emprisonnez l air en glissant le pouce sur l embout Lecteur moyen texte hybride Comment cr er la premi re bulle Avant que le verre ne devienne trop froid on souffle la bulle En tenant la canne horizontalement ou l g rement inclin e vers le sol un jet d air rapide est envoy Il faut emprisonner l air en glissant le pouce sur l embout Lecteur moyen texte de compr hension Pour cr er la premi re bulle Avant que le verre ne devienne trop froid soufflez la bulle En tenant la canne horizontalement ou l g rement inclin e vers le sol envoyez un jet d air rapide L air est emprisonn en glissant le pouce sur l embout Lecteur expert texte d ex cution Pour cr er la premi re bulle Avant que le verre ne devienne trop froid soufflez la bulle En tenant la canne horizontalement ou l g rement inclin e vers le sol envoyez un jet d air
161. exte naturel est une condition suffisante mais pas n cessaire pour valider une th orie Comme l illustre la figure 7 22 les checs dits faibles ne devraient pas tre consid r s des erreurs car m me si r dacteur humain a s lectionn une autre forme linguistique ils font tout de m me partie de l espace de solutions acceptables En fait ces autres formes t moignent de la richesse et de la flexibilit de la langue naturelle notre avis la fronti re entre checs faibles et checs forts doit plut t d marquer la fronti re entre r sultats corrects et r sultats incorrects Nous consid rons alors que l valuation d une th orie en g n ration de texte ne peut tre effectu e par une comparaison mot mot entre textes naturels et textes g n r s automatiquement valuation aveugle Une seconde m thode d valuation consiste donner des sujets un ensemble de textes naturels et un ensemble de textes g n r s automatiquement et leur de mander de les classifier selon des crit res d valuation pr cis comme le contenu informationnel du texte l adaptation du texte au niveau de connaissance du lecteur la compr hensibilit et la coh rence g n rales du texte En particulier pour les textes d instructions il serait int ressant de demander aux sujets d ex cuter la t che prescrite On valuerait alors la qualit des textes g n r s en comparant les erreurs d ex cution de la proc dure le temps de lecture
162. f ves Eplucher et hacher l oignon Eplucher et hacher la pomme de terre Gratter et hacher les carottes Trancher le c leri Faire fondre le beurre Ajouter les l gumes Les faire revenir Ajouter les f ves le bouillon et le lait Faire mijoter Liqu fier la soupe Ajouter la cr me tout en m langeant Ajouter les assaisonnements R chauffer 134 Version de SPIN Comment faire la soupe aux f ves Tremper les f ves Les goutter Les rincer plucher l oignon Le hacher plucher la pomme de terre La hacher Gratter les carottes Les hacher Trancher le c leri Faire fondre le beurre Ajouter les l gumes Les faire revenir Ne pas les faire brunir Ajouter les f ves le bouillon et le lait Faire mijoter Liqu fier la soupe En la m langeant ajouter la cr me Ajouter les assaisonnements R chauffer la soupe Ne pas la faire bouillir FIGURE 7 25 Soupe aux f ves versions de EPICURE et de SPIN textes sources Cette comparaison a t effectu e avec 3 textes une recette de cuisine recette un texte d utilisation d un lecteur de disques audio num riques JVC et un texte de couture patchwork Ces textes et d autres textes g n r s par SPIN sont pr sent s l appendice E Nous pr sentons ici le texte d utilisation du lecteur de disques audio num riques appel par la suite jvc La version originale du texte de disque audio num riques et la version de S
163. ference on Computational Linguistics COLING 92 volume IT pages 763 769 Nantes ao t 1992 K Vander Linden The Expression of Local Rhetorical Relations in Instructio nal Text Dans Proceedings of the 30 Annual Meeting of the Association for Computational Linguistics ACL 92 pages 318 320 University of Delaware juin 1992 K Vander Linden Rhetorical Relations in Instructional Text eneration Dans O Rambow diteur Proceedings of the ACL Workshop on Intentionality and Structure in Discourse Relations pages 140 143 Ohio State University juin 1993 K Vander Linden Speaking of Actions Choosing Rhetorical Status and Gram matical From in Instructional Text Generation Th se de doctorat University of Colorado 1993 K Vander Linden Generating Precondition Expressions in Instructional Text Dans Proceedings of the 32 Annual Meeting of the Association for Computa tional Linguistics ACL 94 pages 42 49 Las Cruces New Mexico juin 1994 K Vander Linden S Cumminget J Martin The Expression of Local Rhetorical Relations in Instructional Text Rapport technique CU CS 585 92 University of Colorado 1992 K Vander Linden S Cumming et J Martin Using System Networks to Build Rhetorical Structures Dans R Dale E Hovy D Rosner et O Stock diteurs Aspects of Automated Natural Language Generation Lecture Notes in Artificial Intelligence pages 183 198 Springler Verlag 1992 K Vander Linden et J Martin Exp
164. ffectuer cette tape 1 Les op rations autonomes Certaines op rations duratives ne demandent pas l agent d tre toujours actif L agent d clenche les op rations puis celles ci s effectuent de facon autonome Entre temps l agent est libre d effectuer d autres op rations tem porellement ind pendantes C est le cas par exemple de laisser ti dir dans 97 4 Faire fondre le chocolat dans le caf feu tr s lent Retirer du feu ajouter le rhum et le sel Laisser ti dir 5 Pendant ce temps ajouter au m lange les ufs le beurre Lorsqu une op ration est autonome elle est g n ralement cit e dans le texte avant ses op rations temporellement ind pendantes de facon minimiser le temps d ex cution de la proc dure 2 Les contraintes de style G n ralement dans les textes d instructions et en par ticulier dans les textes d assemblage il est normal de sp cifier la pr paration des instruments avant de pr senter le coeur de la proc dure Dans le cas des recettes de cuisine Tutin remarque que la pr paration des ingr dients est g n ralement pr sent es avant la cuisson du plat et son service Tut92a Cette strat gie permet de d composer 5TI nous semble plus naturel de consid rer un plan la fois par un parcours en largeur cependant dans un parcours en profondeur ce probl me n aurait pas lieu 113 titre programmer obj enregistrement qual d ih 30 min par une touche incr mentielle
165. fich PM 11 35 th 30min sera affich Inclure seulement les op rations enfants comme dans 34b serait inutile car le lecteur sait d j qu il doit les effectuer D un autre c t inclure seulement les diff rents tats en les associant une seule op ration parent comme dans 34c ne se retrouve pas non plus L inclusion des op rations enfants et l inclusion des effets semblent donc dans ce cas tre co d pendentes Consid rer les cooccurrences d l ments s mantiques permet ainsi de produire des textes coh rents et naturels 2 4 Les connaissances et intentions du lecteur Les connaissances et intentions du lecteur forment un crit re important en g n ration de texte car il permet de produire un texte mieux adapt au lecteur voir par exemple Par91 Par93 et PR94 En effet en consid rant ses connaissances et intentions on peut ainsi donner 55 au lecteur de l information qu il ne conna t pas omettre si possible ce qu il sait d j et corriger ses connaissances erron es Les connaissances et intentions du lecteur peuvent tre d finies par un mod le du lecteur Ce modele est une entit dynamique influenc e par le contexte textuel pr c dent En effet au fur et mesure que le lecteur lit le texte ses connaissances voluent La notion d op ration de base est fortement utilis e par ce type de contrainte 2 5 La nature de la t che La nature de la t che d finit des caract ristiques su
166. generique VIRTUS hhh h hhh hh hhh hh operations NN h hhh hhh hhh hhh hhh hhh hh hhh hh ensemble_discriminant 0 0 optionel r gler obj s lecteur de vitesse de bande dest SP dont appuyer dest touche REC LALLA etats LATVIA ALAA ALLAN EN Ahhh option meilleure qualit d image probable desirable r gler obj s lecteur de vitesse de bande dest SP desirable meilleure qualit d image interne 1 mission sera enregistr e jusqu l heure sp cifi e interne sp cifier obj heure d enregistrement d 1h 30 min interne changer obj canal externe PM 11 05 1 h externe PM 11 35 1 h 30min externe PM 10 35 30min vrai bientot enfoncer obj touche OTR qual 1 fois vrai bientot enfoncer obj touche OTR qual 2 fois vrai bientot enfoncer obj touche OTR qual 3 fois A PII tote te objets RARE ALAA bh end of file LT hhh 2 Mod le du lecteur novice RE Mode Prolog YU UT X4 novice pl Modele d un lecteur novice V5 Author Leila Kosseim Created On Thu Jan 12 14 35 46 1995 X Last Modified By Leila Kosseim Last Modified On Wed Feb 1 11 05 22 1995 VIRTUS T tole te tole te tote to tote lo lute late lolol te lol to late le tole tole toto oto tote lo late lolol Lolo te lol totale to edu to lo ola ola lola lo
167. gent Par exemple le type d action ternuer A n est pas de base car normalement aucun agent G ne peut ternuer de fa on volontaire la premi re contrainte n est donc pas satisfaite Aussi voir double n est pas non plus un type d action de base car dans des conditions normales l agent doit utiliser ses connaissances de cause effet pour savoir par exemple que s il appuie sur ses yeux 1l verra double la seconde contrainte n est donc pas satisfaite Les types d action de base incluent des actions physiques de tr s bas niveau comme bouger son bras bouger son doigt ou plier son genou car m me s il existe certains m canismes biologiques qui entraine le lever d un bras dans des conditions normales l agent n est pas paralys ou handicap tout agent peut volontairement exemplariser ce type d action premi re contrainte sans en connaitre les m canismes biologiques sous jacents seconde contrainte Toute instance d action est soit une instance d action de base soit une instance d action reli e une instance d action de base La relation la plus importante entre deux instances d action est la g n ration Par exemple Jean bouge son bras est une instance d action de base qui g n re l instance d action Jean l ve l interrupteur qui son tour g n re l instance d action Jean allume la lumi re qui son tour g n re Jean r veille Marie Intuitivement la g n ration de Goldman est souvent reli e la locution en Par exempl
168. h torique Noyau Relation rh torique Satellite Noyau par exemple action s lectionner obj canal 4 maniere appuyer dest touche de canal s lectionner obj canal 4 Les textes g n r s par SPIN sont assez courts c est pourquoi une liste lin aire est suffi sante Cependant pour des textes plus longs il serait n cessaire de construire une structure arborescente comme dans la th orie de la RST 115 Relation rh torique c condition laboration but r sultat mani re TABLE 6 27 Positions des satellites par rapport leur noyau 3 4 La structuration rh torique Une fois les relations rh toriques s lectionn es cette liste doit tre structur e pour e r soudre les contraintes de cooccurrence de relations rh toriques e positionner les satellites des relations rh toriques par rapport leur noyau e ajouter la ponctuation 3 4 1 La r solution des contraintes de cooccurrence Une fois toutes les relations rh toriques s lectionn es les contraintes de cooccurrences sont r solues tout comme lors de la structuration s mantique cf la section 3 2 2 3 4 2 Le positionnement des satellites Plusieurs travaux ont tudi l effet du positionnement d expressions dans les textes d ins tructions par exemple Tho85 DFG88 et VL93b En effet les phrases 98 a Pour faire Op faites Oe b Faites Oe pour faire Op ne sont pas utilis es de fa on interchangeable En effet
169. he la planification textuelle Consid rant l approche prise dans les travaux ant rieurs nous avons choisi d utiliser la RST en tant qu outil descriptif pour analyser un corpus de textes et en tant qu outil constructif dans la s lection de la structure textuelle En ce qui concerne la planification du contenu comme nous travaillons sur des textes d instructions nous suivons l approche de Mellish Dale et de Vander Linden en utilisant un planificateur de t che cf le chapitre 6 3 1 Mod le g n ral Dans cette th se nous consid rons la g n ration de textes d instructions comme un pro cessus de choix entre diff rents niveaux de repr sentations Cette approche est illustr e la figure 3 5 Choix I partir d une repr sentation conceptuelle du domaine par exemple une bi blioth que de sch mas d op rations non instanci s un processus de planification s lectionne lie et instancie ces connaissances en une repr sentation conceptuelle de la proc dure d crire c est l tape I de la figure 3 5 Dans les travaux ant rieurs cette tape est g n ralement effec tu e par un planificateur de tache Cette technique est en accord avec les r sultats des tudes psychologiques qui indiquent que la repr sentation conceptuelle d une proc dure poss de une structure hi rarchique et contient des sch mas d op rations instanci s 38 Choix II partir de la repr sentation conceptuelle de la pr
170. huile p n trante est mise Lecteur expert texte de compr hension Desserrage des crous de la roue Il faut d visser les crous avec une cl en croix Si les crous sont difficiles d visser vous mettez un peu d huile p n trante 2 Textes du corpus test 2 1 Friture d oignons 2 1 1 Version originale recette p 360 Oignons frits dans la pate a cr pes liste d ingr dients 1 Trancher les oignons en morceaux d 1 3 de pouce d paisseur D faire en anneaux 2 M langer la farine cr pes avec l oeuf l huile salade et le consomm ou l eau 3 Faire chauffer assez d huile dans un po lon pour en avoir 1 pouce d paisseur 4 rempez les anneaux d oignons un par un dans la p te Les goutter un instant et les faire frire dans l huile pendant 3 minutes Retournez les une fois pendant la cuisson Garder dans un endroit chaud mesure qu ils sont cuits 175 2 1 2 Versions de SPIN Lecteur novice texte d ex cution Friture des oignons dans la p te cr pes Tranchez les oignons en morceaux d 1 3 de pouce d paisseur D faites les en anneaux M langez la farine cr pes l oeuf l huile salade et le consomm Faites chauffer assez d huile frire dans un po lon pour en avoir 1 pouce d paisseur Trempez les anneaux d oignons un par un dans la p te gouttez les un instant Faites les frire dans l huile frire pendant 3 minutes Retournez
171. i s par une relation de co temporalit Par exemple Exemple hors corpus tir de RS9 76 63 En tenant la canne horizontalement ou l g rement inclin e vers le sol on y envoie un jet d air rapide 1 6 La limite La limite est form e d un noyau qui pr sente une op ration et un satellite qui pr sente une condition d arr t pour le noyau Rosner et Stede pr cisent que la condition d arr t doit tre facilement observable Comme dans 64 Remplissez le radiateur avec du nouveau liquide de transmission jusqu la jauge Dans notre corpus cette relation est tr s peu fr quente En effet on ne retrouve que 16 relations de limite 1 96 du corpus Pour les op rations ponctuelles la limite est reli e au pro bl me de r p tition que nous n avons pas tudi et pour les op rations duratives l introduction des limites n cessite une repr sentation conceptuelle bien plus d taill e que des sch mas d op rations utilis s dans ce projet Roc92 Pour ces raisons notre analyse de corpus a inclus les expressions de limite dans les expressions de leur noyau En d autres termes les expressions de limite n ont pas t consid r es directement Par exemple dans 65 R p ter ce geste jusqu ce que la personne rejette le corps tranger ou perde conscience toute l expression en italique a t consid r e comme une op ration s quentielle pr sent e dans une s quence d actions 1 7 L alternative
172. ications La production 148 automatique assure ainsi la consistance entre la documentation et l appareil ce qui ne peut tre garanti avec une r daction manuelle La conformit aux standards de r daction G n ralement les documents techniques doivent se soumettre des standards de r daction grammaticaux lexicaux et typographiques Manuellement ces standards sont difficiles satisfaire car ils ne sont pas naturels mais 1ls sont d autant plus faciles satisfaire automatiquement Nous croyons que des syst mes de r daction technique automatique ou d assistance la r daction seront un jour r alit Cette recherche n a certainement pas d velopp un syst me de r daction de manuels d instructions compl tement automatique Cependant nous osons esp rer qu il y contribuera APPENDICE A Corpus 1 Bibliographie 1 1 Corpus d analyse 1 1 1 Textes d ex cution armoire J Crochemore Meubles utiles construire 3 Lits Commodes Armoires Eyrolles Paris 1989 auto Shell Guide d intervention ENTRETIEN AUTOMOBILE Shell Canada Limited bouche S lection du Reader s Digest Solutions pratiques 4000 probl mes quotidiens S lection du Reader s Digest Montr al 1989 lect Shell Guide d intervention URGENCES EN LECTRICIT Shell Canada Limited recette J Benoit La Nouvelle Encyclop die De La Cuisine Les Messageries du Saint Laurent Montr al dition deluxe 1974 t l Toshiba
173. icats rh toriques pour repr senter la structure st r otypique de textes McK85 Par91 Les relations de discours qui repr sentent la structure textuelle par un arbre de relations entre expressions linguistiques adjacentes Parmi les tudes qui suivent cette approche on retrouve les relations de coh rence de Hobbs Hob79 Hob82 Hob85 Hob90 et de Dahlgren Dah88 Dah89 et la th orie de structure rh torique Rheto rical Structure Theory ou RST de Mann et Thompson MT88 Les instructions sont caract ris es par des relations claires et st r otyp es entre les ex pressions linguistiques L approche par relations de discours pour l analyse de ces textes est donc tr s appropri e Dans notre tude cette analyse a t effectu e par la RST En effet certaines tudes par exemple RS92 VL93b ont d j utilis cette th orie dans le contexte de la g n ration et de l analyse d instructions Ces tudes d montrent ainsi l applicabilit de la RST dans ce genre discursif et nous offrent des points de d part et de comparaison tr s int ressants La RST est d ailleurs une th orie bien connue analys e et g n ralement accept e en linguistique informatique Pour de plus amples discussions sur cette th orie voir par exemple Hov90b Hov93 MH93 MP92 en soulignent cependant certaines limites Voyons maintenant en quoi consiste la RST et comment elle peut tre utilis e dans le cadre de la planification de texte 3
174. ifier l heure d enregistrement d 1h 30 min et appuyer sur la touche TIMER dans un d lai de 9 secondes e les postconditions de succ s les modifications ajouts et retraits l tat courant du monde si l op ration est correctement ex cut e par exemple ajouter que X sera programm e les postconditions d chec les modifications ajouts et retraits l tat courant du monde si l op ration n est pas correctement ex cut e par exemple ajouter que X ne sera pas programm Comme on peut le constater la syntaxe des sch mas est bas e sur la logique de pr dicats de plus les variables permettent de g n raliser les op rations et par unification les adapter un cas particulier rappelons du chapitre 2 que l utilisation de variables dans les sch mas d op rations est motiv e psychologiquement Lorsque des sch mas d op rations sont utilis s comme source pour la planification de t che puis pour la planification de texte le texte g n r est assez d pendant de la structure et du contenu des sch mas Cependant les sch mas d op rations ne sont pas universels tous les agents plusieurs facteurs peuvent influencer leur d veloppement La disponibilit lexicale de la langue utilis e par exemple peut influencer le d coupage d op rations Aussi ind pendamment de la langue utilis e une m me t che peut tre mod lis e de diff rentes fa ons avec plus ou moins de d tails une structure diverse M
175. ilis e dans le cas de conditions mat rielles modifiables qui ne sont pas reli s l op ration par une permission C est le cas de 78 En effet Vander Linden remarque que les conditions qui sp cifient un tat modifiable un tat que l agent doit v rifier ou faire en sorte qu il devienne vrai sont pr sent es par une s quence VL93b C est ce qu il appelle la promotion rh torique Ce ph nom ne semble s appliquer aussi bien en francais que dans l tude de Vander Linden iii Un but ou une c condition avec ellipse du verbe sont utilis s lorsque la condition ma t rielle indique un type d appareil syst me par exemple 76 Dans ce cas la condition mat rielle est aussi souvent pr sent e par les deux relations iv Dans tous les autres cas les conditions mat rielles sont pr sent es par une c condition comme dans 75 Ces heuristiques sont r sum es la table 5 18 3 4 Les effets Comme l indique la table 5 15 p 79 un effet peut tre pr sent par e un r sultat 68 96 comme dans les exemples 80a et 80b 80 a Brancher le cordon d alimentation du magn toscope dans une prise secteur 120V et appuyer sur l interrupteur POWER Le voyant POWER s allume et l horloge commence clignoter b Engagez le levier de vitesse rapidement dans chacune des positions cela fait circuler le liquide de transmission 11 DHP 94 notent qu en anglais un effet peut tre pr sent par une s quence
176. ilitera par la suite le lavage et le repassage Vous n appuyez pas Retirez les gabarits de papier B tissez les bords sur l endroit pour maintenir les coutures Repassez de nouveau sur l envers pour effacer les marques des b tis Texte de compr hension Pour faire les finitions Lorsque les morceaux sont assembl s repassez sur l envers Le repassage est important il facilitera par la suite le lavage et le repassage Si l endroit a aussi besoin d tre repass enlevez les fils de b ti repassez On n appuye pas Retirez les gabarits de papier B tissez les bords sur l endroit pour maintenir les coutures Repassez de nouveau sur l envers pour effacer les marques des b tis 2 3 Utilisation d un lecteur de disques audio num riques 2 3 1 Version originale JVC p 10 Pour placer couter et arr ter un CD 1 Appuyer sur OPEN CLOSE 2 Mettre un CD face imprim e vers le haut sur le plateau 3 Pour couter le CD appuyer sur Lecture pause et ajuster le volume Le plateau CD se ferme automatiquement L affichage indique la plage reproduite et la dur e coul e depuis le d but 4 Pour arr ter le CD appuyer sur CLEAR la reprise de la lecture du CD celle ci commence partir de la plage 1 5 Pour mettre l appareil en mode de pause appuyer sur Lecture pause pendant que le CD est reproduit en appuyant de nouveau sur Lecture pause le CD commence l o il a t laiss 6 Pour retirer le CD appuyer sur OPE
177. ines relations rh toriques semblent co d pendentes tandis que certaines combinaisons ne se retrouvent jamais Par exemple si deux conditions mat rielles quivalentes sont communiquer alors la plus facile v rifier est pr sent e par une c condition tandis que l autre est pr sent e par un r sultat D un autre c t pour pr senter une influence entre op rations co temporelles on n utilisera jamais une s quence reli e par une relation de mani re une concurrence comme l illustre l exemple 68a Dans ces cas on pr f rera un but reli une concurrence comme dans 68b 68 a Faites A en faisant A tout en faisant As b Pour faire Aj faites Ay tout en faisant Aa 2 3 Les connaissances et intentions du lecteur Lors de la pr sentation des l ments s mantiques les connaissances et intentions du lecteur sont aussi consid rer Par exemple pour pr senter une option une c condition ou un but sont disponibles comme dans 69 a Si l on souhaite une ligne plus large alors s attarder sur le verre de fa on laisser s couler plus de couleur b Pour obtenir une ligne plus large alors s attarder sur le verre de fagon laisser s couler plus de couleur On pr f re cependant une c condition pour les lecteurs novices car la nature optionnelle y est plus explicite 69a D un autre cot le but 69b ne pr sente pas la nature optionnelle aussi explicitement et est par cons quent plus appr
178. inuer la proc dure C est le cas dans l exemple 41a ii Si le lecteur ne peut comprendre pourquoi une ligne d op rations doit tre effectu e dans le contexte courant de la proc dure dans ce cas un effet est introduit simplement pour satisfaire la curiosit du lecteur Par exemple dans 41b le lecteur inexp riment peut tr s bien se demander pourquoi pour v rifier le niveau de liquide de transmission d une voiture il faut la faire rouler pendant 20 minutes iii Si le lecteur peut supposer un effet incorrect l effet correct est introduit pour rectifier ses connaissances Les fausses suppositions du lecteur peuvent tre faites partir de ses connaissances initiales du domaine ou de la mention pr c dente d un effet dans la proc dure Par exemple dans 43 Appuyer sur TV VCR Le voyant s allume Si l interrupteur d alimentation est en position ON le s lecteur TV VCR doit tre mis en position TV et le voyant reste teint le premier effet enseigne au lecteur l tat engendr si on appuie sur TV VCR Cependant cette instruction suppose sans le mentionner que l interrupteur est en position OFF dans ce cas appuyer une fois sur le bouton TV VCR met l appareil en position VCR Le lecteur peut donc croire tort que chaque fois qu il appuie sur ce bouton le voyant s allume Le second effet a donc t introduit pour corriger cette supposition Dans ces 3 situations le but communicatif du texte influence l
179. ion Language and Behavior Dans Proceedings of the International Joint Conference on Artificial Intelligence IJCAI 93 volume 2 Chambery France 1993 E Smith et L Goodman Understanding instructions The role of explanatory material Bolt Beranek amp Newman Cambridge Massachusetts 1982 A Tate Project Planning using a Hierarchical Non linear Planner Dissertation abstracts international report 25 University of Edinburgh 1976 L Timbal Duclaux La communication crite scientifique et technique ESF Entreprise Moderne d dition Paris 1990 Tho21 Tho77 Tho85 Tut92a Tut92b VL92 VL93a VL93b VL94 VLCM92a VLCM92b VLM95 WAF 93 Wal89 Wei9 1 ZL91 187 E L Thorndike The Teacher s Word Book Columbia University Teacher s College New York 1921 H Thompson Strategy and Tactics A Model for Language Production Papers from the Thirteenth Regional Meeting Chicago Linguistic Society 13 651 668 avril 1977 S A Thompson Grammar and written discourse Initial vs final purpose clauses in English Text 5 1 2 55 84 1985 A Tutin Etude des anaphores grammaticales et lericales pour la g n ration automatique de textes de proc dures Th se de doctorat D partement de lin guistique et philologie Universit de Montr al 1992 A Tutin Lexical choice in context generating procedural texts Dans Pro ceedings of the 15 International Con
180. ironnement le plus probable et quelques fois en s inspirant de la forme de surface En effet certains traits sont facilement d ductibles directement de la forme de surface Par exemple la polarit d une op ration est indiqu e par la polarit de l expression ex ne pas faire et la s mantique du verbe employ ex viter Aussi l ex cution imm diate future d une op ration se d duit g n ralement du temps du verbe employ La majorit des l ments s mantiques s identifient cependant par la forme de surface ainsi que par des connaissances pragmatiques li es proc dure elle m me C est le cas de la distinction entre effets et conditions mat rielles Les conditions mat rielles sont habituellement pr c d es d expressions comme s ou lorsque ce qui n est pas le cas pour les effets Aussi en ex cutant l instruction mentalement ou physiquement on peut distinguer les tats g n r s par une op ration de ceux qui la contraignent rod 7 09 JU LINIUOD orypetgdo o uonpgur o1njuj uorjnooxo o onjuo9A9 uorjexodo uor do PIEIP2ULUIE Uorjnooxo SUOT oe p sod o1juo uolyedguas suorjoe p so ue sur o1 uo uolyedguas ayxe up uorjedodo oun red 9919ugg uou ayxe up uorjediodo o1jne oun ced 9919u98 pre 49 I oarye y noey aarptsod uoryusagad aAtJeSou FIGURE 4 6 o 9rzoyeur uorjrpuoo uorjedo
181. is PM 10 35 30 min sera affich Lorsque la touche est enfonc e deux fois PM 11 05 1h sera affich Les heuristiques de pr sentation sont fonction de tous les types de contraintes de la re pr sentation s mantique des cooccurrences des connaissances du lecteur et de la nature de la tache i On utilise une c condition dans 3 cas distincts a Le lecteur croit que deux op rations s quentielles O4 et O gt doivent tre ex cut es dans un certain ordre mais en r alit elles doivent tre ex cut es dans l ordre inverse C est le cas dans 72a o le retrait de la lyre et le d gagement de la douille sont dans le cas g n ral ex cuter dans cet ordre comme indiqu par les titres des proc dures mais dans le cas pr sent les m mes op rations doivent tre ex cut es dans l ordre inverse Dans ce cas une des op rations est pr sent e par une s quence et l autre par une c condition Ici l utilisation d une c condition permet de mettre en valeur l ordre temporel des op rations Un r sultat ou une s quence d actions suivra une op ration s quentielle O dans le texte et l agent de O n est pas n cessairement l agent du reste de la proc dure Dans ce cas la c condition permet simplement d indiquer que O doit tre faite mais sans pr ciser qui doit la faire 9 est un ensemble d op rations s quentielles enfants d une op ration s quentielle Op Op sera incluse dans le texte
182. is ne fait que modifier les connaissances du lecteur Les 8 autres l ments s mantiques sont proc duraux Les effets et les conditions mat rielles Les l ments proc duraux peuvent com muniquer un tat ou une op ration La distinction entre un tat et une op ration est une question d licate Dans son travail VL93b Vander Linden consid re tout l ment au niveau s mantique comme tant une op ration Il ne prend pas avantage de la distinction d j faite au niveau de la planification de t che entre un tat et une op ration Vander Linden ne consi d re Jamais un l ment comme un tat mais recherche toujours l op ration qui l a entrain Bien que tout tat soit engendr par une op ration non seulement 1l n est pas toujours possible de d terminer comment un tat a t atteint mais une telle op ration peut tre sans aucune valeur dans le contexte de la proc dure Par exemple la v rification du niveau d huile d une automobile diff re s il s agit d une traction avant En planification de t che une op ration est une fonction entre deux tats 45 ou d une traction arri re Ici on ne peut d terminer l op ration qui a engendr le type de traction le propri taire a achet une traction avant le concessionnaire la lui a vendue le fabricant l a construite De plus m me si cette op ration pouvait tre d termin e elle ne serait d aucun secours lors de la r daction de la pro
183. isation en compl ment ex for desk installation iv la pr position for suivie d un g rondif comme compl ment ex for charging the batte ries Ces formes grammaticales n ont pas toutes une correspondance en fran ais En effet dans notre tude les buts peuvent tre exprim s par i la forme infinitive qui correspond la forme i anglaise ii la pr position pour suivie d une m tonymie de but correspondant la forme ii iii une proposition subordonn e circonstancielle de but avec verbe au subjonctif ex pour que la syntonisation soit pr cise Les formes retrouv es dans le corpus sont pr sent es la table 6 31 Notons qu en fran ais aucune nominalisation ni g rondif formes iii et 1v n est utilis en revanche la subordonn e infinitive forme 1 est nettement plus utilis e qu en anglais et le fran ais utilise des proposi tions subordonn es circonstancielles forme iii 122 Pr sent E se produit Futur E se produira Devrait infinitif E devrait se produire Doit infinitif E doit se produire autres TABLE 6 32 Formes des r sultats Les r gles d velopp es par Vander Linden semblent assez bien s appliquer au fran ais c est pourquoi SPIN s en inspire fortement Si le but s applique plusieurs actions la forme 1 est toujours choisie La m tonymie de but forme ii semble aussi suivre les m mes r gles que l anglais elle est utilis e lorsque l objet est
184. isation et la sortie ordonne les constituants syntaxiques et choisit les mots utiliser Cette derni re tape est responsable d introduire des pronoms suivant le mod le de Dale Dal88 En ce qui concerne le choix du contenu et de la structure rh torique il faut retenir que 27 e Le but de ce travail est d expliquer des plans et non de g n rer des textes d instructions Malheureusement les textes g n r s sont peu naturels car Toutes les op rations et toutes les relations hi rarchiques sont pr sent es alors que dans les textes naturels certaines informations sont laiss es implicites Tout comme dans EPICURE aucun r sultat condition ou imp ratif n gatif n est inclus dans le texte e Les strat gies rh toriques de Mellish ne sont pas motiv es linguistiquement Les op rations sont g n ralement reli es par une relation de s quence et les relations hi rar chiques sont toujours pr sent es par un but Comme nous verrons au chapitre 5 ces strat gies sont une simplification des ph nom nes que l on retrouve dans des textes naturels De plus les strat gies rh toriques forwards backwards et lump sont bas es sur la structure du plan et non sur des ph nom nes linguistiques Tout comme pour le travail de Dale notre approche utilise une repr sentation conceptuelle plus d taill e permettant ainsi de g n rer des r sultats des imp ratifs n gatifs etc Nous comparerons le syst
185. istique informatique 1 R daction technique l inverse de la r daction cr ative la r daction technique pr sente des faits donne des instructions et interpr te de l information La r daction technique fait r f rence la conception la mise jour et l utilisation de documentation d appareils ou syst mes RML95 dans le but d informer ou d instruire le lecteur Bin86 TD90 Voyons un peu les travaux g n raux en r daction technique puis en documentation infor matique application de plus en plus r pandue 1 1 Travaux g n raux D apr s Pus89 la documentation technique est g n ralement consid r e mauvaise et dif ficile utiliser par les lecteurs principalement parce que les r dacteurs connaissent peu l or ganisation textuelle que les lecteurs pr f rent En effet la majorit des travaux g n raux en r daction technique d finissent des principes sur la r alisation linguistique par exemple viter l utilisation de mots longs ou la mode de trop de mots de pas assez de mots de verbes flous de la forme passive de la troisi me personne Wei91 et les choix typographiques Les travaux de ce domaine ne sont pas directement utilisables dans notre projet car les conseils donn s ne guident pas le r dacteur sur le contenu textuel et sont souvent contradictoires flous ou subjectifs Toutefois certains chercheurs proposent des principes de r daction guidant non seulement la r alisation lingui
186. ito pour un environnement de travail tr s trop amical et pour les vendredis gateaux Un gros merci Nicolas Anquetil le co administrateur du laboratoire pour les nombreuses consultations techniques Je profite aussi de l occasion pour remercier mes parents qui ne m ont jamais permis d arr ter Merci ma m re pour l utilisation de son bureau Enfin merci Massimo pour sa patience ses encouragements ses conseils techniques et surtout pour m avoir support toutes ces ann es XVIII Massimo CHAPITRE 1 Introduction 1 But de la th se Lorsqu un agent communique il doit d abord d terminer ce qu il va dire puis comment il va le pr senter Bien que de nombreux travaux en g n ration de texte se soient pench s sur la planification textuelle peu ont directement trait de ces questions fondamentales Dans cette th se nous tentons de r pondre explicitement ces deux questions e Quelle information doit tre communiqu e dans le texte et quelle information doit tre laiss e implicite Par exemple dans la phrase 1 Appuyer sur la touche de r glage de canal CHANNEL SET pour r gler le canal de r ception Le r dacteur a choisi de sp cifier deux op rations bien qu une seule aurait t suffisante pour ex cuter correctement l instruction Par exemple 2 Appuyer sur la touche de r glage de canal CHANNEL SET ou 3 R gler le canal de r ception e Comment structurer l information pour
187. justifi e Nous ne sommes pas convaincue qu une telle distinction existe du point de vue rh torique Le fait de pr senter une op ration par une s quence dans un paragraphe ou une s quence dans une num ration est nous croyons une question de r alisation motrice et ne devrait pas donner lieu une nouvelle relation rh torique 1 9 La mani re La mani re n est pas directement consid r e par Vander Linden En effet il ne distingue pas entre la mani re et le but Pour lui les deux propositions 67 a Faites Op en faisant Oe b Pour faire Op faites Oe pr sentent la relation hi rarchique entre O et Oe de la m me fa on D apr s Mann et Thompson MT88 dans la relation de mani re 67a en comprenant le satellite en faisant Oe le lecteur augmente son habilet d effectuer l op ration du noyau Op tandis que dans la relation de but 67b le satellite pour faire O pr sente une situation r aliser par l ex cution de l op ration du noyau Oe Nous distinguons alors comme Mann et Thompson entre la mani re et le but 1 10 L laboration L laboration n est pas une relation proc durale mais pr sente des d tails additionnels sur le noyau Par exemple le noyau peut pr senter un ensemble et le satellite un membre particulier ou le noyau peut pr senter un tout et le satellite une partie Dans les textes d instructions le noyau pr sente g n ralement un objet et le satellite un attribut de l
188. l cran Dans ce cas l effet lui m me vous pouvez voir est pr sent dans une s quence d action et l op ration qui l engendre observer lui est reli e par une mani re Le choix entre un but un r sultat et une mani re ne semble pas d pendre de cooccurrences de relations rh toriques mais plut t des autres types de contraintes En effet consid rons les exemples suivants 83 a Pour teindre la radio tournez le bouton VOLUME compl tement gauche Eteignez la radio en tournant le bouton VOLUME compl tement gauche b 0 020 1 Exemples hors corpus Tournez le bouton VOLUME compl tement gauche la radio s teindra Pour teindre la radio teignez le moteur de la voiture Q teignez la radio en teignant le moteur de la voiture teignez le moteur de la voiture la radio s teindra 88 84 a Pour allumer le t moin Caps Lock momentan ment enfoncez et relachez la touche Caps Lock b Allumer le t moin Caps Lock momentan ment en enfon ant et en rel chant la touche Caps Lock c Enfoncez et relachez la touche Caps Lock le t moin Caps Lock s allumera momen tan ment d Pour allumer le t moin Caps Lock momentan ment lancez le gestionnaire de fen tres X e Allumer le t moin Caps Lock momentan ment en lan ant le gestionnaire de fe n tres X f Lancez le gestionnaire de fen tres x le t moin Caps Lock s allumera momentan ment Ces exe
189. l op ration ne doit pas tre ex cut e imm diatement alors la c condition semble pr f r e Comme l op ration appuyer de nouveau sur Lecture pause ne doit pas tre effectu e imm diatement SPIN a pr f r la pr senter par une c condition En appliquant les heuristiques sur des textes hors du corpus d analyse SPIN a pu g n rer un texte assez naturel et comparable au texte source Ce test a t effectu sur d autres textes hors du corpus cf appendice E 2 Ainsi nous sommes assez confiante de la validit de nos heuristiques 2 valuation du projet 2 1 Points forts Parmi les points forts de notre travail citons TL expression le CD se commence est bien s r incorrecte Cette erreur est due aux approximations faites au niveau grammatical 138 2 1 1 La distinction entre le contenu et la structure rh torique Le point fort le plus important de notre travail est que le mod le th orique individualise les deux questions importantes en planification textuelle En effet le niveau s mantique quoi dire et le niveau rh torique comment l organiser sont consid r s s par ment tout en tant reli s de fa on plusieurs plusieurs Dans les approches pr c dentes la distinction entre ces deux niveaux n est g n ralement pas faite Par exemple en utilisant la RST ou les sch mas rh toriques de McKeown McK85 pour effectuer la planification textuelle enti re les questions s mantiques et rh to
190. l agent effectuera la ligne d op ration sp cifi e Une mani re est utilis e si le lecteur ne peut deviner que l effet est d sirable et si l op ration qui engendre l effet est la m thode normale Cependant dans cette situation un r sultat est toujours disponible Comme on ne retrouve que 4 de mani re dans notre corpus mais 68 96 de r sultat 1l semble pr f rable d utiliser cette derni re relation Ces heuristiques sont r capitul es la table 5 19 3 5 Les influences L influence est un peu sp ciale car il s agit plut t d une relation et non d un l ment s mantique L influence existe entre deux ensembles d op rations une op ration parent et une ou plusieurs op rations enfants En contraste avec les autres l ments s mantiques le noyau de la relation rh torique utilis e n est pas fixe il d pend de la relation rh torique choisie L influence peut tre pr sent e par e une relation de mani re 69 96 comme dans les exemples 85a 85b et 85c dans ce cas le noyau est constitu de l op ration parent 85 a La paraison est centr e soit en utilisant le marbre soit en la roulant dans une forme creus e dans du bois appel e mailloche b Avec un tournevis plat grattez la salet accumul e sur le contact c R gler la ceinture en la tirant par la languette 90 e une relation de but 31 96 voir les exemples 86a 86b et 86c dans ce cas le noyau est form des op rations e
191. la forme 98b ne sera pas utilis e si O est une op ration optionnelle mais la forme 98a est toute indiqu e Pour pr senter des instructions correctement il est donc n cessaire d ordonner le satellite et le noyau des relations rh toriques de fa on correcte Parmi les travaux sur ce sujet celui de Vander Linden est de loin le plus complet c est pourquoi les d cisions prises par SPIN sont fortement bas es sur ses observations D apr s notre corpus la position des satellites d une relation rh torique par rapport 4 son noyau semble la m me en anglais et en fran ais Les observations de notre corpus sont illustr es la table 6 27 Seules les relations de c condition laboration but r sultat et mani re sont pr sent es les autres relations tant multi nucl iques ne sont pas concern es par le positionnement des sa tellites La c condition Les r gles de Vander Linden pour le positionnement des c conditions sont assez complexes Cependant en anglais comme en frangais les c conditions sont g n ralement plac es avant le noyau 90 96 versus 11 96 Dans le syst me SPIN les c conditions sont alors 116 toujours positionn es avant leur noyau sauf en cas de r trogradation rh torique Par exemple dans Appuyez sur la touche OTR 3 fois Lorsqu elle est enfonc e 1 fois PM 10 35 30min la relation de c condition a pour satellite Lorsqu elle est enfonc e 1 fois et pour noyau Appuyez sur la touche OTR
192. la structure rh torique des textes d instructions Pour une comparaison plus stricte nous avons repris les exemples utilis s par ces chercheurs et les avons fait g n rer par SPIN Les textes de SPIN sont comparables ou mieux que ceux g n r s par les autres syst mes Nous sommes consciente que ces comparaisons ne portent que sur un exemple par syst me mais seuls ces exemples taient disponibles De plus faire g n rer un texte du r pertoire de SPIN ou un texte hors corpus par EPICURE et le syst me de Mellish nous semble inappropri vis vis de ces travaux 1 2 1 Le syst me de Mellish Pour comparer notre approche celle de Mellish nous avons repris son exemple de fusible comment faire fonctionner une prise de courant dont le fusible est d fectueux Les sch mas d op rations et la repr sentation conceptuelle de la t che de Mellish nous sont disponibles ainsi assurant que l entr e donn e aux deux syst mes sont identiques 130 Modification l entr e de Mellish En fait l entr e de Mellish a t prise presque telle quelle trois modifications mineures ont t apport es i La syntaxe des sch mas d op ration de Mellish a t modifi e pour adapter celle de SPIN ii Un mod le du lecteur et la nature de la t che ont t d finis de fa on ce que le texte g n r se rapproche le plus de celui de Mellish iii Comme la planification de tache de Mellish se base sur la n gation par
193. lanification textuelle par le domaine de discours Il serait tr s int ressant de v rifier si effectivement le domaine de discours influence la planification textuelle ou bien si ces variations peuvent tre expliqu es uniquement par le but communicatif 1 3 Extensions g n rales 1 3 1 L application des heuristiques d autres langues Plus la g n ration de discours descend du niveau conceptuel vers le niveau linguistique plus la langue de transmission influence les d cisions prendre En effet la repr sentation conceptuelle du discours est par d finition ind pendante de la langue de transmission cependant l intonation la mise en page le choix des mots et des structures grammaticales d pendent fortement de la langue Qu en est t il alors du contenu s mantique et de la structure rh torique du discours prime abord il semblerait que le contenu textuel soit ind pendant de la langue de transmission En effet dans les manuels techniques le domaine de discours et le contenu ont pr c dence sur le style textuel Cependant Hervey et Higgins HH92 consid rent les manuels d instructions comme un genre de texte publicitaire fortement orient vers le consommateur C est pourquoi ils notent que dans certains manuels le contenu s mantique des textes dans diff rentes langues n est pas le m me Ils citent en particulier le manuel d une Renault 5 o la version fran aise et anglaise ne d crivent pas les m me
194. late 4 charge les schemas et la nature de la tache consult novice nature p1l consult novice schemas pl LUE ART LR LRU V4 novice pl end of file RL PII IBI III loll IUIUS hhh hhh Ahhh hhh 165 166 2 1 Sch mas d op rations UN UUR Mode Prolog 4 AUALA novice_schema pl modele de l usager pour VCR Author Leila Kosseim 4 Created On Tue Aug 18 11 14 23 1992 4 Last Modified By Leila Kosseim 4 Last Modified On Tue Feb 7 10 02 21 1995 RE Ahhh hhh VIII III IRIS hhh hhh hhh hh e e hh hht hhh hh hhh hhh hhh hhh hhh declarations pour que quintus ne se plaigne pas si le predicat n est pas defini LR hhh hhh dynamic lecteur 1 AALALA A hhh UII IUIS hth h hht UII itt hilt hit schemas d operations III III hh I Ie d d dee e bh lo le ld e edu te tell luo lode ede e lecteur enfoncer obj _ qual _ precond corps succes echec lecteur appuyer dest touche OTR qual 3 fois precond corps enfoncer obj touche OTR qual 1 fois enfoncer obj touche OTR qual 2 fois enfoncer obj touche OTR qual 3 fois succes echec lecteur appuyer dest touche TIMER qual precond corps succes echec lecteur appuyer dest touche de canal precond corps succes chang obj canal
195. les connaissances et intentions du lecteur la nature de la proc dure et le but communicatif du texte En se basant sur ces contraintes nous avons d ve lopp des heuristiques d introduction g rant l inclusion d l ments s mantiques dans le texte et des heuristiques de pr sentation g rant le choix des relations rh toriques Ces heuristiques ont t implant s dans le syst me informatique SPIN qui a servi a valider la th orie 1 Avenues de recherche Cette th se ne s est pench e que sur certains aspects particuliers de la planification de textes d instructions Plusieurs questions n ont pas t abord es et de nombreuses extensions seraient 144 possibles Nous avons divis ces questions en trois cat gories les extensions l implantation les extensions au mod le th orique et les extensions g n rales de la th se 1 1 Extensions l implantation SPIN n est qu un syst me prototype Parmi les extensions possibles citons l implantation de structures s mantiques et rh toriques arborescentes au niveau du planificateur de texte et l extension des autres modules la greffe d un planificateur de t che plus standard d un module de r alisation grammaticale plus vari e et mieux motiv e et d un module de r alisation motrice permettant une mise en page plus labor e 1 2 Extensions au mod le th orique 1 2 1 Les r p titions et les alternatives Les ph nom nes de r p titions et d alter
196. les une fois pendant la cuisson Gardez les dans un endroit chaud 4 mesure qu ils sont cuits Lecteur novice texte hybride Friture des oignons dans la p te cr pes Tranchez les oignons en morceaux d 1 3 de pouce d paisseur D faites les en anneaux M langez la farine cr pes l oeuf l huile salade et le consomm Faites chauffer assez d huile frire dans un po lon pour en avoir 1 pouce d paisseur Trempez les anneaux d oignons un par un dans la p te gouttez les un instant Faites les frire dans l huile frire pendant 3 minutes Retournez les une fois pendant la cuisson Gardez les dans un endroit chaud mesure qu ils sont cuits Lecteur novice texte de compr hension Friture des oignons dans la p te cr pes Trancher les oignons en morceaux d 1 3 de pouce d paisseur Les d faire en anneaux M langer la farine cr pes l oeuf l huile salade et le consomm Faire chauffer assez d huile frire dans un po lon pour en avoir 1 pouce d paisseur Tremper les anneaux d oignons un par un dans la p te Les goutter un instant Les faire frire dans l huile frire pendant 3 minutes Les retourner une fois pendant la cuisson Les garder dans un endroit chaud mesure qu ils sont cuits Lecteur moyen texte d ex cution Friture des oignons dans la p te cr pes Pr parez les oignons en les tranchant en morceaux d 1 3 de pouce d paisseur puis en les d faisant en anneaux M
197. lle attribut d objet effet influence op ration co temporelle option pr vention op ration ventuelle Relation rh torique laboration but r sultat Relation rh torique laboration but r sultat Relation rh torique laboration but r sultat Relation rh torique laboration but r sultat 157 total mani re concurrence total mani re concurrence 28 total mani re concurrence total mani re concurrence 94 bouche Relation rh torique s quence c condition laboration but r sultat op ration s quentielle condition mat rielle attribut d objet effet influence op ration co temporelle option pr vention op ration ventuelle rotin Relation rh torique s quence c condition laboration but r sultat op ration s quentielle condition mat rielle attribut d objet effet influence op ration co temporelle option pr vention op ration ventuelle Relation rh torique laboration but r sultat op ration s quentielle condition mat rielle attribut d objet effet influence op ration co temporelle option pr vention op ration ventuelle Relation rh torique laboration but r sultat op ration s quentielle condition mat rielle attribut d objet effet influence op ration co temporelle option pr vention op ration ventuelle mani re mani re mani re mani re concurrence concurrence concurrence concu
198. m ne que l on tudie en d l guant les probl mes difficiles un autre module Nous vitons ainsi de supposer que le module pr c dent procurera au planificateur de texte toute l information dont il a besoin et que le module suivant s accommodera de l information que le planificateur produira Comme l illustre la figure 6 10 SPIN poss de une architecture lin aire Dans cette figure les rectangles indiquent les processus et les rectangles arrondis les bases de connaissances Les planification de texte realisation linguistique requ te initiale V planification de t che lec css cnet J Y repr sentation conceptuelle de la t che 9T repr sentation conceptuelle du domaine selection des elements semantiques l ments s mantiques y structuration semantique structure s mantique selection des relations rhetoriques relations rh toriques structuration semantique schemas nature de as d operations la t che x As M M N 7 n y 3 12 mod le du lecteur E schemas nature de d operations la t che structure rh torique selection de la structure grammaticale V structure grammaticale V realisation lexico morphologique E lec cu aes Bescherelle V texte non formatt V realisation motrice
199. me de Mellish au n tre de fa on plus d taill e au chapitre 7 TECHDOC de R sner et Stede Dans le cadre du projet TECHDOC Rosner et Stede ont analys l applicabilit de la RST la production multilingue de manuels d automobiles pour construire un syst me de g n ration multilingue RS92 RS94 PR94 Rosner et Stede utilisent aussi la RST de fa on constructive L aspect le plus int ressant de leur projet est l ensemble de nouvelles relations rh toriques qu ils d veloppent pour l analyse des textes d instructions Ils d finissent les relations de e pr condition aussi d finie par VL93b qui est une combinaison de la circonstance et de la condition ex Dans ce cas faites O e limite until ex Faites O jusqu ce que E arrive e alternative ex E est vrai ou Es est vrai e s quence num r e step sequence qu ils distinguent de la s quence standard non num r e ex 1 Faites O4 2 Faites Os 3 Faites Os 28 Ces nouvelles relations nous ont t tr s utiles lors de l analyse de corpus Le chapitre 5 discute de leur utilisation dans notre projet IMAGENE de Vander Linden Le travail de Vander Linden VL92 VLCM92a VLCM92b VL93a VL93b VL94 nous int resse particuli rement car nos deux travaux se compl tent bien Vander Linden a travaill un peu sur la structure rh torique et intensivement sur sa r alisation grammaticale De notre cot nous nous sommes attard
200. me fonctionne et quelles sont les relations de cause et d effet de la tache Ces textes pr sentent un ph nom ne dynamique Smith et Goodman ont v rifi l hypoth se qu un texte d instructions est mieux interpr t et donc ex cut si le texte inclut de l information de plus haut niveau et est organis hi rarchi quement Ils ont test leur hypoth se avec un texte d assemblage de circuit lectrique de chacun des genres ci haut Les r sultats de leur exp rience indiquent que e Les sujets interpr tent plus facilement les explications structurelles et fonctionnelles que les explications lin aires Il semble donc que l information hi rarchique facilite le d veloppement de repr sentations mentales et l int gration de l information dans ces repr sentations ce qui corrobore les r sultats de Dixon Dix87a DFG88 15 e Les sujets ayant de l information structurelle et fonctionnelle font moins d erreurs d ex cution En effet l information hi rarchique indique comment ex cuter les tapes ce qui vite des instructions vagues et r duit les risques d erreurs Dixon Dix87b aussi re Dj m marque que l information organisationnelle r duit les risques d erreurs e Les sujets ayant de l information fonctionnelle ex cutent l assemblage mieux que ceux qui se basent sur une explication lin aire ou structurelle La recherche de Smith et Goodman n a pas directement influenc notre projet mais elle nou
201. mples d montrent qu un but ne peut tre utilis pour pr senter un effet non externe que si l agent d sire atteindre l effet c est le cas dans 83a En effet un but laisse implicitement l agent le choix d ex cuter ou non la prochaine ligne d op rations L utilisation de cette relation n est donc ad quate que si l agent reconnait l effet comme tant d sirable et choisira lui m me d ex cuter la prochaine ligne d op rations Cependant un r sultat et une mani re obligent le lecteur ex cuter l op ration qui engendre l effet Ces relations peuvent donc tre utilis es m me si l effet n est pas d sir par le lecteur c est le cas de 83b et 83c Aussi le but et la mani re communiquent que l op ration qui suit est la m thode normale pour atteindre l effet c est pour cela que les exemples 83e et 83d semblent inad quats tandis que le r sultat dans 83f semble tout fait correct Lorsqu il s agit d une r action de l appareil c est dire d un effet externe l appareil et directement engendr par un autre agent que l agent principal de la t che les relations de but de r sultat et de mani re s interpr tent de la m me fa on que s il s agissait d effets non externes Cependant une r action n est habituellement pas d sir e par l agent par exemple dans 84 en temps normal l agent ne d sire pas allumer le t moin CAPS Lock Habituellement le t moin CAPS LOCK n est qu un effet secondaire sans importa
202. mporelles Certaines op rations doivent tre ex cut es imm diatement mais de fa on simultan e Par exemple 52 En moyenne 3 des l ments s mantiques du corpus communiquent des op rations co effleurer la surface du verre tout en le faisant tourner temporelles Pour introduire cet l ments s mantique on se base sur les heuristiques des op rations s quentielles En effet comme l indique la table 4 10 67 contrainte commu autre conceptuelle nature cooc lecteur but com niquer de la t che currence municatif les heuristiques Oj et O2 sont O1 et O5 desop rationss co temporelles quentielles s ap pliquent sur une paire d op rations effectuer O1 et O2 TABLE 4 10 Heuristiques de s lection l op ration co temporelle i Les op rations co temporelles sont introduites sous les m mes conditions que les op rations s quentielles cf section 3 1 mais en plus la repr sentation conceptuelle de la t che doit t moigner de leur co temporalit 3 7 Les options Certaines expressions dans les textes d instructions expriment une option de l usager Une option indique une op ration et ventuellement ses op rations enfants qui n est pas n cessaire la proc dure mais qui peut tre ex cut e si l agent le d sire Par exemple 53 a Si Von souhaite une ligne plus large alors s attarder sur le verre de fa on laisser s couler plus de
203. n retrouve e l architecture int gr e de Appelt App85 qui consid re la planification textuelle et la r alisation linguistique au m me niveau e l architecture entrelac e Hov90a o il existe une communication bidirectionnelle entre les modules strat gique et tactique e la g n ration incr mentielle par exemple KH82 Kem87 DSK91 Rei92 qui initie la r alisation linguistique d une partie du discours imm diatement apr s sa planification et non apr s que toute la repr sentation s mantique ait t construite Dans ce mo d le diff rentes tapes de la production de texte sont effectu es en parall le de fa on pipeline en utilisant ce terme dans sa d finition informatique traditionnelle Pour les raisons num r es plus haut dans cette th se comme dans la majorit des sys t mes de g n ration nous avons opt pour une architecture s quentielle 6Le terme pipeline signifie ici un cheminement lin aire et non que la r alisation linguistique d un l ment de discours n s effectue en m me temps que la planification textuelle de l l ment n 1 Zoc92 pr sente une synth se des syst mes de g n ration de texte d velopp s jusqu en 1992 8 Pourtant Rei94 pense que l approche s quentielle serait plus proche du syst me de la production humaine de la langue que d autres architectures moins modulaires 3 Contributions Notre recherche apporte plusieurs contributions e Du point de vue ling
204. natives n ont pas t abord s dans cette th se Bien que ces ph nom nes soient fr quents dans les textes d instructions ils requi rent une repr senta tion conceptuelle qui ne s adapte pas facilement une hi rarchie de plans Pour les r p titions un genre de boucle au niveau des plans est n cessaire voir par exemple l approche adopt e par le syst me NOAH Sac77 et les alternatives requi rent des liens de disjonctions entre noeuds d un m me plan Pour une analyse de ces ph nom nes dans les textes d instructions se r f rer Kar88 et Roc92 1 2 2 Une repr sentation conceptuelle de la t che plus labor e Dans notre mod le la repr sentation conceptuelle de la t che est une hi rarchie de plans Cette repr sentation bas e sur des r sultats en psychologie Dix87a BVDGH90 indique les op rations effectuer dans la proc dure mais ne repr sente pas les op rations ne pas effectuer Pour g n rer des imp ratifs n gatifs notre approche se base alors sur un modele de l usager et la nature de la t che Une repr sentation conceptuelle bas e sur la trace du planificateur de t che indiquerait non seulement quoi faire et quoi ne pas faire mais aussi pourquoi ne pas faire certaines op rations 1 2 3 La s lection de contenu comme question non binaire Cette th se a abord la question de s lection de contenu comme question binaire un l ment s mantique est communiqu ou laiss implicite
205. nce Dans ce cas les relations de but et de mani re ne sont g n ralement pas pr f r e car elle mettent en vidence l importance de cet effet De ces observations les r gles suivantes peuvent tre formul es i Un r sultat est toujours utilis s il s agit d une r action de l appareil car l effet est g n ralement un effet secondaire non d sirable c est le cas dans 80a 84c et 84f ii Un but est utilis si le lecteur sait ou peut deviner que l effet est d sirable et si la m thode d crite est la facon normale pour r aliser l effet c est le cas dans 81 et 83a heuris contrainte relation tique s mantique cooc lecteur nature de pr f r e currence la t che i E est un effet E est une r action r sultat un effet externe en gendr par un autre agent que l agent principal ii E est un effet sait ou peut deviner l op ration qui en but que E est d sirable gendre E est la m thode normale d en gendrer E ii E est un effet ne peut deviner que r sultat E est d sirable E est un effet l op ration qui en r sultat gendre E est la m thode normale d en gendrer E TABLE 5 19 Heuristiques de pr sentation l effet iii Un r sultat est aussi utilis si le lecteur ne peut deviner qu un effet est d sirable comme dans 80b et 83c ou lorsque la m thode d crite pour r aliser l effet n est pas la m thode normale comme dans 83f Dans ce cas le r sultat assure que
206. ne op ration effectuer ou un objet utiliser 8 Nous tenons remercier Myriam Beauchemin qui dans le cadre de son projet de premier cycle a contribu la r alisation du module de r alisation grammaticale de SPIN L objet peut tre un instrument un mode de fonctionnement un syst me 119 Lorsque le texte ne porte que sur un seul objet ne servant qu peu de buts le titre d une proc dure peut exprimer cet objet Par exemple 99 La levure Sur les 115 titres du corpus 20 suivent ce sch ma Tous ces titres sont r alis s par un groupe nominal Plus fr quemment 80 le titre indique une op ration effectuer Ceci se r alise g n ralement de 3 fa ons e par un groupe nominal dont la t te est la nominalisation de l op ration Par exemple 100 Retrait de Vabat jour e par une expression de but comme dans les instructions cf la section 4 1 5 Par exemple 101 a Pour s lectionner les canaux b Pour Berline et Hatchback e par une proposition interrogative de la forme comment infinitif Par exemple 102 Comment renommer un r pertoire D apr s le corpus les titres indiquant un objet sont peu utilis s pour des textes d ex cution tandis que les titres indiquant une op ration peuvent s adapter tous les buts communicatifs C est pourquoi SPIN choisit la forme grammaticale des titres en fonction de leur but commu nicatif Pour les textes hybrides et de compr hension
207. ne sont pas communiqu s De plus le m me genre d information n est pas toujours pr sent de la m me fa on par exemple la relation hi rarchique entre les op rations s lectionner et appuyer de la phrase 3 est pr sent e par une mani re tandis que la m me relation entre sp cifier et presser est pr sent e par une relation de but dans la phrase 4 La planification textuelle est influenc e par un grand nombre de facteurs la nature et la re lation entre interlocuteurs le contexte de la communication le domaine de discours Cependant certains types de situations ou contextes communicatifs donnent lieu de fa on consistante des genres textuels particuliers poss dant des caract ristiques rh toriques et lexico grammaticales particuli res On pensera par exemple des recettes de cuisine des textes publicitaires ou des articles de journaux Ce ph nom ne linguistique a t mis en vidence par les travaux sur les sous langages KL82 et sur la th orie des registres register theory GC78 ZZ82 Toutefois notre th se s est limit e un genre particulier les textes d instructions Ces textes consistent 3 Une variante de ce texte a t g n r e automatiquement par le syst me SPIN d crit au chapitre 6 principalement en une s quence ordonn e d tapes ex cuter sur un objet unique ou une si tuation sp cifique pour atteindre un tat d sir Ils peuvent d crire des taches simples incluant
208. neau arri re gauche du connecteur d antenne i Si le texte vise l ex cution imm diate de la proc dure un objet particulier est manipul et un de ses attributs que le lecteur ne conna t pas entraine ou justifie l ex cution d une ligne d op rations alors cet attribut est inclus dans le texte C est le cas de l exemple 37a extrait d une proc dure pour r parer la douille d une lampe Ici le fait que les lampes une seule douille comportent g n ralement une lyre qui bloque l acc s la douille justifie qu il faille enlever la lyre pour r parer la douille Cette r gle compte pour 62 96 des attributs d objets communiqu s dans les textes d ex cution Les autres 38 96 semblent tous se justifier diff remment ii Plus le texte vise la compr hension de la proc dure plut t que son ex cution imm diate plus d objets manipul s et d op rations effectu es sont accompagn s d une description et ceci la discr tion du r dacteur Les attributs d objets ne sont pas n cessaires l interpr tation correcte de la proc dure c est pourquoi les heuristiques r sum es la table 4 5 ne sont pas particuli rement pr cises 3 3 Les conditions mat rielles Les conditions mat rielles pr cisent l tat de l environnement dans lequel une op ration doit tre effectu e Elles sont incluses dans le texte pour permettre l agent de d cider lui m me si la prochaine ligne d op rations doit tre ex cut e
209. nfants 86 a Si la boite pont est munie d une jauge d huile tirez la hors du tube de rem plissage essuyez la reins rez la compl tement et retirez la de nouveau pour lire le niveau d huile b Tourner cette touche droite et gauche pour minimiser les parasites c Rouler le pinceau en le tirant vers soi de fa on reformer la pointe Il est noter que pour des raisons grammaticales toutes les op rations enfants sont pr sent es par une m me relation rh torique les influences dans 87 Pour faire O faites O en faisant Oei et Oca mettent en jeu des op rations de trois niveaux d abstraction diff rents cependant les op rations du m me niveau O1 et O2 sont toutes deux pr sent es par la m me relation la mani re 3 Les heuristiques impliqu es dans le choix de la relation rh torique d pendent du contexte textuel et de la nature de la t che i une mani re est utilis e si a Plus d une op ration enfant sont pr senter et l une d elle pr cise l utilisation t 4 d un instrument Par exemple dans 85a l utilisation du marbre dicte le choix d une mani re pour toutes les op rations enfants b Une seule op ration enfant Oe est pr senter et Oe sp cifie l utilisation d un instrument particulier Dans ce cas une mani re est g n ralement utilis e mais avec ellipse du verbe utiliser comme dans 85b c Une seule op ration enfant Oe est pr senter et s
210. niversity of Delaware juin 1992 E Rosch Principles of Categorization Dans E Rosch et B Lloyd diteurs Cognition and Categorization pages 27 48 Lawrence Erlbaum Hillsdale NJ 1978 D Rosner Intention rhetoric or discourse relations a case from multilin gual document generation Dans O Rambow diteur Proceedings of the ACL Workshop on Intentionality and Structure in Discourse Relations pages 106 109 Ohio State University juin 1993 C K Riesbeck et R C Schank Inside Case based Reasoning Lawrence Earl baum Associates 1989 D Rosner et M Stede Customizing RST for the Automatic Production of echnical Manuals Dans R Dale E Hovy D Rosner et O Stock diteurs Aspects of Automated Natural Language Generation Lecture Notes in Artificial Intelligence pages 199 214 Springler Verlag avril 1992 D Rosner et M Stede Generating Multilingual Documents from a Know ledge Base The TECHDOC Project Dans Proceedings of the 15 International Conference on Computational Linguistics COLING 94 Kyoto Japon 1994 E D Sacerdoti Planning in a Hierarchy of Abstraction Spaces Artificial Intel ligence 5 115 135 1974 E D Sacerdoti Structure for Plans and Behavior Elsevier New York 1977 M H Sawyer Review of Research in Revising Instructional Text Journal of Reading Behavior XXIIT 3 307 333 sep 1991 D Scott Generating Multilingual Instructions Contribution Panel Instruc t
211. nnancement des op rations du plan le syst me peut r soudre certains probl mes directement sans effectuer de retour arri re Dans un plan lin aire un plan trop strict force l utilisation inefficace du retour arri re Aussi la planification hi rarchique oblige les syst mes formuler un plan complet chaque niveau d abstrac tion avant d entamer le niveau suivant Ils peuvent donc d tecter plus rapidement les branches qui aboutissent un chec De plus de tels planificateurs conservent un grand nombre d informations sur la structure du plan si un retour arri re doit avoir lieu une grande partie de l information est d j disponible e Du point de vue de la repr sentation de connaissances la hi rarchie de plans produite est plus d taill e et plus naturelle qu un seul plan non lin aire e Finalement de nombreux psychologues croient qu un plan est mentalement repr sent par une d composition successive d op rations cf le chapitre 2 cette approche est donc motiv e psychologiquement 101 Pour ces raisons SPIN utilise une approche hi rarchique pour d velopper des plans non lin aires Lors du d veloppement du planificateur de tache de SPIN 2 crit res taient importants e Le code source du planificateur de tache doit tre disponible En effet typiquement un plan en intelligence artificielle est ex cut par un agent capable de prendre peu de d cisions il ne peut donc pas contenir de points de
212. ns 30 V rifiez le de nouveau lorsque la voiture aura roul Les op rations co temporelles et s quentielles Parmi les op rations obligatoires effectuer imm diatement on peut distinguer celles effectu es en m me temps qu une autre les op rations co temporelles par exemple 31 effleurer la surface du verre tout en le faisant tourner et les op rations ex cuter individuellement les op rations s quentielles comme dans 32 1 Mettre le commutateur CATV sur la position STD 2 S lectionner diff rents canaux 1 2 Probl mes li s l analyse s mantique De fa on g n rale toute analyse de texte un niveau plus profond que la syntaxe posent un certain nombre de probl mes En effet les textes nous pr sentent leur syntaxe leur choix lexicaux et leur mise en page Cependant de ces formes de surface des analyses rh torique et s mantique ne peuvent qu tre d duites par interpr tation D j lorsqu une analyse rh torique est effectu e plusieurs structures semblent convenir L interpr tation s mantique d un texte tant encore plus loign e de la forme de surface elle peut alors aussi accepter plusieurs so lutions Pour effectuer l analyse s mantique du corpus nous avons donc tenter de questionner chaque expression analys e sur sa probabilit de satisfaire les traits identifi s la figure 4 6 Ceci a t effectu en visualisant l ex cution des instructions dans leur env
213. ns la repr sentation conceptuelle de la proc dure Le but de ce travail est d expliquer des plans et non de g n rer des textes d instructions comme nous avons vu au chapitre 2 cette strat gie ne semble pas appropri e pour g n rer des textes naturels car e Toutes les op rations et toutes les relations hi rarchiques sont pr sent es alors que dans les textes naturels certaines informations sont laiss es implicites e Aucun r sultat imp ratif n gatif DE93a DE93b ou autre type d information re trouv s dans des textes naturels ne sont inclus dans le texte Du point de vue de l organisation textuelle les strat gies rh toriques de Mellish consid rent g n ralement un lien direct entre les niveaux s mantique et rh torique En effet hormis certaines strat gies rh toriques non justifi es linguistiquement les op rations sont toujours reli es par une relation de s quence tandis que les relations hi rarchiques sont toujours pr sent es par un but Dans le syst me EPICURE Dal92 la planification du contenu ins re syst matiquement dans le texte toutes les op rations situ es aux feuilles de la repr sentation conceptuelle de la proc dure c est dire les op rations que le lecteur sait effectuer et seulement ces informations D apr s l tude de Vander Linden VL93b pr sent e au chapitre 2 comme dans le domaine des recettes de cuisine 90 100 du contenu est form de s quences d actions
214. ntations de la repr sentation conceptuelle du domaine la repr sentation typographique du texte Les deux prochains chapitres pr senteront les liens entre la repr sentation conceptuelle de la t che la repr sentation s mantique et la repr sentation rh torique du texte CHAPITRE 4 S lection du contenu Nous avons vu la figure 3 5 du chapitre pr c dent que la planification de texte prend en entr e une repr sentation conceptuelle de la t che accomplir et s lectionne une repr sen tation rh torique du texte de proc dure Ce processus s effectue en deux tapes d abord un ensemble d l ments s mantiques est s lectionn choix II puis les relations rh toriques les plus appropri es pour pr senter ces l ments sont s lectionn es choix IIT Dans ce chapitre nous discutons des heuristiques pour choisir les l ments s mantiques communiquer les heuristiques de s lection D abord les l ments s mantiques qui se retrouvent le plus souvent dans les textes d instructions sont pr sent s Ensuite les crit res les plus impor tants influen ant leur inclusion dans le texte sont pr sent s Finalement pour chaque l ment s mantique les heuristiques de s lection sont pr sent s en d tail 1 Analyse s mantique des instructions 1 1 Les l ments s mantiques Les l ments s mantiques identifient le sens des expressions textuelles Dans le corpus nous avons identifi 9 l ments s man
215. ntent de d velopper ou d valuer des m thodes de r vision visant augmenter la compr hension ou la m morisation des lecteurs Dans cette voie plusieurs aspects ont t abord s Saw91 Les plus pertinents pour notre travail sont les mesures de lisibilit et le d veloppement de strat gies expertes de r vision Les mesures de lisibilit sont des formules initialement d velopp s par Thorndike Tho21 mesurant le degr de difficult de lecture d un texte Ces mesures tiennent compte de ph nom nes comme la fr quence de mots la forme active ou passive et la complexit syn taxique Ces formules reprises et beaucoup d velopp es depuis offrent une fa on simple et pratique d valuer la difficult de lecture d un texte mais leur validit a t s rieusement re mise en question car elles ne prennent en consid ration que des caract ristiques de surface et ignorent un bon nombre de facteurs critiques Saw91 Ces formules peuvent identifier des textes difficiles lire mais n assurent pas que les textes ayant un index de lisibilit satisfaisant sont faciles lire Nous n avons pas explor cet axe de recherche car notre th se s interroge sur le contenu du texte plut t que sa forme de surface Les strat gies expertes de r vision visent am liorer des textes d enseignement en formalisant l expertise des r dacteurs professionnels et son effet sur la compr hension du texte Cependant selon Bri86 e L
216. ntielles cf la section 3 1 et par cons quent n est pas communiqu e heuris tique conceptuelle l tat Eg contraint une op ration et nature de la t che E Ea est inv rifiable d apr s les connaissances du domaine l tat Eg contraint une op ration et E Ea est inv rifiable d apr s les connaissances du domaine l tat Eg contraint une op ration et est inv rifiable d apr s les connais sances du domaine l tat Eg contraint une op ration et est inv rifiable d apr s les connais sances du domaine l tat contraint une op ration et Eq est difficile valuer E est plus facile et E Ea Eq est difficile valuer E est plus facile et E Ea est inv rifiable d apr s les connaissances du domaine contrainte cooc currence ne sait pas que Hy E lecteur ne sait pas com ment v rifier Eg sait v rifier un autre tat E mais ne sait pas que Er Eg ne sait pas com ment v rifier Eg sait v rifier un autre tat E et sait que Ey Eg sait que Ey Ea TABLE 4 6 Heuristiques de s lection la condition mat rielle but com municatif 61 commu niquer E Certains travaux comme Mel88 VL93b discutent de conditions temporelles sp cifiant la fin d une op ration par ex quand O est finie Dans notre corpus ces conditions ne comp tent que pour 6 occurrences 4 96 des conditions mat rielles c est pourquoi
217. obtenir un texte coh rent En effet une m me information est parfois pr sent e selon un certain point de vue et parfois selon un autre C est le cas dans 4 a Appuyer sur la touche de r glage de canal CHANNEL SET pour r gler le canal de r ception b R gler le canal de r ception en appuyant sur la touche de r glage de canal CHANNEL SET S mantiquement ces phrases repr sentent le m me ph nom ne l op ration r gler est un niveau d abstraction sup rieur l op ration appuyer Cependant la premi re phrase 1 Les r f rences exactes de tous les exemples se trouvent l appendice A 3 z3 4 n6 n7 n9 n10 ni programmer obj enregistrement n6 appuyer obj touche de canal qual d 1 heure 30 chang obj canal n2 r gler obj s lecteur de vitesse de n7 presser obj touche OTR qual 3 fois bande dest SP gt 1 h 30 min gt allum SP n8 enfoncer obj touche OTR qual 1 fois n3 s lectionner obj canal 4 gt 30 min gt s lectionn obj canal 4 n9 enfoncer obj touche OTR qual 2 fois n4 sp cifier obj heure d enregistrement 30 min gt sp cifi obj heure d enregistrement n10 enfoncer obj touche OTR qual 3 fois n5 presser obj touche TIMER qual dans 30 min un d lai de 9 secondes allum obj lumi re TIMER FIGURE 1 1 Exemple simplifi de la repr sentation conceptuelle d une t che pr sente la relation hi rarchique comme
218. oc dure on choisit l infor mation communiquer dans le texte et celle qui restera implicite Cette tape produit une repr sentation s mantique du texte d instructions Ce processus n a pas re u beaucoup d at tention dans les travaux ant rieurs en linguistique informatique probablement par crainte de supposer une repr sentation conceptuelle subjective Choix III partir de la repr sentation s mantique du texte sa structure rh torique est choisie Dans la plupart des syst mes ant rieurs la d termination du contenu et la d termination de la structure rh torique rel vent de la m me question Sans distinction entre les choix IT et IIT une diversit rh torique est alors perdue Choix IV La structure rh torique est finalement transform e en une repr sentation grammaticale et lexicale C est cette tape que le choix des formes grammaticales et des mots utiliser pour faire r f rence une relation et un concept particuliers est effectu Ces d cisions sont prises en m me temps car les choix grammaticaux d pendent de la disponibilit lexicale de la langue En effet il n est pas toujours possible de trouver une forme lexicale convenant aux structures grammaticales pr f r es Dan85 Choix V La repr sentation lexicale est finalement mise en page et r alis e typogra phiquement Ici aussi de nombreux choix sont disponibles pour transmettre une m me repr sentation lexicale Faut il num roter les
219. ocus in justifi s par exemple d noncer une op ration permettant d atteindre le but O ensuite une op ration non reli e puis revenir une op ration permettant d atteindre La liste de l ments s mantiques de l exemple vcr apr s cette tape est illustr e la fi gure 6 18 Remarquons ici que l l ment s mantique issu du noeud n5 op seq appuyer dest touche TIMER qual dans un d lai de 9 secondes est maintenant ordonn correcte ment la fin de la liste 3 2 2 La r solution des contraintes de cooccurrence Une fois tous les l ments s mantiques s lectionn s les contraintes de cooccurrences de la forme contrainte Contraintes Choix si vraies Faits si vraies 6Les op rations de pr paration sont explicitement sp cifi es dans la repr sentation de la t che cf la table 6 25 p 109 114 titre but programmer obj enregistrement qual d ih 30 min par une touche incr mentielle _ paragraphe action r gler obj s lecteur de vitesse de bande dest SP but meilleure qualit d image r gler obj s lecteur de vitesse de bande dest SP action s lectionner obj canal 4 maniere appuyer dest touche de canal action appuyer dest touche OTR qual 3 fois c_condition enfoncer obj touche OTR qual 1 fois appuyer dest touche OTR qual 3 fois resultat PM 10 35 30min enfoncer obj touche OTR qual 1 fois c_condition enfoncer obj touche OTR
220. of the Cognitive Science Society pages 157 165 Cambridge Massachusetts juillet 1990 G Peter et D Rosner User Model Driven Generation of Instructions User Modeling and User Adapted Interaction 3 289 319 1994 C Paris et D Scott Stylistic Variation in Multilingual Instructions Dans Pro ceedings of the Tt International Workshop on Natural Language Generation pages 45 52 Kennebunkport Maine juin 1994 C Paris W Swartout et W Mann Preface Dans C Paris W Swartout et W Mann diteurs Natural Language Generation in Artificial Intelligence and Computational Linguistics The Kluwer International Series in Engineering and Computer Science pages xv xix Kluwer Academic Publisher Boston 1991 M L Puscas A Survey of Technical Computer Users Resulting in Guidelines for the Development of Technical Computer Documentation Dans Conference Proceedings of SIGDOC pages 49 65 Baltimore MD november 1989 ACM C Paris K Vander Linden M Fischer T Hartley L Pemberton R Power et D Scott A Support Tool for Writing Multilingual Instructions Dans Pro ceedings of the 14 International Joint Conference on Artificial Intelligence IJCAI 95 Montr al Canada 1995 F Pereira et D Warren Definite Clause Grammars for Language Analysis A Survey of the Formalism and a Comparison with Augmented Transition Net works Artificial Intelligence 13 231 278 1980 RD92 Rei78 Rei92 Rei94 RMG 76 RML95
221. on ne sera pas perdu 8 Il existe donc une relation de g n ration entre les 2 types d actions revisser et ne pas perdre D un autre cot l op ration enfant peut tre g n r e par l op ration parent unique ment si celle ci est ex cut e d une facon particuli re C est le cas dans 24 tourner cette touche droite et gauche pour minimiser les parasites Ici la g n ration entre tourner et minimiser n aura lieu que si tourner est ex cut d une fa on particuli re Par exemple si la touche est tourn e deux fois droite plut t que trois la g n ration n aura pas lieu car les parasites ne seront pas minimis s La g n ration est donc conditionnelle la fa on dont a est ex cut e et cette condition est diff rente chaque fois que l op ration est ex cut e Il existe donc une relation de g n ration entre les instances d actions mais entre les types d actions on ne peut d finir de relation de g n ration Dans ces cas l op ration parent 2 influence ou guide l interpr tation de l op ration enfant a de fa on produire la g n ration On a alors affaire une influence Tr s r cemment Di Eugenio et Webber DEW95 ont not dans les instructions un ph nom ne apparent l influence ph nom ne qu elles nomment la surcharge prag matique pragmatic overloading Di Eugenio et Webber notent que les expressions de but purpose clauses les expressions jusqu until clauses
222. on op ration parent O est une op ration de base Dans ce cas l influence est g n ralement vue en aval le noyau est form de O et le satellite de Oe par une mani re comme dans 85c ii une relation de but est utilis e si 18Ces heuristiques n expliquent pas tous les ph nom nes du corpus Par exemple dans le manuel de magn toscope du corpus on retrouve les tapes 88 5 S lectionner le canal r gler en appuyant sur le s lecteur de canal 7 Appuyer sur la touche de r glage de canal CHANNEL SET pour r gler le canal de r ception Ici dans le m me contexte textuel et dans la m me t che la premi re fois une mani re est utilis e et la seconde fois un but est utilis 14 En effet dans le corpus l utilisation d un instrument n est exprim e par une s quence d action ind pen dante par exemple utiliser tel instrument qu une seule reprise Tous les autres instruments sont sp cifi s par une mani re heuris tique contrainte cooc lecteur currence s mantique Se et Op communi quent une influence et Se est un ensemble Oe et Op communi quent une influence et Oe n est pas un ensemble Oe et Op communi Op est de base quent une influence et Oe n est pas un ensemble Se et Op communi quent une influence et Se est un ensemble Se et Op communi quent une influence et Se est un ensemble Oe et Op communi Oe est de base quent une influence et Oe n est pas un ensemble TABLE 5 20
223. onde ou bien il doit exister une autre op ration Os elle m me ayant des pr conditions satisfaites qui rend P vraie si Og est ex cut e Dans le syst me SPIN ces 2 techniques de satisfaction de pr conditions sont utilis es mais si aucune ne fonctionne l op ration O4 est tout de m me s lectionn e de fa on ce que P soit v rifi par l agent au moment de l ex cution de la proc dure De plus les autres op rations qui satisfont aussi l tat initial E et ayant des pr conditions que le planificateur ne peut v rifier sont aussi accept es de fa on cr er plusieurs lignes de conduites possibles pour l agent Notons que le planificateur de SPIN ne peut valuer ses alternatives En effet il s lec tionne syst matiquement la premi re op ration satisfaisante sans v rifier si une autre op ration produirait un plan plus simple l tape iii le syst me de critiques de Sacerdoti sert v rifier que les expansions lo cales forment un plan global coh rent Pour cette tape le planificateur de tache de SPIN prend une approche assez simple En effet la critique la plus importante de Sacerdoti consid re le conflit lorsque la postcondition d une op ration O d fait une pr condition d une op ration non s quentielle Og La solution ce probl me est de placer l op ration victime O2 avant O4 dans le plan Dans le planificateur de SPIN la relation temporelle entre les op rations est in diqu e directement dans la repr
224. ongs Seulement une strat gie de d coupage de la t che globale en un ensemble de textes locaux devrait tre d velopp e 3 R sum Dans ce chapitre nous avons tent d valuer notre recherche D abord nous avons valid les heuristiques pr sent es aux chapitres pr c dents Nous croyons qu une comparaison mot mot de textes g n r s par SPIN avec des textes naturels constitue une condition suffisante mais non n cessaire pour valuer les heuristiques Nous avons alors utilis deux autres m thodes D abord nous avons compar les r sultats de SPIN avec les syst mes similaires d j existants Mel88 Dal92 Ensuite nous avons produit des textes d instructions ne faisant pas partie du corpus d analyse et les avons compar s aux textes sources de fa on qualitative Nous n avons pas consid r chaque heuristique de fa on individuelle mais les avons plut t valu s de fa on globale Les deux m thodes semblent indiquer que les heuristiques de s lection et de pr sentation sont appropri es pour s lectionner le contenu et la structure rh torique des textes d instructions Cependant dans le cas des effets SPIN semble bien moins explicite que les r dacteurs humains 8 Une relation d alternative serait aussi possible 142 Pour valuer le projet de fa on globale nous avons not certains de ses points forts la dis tinction entre les niveaux s mantiques et rh toriques et le d veloppement d un syst me complet
225. onsid r e et de la proximit temporelle de l v nement Rosch a donc fait l hypoth se que les gens poss dent une repr sentation mentale plus facilement accessible pour certains v nements qu elle a appel des v nements de base De plus Rosch stipule que le niveau de base des v nements correspond au niveau de base des objets impliqu s dans l v nement Ainsi se brosser les dents est une op ration de base car elle implique l utilisation d objets de base une brosse dents un dentifrice plus facilement disponible conceptuellement Dans le m me ligne de pens e Pollack aussi d finit la notion d op rations de niveau de base domain basic act types Pol86 Elle prend comme exemple le domaine du courrier lec tronique dans lequel toutes les op rations qui d crivent une commande sont des op rations de niveau de base par ex effacer un message envoyer un message Pour Pollack taper un caract re au clavier ne peut tre consid r une op ration de base du domaine car l op ration est trop sp cifique De m me pour taper une cha ne de caract res ou taper quot que ce soit Dans ce domaine une op ration de base serait plut t mettre une commande Pollack propose donc qu l int rieur d un domaine de discours on peut d finir un ensemble d op rations de 5La notion d op rations de base diff re de la notion d op rations primitives Cette derni re sera plus d taill e au chapitre 6 mais pour les impa
226. op rations co temporelles et les op rations s quentielles semblent prime abord aussi influenc s par le but communicatif mais nous croyons que leur variation est due un autre facteur Les op rations co temporelles semblent plus fr quentes dans les textes de compr hension que dans les textes d ex cution mais nous croyons que ceci est d au fait que les t ches complexes qui requi rent plus d op rations co temporelles sont g n ralement pr sent es par un texte de compr hension et les t ches plus simples le sont par une liste d ex cution D un autre c t les op rations s quentielles semblent moins fr quentes dans les textes de compr hension Seulement nous croyons que leur fr quence relative aux autres l ments est plus basse car ces textes comptent une plus grande fr quence des autres l ments s mantique En effet si on calcule la fr quence des op rations s quentielles par rapport aux l ments s mantiques non influenc s on a 69 96 d op rations s quentielles dans les textes d ex cutions 65 96 dans les textes hybrides et 64 96 dans les textes de compr hension La fr quence des op rations s quentielles semble donc maintenue Le but communicatif sera donc pris en consid ration pour communiquer les attributs d ob jets et les effets mais pas pour les autres l ments s mantiques 3 Heuristiques de s lection Les l ments s mantiques retrouv s dans notre corpus sont pr sent s la table 4 2
227. op on Intentionality and Structure in Discourse Relations pages 7 10 Ohio State University juin 1993 K De Smedt et G Kempen Segment Grammar a Formalism for Incremen tal Sentence Generation Dans C Paris W Swartout et W Mann diteurs Natural Language Generation in Artificial Intelligence and Computational Lin guistics The Kluwer International Series in Engineering and Computer Science chapitre 13 pages 329 349 Kluwer Academic Publisher Boston 1991 R Fikes et N Nilsson STRIPS A new approach to the application of theorem proving to problem solving Artificial Intelligence 2 189 208 1971 P E Friedland Knowledge based experiment design in molecular genetics Th se de doctorat Computer Science Dept Stanford University 1979 S Glynn T Andre et B Britton The Design of Instructional Text Intro duction to the Special Issue Educational Psychologist Special Issue Design of Instructional Text 21 4 245 251 automne 1986 M Gregory et S Carroll Language and Situation Language Varieties and their Social Contexts Routledge Kegan Paul London 1978 A Goldman A Theory of Human Action Princeton University Press Princeton NJ 1970 B J Grosz et C L Sidner Attention Intentions and The Structure of Dis course Computational Linguistics 12 3 175 204 juillet septembre 1986 K Hammond Case Based Planning Viewing Planning as a Memory Task Academic Press 1989 J Hartley Designing Instructional
228. opri pour des lecteurs experts qui ne risquent pas d interpr ter le but comme tant obligatoire 2 4 La nature de la t che La nature de la t che influence non seulement la s lection des l ments s mantiques mais aussi la s lection des relations rh toriques En effet certaines relations rh toriques sont plus appropri es pour pr senter certains types d op rations et d tats Par exemple comme nous verrons plus loin une condition facile valuer sera plut t pr sent e par une c condition tandis qu une condition plus difficile valuer pr f rera un r sultat Aussi un effet externe sera plut t pr sent par un r sultat tandis qu un effet interne pr f rera un but 2 5 Le but communicatif Les relations rh toriques ne semblent pas influenc es par le but communicatif du texte En effet dans notre corpus un m me l ment s mantique est pr sent par la m me relation 81 rh torique peu importe s il s agit d un texte d ex cution de compr hension ou hybride cf la section 2 6 du chapitre 4 La figure 5 9 illustre les r sultats du corpus Les attributs d objets et les op rations co temporelles sont respectivement pr sent s par des laborations et des concurrences ind pen damment du type de texte Les op rations s quentielles sont presque toujours pr sent es par des s quences d actions dans les 3 types de textes Les conditions mat rielles les effets les influences les options et les
229. orties et les segments de programmes la police sans serif est utilis e pour les citations la police oblique est utilis e pour les termes en langue trang re la police italique dans les exemples indiquent les expressions portant un int r t particulier la police italique est aussi utilis e pour les exemples cit s dans le texte les expressions incorrectes sont pr c d es du symbole xvii REMERCIEMENTS Sans le support intellectuel moral et financier de certaines personnes et organismes cette th se n aurait jamais vu le jour Je tiens d abord remercier mon directeur de recherche Guy Lapalme qui m a enseign mon premier cours d intelligence artificielle et m a pris sous sa tutelle depuis ce moment l Sa disponibilit sa g n rosit ses conseils et sa confiance en moi m ont t d un grand secours durant ces ann es Son sens de l humour ses connaissances et ses accomplissements ont fait de lui un professeur remarquable et tant appr ci Merci Richard Kittredge qui a bien voulu co diriger cette th se et dont l expertise et les conseils judicieux ont grandement am lior ce travail Merci Paul Bratley et Jacques Malenfant qui ont pris le temps de lire et commenter cette th se et C cile Paris qui m a fait l honneur d en tre l examinatrice externe Pour leur support financier Je tiens remercier le CRSNG et l Universit de Montr al Merci la gagne du laboratoire Incogn
230. our atteindre ce but Les op rations sont d crites par des listes de pr conditions et d effets suivant le format des sch mas d op rations de sTRIPS FN71 Ces sch mas d op rations sont emmagasin s dans la biblioth que de plans et sont utilis s deux fins e La liste d effets des sch mas d op ration sert mod liser la recette en cours et les changements d tat des ingr dients e Le fait de d composer ou non une op ration en sous op rations d termine le niveau de d tail contenu dans le plan et par cons quent le niveau de d tail du texte g n r La d cision de d composer ou non une op ration est r alis e en consultant un mod le du lecteur Ce mod le contient principalement une liste d op rations que le lecteur sait effectuer Une op ration n est pas d compos e si le lecteur sait l effectuer Le r sultat du planificateur de discours est une sp cification hi rarchique du texte Une op ration d optimisation est ensuite effectu e sur cette sp cification pour agr ger les op rations cons cutives manipulant un m me objet ou faisant r f rence une m me action Cette tape permet de cr er un texte moins lourd Par exemple les trois op rations tremper les pois rincer les pois et goutter les pois sont regroup es en un seul noeud tremper rincer et goutter les pois La hi rarchie optimis e est ensuite pass e au g n rateur de discours la composante tactique qui parcourt ses feuilles de gauche
231. our une meilleure qualit d image r glez le s lecteur de vitesse de bande sur SP Le s lecteur est gauche de l appareil S lectionnez le canal 4 en appuyant sur la touche de canal Appuyez sur la touche OTR 3 fois pour sp cifier l heure d enregistrement d ih 30 min Lorsque la touche est enfonc e 1 fois PM 10 35 30min Lorsqu elle est enfonc e 2 fois PM 11 05 1 h Lorsqu elle est enfonc e 3 fois PM 11 35 1 h 30min Appuyez sur la touche TIMER dans un d lai de 9 secondes Lecteur moyen texte d ex cution Programmation d un enregistrement d ih 30 min par une touche incr mentielle W appuyez pas sur la touche REC Pour une meilleure qualit d image r glez le s lecteur de vitesse de bande sur SP S lectionnez le canal 4 en appuyant sur la touche de canal Appuyez sur la touche OTR 3 fois Lorsqu elle est enfonc e 1 fois PM 10 35 30min Lorsqu elle est enfonc e 2 fois PM 11 05 1 h Lorsqu elle est enfonc e 3 fois PM 11 35 1 h 30min Appuyez sur la touche TIMER dans un d lai de 9 secondes Lecteur moyen texte hybride Programmation d un enregistrement d ih 30 min par une touche incr mentielle Il ne faut pas appuyer sur la touche REC Pour une meilleure qualit d image r gler le s lecteur de vitesse de bande sur SP Le s lecteur est gauche de l appareil S lectionner le canal 4 en appuyant sur la touche de canal Appuyer sur la touche OTR 3 fois Lorsqu elle
232. p 17 peint p 32 souffle p 75 recette p 707 RS92 p 206 non retrouv bouche p 342 non retrouv RS92 p 206 non retrouv non retrouv lec p 141 non retrouv t l p 14 e amp Qt o ot Ot Ct Qt oon e ewer SS Qt e peint p 17 variation de lec p 17 o ner ver p 23 DEW95 non retrouv DD A w non retrouv D Qt non retrouv 2 o non retrouv o D 6 o A auto p 14 souffle p 73 t l p 12 peint p 108 vcr p 16 non retrouv DD Qo co T o e LL non retrouv mazda p 2 11 souffle p 31 ordi p 100 non retrouv peint p 31 vcr p 8 auto p 9 lec p 19 VL93b p 75 lec p 17 19 VL93b p 102 ver p 16 ver p 15 lec p 21 t l p 16 lec p 17 auto p 10 auto p 8 non retrouv o De non retrouv ordi p 197 peint p 30 31 lec p 17 vcr p 4 auto p 14 D D D ct lec p 22 ver p 8 auto p 8 souffle p 72 auto p 8 auto p 9 peint p 30 31 recette p 139 auto p 14 J xissesuip ce oo vcr p 14 non retrouv non retrouv DHP 94 p 61 non retrouv dog guod e c APPENDICE B Exemple d analyse de corpus 1 Texte source source peint p 31 Pour obtenir avec le pinceau poils courts une ligne fine et nette 1 glisser rapidement sur l
233. perdre l ordre de succession des 112 op rations Par exemple pour s lectionner les l ments s mantiques du texte ver SPIN parcourt la repr sentation de la figure 6 15 ainsi ni n2 n3 n4 n5 n2 n6 n7 n5 n2 n6 n8 n9 n10 n5 Comme un m me n ud peut se retrouver diff rents niveaux SPIN n en consid re que la premi re occurrence Dans cet exemple si seules les op rations s quentielles issues des noeuds feuilles sont s lectionn es l ordre des op rations dans le texte sera n2 nb n6 n8 n9 n10 Ici l op ration issue du noeud n5 n est pas ordonn e correctement car elle devrait tre la derni re De la m me fa on si seule la derni re occurrence tait consid r e le r sultat pourrait tre erron Pour faire face ce probl me une fois que la liste des l ments s mantiques est construite elle est ordonn e de nouveau en fonction des relations temporelles de la repr senta tion du domaine Comme nous avons vu la section 2 par d faut un plan non lin aire ordonne toutes les op rations de fa on partielle sauf si elles sont s quentielles D un autre c t le texte ordonne toutes les op rations par un ordre total sauf si elles sont co temporelles Pour r diger un texte partir d un plan non lin aire il est donc n cessaire d aplatir ce dernier de fa on lin ariser les op rations temporellement ind pendantes D apr s le corpus 2 crit res semblent tre utilis s pour e
234. plus important que le groupe verbal et ce dernier peut tre omis comme dans 104 Pour 1 les crous qui ne portent aucune marque tourner en sens contraire o le verbe d visser a t omis Tout comme en anglais si une m tonymie ne peut tre produite la subordonn e infinitive i est ensuite tent e nouveau Les conditions contraignant l utilisation de la subordonn e circonstancielle forme iii ne semblent pas claires Cette question tant hors de notre domaine de recherche SPIN ne produit simplement pas cette forme 4 1 6 Le r sultat En anglais pour exprimer un r sultat g n ralement 2 formes sont disponibles une propo sition au pr sent et une proposition au futur Pour justifier le choix entre ces 2 formes Vander Linden a remarqu que lorsque le r sultat est ou peut tre ex cut par le lecteur le pr sent est utilis Par exemple 105 Lorsque le 7010 est install et la pile s est charg e pendant 12 heures positionnez le bouton OFF STBY TALK sur STBY Le 7010 est maintenant pr t tre utilis Tandis que lorsque le r sultat est ex cut par l appareil lui m me le futur est utilis Par exemple 106 Placez le r cepteur sur la base L indicateur de chargement de pile s allumera En fran ais nous avons observ les 5 formes grammaticales illustr es la table 6 32 une proposition au pr sent et au futur une proposition avec le verbe devoir au pr sent et au conditionnel
235. pm LX Representation Semantique du Texte P III y oN Representation Rhetorique du Texte e IV EE Representation Grammatico Lexicale du Texte e V VEDI Representation Typographique du Texte e FiGURE 3 5 Notre approche la planification de textes d instructions 40 41 mauvaise structuration mauvais termes ou extra linguistique manuels d suets Pour viter d analyser des textes linguistiquement incorrects nous n avons consid r que des textes r dig s l origine en fran ais ou des traductions correctes qui ne semblaient pas influenc es par la langue d origine Le corpus s lectionn provient de 15 sources diff rentes Il est compos de 79 proc dures et compte environ 13 300 mots Pour ne pas se restreindre un style particulier d instructions les textes s lectionn s vont de listes d ex cution explications lin aires des textes plus explicatifs explications fonctionnelles En effet nous avons choisi des textes assez vari s que ce soit du point de vue du lecteur vis du types d op rations ou du but des instructions de fagon d velopper une th orie applicable un grand nombre d instructions Le prix de cette d cision est une perte de pr cision lors de la g n ralisation des r
236. pr ventions introduire dans le texte mais le sera lors du choix de la relation rh torique cf le chapitre 5 Dans le corpus on retrouve en moyenne 1 96 de pr vention L inclusion de cet l ment s mantique dans le texte d pend fortement des connaissances du lecteur et de la nature de la t che Comme l illustre la figure 4 7 p 72 le but communicatif ne semble pas jouer de r le important Les pr ventions semblent incluses dans le texte dans 3 situations 1 Une op ration ne doit pas tre effectu e mais le lecteur pourrait naturellement supposer qu elle doit l tre Ses raisons peuvent inclure a dans une situation similaire l op ration a t effectu e ou b le but courant est g n ralement atteint par cette op ration Par exemple dans 69 heuris contrainte commu tique conceptuelle nature cooc lecteur but com niquer de la t che currence municatif i une op ration O peut naturellement n gation de O ne doit pas tre supposer que O effectu e doit tre ex cut e un tat E em ne connait pas E n gation de O p che l application d une op ration O une op ration O O est dangereuse n gation de O ne doit pas tre ou n faste et O effectu e est irr versible TABLE 4 12 Heuristiques de s lection la pr vention 55 Utilisez une cl en croix pour desserrer les crous de la roue N enlevez pas compl tement les crous la plupart du temps o l on desserre un crou le b
237. que op ration s quentielle condition mat rielle attributs d objets effet influence op ration co temporelle option pr vention op ration ventuelle TABLE 5 15 Proportion 98 0 9 0 8 90 4 4 2 100 68 29 96 4 96 69 96 31 96 100 79 96 21 96 86 96 14 96 73 96 27 96 Relations rh toriques s quence but c condition c condition but r sultat s quence laboration r sultat but mani re mani re but concurrence but c condition s quence mani re c condition mani re 79 Exemple Faites O1 Faites Oo Faites O1 pour faire O2 Faites O4 avant de faire Oo Si C est le cas Pour le cas C Si Cy est vraie alors Co l est aussi V rifier C L objet OB poss de l attribut A Faites Oe Op sera fait Pour faire Op faites O Faites O en faisant Oe Faites Op en faisant Oe Faites Oe pour faire Oy En faisant O1 faites Oo Pour faire O Si vous voulez faire O Faites O1 Ne faites pas O2 Faites O1 en vitant de faire O2 Si vous faites O En faisant O Pr sentation des l ments s mantiques 80 relation pr f r e d pend entre autres du fait que l op ration s quentielle parent se d compose en une seule op ration s quentielle ou en un ensemble d op rations s quentielles 2 2 Les cooccurrences de relations rh toriques Dans les textes d instructions certa
238. r vention P est de type neg TC TABLE 5 23 Heuristiques de pr sentation la pr vention e une s quence 86 96 voir les exemples 93a et 93b 93 a Une fois le mors de la canne r chauff il ne faut pas le plonger dans la masse de verre en fusion b Secouez doucement le capuchon pour le d gager sans le tourner e une mani re 14 96 comme dans 94 On soutire nouveau le vin en prenant soin de ne pas d ranger la lie et en s effor ant de laisser entrer le moins d air possible Comme l illustre la table 5 23 l tude de Di Eugenio DE93b explique ces ph nom nes En effet i Toutes les pr ventions de type DONT sont pr sent es par des s quences d actions n gatives comme dans 93a et 93b ii Dans notre corpus une mani re pr sente toujours les neg TC n gation de la forme en prenant soin de ne pas comme dans 94 Notons cependant que notre corpus ne compte que 3 neg TC 3 9 Les op rations ventuelles L op ration ventuelle est pr sent e par e une c condition 73 96 comme dans 95a et 95b 16 Ceci ne semble pas tre le cas en anglais En effet le corpus de DE93b compte de nombreux neg TC pr sent s par des s quences d actions heuris contrainte relation tique s mantique cooc lecteur nature de pr f r e currence la t che i O est une op ration O est une r gle c condition ventuelle g n rale mais son ex cution n est pas imm diate i O
239. r les op rations et les tats dans la t che particuli re Ces contraintes indiquent par exemple si un tat est interne ou externe l appareil manipul facile v rifier ou non L inclusion de certains l ments s mantiques est d pendant de ce type de contrainte C est le cas par exemple des effets qui ne sont inclus dans les textes d ex cution que s ils sont externes tandis que dans les textes visant seulement la compr hension des effets internes et externes se retrouvent aussi fr quemment 2 6 Le but communicatif Dans notre th se le but communicatif est d fini par l incitation effectuer ou non la proc dure au moment de la lecture du texte Il indique si le lecteur est l agent de la proc dure ou non Pour d terminer si le but communicatif joue un r le dans la s lection du contenu nous avons divis notre corpus en 3 cat gories e les texte d ex cution qui s adaptant bien une ex cution imm diate de la proc dure Y textes Ces textes sont caract ris s par des listes num r es de phrases courtes sp cifiant au moins une op ration effectuer Les proc dures sont courtes requi rent peu d instruments et utilisent des termes peu sp cialis s De plus leurs op rations requi rent peu de dext rit et de jugement Ces textes se rapprochent des explications lin aires de Smith et Goodman SG82 cf le chapitre 2 e les textes de compr hension visant uniquement la compr hension 4 textes C
240. r y sont souvent introduites C est justement cette versatilit qui fait de la RST un outil pratique L ensemble initial d environ 25 relations constitue ainsi un ensemble ouvert pour une adaptation de la liste des relations pour les textes d instructions on se r f rera au chapitre 5 e les sch mas Les sch mas sp cifient la composition structurelle d un texte D finis en termes de rela tions les sch mas indiquent comment les portions de texte sont agenc es Par exemple le sch ma correspondant la relation de but de l exemple 16 est ae Pour mettre le poste presser le bouton de TV hors tension de nouveau 34 Avant de rebobiner enfoncer le bouton place sous le bo tier pour debrayer la roue d entra nement puis tourner la manivelle de rembobinage dans le sens des aiguilles d une montre jusqu ce que la pellicule soit enti rement rentree dans la cartouche La manivelle ne doit alors plus offrir de resistance Le dos peut maintenant etre ouvert toujours en lumi re attenuee sequence sequence Avant de rebobiner enfoncer le puis tourner la manivelle de rembobinage Le dos peut maintenant tre ouvert bouton place sous le bo tier pour dans le sens des aiguilles d une montre toujours en lumi re attenuee debrayer la roue d entra nement jusqu ce que la pellicule soit enti rement rentree dans la cartouche La manivelle ne doit alors plus offrir de resistance circonstance but ba Le do
241. rapide Emprisonnez l air Lecteur expert texte hybride Pour cr er la premi re bulle Avant que le verre ne devienne trop froid il faut souffler la bulle En tenant la canne horizontalement ou l g rement inclin e vers le sol envoyez un jet d air rapide Emprisonnez l air Lecteur expert texte de compr hension Comment cr er la premi re bulle Avant que le verre ne devienne trop froid on souffle la bulle En tenant la canne horizontalement ou l g rement inclin e vers le sol envoyer un jet d air rapide On emprisonne l air 173 1 3 Desserrage d une roue de voiture 1 3 1 Version originale auto p 8 Desserrage des crous Utilisez une cl en croix pour desserrer les crous de la roue S ils portent la marque L ils ont le filetage gauche et vous devez les d visser en tournant dans le sens des aiguilles d une montre Pour les crous qui ne portent aucune marque tournez en sens contraire Si les crous sont difficiles d visser mettez un peu d huile p n trante attendez quelques minutes puis essayer de nouveau N enlevez pas compl tement les crous 1 3 2 Versions de SPIN Lecteur novice texte d ex cution Desserrage des crous de la roue D visser les crous avec une cl en croix ils portent la marque L les crous ont le filetage gauche tourner les crous dans le sens des aiguilles d une montre ils ne portent pas de marque tourner les crous en
242. rectement par l agent Elles sont assez sp cifiques pour tre descriptives mais assez g n rales pour tre utiles De nombreux travaux en psycholinguistique se sont pench s sur la question de niveaux de base dans des cat gories conceptuelles structur es hi rarchiquement CGB88 PR90 Les cat gories de base sont d finies comme les cat gories les plus abstraites pour lesquels les membres poss dent un grand nombre de propri t s perceptuelles ou abstraites communes ou bien comme les cat gories poss dant les propri t s communes les plus importantes Cependant ces travaux se penchent g n ralement sur les concepts d objets et peu se sont occup s de concepts d v ne ments D apr s Rosch Ros78 les op rations de niveau de base semblent tre les op rations plus facilement retenues en m moire Rosch a effectu des exp riences sur les unit s d v nements m moris s en demandant des sujets de se souvenir des op rations effectu es durant la journ e la veille l avant veille etc et pendant des p riodes de temps diverses Les sujets ont cit s des op rations comme se brosser les dents prendre une douche aller au cours de statistiques mais personne n a mentionn des unit s plus petites comme prendre le tube de dentifrice l craser ou des unit s plus larges comme effectuer les t ches matinales De plus les unit s d v nements mentionn s taient les m mes ind pendamment de la p riode de temps c
243. ressing Rhetorical Relations in Instructio nal Text A Case Study of the Purpose Relation Computational Linguistics 21 1 29 57 mars 1995 W Wahlster E Andr W Finkler H J Profitlich et T Rist Plan based In tegration of Natural Language and Graphics Generation Artificial Intelligence 63 1 2 387 427 octobre 1993 aussi disponible en rapport technique Deutsches Forschungszentrum f r Kustliche Intelligenz DFKI RR 93 02 M Walker Evaluating Discourse Processing Algorithms Dans Proceedings of the 27 Annual Meeting of the Association for Computational Linguistics ACL 89 Vancouver juin 1989 E H Weiss How To Write Usable User Documentation Oryx Press Phoenix 2 edition 1991 M Zock et A Laroui Visualising results of choices in language generation the use of the intermediate structures Dans Proceedings of the Machine Learning Workshop IJCAI 91 Sidney 1991 Zoc90a Zoc90b Zoc91a Zoc91b Zoc92 Zoc93 2282 188 M Zock If you can t open a black box open a window or how to visualize dependency relationships when mapping meaning into form Dans Proceedings of the COGNITIVA Madrid 1990 M Zock La g n ration interactive de langage comment visualiser le passage de l id e a la phrase Dans J Anis et J L Labrave diteurs Texte et Ordinateur Les Mutations du Lire Ecrire pages 201 220 Edition de Vespace Europ en juin 1990 M Zock Comment transformer une bo
244. riques sont consid r es dans un m me module Pour pr senter un l ment de sens par diff rentes strat gies rh toriques les m mes contraintes s mantiques doivent alors tre pr sentes dans diff rents plans rh toriques ainsi les alourdissant inutilement Aussi dans un contexte de g n ration multilingue si l on consid re que le contenu s mantique est ind pendant de la langue de communication mais que les choix rh toriques diff rent notre approche permet de modifier les choix rh toriques sans toucher au niveau s mantique 2 1 2 Un syst me motiv linguistiquement Habituellement la linguistique informatique attaqu e du point de vue de la linguistique donne lieu des th ories sur l utilisation de la langue mais donne rarement naissance des sys t mes concrets D un autre c t lorsqu attaqu e du point de vue informatique la linguistique informatique donne souvent lieu des syst mes automatiques mais ceux ci ne sont pas toujours bas s sur des ph nom nes linguistiques justifi s Bien que notre expertise soit plut t informa tique nous nous sommes efforc e de batir un syst me informatique bas sur des fondements linguistiques 2 1 3 Un syst me complet Comme dernier point fort de notre recherche notons que le syst me SPIN effectue toutes les tapes de la g n ration de textes de fa on automatique La figure 7 28 reprise du chapitre 3 illustre notre vision de la g n ration de textes d
245. rmer le plateau Conservez le ferm sauf pendant le chargement et le retrait pour prot ger le m canisme de la poussi re et des accidents Texte de compr hension Comment placer un CD l couter puis l arr ter Appuyez sur OPEN CLOSE Mettez le CD face imprim e vers le haut sur le plateau Appuyez sur Lecture pause Ajustez le volume Pour arr ter le CD appuyez sur CLEAR Pour mettre l appareil en mode de pause appuyez sur Lecture pause pendant que le CD est reproduit Le CD se commencera l o il a t laiss Pour le retirer appuyez sur OPEN CLOSE en appuyant sur Lecture pause de nouveau sortez le CD Appuyez sur OPEN CLOSE de nouveau pour fermer le plateau Conservez le ferm sauf pendant le chargement et le retrait pour prot ger le m canisme de la poussi re et des accidents 2 4 Soupe aux f ves de Dale 2 4 1 Version originale Dal92 Soupe aux f ves Tremper goutter et rincer les f ves plucher et hacher l oignon plucher et hacher la pomme de terre Gratter et hacher les carottes Trancher le c leri Faire fondre le beurre Ajouter les l gumes Les faire revenir Ajouter les f ves le bouillon et le lait Faire mijoter Liqu fier la soupe 179 Ajouter la cr me tout en m langeant Ajouter les assaisonnements R chauffer 2 4 2 Versions de SPIN Texte d ex cution Comment faire la soupe aux f ves Tremper les f ves Les goutter Les rincer
246. rogramm obj X op r gler obj s lecteur de vitesse de bande dest SP precond meilleure qualit d image corps succes ajout r gl obj s lecteur de vitesse de bande dest SP echec op s lectionner obj canal 4 precond corps appuyer dest touche de canal succes ajout s lectionn obj canal 4 echec ajout neg s lectionn obj canal 4 op sp cifier obj heure d enregistrement d ih 30min precond corps appuyer dest touche OTR qual 3 fois succes ajout sp cifi obj heure d enregistrement d 1h 30min echec ajout neg sp cifi obj heure d enregistrement d 1h 30min op appuyer dest touche OTR qual 3 fois precond corps enfoncer obj touche OTR qual 1 fois enfoncer obj touche OTR qual 2 fois enfoncer obj touche OTR qual 3 fois 161 succes ajout sp cifi obj heure d enregistrement echec ajout neg sp cifi obj heure d enregistrement op enfoncer obj touche OTR qual 2 fois precond corps succes ajout PM 11 05 1 h 1 echec ajout PM 10 35 30 min op enfoncer obj touche OTR qual 3 fois precond corps succes ajout PM 11 35 1 h 30min echec ajout PM
247. rrence 158 e 7 1 5 2 9 2 0 0 66 t2 D WHOoOooCWOrF NE 159 Relation rh torique s quence c condition laboration but r sultat mani re concurrence op ration s quentielle condition mat rielle attribut d objet effet influence op ration co temporelle option pr vention op ration ventuelle Relation rh torique laboration but mani re r sultat concurrence op ration s quentielle condition mat rielle attribut d objet effet influence op ration co temporelle option pr vention op ration ventuelle antique Relation rh torique s quence c condition laboration but r sultat mani re concurrence 30 1 op ration s quentielle condition mat rielle attribut d objet effet influence op ration co temporelle option pr vention op ration ventuelle APPENDICE D Entr e de SPIN 1 Repr sentation conceptuelle du domaine Ahhh hhh AAAA AAAA Ah ALAALA Ah hhh Mode Prolog WV X4 vcr_spec pl Specifications de la tache Author Leila Kosseim Created On Thu Jan 12 14 35 46 1995 4 Last Modified By Leila Kosseim Last Modified On Thu Feb 2 17 52 04 1995 WAAL hhh hhh hhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhh 4 charge les schemas et la nature de la tache consult vcr nature pl consult vcr schemas p1 CUIU BIB III ISTIS III IIIS III ISI ISI LIII VIII II ISI III III PII TUI 4 vcr spec pl end of file CUI
248. s avons motiv cette recherche en mentionnant ses contributions la science e du point de vue th orique l interpr tation d instructions et le d veloppement d un mod le de planification textuelle motiv linguistiquement e du point de vue pratique l automatisation de la r daction de textes d instructions Les contributions th oriques ont t d montr es tout au long de la th se Penchons nous maintenant sur le point de vue pratique Reiter Mellish et Levine ont d montr que la pro duction de documentation technique est un processus assez co teux et peu automatis dans l industrie RML95 Pourtant dans des domaines o des sp cifications d appareils existent d j l automatisation de ce processus implique de nombreux avantages Entre autres La r duction de l entretien de la documentation L entretien et les mises jour d un document peuvent en effet tre plus co teux que sa production initiale Avec une g n ration automatique seule une modification dans les sp cifications conceptuelles est n cessaire et les nouveaux documents peuvent tre produits automatiquement Avec l approche manuelle il est n cessaire de chercher dans tous les documents les r f rences au ph nom ne modifi ce qui est long co teux et non l preuve des erreurs La consistance entre la documentation et l appareil Id alement le concepteur de l appareil et le r dacteur technique partagent une m me base de sp cif
249. s le vid o SPIN utilisera la repr sentation concep tuelle du domaine du fichier Specifications vcr_spec pl et le mod le de lecteur du fichier Modele_Lecteur VCR novice pl Le texte g n r sera une liste d ex cution et le mode de d ver minage teint fera en sorte que les structures interm diaires ne seront pas affich es Le r sultat de cette requ te est illustr la figure 6 13 En suivant la production de ce texte tudions maintenant chaque tape de SPIN 2 La planification de t che Le but du planificateur de tache est de construire une repr sentation conceptuelle de la t che accomplir partir d une repr sentation conceptuelle du domaine La repr sentation de la t che sera ensuite pass e au planificateur de texte qui construira une repr sentation rh torique du texte Pour se pencher sur des ph nom nes particuliers de la planification de tache diff rentes approches ont t d velopp es On retrouve par exemple la planification par squelettes Fri79 1 On peut aussi utiliser le pr dicat spin O et se laisser guider par le menu 100 Programmation d un enregistrement d ih 30 min par une touche incr mentielle Pour une meilleure qualit d image r glez le s lecteur de vitesse de bande sur SP S lectionnez le canal 4 en appuyant sur la touche de canal Appuyez sur la touche OTR 3 fois Lorsqu elle est enfonc e 1 fois PM 10 35 30min Lorsqu elle est enfonc e 2 fois PM 11 05 1
250. s permet de mieux comprendre les diff rents types d instructions et l effet du choix du contenu sur l interpr tation et l ex cution de la t che Dans KE91 Konoske et Ellis ont ensuite repris des travaux de Smith et Goodman et ont test l effet des diff rents types d explications sur l apprentissage l ex cution et la m morisation de la t che Les r sultats de leurs exp riences indiquent que l avantage des diff rents types d explications d pend de l expertise de l agent et de sa connaissance du syst me En effet avec des tudiants de premier cycle une premi re exp rience indiquait que l information fonctionnelle facilite l apprentissage la m morisation et l ex cution de la proc dure Cependant une seconde exp rience effectu e sur du personnel de la marine plus exp riment n arrivait pas la m me conclusion L explication retenue est que du leur niveau de connaissances diff rent ces deux groupes de sujets utilisent des strat gies d interpr tation diff rentes Les tudiants tentaient de se souvenir de l information tandis que le personnel de la marine tentait de reconstruire la proc dure en d terminant les contraintes satisfaire pour atteindre le but Du travail de Konoske et Ellis il faut retenir qu un r dacteur d instructions doit tenir compte de la structure des connaissances du lecteur et de la structure de la tache pour d ter miner la structure du contenu textuel 2 2 3 Le travail de Donin Br
251. s peut toujours en lumi re attenuee Avant de rebobiner pour debrayer la maintenant ere ouvert enfoncer le bouton roue d entra nement resultat place sous le bo tier puis tourner la manivelle La manivelle ne doit alors circonstance de rembobinage dans le plus offrir de resistance N sens des aiguilles d une montre jusqu ce que la pellicule soit Avant de enfoncer le bouton enti rement rentre dans la cartouche t place sous le boitier rebobiner circonstance puis tourner la manivelle jusqu ce que la pellicule soit de rembobinage dans entierement rentree dans la cartouche g le sens des aiguilles d une montre FIGURE 3 4 Exemple d analyse textuelle par la RST ou le satellite pour mettre le poste se rapporte au noyau presser le bouton Dans la convention de la RST le segment horizontal indique l expression linguistique le segment vertical ou oblique indique un noyau et l arc tiquet X indique l existence de la relation rh torique X 2 1 La RST en tant que th orie descriptive La RST d finit des relations tous les niveaux de la structure textuelle Une description de texte par la RST construit donc une structure arborescente qui relie les portions du m me niveau puis des portions plus petites Jusqu couvrir tout le texte Par exemple la figure 3 4 illustre une analyse de texte par la RST 2 2 La RST en tant que th orie constructive La RST peut tre utilis e de facon con
252. s ph nom nes Hervey et Higgins justifient cette diff rence de contenu par la diff rence culturelle entre francophones et anglophones En l ar exemple criture vers la droite ou vers la gauche paragraphes ou listes num r es HH92 146 effet diff rentes cultures r agissent diff remment des m mes ph nom nes linguistiques et poss dent des niveaux de connaissances diff rents C est pourquoi une recette de cuisine peut s adresser un lecteur anglais en supposant un niveau d expertise faible tandis que cette m me attitude offusquerait un fran ais La langue de communication semble donc jouer un r le indirect dans la d termination du contenu textuel d instructions car elle est une composante importante dans la culture du lecteur D autres facteurs comme le statut social du lecteur son mode de vie sa situation g ographique etc influencent aussi au m me titre le contenu textuel Nos heuristiques de s lection ne sont pas influenc es par la langue de communication ni par d autres facteurs culturels Dans SPIN pour prendre en consid ration les diff rences culturelles des lecteurs le mod le du lecteur devrait tre tendu pour inclure non seulement ses connaissances sur le domaine mais aussi sa culture De plus des heuristiques devraient tre d velopper pour prendre en consid ration l influence des diff rences culturelles l inverse du contenu s mantique la structure textuelle est directem
253. s plu sieurs domaines d application De plus comme nous verrons au chapitre 6 nous utilisons une repr sentation conceptuelle contenant bien plus que la d composition de la t che permettant ainsi de g n rer un contenu textuel plus vari Nous comparerons le travail de Dale et le n tre plus en d tail au chapitre 7 Le syst me de Mellish et Evans Mellish et Evans ont construit un syst me de g n ration de texte qui accepte en entr e une repr sentation conceptuelle d une proc dure g n r e par un planificateur de t che et produit un texte en langue naturelle expliquant comment ex cuter la proc dure Mel88 ME89 Mel90 Le syst me a t test sur plusieurs domaines comme la cuisine la construction d une maison et la r paration d une voiture et d une prise lectrique Le syst me de Mellish prend en entr e des structures Prolog correspondant celles pro duites par le planificateur de t che NONLIN Tat76 et proc de en quatre tapes 1 La planification du message organise l information de la repr sentation concep tuelle en morceaux qui seront r alis s par des parties ind pendantes du texte La 26 H A di LF Une fois avoir fait A ie C Pa i vous pouvez faire B et C K forwards Se a S Avant de faire A Ai zN vous devez faire B et C Ac backwards Plan de la procedure Texte correspondant FIGURE 2 3 Strat gies rh toriques forwards et ba
254. s sont difficiles d visser facilitez le d vissage en mettant un peu d huile p n trante 174 Lecteur moyen texte hybride Desserrage des crous de la roue Vous n enlevez pas les crous compl tement D vissez les avec une cl en croix S ils portent la marque L les crous ont le filetage gauche les crous sont tourn s dans le sens des aiguilles d une montre S ils ne portent pas de marque tournez les crous en sens contraire Si les crous sont difficiles d visser facilitez le d vissage en mettant un peu d huile p n trante Lecteur moyen texte de compr hension Desserrage des crous de la roue Vous n enlevez pas les crous compl tement Il faut les d visser avec une cl en croix S ils portent la marque L les crous ont le filetage gauche les crous sont tourn s dans le sens des aiguilles d une montre S ils ne portent pas de marque il faut tourner les crous en sens contraire Si les crous sont difficiles d visser vous facilitez le d vissage en mettant un peu d huile p n trante Lecteur expert texte d ex cution Pour desserrer les crous de la roue D visser les crous avec une cl en croix i les crous sont difficiles d visser mettre un peu d huile p n trante Lecteur expert texte hybride Desserrage des crous de la roue Les crous sont d viss s avec une cl en croix Si les crous sont difficiles d visser un peu d
255. s textes hybrides 69 96 tandis que dans les textes de compr hension il y a autant d effets internes qu externes Les heuristiques i ii et iii r capitul es la table 4 8 ont donc t ajust es pour prendre en consid ration le but communicatif du texte 3 5 Les influences Une influence indique comment ou pourquoi une op ration doit tre ex cut e tout en guidant son ex cution Par exemple 47 tourner cette touche droite et gauche pour minimiser les parasites Dans le corpus 9 96 des l ments s mantiques sont des influences L influence se distingue de l effet car ce dernier n influence pas comment l op ration est ex cut e mais augmente sim plement les connaissances du lecteur L effet entre 2 op rations sp cifie une relation de g n ration entre les types d action D un autre cot l influence sp cifie une g n ration entre des instances d action Si l op ration enfant est ex cut e d une fa on particuli re alors elle g n rera l op ration parent l ex cution de l op ration enfant est donc influenc e par l op ration parent Comparez par exemple les phrases 41b et 47 Dans la premiere r chauffer le moteur n in fluence pas comment on fait rouler l automobile tandis que dans le second exemple comment la touche est tourn e de droite gauche est dict par la quantit de parasites l cran heuris tique i i i E contrainte nature de la t che
256. sauf un C est le cas dans 49 Si la boite pont est munie d une jauge d huile tirez la hors du tube de remplis sage essuyez la reins rez la compl tement et retirez la de nouveau pour lire le niveau d huile Ici pour effectuer l op ration de base lire le niveau d huile toutes ses op rations enfants sont pr cis es sauf la plus vidente regarder la marque du niveau d huile sur la jauge Dans le corpus 70 96 des influences satisfont ce cas On introduit aussi une influence dans le texte si Oy est une op ration de base Oz est enfant unique et son ex cution d pend de l ex cution de son op ration parent O Cette d pendance d finit g n ralement une condition d arr t comme dans 50a Oy secouer et Op d gager ou bien une m thode suivre comme dans 50b O couper et Op former et 50c Oy disposer et Op placer 50 a Secouez doucement le capuchon pour le d gager b Coupez le carr en deux pour former deux triangles 12Dans le domaine du soufflage de verre la paraison est le r sultat de la seconde cueillette de verre en fusion 18 On peut aussi interpr ter cette phrase comme sp cifiant une permission dans ce cas pour lire le niveau d huile communiquerait une op ration s quentielle et non une influence 14 Exemple hors corpus tir de DE93b conceptuelle heuris tique i Oy doit tre ef fectu e tre ef nature de la t che S est l ensemble des op rations en
257. se i de Dale ne semble pas tenir En comparant les connaissances du lecteur la repr sentation conceptuelle du domaine on vitera de lui donner de l information vidente ses yeux et on pourra inclure dans le texte de l information qui compl tera ou rectifiera ses attentes L hypoth se ii de Dale vient de sa d finition d une op ration primitive Pour Dale une op ration est primitive si le lecteur sait comment l ex cuter il connait la valeur du champ corps Cependant cette d finition ne tient pas compte des autres informations contenues dans les sch mas d op ration Si le lecteur sait comment d composer une op ration mais n en connait 108 lecteur programmer obj X qual Y precond corps succes ajout programm obj X echec ajout neg programm obj X FIGURE 6 16 Exemple de sch ma d op rations du mod le du lecteur pour le texte ver pas les pr conditions celle ci doit elle tre consid r e primitive Pour consid rer ceci nous utilisons une notion d op ration primitive plus contraignante Une op ration est primitive pour un lecteur si celui ci connait au moins unf de ses sch mas de fa on compl te correcte et minimale Dans SPIN le mod le du lecteur est donc lui aussi compos d une biblioth que de sch mas d op rations et de connaissances sur la nature de la t che La figure 6 16 illustre un sch ma d op ration du lecteur tir de mod le novice pl Ici l
258. sens contraire i les crous sont difficiles d visser mettre un peu d huile p n trante attendre quelques minutes essayer de nouveau Lecteur novice texte hybride Desserrage des crous de la roue On d visse les crous avec une cl en croix S ils portent la marque L les crous ont le filetage gauche tournez les crous dans le sens des aiguilles d une montre S ils ne portent pas de marque les crous sont tourn s en sens contraire Si les crous sont difficiles d visser on met un peu d huile p n trante attendez quelques minutes on essaye de nouveau Lecteur novice texte de compr hension Desserrage des crous de la roue Il faut d visser les crous avec une cl en croix S ils portent la marque L les crous ont le filetage gauche vous tournez les crous dans le sens des aiguilles d une montre S ils ne portent pas de marque vous tournez les crous en sens contraire Si les crous sont difficiles d visser vous mettez un peu d huile p n trante vous attendez quelques minutes il faut essayer de nouveau Lecteur moyen texte d ex cution Desserrage des crous de la roue Wenlevez pas les crous compl tement D vissez les avec une cl en croix ils portent la marque L les crous ont le filetage gauche tournez les crous dans le sens des aiguilles d une montre S ils ne portent pas de marque tournez les crous en sens contraire i les crou
259. sentation conceptuelle du domaine et non pas calcul e par le planificateur vitant ainsi ce probl me de conflit 106 Finalement l it ration de l tape iv termine lorsque d apr s le mod le du lecteur toutes les op rations du plan sont primitives c est dire lorsque le lecteur sait comment effectuer toutes les op rations du plan Rappelons que le but de la planification de t che dans SPIN est de d montrer qu il est possible d utiliser la sortie d un tel syst me pour des fins de g n ration de texte malgr sa simplicit ce module nous semble ad quat dans ce contexte 3 La planification de texte Une fois la repr sentation conceptuelle de la t che construite la planification textuelle vient d terminer quoi dire et comment le pr senter Dans SPIN ce travail s effectue en quatre tapes i la s lection des l ments s mantiques ii i iii la structuration des l ments s mantiques la s lection des relations rh toriques iv la structuration des relations rh toriques 3 1 Le choix des l ments s mantiques Communiquer toute l information disponible dans la repr sentation conceptuelle de la t che produirait un texte tr s lourd c est pourquoi il est n cessaire de s lectionner quels l ments s mantiques seront communiqu s et quels l ments s mantiques seront laiss s implicites Pour s lectionner les l ments s mantiques proc duraux communiquer la
260. sing Rhetorical Relations Dans Proceedings of the 10 Annual Conference of The Cognitive Science So ciety pages 637 643 Montr al ao t 1988 J Moore et M Pollack A Problem for RST The Need for Multi Level Discourse Analysis Computational Linguistics 18 4 537 544 dec 1992 J Moore et C Paris Planning Text for Advisory Dialogues Capturing Inten tional and Rhetorical Information Computational Linguistics 19 4 651 694 d cembre 1993 W Mann et S Thompson Rhetorical Structure Theory Towards a functional theory of text organization T EXT 8 3 243 281 1988 C Paris The role of the user s domain knowledge in generation Computational Intelligence 7 71 93 1991 C Paris User Modelling in Text Generation Frances Pinter London England 1993 J Price et H Korman How to Communicate Technical Information A Hand book of Software and Hardware Documentation Benjamin Cummings 1993 M Pollack Inferring Domain Plans in Question Answering Th se de doctorat University of Pensnylvania 1986 SRI rapport technique SRIN 403 L Polanyi A formal Model of the Structure of Discourse Journal of Pragmatics 12 5 6 601 638 d cembre 1988 M Pollack Plans as Complex Mental Attitudes Dans Intentions in Communi cation chapitre 5 The MIT Press Cambridge MA 1990 S Peters et W Rapaport Superordinate and Basic Level Categories in Dis course Memory and Context Dans Proceedings of the 12 Annual Conference
261. soupe Vous ne la faites pas bouillir 180 2 5 Prise lectrique de Mellish 2 5 1 Version originale pour faire en sorte que la prise de courant fonctionne vous devez avoir install le nouveau fusible pour faire en sorte que vous installiez le fusible le couvercle doit tre t et la bo te du fusible doit tre vide enlever le couvercle et enlever l ancien fusible ensuite la bo te du fusible sera vide installez le nouveau fusible cependant maintenant le couvercle n est pas mis installez le couvercle ensuite branchez la prise et la prise fonctionnera 2 5 2 Versions de SPIN Texte d ex cution Comment faire fonctionner le syst me Enlevez le couvercle Enlevez l ancien fusible Installez un nouveau fusible Installez le couvercle Branchez la prise Texte hybride Comment faire fonctionner le syst me Enlever le couvercle Enlever l ancien fusible Installer un nouveau fusible Installer le couvercle Brancher la prise Texte de compr hension Comment faire fonctionner le syst me Enlever le couvercle Enlever l ancien fusible Installer un nouveau fusible Installer le couvercle Brancher la prise R F RENCES AKPT91 A1183 A1191 App85 AR95 Bal92a Bal92b BHS94 Bin86 Bri86 BVDGH90 Car92 CGB88 Dah88 Dah89 J Allen H Kautz R Pelavin et J Tenenberg Reasoning about Plans Morgan Kaufmann San Mateo Californie 1991
262. stique mais aussi l organisation textuelle En particulier Bingham Bin86 10 offre des conseils sur la r daction d explications de proc d s Bingham d finit trois classes de proc d s en fonction de l agent qui l ex cute a les proc d s effectu s par des agents humains par exemple une recette de cuisine b les proc d s ex cut s par un m canisme par exemple le fonctionnement d une voiture c les proc d s naturels sur lesquels personne n a de contr le par exemple une ruption volcanique La classe a qui nous int resse plus particuli rement est divis e en explications de proc dures o le lecteur tente seulement de comprendre le proc d et en instructions o le lecteur agit selon les directives du texte Les explications de proc dure sont g n ralement form es de plusieurs paragraphes tandis que les instructions utilisent des tapes num rot es Dans la plupart des travaux en linguistique informatique cf la section 3 de ce chapitre seules les ins tructions sont consid r es Dans notre projet les deux types de textes de la classe a ont t consid r s Nous y faisons r f rence par le terme texte d instructions 1 2 Travaux en documentation informatique Une application tr s r pandue en r daction technique est celle de la r daction de docu mentation informatique Ce type de documentation inclue les textes d instructions mais aussi les tutoriels les cartes d aid
263. structive deux fins pour planifier le contenu ainsi que l organisation textuelle ou pour planifier seulement l organisation textuelle la d termination du contenu tant bas e sur une autre m thode I source photo p 87 88 Les citations de cette forme indiquent un texte du corpus dont la r f rence se trouve l appendice A 1 2 Nous utilisons ici les relations originelles de la RST et non les relations particuli res pour les instructions pr sent es au chapitre 5 35 2 2 1 Planification enti re par la RST La RST peut tre utilis e non seulement pour organiser le contenu mais aussi pour le d terminer c est le cas de MP88 MP93 Moo95 Cette approche se base sur le but communicatif du texte pour diriger la s lection du contenu et des relations rh toriques ainsi que leur structure hi rarchique Le planificateur de texte est en fait un planificateur de tache cf le chapitre 6 section 2 qui utilise deux types d op rateurs des op rateurs caract risant les croyances du lecteur pour d terminer le contenu textuel et des op rateurs rh toriques Chaque op rateur est d finie par i un effet c est dire l effet de l op rateur sur les croyances du r dacteur et du lecteur ii des contraintes v rifier avant d appliquer l op rateur ces contraintes peuvent porter sur des faits ou des relations du domaine de discours sur des connaissances du lecteur ou encore sur le noyau de la relation
264. t pour enfants immobilisez le dispo sitif de s curit avec la ceinture ventrale l agent ne doit pas n cessairement monter le dispositif mais l op ration est telle que s il l ex cute il en est tout fait conscient son choix a t volontaire Dans ce cas on a affaire une option D un autre c t dans 22 Si vous tentez d acc der au disque C gt vous n y parviendrez pas 46 l op ration tenter d acc der au disque C gt est telle que l agent peut l effectuer sans s en rendre compte Par exemple il suppose qu une commande n acc de pas au disque mais en fait n cessite cet acc s Dans le cas d une d cision involontaire comme celle ci l expression communique une op ration ventuelle Les influences et les effets Si l op ration est obligatoire elle peut tre g n r e dans le sens de Goldman cf le chapitre 2 par une autre op ration incluse dans le texte Dans ce cas il peut s agir d une influence ou d un effet Si l op ration parent 8 contribue toujours l op ration enfant a ind pendamment de comment a est ex cut e alors on a affaire un effet Dans ce cas 8 n influence pas l interpr tation et l ex cution de o Par exemple dans 23 Revissez l crou capuchon sur la lyre pour ne pas le perdre peu importe comment on revisse l crou capuchon a par exemple en faisant deux rotations droite plut t que trois la g n ration aura lieu car l crou capuch
265. t tre produits traduits et mis jour Car92 Les travaux en g n ration de texte offrent la possibilit d automatiser certaines manipulations de documents par exemple l interface pour des bases de donn es McK85 l enseignement assist par ordinateur Zoc90a Zoc91a Zoc91b ZL91 la production de rapports r sumant de grandes quantit s de donn es Kay92 la g n ration multilingue comme alternative la traduction automatique R6s93 Sco93 et l assistance la r daction technique PVLF 95 En linguistique informatique la g n ration de texte permet de d velopper des th ories formelles sur la production humaine de la langue et d tendre clarifier et v rifier des th ories repr sentation conceptuelle planification textuelle quoi dire determination du contenu et de l organisation textuelle realisation linguistique comment le dire determination des structures grammaticales et choix lexical realisation motrice le dire operations phono acoustiques ou graphiques texte en langue naturelle FIGURE 1 2 Architecture lin aire de la g n ration de texte d velopp es en linguistique en psychologie et en sociologie sur la communication humaine PSM91 2 2 Architecture Thompson a formalis le processus de g n ration de texte en deux tapes s quentielles la planification du texte qui d termine quoi dire et la r alisation linguistique
266. t gories e les v nements de cr ation Les PC de cr ation indiquent un but qui entraine la r ali sation d un v nement Par exemple la cr ation d un objet comme dans 12 Joignez les bouts de la bande du chapeau pour former un cercle La majorit des PC du corpus de Di Eugenio font partie de cette classe e les v nements de pr vention Les PC indiquant un v nement de pr vention informent le lecteur que le monde ne devrait pas changer c est dire que le lecteur devrait viter qu un v nement se produise Ces PC sont reli s aux imp ratifs n gatifs Par exemple 13 Coller les cot s rudes du tissu pour viter que des fils s effilochent pendant que vous travaillez e la modification des connaissances du lecteur Ces PCs indiquent un changement qui affectera les connaissances du lecteur plut t que le monde Comme dans 14 Pour d terminer la quantit de bordure mesurez la largeur en pieds de tous les murs couvrir et divisez par 3 Les PCs de Di Eugenio s expliquent g n ralement par les relations de g n ration et de permission Dans une PC a l action g n rante contribue toujours l action g n r e Dans le cas o f et o soient simplement reli es par la relation EST UN alors on aurait affaire une abstraction On peut donc classifier les relations d abstraction contribution g n ration et permission de la fa on suivante e Si l ex cution de a contribue l ex cution
267. t indiqu par des s quences Prolog Par exemple la hi rarchie de la figure 6 15 est repr sent e par Cini n2 n3 n4 n5 n2 n6 n7 n5 n2 n6 n8 n9 n10 n5 Voyons maintenant comment fonctionne la planification de t che 105 2 3 Le processus de planification de t che Tel que d velopp par Sacerdoti Sac77 l algorithme pour construire un plan non lin aire de fa on hi rarchique construit d abord un plan un niveau d abstraction lev puis ce plan est d compos un niveau d abstraction plus d taill Plus pr cis ment il faut i Former un plan initial compos d un seul n ud signifiant atteindre but d sir ii Faire l expansion du plan le plus d taill dans la hi rarchie ainsi produisant un plan encore plus d taill iii Critiquer le nouveau plan pour r ordonner ou liminer les op rations redondantes iv R it rer les tapes ii et iii jusqu au niveau de d tail d sir L tape i permet SPIN de cr er le n ud n1 de la figure 6 15 Pour l tape ii l algorithme conventionnel d expansion a quelque peu t modifi pour tenir compte des pr conditions ne pas nier par chec En effet pour qu une op ration O soit s lectionn e sa postcondition de succ s doit atteindre un tat d sir et ses pr conditions doivent tre satisfaites Typiquement pour satisfaire une pr condition P celle ci doit faire partie de l tat courant du m
268. t la plus facile est communiqu e C est le cas dans 39 S ils les crous portent la marque L ils ont le filetage gauche et vous devez les d visser en tournant dans le sens des aiguilles d une montre Pour les crous qui ne portent aucune marque tournez en sens contraire Ici le filetage gauche droite est la condition fondamentale pour d terminer dans quel sens d visser les crous Cependant cet tat est difficile v rifier tandis que l tat quivalent porter ou non la marque L est bien plus facile v rifier Initialement comme le lecteur ne sait pas n cessairement que les deux tats sont quivalents ils sont tous les deux communiqu s Cependant on peut supposer plus tard que le lecteur peut deviner que l tat les vis ne portent aucune marque est quivalent les vis ont le filetage droite Il est donc inutile de communiquer ce second tat Comme nous verrons au chapitre 6 les conditions quivalentes sont sp cifi es dans la repr sentation conceptuelle de la t che cf la table 6 25 p 109 L op ration contrainte par l tat peut tre explicite dans le texte comme dans les exemples pr c dents ou bien peut tre laiss e implicite comme dans 40 Sila couleur ne suit pas lorsque l on passe rapidement sur le verre c est qu elle est trop paisse Suivre le mod le sous verre Ici l op ration implicite diluer la peinture satisfait l heuristique ii des op rations s que
269. tant 3 2 La structuration s mantique Une fois la liste des l ments s mantiques construite une certaine structuration est n ces saire Cette tape a pour but de i r ordonner la liste des l ments s mantiques ii r soudre les contraintes de cooccurrence d l ments s mantiques laiss es non r solues 3 2 1 Le r ordonnancement des l ments s mantiques Le r ordonnancement des l ments s mantiques n est pas motiv linguistiquement mais est effectu pour des consid rations d implantation Cette tape a pour but de pallier 2 probl mes e Les m mes instances d op rations r p t es dans plusieurs plans de la repr sentation de la t che changent l ordonnancement des l ments s mantiques e L ordonnancement des op rations dans le plan ordre partiel ne correspond pas l ordonnancement des l ments s mantiques dans un texte ordre total Comme nous avons vu pr c demment SPIN s lectionne les l ments s mantiques en par courant la repr sentation de la tache en largeur Cependant dans cette repr sentation un noeud ayant fini son expansion avant les autres est r p t jusqu au niveau le plus bas Par exemple dans la figure 6 15 les noeuds n2 n6 et n5 se retrouvent diff rents niveaux dans la repr senta tion de la t che Ainsi lors du parcours pour s lectionner les l ments s mantiques ces noeuds sont consid r s plusieurs reprises Ce ph nom ne peut faire
270. te donn les heuristiques de pr sentation D abord les rela tions rh toriques les plus fr quentes dans les textes d instruction sont pr sent es Puis tout comme pour les heuristiques de s lection les contraintes g rant les heuristiques sont pr sent es Finalement pour chaque l ment s mantique les heuristiques de pr sentation sont sp cifi es 1 Les relations rh toriques dans les instructions Parmi les relations rh toriques de la RST seul un ensemble restreint est couramment utilis dans les textes d instructions Deux travaux ant rieurs ont tudi la question des relations rh toriques dans les textes d instructions Vander Linden VL93b et Rosner et Stede RS92 Pour Vander Linden les 5 relations les plus importantes sont e la s quence la pr condition que nous appelons c condition le but purpose le r sultat e la concurrence Rosner et Stede consid rent aussi e la limite until e l alternative e la s quence num r e step sequence 75 notre tour nous ajoutons e la mani re means e l laboration Voyons maintenant chaque relation en d tail 1 1 La s quence La s quence est une relation multi nucl ique o les noyaux sont reli s par une relation de succession On retrouve cette relation dans des phrases comme 60 Faire cuire les spaghettis les goutter et les saler au go t 1 2 La c condition La c condition est en fait une combinaison
271. tes d instructions Har85 Har86 Ainsi SPIN organise les textes d ex cutions en listes num r es et les textes hybrides et de compr hension en paragraphes 6 R sum Ce chapitre a pr sent l implantation du syst me SPIN SPIN poss de une architecture lin aire D abord partir d une repr sentation conceptuelle du domaine compos e d une bi blioth que de sch mas d op rations et d une base de connaissance sur la nature de la t che un planificateur de t che d veloppe une hi rarchie de plans formant la repr sentation conceptuelle de la tache accomplir SPIN entame ensuite la planification textuelle D abord un ensemble d l ments s mantiques communiquer est s lectionn et structur Cette tape est effectu e en appliquant les heuristiques pr sent es aux chapitre 4 Puis les relations rh toriques les plus appropri es sont s lectionn es et structur es suivant les heuristiques de pr sentation du cha pitre 5 Pour la r alisation linguistique l tude de Vander Linden nous a fortement inspir cependant cette tude a t adapt e pour le fran ais Finalement les choix grammaticaux sont r alis s lexicalement puis affich s Le but de SPIN est de v rifier la validit des heuristiques pr sent es aux chapitres 4 et 5 Le prochain chapitre est donc exclusivement consacr l valuation de ces r sultats CHAPITRE 7 valuation Dans ce chapitre nous tentons d
272. textuelle d instructions CHAPITRE 3 Planification d instructions La s lection des informations communiquer et de la structure rh torique pour les pr senter d pend d un grand nombre de facteurs Pour restreindre notre recherche nous ne nous sommes attard e que sur un genre textuel particulier les textes d instructions Ce chapitre est d di la description des textes d instructions en tant que genre tex tuel D abord nous en d crivons les caract ristiques rh toriques qui en permettent une analyse stricte Ensuite nous d crivons l outil d analyse la th orie de structure rh torique RST Nous expliquons les fondements de la RST et analysons comment elle est utilis e de fa on descrip tive et constructive en planification textuelle Finalement nous pr sentons notre approche la planification textuelle d instructions et d crivons bri vement le corpus sur lequel l analyse a t effectu e 1 Les textes d instructions en tant que genre textuel Le d veloppement de syst mes de g n ration de texte est grandement limit par l habi let effectuer des choix justifi s parmi toutes les possibilit s disponibles aux niveaux de la planification et de la r alisation textuelle Ces choix d pendent entre autres de la nature et de la relation entre interlocuteurs du contexte de la communication et du m dium employ Cependant certains types de situations communicatives donnent lieu de fa on s
273. tients la distinction se situe au niveau des connaissances du lecteur En effet le lecteur sait d composer une op ration de base en sous op rations tandis que pour une op ration primitive il connait non seulement sa d composition mais aussi ses pr et postconditions 92 base Dans certains cas certains agents peuvent poss der un r pertoire d op rations de base diff rent La notion d op ration de base est donc assez subjective L ensemble des op rations de base n est pas universel tous les domaines et tous les sujets Il semblent d pendre e du domaine de discours e du niveau de connaissances du lecteur et du r dacteur e du but de la communication Rappelons qu en philosophie des actions Goldman et Danto Gol70 Dan63 Dan65 Dan73 d finissent aussi une notion d actions de base Pour Goldman et pour Danto une action de base est la source de toute relation de g n ration Une action est consid r e de base si elle est la plus sp cifique que l agent peut effectuer de fa on volontaire par exemple baisser le bras ou lever les paules De plus une op ration de base ne peut tre ex cut e en faisant une autre action Dans ce cas l action taper un caract re au clavier n est pas de base car elle ne peut tre effectu e qu en faisant une autre action qu en bougeant ses doigts d une fa on particuli re sur un endroit particulier En philosophie d actions l ensemble des actions de base correspond g
274. tion de la pr sentation ainsi permettant des r visions locales Aussi la s lection du m dia s effectue en m me temps que la s lection du contenu Cependant tout comme dans COMET la d termination du contenu et la d termination de l organisation textuelle sont effectu es en m me temps cette fois ci via les relations et plans de la RST 24 Comme nous verrons au chapitre 3 nous n avons pas utilis la RST de fa on constructive comme dans WIP mais plut t de fa on descriptive lors de l analyse de corpus 3 2 2 Syst mes de g n ration de textes Dans les travaux en g n ration automatique de texte plusieurs projets se sont pench s sur les textes d instructions EPICURE le syst me de Mellish et Evans TECHDOC IMAGENE DRAFTER et GIST EPICURE de Dale Le syst me EPICURE de Dale est un syst me de g n ration de texte ax sur la production d expressions r f rentielles pour communiquer des entit s complexes Dal88 Dal89a Dal89b Dal92 EPICURE est compos d une composante strat gique et d une composante tactique pour g n rer des recettes de cuisine un type particulier de textes d instructions Pour notre th se la composante strat gique de EPICURE nous int resse particuli rement Ce planificateur de discours est en fait un planificateur hi rarchique de t che ayant comme but initial la production d une recette particuli re Le planificateur d termine quelles op rations sont n cessaires p
275. tions Aussi si la m me instance d op ration se retrouve dans diff rents plans diff rents niveaux dans la repr sentation de la tache elle ne sera pas distingu e dans ces diff rents plans et sera tiquet e par le m me identificateur 104 PERTE plan 1 scm as plan 2 Les n5 o plan 3 n10 FIGURE 6 15 Repr sentation conceptuelle de la tache pour le texte ver Les n uds de la repr sentation de la tache sont reli s par deux types de liens e Un lien hi rarchique entre une op ration et ses op rations enfants Ces liens forment un arbre o chaque niveau de l arbre constitue un plan un certain niveau d abstrac tion e Un lien de pr c dence entre op rations d un m me niveau d abstraction Ces liens d finissent l ordonnancement des op rations et forment un plan un niveau d abstrac tion particulier La figure 6 15 illustre la repr sentation conceptuelle de la tache pour le texte vcr Les fl ches pleines indiquent les liens hi rarchiques tandis que les liens en pointill s indiquent la pr c dence l int rieur d un plan Dans cet exemple particulier toutes les instances d op rations d un m me plan sont ordonn es de fa on totale Cette structure est gard e dans SPIN sous la forme d une liste de plans o chaque plan est une liste Prolog L ordre partiel entre op rations es
276. tiques proc duraux et un l ment non proc dural e l op ration s quentielle e l attribut d objet non proc dural e la condition mat rielle e l effet e l influence e l op ration co temporelle e l option e la pr vention l Nous utilisons le terme l ment plut t que relation car ces informations donnent g n ralement lieu au satellite ou au noyau d une relation rh torique plut t qu au lien entre ces composantes 44 l ments S mantique op ration s quentielle condition mat rielle attribut d objet effet influence op ration co temporelle option pr vention op ration ventuelle autre EE w TABLE 4 2 l ments s mantiques du corpus e l op ration ventuelle La fr quence de ces l ments s mantiques dans le corpus est pr sent e la table 4 2 Bien s r cette liste n est pas exhaustive elle reste un ensemble ouvert Cependant elle comptabilise la grande majorit 9996 des l ments retrouv s dans notre corpus Pour identifier l l ment s mantique communiqu par une expression textuelle nous avons utilis la classification de la figure 4 6 p 49 Les attributs d objets Parmi les l ments s mantiques seuls les attributs d ob jets sont non proc duraux Par exemple 18 Une lampe une seule douille comporte habituellement une lyre qui tient une barre de retenue par les manchons Cet l ment ne participe pas directement la proc dure ma
277. tit s lexicales plut t que concep tuelles En effet son op ration 20 stir_in obj cream profite que l anglais poss de l entr e lexicale to stir in Cependant celle ci n existe pas en fran ais c est pourquoi 2devrait tre not 132 E ni n2 E m Iss a7 ks s nia nis n16 n 7 p18 nie n20a n20b nat n22 n10 nii n12 n13 n23 n24 n25 n26 n27 n28 n faire obj soupe nib ajouter obj l gumes ni pr parer obj ingr dients ni6 faire revenir obj l gumes n2 cuisiner obj ingr dients ni7 ajouter obj f ves bouillon lait n3 pr parer obj f ves ni8 faire mijoter n4 pr parer obj l gumes ni9 liqu fier obj soupe n5 effectuer obj tape_cuisson1 n20a ajouter obj cr me n6 effectuer obj tape cuisson2 n20b m langer obj soupe n7 tremper obj f ves n21 ajouter obj assaisonnements n8 goutter obj f ves n22 s faire r chauffer obj soupe n9 rincer obj f ves n23 plucher obj oignon ni0 pr parer obj oignon n24 hacher obj oignon nii pr parer obj pommes de terre n25 plucher obj pommes de terre ni2 pr parer obj carottes n26 hacher obj pommes de terre ni3 trancher obj c leri n27 gratter obj carottes ni4 faire fondre obj beurre n28 hacher obj carottes FIGURE 7 24 Repr
278. tous les autres cas toute op ration de base obligatoire imm diate et ind pendante Dans de nombreuses proc dures de l information qui n a pas directement voir avec la proc dure ex cuter est communiqu e ce sont les attributs d objets Comme l indique la figure 4 8 p 73 cet l ment s mantique est beaucoup moins fr quent dans les instructions d ex cution que dans les instructions visant seulement la compr hension Ceci explique pourquoi aucun travail en analyse d instruction par exemple RS92 VL93b ne discute de ce sujet Cependant en moyenne dans notre corpus cet l ment s mantique compte pour pr s de 11 96 du texte Voici deux exemples d attributs d objets 59 heuris contrainte commu tique conceptuelle nature cooc lecteur but com niquer de la t che currence municatif i un objet OB A est un at ne conna t pas ex cution A doit tre utilis tribut de OB l attribut A de qui justifie la OB prochaine ligne d op rations ii un objet OB texte visant de de plus en doit tre utilis plus en plus la plus de d at ou O doit tre compr hension plu tributs de OB ex cut e t t que l ex cution TABLE 4 5 Heuristiques de s lection l attribut d objet 37 a Une lampe une seule douille comporte habituellement une lyre qui tient une barre de retenue par des manchons Pour enlever la lyre b Le s lecteur de sortie VCR VHF OUT est implant sur le pan
279. trement L heure d enregistrement sera sp cifi Pressez la touche TIMER dans un d lai de 9 secondes la lumi re TIMER s allumera Pour s lectionner le canal 4 appuyez sur la touche de canal Le canal changera Pour sp cifier l heure d enregistrement pressez la touche OTR 3 fois PM 11 35 1 h 30 min sera affich Pour pressez la touche OTR 3 fois enfoncez la une fois PM 10 35 30min sera affich enfoncez la une seconde fois PM 11 05 1 h sera affich enfoncez la une troisi me fois PM 11 35 1 h 30 min sera affich Ce texte est videmment inacceptable Par contre le texte suivant est bien plus compr hensible et coh rent Pour programmer un enregistrement d 1 heure 30 1 R glez le s lecteur de vitesse sur SP SP s allumera 2 S lectionnez le canal 4 en appuyant sur la touche de canal 3 Pressez la touche OTR 3 fois pour sp cifier l heure d enregistrement 4 Lorsqu elle est press e une fois PM 10 35 30 min sera affich 5 Lorsqu elle est press e une seconde fois PM 11 05 1 h sera affich 6 Lorsqu elle est press e une troisi me fois PM 11 35 1 h 30 min sera affich 7 Presser la touche TIMER dans un d lai de 9 secondes 8 Dans ce dernier texte certaines informations pr sentes dans la repr sentation conceptuelle ne sont pas explicit es Par exemple les effets s lectionn obj canal 4 et sp cifi obj heure d enregistrement
280. trice qui prend des d cisions sur la mise en action de la communication les op rations graphiques tel que la mise en page ou en g n ration de parole les op rations phono acoustiques L approche de Thompson a t accept e par un grand nombre de chercheurs Ainsi le syst me TEXT McK85 s occupe de planification textuelle tandis que MUMBLE McD84 se concentre sur la r alisation linguistique L approche prescrit un processus lin aire de produc tion de texte aussi dit pipeline Cette architecture offre de nombreux avantages du point de vue informatique car la t che de chaque composante est bien s par e offrant ainsi une mo dularisation naturelle et la communication entre n modules est restreinte n 1 interfaces unidirectionnelles C est pourquoi la majorit des syst mes de g n ration ont adopt cette approche qui permet de se concentrer sur un aspect particulier de la g n ration et faire abs traction des autres questions Cependant elle suppose que 1 l information est trait e de fa on unidirectionnelle les d cisions prises en aval n influencent pas les d cisions prises en amont 2 le contenu textuel est d termin d un seul coup et 3 la formulation linguistique ne commence que lorsque le contenu est enti rement sp cifi Zoc93 Ces hypoth ses n tant pas motiv es psycho linguistiquement l approche s quentielle reste souvent contest e App85 Parmi les approches alternatives o
281. truction o l tape composante est situ e avant l information organisationnelle Les travaux de Dixon confirment l hypoth se d une repr sentation conceptuelle constitu e de sch mas d op rations et nous aide mieux comprendre de fa on g n rale les textes d ins tructions Du point de vue de la r alisation linguistique le travail de Dixon est important car il nous indique comment exprimer et positionner les diff rents types d information de fa on plus facile interpr ter 2 2 2 Les travaux de Smith et Goodman et de Konoske et Ellis Smith et Goodman ont tudi comment le contenu des textes d instructions en influence la compr hension SG82 Ils ont d velopp la taxonomie qualitative suivante pour classifier ces textes l explication lin aire d crit quoi faire avec le syst me ou dans la situation Ce type de texte d instructions contient un but de haut niveau suivi d une s quence d actions ex cuter Les buts peuvent ventuellement tre divis s en sous proc dures Ce type de texte semble correspondre aux instructions de Bingham Bin86 et aux tapes composantes de Dixon Dix87a l explication structurelle d crit comment et pourquoi le syst me est construit et comment ses composantes sont inter connect es Ces textes pr sentent un ph nom ne statique et semblent inclure l information organisationnelle de Dixon Dix872 l explication fonctionnelle d crit comment et pourquoi le syst
282. tructions de qualit 3 Linguistique informatique En linguistique informatique le terme terte d instructions est g n ralement limit des manuels d appareils o le lecteur est l agent de la proc dure Nous d crivons ici quelques travaux portant sur l interpr tation et la g n ration de texte l analyse de texte tant moins pertinente notre th se 3 1 Interpr tation d instructions Nous passerons en revue deux travaux importants en interpr tation d instructions celui de Balkanski et celui de Di Eugenio Ces deux travaux se basent sur le travail de Goldman sur la th orie des actions 3 1 1 L tude de Goldman Goldman a tudi les actions sous un aspect philosophique Dans Gol70 il d finit deux concepts importants la relation de g n ration entre deux actions et la notion d action de base La relation de g n ration est tr s importante dans l tude des textes d instructions car elle y est tr s fr quente La notion d action de base est utilis e dans cette th se pour expliquer l introduction de certaines op rations de la proc dure dans le texte cf chapitre 4 section 3 1 Pour d finir la relation de g n ration Goldman commence par refuser ce qu il nomme la th orie d identit qui veut que certaines actions comme lever l interrupteur et allumer la lumi re ne fassent r f rence qu une seule et m me action mais sous diff rents points de vue D apr s Goldman la premi re
283. tte moyen moyen t l peu beaucoup vcr peu beaucoup beaucoup moyen moyen moyen antique beaucoup peint beaucoup souffle beaucoup vin beaucoup 151 3 R f rence des exemples exemple r f rence exemple r f rence exemple r f rence vcr p 8 photo p150 151 vcr p 4 auto p 8 auto p 14 vcr p 4 lec p 20 A e oe Ka non retrouv d w non retrouv m A vcr p 4 t l p 15 ordi p 198 non retrouv vcr p 8 variation de vcr p 8 Dix87a p 84 Dix87a p 81 Dix87b p 24 Dix87b p 34 Bal92b p 296 DE93b p187 DE93b p187 DE93b p49 DE93b p49 DE93b p49 DHP 94 p 61 t l p 14 lec p 19 lec p 17 ver p 23 bouche p 342 mazda p2 15 d e ordi p 199 non retrouv vcr p 23 souffle p 76 variation de souffle p 76 lec p 19 auto p 12 mazda p 2 13 dodo A A O D NOO Wm we SS RSS Qt lec p 18 auto p 12 DE93b p6 vcr p 23 rotin p 33 peint p 32 souffle p 77 non retrouv OU QU gt ooco ES Qt D souffle p 73 ver p 8 peint p 31 non retrouv ot Ot w w amp 1 o auto p 10 peint p 32 lec p 18 souffle p 75 auto p 8 souffle p 78 79 non retrouv auto p 10 DE93b p187 peint p 31 peint p 32 souffle p 73 auto p 14 lec p 18 t l p 14 vin p 98 recette p 515 t l p 14 RS92 p 205 peint p 32 lec
284. ue le syst me peut en utiliser un autre mais ne peut modifier ou tendre le premier Une fois d termin le contenu de la pr sentation est pass au coordinateur de m dia qui s lectionne ce qui sera pr sent par un graphique et ou par du texte et redirige cette information au g n rateur de graphiques ou de texte TDi Eugenio modifie la premi re condition de permission de Balkanski car celle ci suppose que l ex cution de o doit finir avant le d but de l ex cution de une contrainte trop restreignante 8 CoOrdinated Multimedia Explanation Testbed 23 L approche par sch mas rh toriques ne fait pas de distinction entre le contenu s mantique et la pr sentation rh torique du texte car ces sch mas d terminent le contenu et l organisation en m me temps wip de Wahlster et al Tout comme COMET WIP WAFT93 AR95 est un syst me de pr sentation multim dia textes et graphiques qui produit des instructions partir d une repr sentation unique WIP est un projet de taille dont le prototype a pris 30 ann es personnes construire Ses r sultats sont assez impressionnants Le syst me est sensible aux facteurs contextuels comme l expertise du lecteur la langue cible anglais ou allemand le format physique papier ou cran et le mode de production incr mentiel ou non Les caract ristiques les plus importantes de WIP incluent i La division de la t che entre les diff rents m dias est d termin e dynamiq
285. uement partir d information contextuelle comme le lecteur et la situation d crire ii Tous les processus de g n ration d termination du contenu s lection du m dia et r a lisation du contenu peuvent tre incr mentiels et peuvent donc s adapter aux change ments de l environnement de pr sentation Pour d terminer le contenu de la pr sentation dans le texte et dans le graphique WIP utilise la RST MT88 de fa on constructive Le syst me utilise un ensemble de strat gies de pr sentation des connaissances g n rales ou sp cifiques sur la meilleure facon de pr senter un sujet particulier Ces strat gies sont repr sent es par des relations et des plans RST contenant plusieurs champs comme le nom de la relation ses effets ses conditions et un champ additionnel pour le mode de pr sentation Le planificateur prend en entr e un but de pr sentation de haut niveau et recherche une strat gie dont l effet ou le nom s unifie avec le but R cursivement ce processus est appliqu et g n re un graphe dirig acyclique o les feuilles repr sentent des actes de pr sentation textuels ou graphiques Ces actes sont ensuite pass s aux concepteurs graphique et textuel qui se chargent de produire un dessin ou un texte correspondant Compar l approche par sch mas de COMET l approche de WIP profite des avantages de la planification textuelle par la RST Entre autres elle repr sente explicitement les effets de chaque por
286. uistique informatique cette recherche apporte une approche mo tiv e linguistiquement aux mod les existants de planification de textes d instructions Aussi l tude de corpus effectu e offre une meilleure compr hension des textes d ins tructions Il s agit d une analyse moins approfondie mais dans la m me ligne que les travaux de Balkanski Bal92a Bal92b et de Di Eugenio DE93b e Du point de vue pratique cette recherche permet d initier une automatisation de la r daction de textes d instructions ou du moins d assister les r dacteurs techniques dans leur travail tout en assurant que les textes soient compr hensibles et coh rents comme le travail de Vander Linden VL93b 4 Structure de la th se Cette th se d veloppe des heuristiques guidant la s lection du contenu et du statut rh to rique d l ments de discours Pour pr senter nos r sultats nous proc dons ainsi e Au chapitre 2 nous nous familiarisons avec les travaux les plus pertinents en psycholo gie en r daction technique et en linguistique informatique traitant de textes d instruc tions e Au chapitre 3 la question de planification de textes d instructions est abord e de fa con g n rale Ce chapitre pr sente la th orie de structure rh torique RST MT88 explique comment la RST est utilis e en linguistique informatique et pr sente notre approche la planification de textes d instructions e Les chapitres 4 et 5 d taillent l analyse de
287. un but s quence O sont inclus dans s quentielle contrainte le par O est une op ration texte une par un tat E s quence les op ration O O est une op ration s quentielle TABLE 5 16 Heuristiques de pr sentation l op ration s quentielle ex cutant une op ration O qu il conna t Il existe donc un lien de permission entre O et O De plus pour utiliser un but au moins un O doit tre communiqu dans le texte et les O doivent tre pr sent s par une s quence Par exemple dans 73 Comprimez les bras de la lyre pour la replacer dans la barre de retenue replacer la barre ne peut tre ex cut que si les bras de la lyre sont comprim s Cet tat modifiable forme ainsi une condition d ex cution pour replacer la barre et l op ration comprimer les bras permet l op ration replacer la barre iii Dans les autres cas toute op ration s quentielle O est pr sent e par une s quence comme dans 70 Ces heuristiques sont r sum es la table 5 16 3 2 Les attributs d objets Comme le montrent les tables 5 15 p 79 et 5 17 pour pr senter les attributs d objets la relation d laboration est toujours utilis e Par exemple 74 Une lampe une seule douille comporte habituellement une lyre qui tient une barre de retenue par les manchons Dans l implantation les liens de g n ration et de permission sont d finis comme dans le projet de DHP 94 cf le chapitre 2 8
288. urs sous proc dures nous avons compt de la fa on suivante si la proc dure principale atteint un but bien pr cis par exemple changer l huile d une voiture alors nous n avons compt qu une seule proc dure si par contre la proc dure principale atteint un but vague par exemple utiliser les boutons de la t l commande alors chaque sous proc dure a t compt e 42 e r parations lectriques lect e entretien automobile auto mazda e techniques du rotin rotin e techniques de la photographie photo e vinification vin e restauration de meubles antiques antique e organisation de disques durs ordi e peinture sur verre peint e soufflage de verre souffle Les r f rences compl tes du corpus d analyse sont donn es a l appendice A 1 4 R sum Dans ce chapitre nous avons consid r les textes d instructions en tant que genre textuel Nous en avons pr sent les caract ristiques textuelles g n rales et not que leur structure rh to rique st r otyp e en permet une analyse stricte La th orie de la RST utilis e lors de l analyse de corpus a t pr sent e et nous avons vu ses utilisations descriptive et constructive dans les travaux ant rieurs de planification textuelle Finalement nous avons d crit et justifi notre approche g n rale Nous consid rons la g n ration de textes d instructions comme un processus de choix entre diff rents niveaux de repr se
289. ut es en m me temps Pour identifier la co temporalit Goldman propose d essayer de relier les 2 ins tances par la locution et en m me temps Par exemple dans Jean allume la lumi re en parlant Marie les 2 instances sont co temporelles mais dans Jean allume la lumi re en levant l inter rupteur les 2 instances ne sont pas co temporelles Goldman distingue 4 types de g n ration illustr s la table 2 1 1 la g n ration causale 2 la g n ration par convention 3 la g n ration simple et 4 la g n ration par augmentation Comme propri t s int ressantes notons que la relation de g n ration est e asym trique si a g n re alors B ne peut g n rer a e non r flexive a ne g n re pas a e transitive si a g n re D et p g n re y alors a g n re y 19 L tude de Goldman est la base de celles de Balkanski et de Di Eugenio pr sent es plus loin Nous retenons de son tude la notion de g n ration et la notion d action de base utilis e au chapitre 4 3 1 2 L tude de Balkanski Balkanski a tudi ce qu elle appelle les propositions de raison rationale clause ou RC et de moyen means clause ou MC fr quentes dans les textes d instructions Bal92a Bal92b Elle a d velopp un modele d interpr tation pour ces propositions en d finissant des r gles qui permettent de d duire un ensemble de croyances et d intentions associ es chaque construction Par exemple les phrases suiv
290. ut final est de l enlever C est pour quoi l instruction pr cise de ne pas atteindre ce but habituel Ce cas compte pour environ 75 96 des pr ventions retrouv es ii Si un tat emp che l ex cution d une op ration de base dans le contexte courant mais le lecteur ne connait pas cet tat il pourrait supposer que l op ration peut tre effectu e une pr vention est donc communiqu e Par exemple 56 En cas de feu n utilisez pas les ascenseurs Ce cas compte pour 12 5 96 des pr ventions retrouv es iii S il est tr s dangereux ou n faste la proc dure qu une op ration soit effectu e et que l op ration est irr versible alors elle est communiqu e en tant que pr vention Par exemple 57 Ne jamais m langer de produits contenant de l acide ou de l ammoniaque avec j g p q du javellisant au chlore 8 Cette situation compte pour 12 5 96 des pr ventions du corpus On retrouve 21 pr ventions dans le corpus et les heuristiques ci dessus r sum es table 4 12 semblent toutes les justifier 3 9 Les op rations ventuelles Pr s de 1 96 des expressions du corpus communiquent une op ration ventuelle une op ration facultative que l agent peut effectuer involontairement ou une op ration obligatoire qu il pourra effectuer dans le futur C est le cas de 15Exemple hors corpus Cet exemple satisfait aussi l heuristique ii 16 Exemple hors corpus tir de DE93b 70 heuris contrainte commu tiqu
291. xplicatif un tel parall lisme alourdirait le texte Avec l approche lin aire de la figure 3 5 l in terd pendance entre les niveaux ne peut tre r alis e Aussi il est important de noter que ce qui importe nos yeux est la distinction entre la question s mantique et la question rh torique et non la distinction de leurs processus Dans notre approche nous avons opt pour deux processus s quentiels chacun s occupant d une question particuli re Cependant nous ne condamnons aucunement d autres architectures Deux processus un s mantique et un rh torique entrelac s ou un m me processus s occupant des deux questions feraient tout fait l affaire s ils distinguent les deux niveaux et permettent un lien plusieurs plusieurs entre les deux Comme notre travail cherche bien distinguer les tapes de d termination de contenu et de structure textuelle en planification de texte nous avons port une attention particuli re la correspondance entre les repr sentations conceptuelle s mantique et rh torique choix IT et III Pour le premier choix un ensemble d heuristiques de s lection de contenu choisit des l ments s mantiques tre communiqu s dans le texte Lors de cette tape nous consid rons la distinction faite au niveau de la planification de t che entre op rations et tats cf le chapitre 6 La correspondance entre les niveaux s mantique et rh torique est effectu e par des heuristiques
292. yst matique des genres textuels particuliers caract risables par leurs choix textuels On pensera par exemple des textes narratifs publicitaires ou descriptifs Les textes d instructions poss dent une structure textuelle assez st r otyp e En effet Kittredge Kit82 et Price et Korman PK93 y identifient 3 parties principales i une introduction ou passage descriptif crit dans un style similaire celui retrouv dans la langue courante 32 ii les tapes ou la section proc durale dont la s quence de phrases imp ratives forme le c ur du texte d instructions iii les explications qui identifient par exemple des erreurs possibles Dans le cas des textes d assemblage Tutin Tut92a d taille l introduction en commen taires ex l historique param tres ex le temps de d assemblage et une liste d instruments n cessaires ex les ingr dients d une recette Dans cette th se nous ne nous attardons qu la section proc durale des textes partie ii que nous appelons simplement instructions comme dans Tut92a Voyons maintenant comment cette section est structur e En linguistique informatique il existe plusieurs approches pour d crire la structure d un texte On retrouve par exemple Les segments de discours qui d coupent le texte en blocs qui se chevauchent ou s incluent Rei78 GS86 Pol88 Les sch mas rh toriques qui d finissent une combinaison plus ou moins flexible de pr d
Download Pdf Manuals
Related Search
Related Contents
Amino Set-Top Box Configuration Guide Formation par la Recherche n°14, mars 1986 EMI 対策 フェライトコアの取り付けかた Dell PowerConnect 5548p Command Line Interface Guide EF300mm F4L IS USM C-571S 取扱説明書 Copyright © All rights reserved.
Failed to retrieve file