Home
Motifs français de césure typographique - Cahiers GUTenberg
Contents
1. co trans mais attention ici aux faux amis on coupera trans at lan tique mais tran sac tion et inter peuvent tre consid r s comme tymologiques on peut alors couper inter action e c ceux tels que sur psy pro ex et sub sont aussi examiner avec attention mais exception de ce dernier la coupure syllabique co ncide en g n ral avec la s paration pr fixe base 11 Le Code typographique 7 dit improprement les mots compos s dont le trait d union a disparu En effet le mot ch vrefeuille existait d j en un seul mot au Moyen Age il semble donc qu il n ait jamais comport de trait d union 12 Cette coupure n est pas effectu e automatiquement par TEX avec les motifs actuels 42 Motifs de c sure francais e d d autres comme para sont plus difficilement d cidables parabole paravent et parachever n ont pas la m me racine tymologique ainsi 12 on devrait couper pa ra chro nisme mais aussi par ache ver e f et parfois on s interroge sans fin sur des pr fixes comme poly ou t l faut il couper ou conserver intact ces pr fixes J D SARM NIEN pr cise dans 5 que 96 8 des mots peuvent tre trait s de fa on syllabique classique Alors on est port croire que la m thode et les quelques r gles que nous venons d exposer conviendront dans la grande majorit des cas pour les textes usuels 5 Un peu de TEXnique Le proc d utilis par TEX p
2. mW e2s1u2s m etais2ta 4me 4mes Wa2ment da2ment fa2ment amalga2ment cla2ment ra2ment temp era3ment ta2ment testa3ment gua2ment e2ment car e2ment diaphrag2ment ryth2ment ai2ment rai3ment ab i2ment eci2ment vidi2ment subli2ment eli2ment reli2ment mi2ment ani2ment veni2ment ri2ment d etri3ment nutri3ment inti2ment esti2ment l2ment flam2ment gram2ment gem2ment om2ment com3ment Wo2ment slalo2ment chro2ment to2ment ar2ment sar3ment er2ment antifer3ment ser3ment fir2ment or2ment as2ment au2ment ecu2ment fu2ment hu2ment fichu3ment llu2ment plu2ment bou2ment bru2ment su2ment tu2ment imi im i0 milliiam im2n emo im2n es im2n esi imo imo im oe0 monoia2 monoie2 mono1 e2 mono1i2 monoi i2d e mono1o2 monoiu2 mono1s2 mon2t3r eal mis2 imu im u imy moye2n1 a2g ina ina ine inVe inV e inVe ane nes 2nent r ema3nent imma3nent perma3nent emi3nent pr e emi3nent pro emi3nent sur emi3nent immi3nent conti3nent perti3nent absti3nent ini in i0 ino ino in oe0 no2n1obs inu inu n3s2at n3s2ats nix iny 04 304 7o4 7o4 02b3long loctet oid21 o1 e2dre olioni ombud2s3 omni1s2 ois2tas ois2tat ois2t ero ois2tim o1s2tom ois2trad ois2tratu ois2triction oualou ouaiou oviis2
3. eu2r1ia2 eu2r1a2 euis2tat extral extra2c extra2i ifa 1fVa ife 1fVe 1fV e 1fVe 4fe 4fes 2fent ifi 1f 7 i0 1f21 4fle 4fles 2flent 1fo 1fVo 1f2r 4fre 4fres 2frent f1s2 ifu 1fVu ify iga 1gV a ige ig e 1gV e 1gVe 4ge ages 2gent r e3gent entre3gent indi3gent dili3gent intelli3gent indul3gent Motifs de c sure fran ais tan3gent rin3gent contin3gent ar3gent ar3gent ser3gent ter3gent r esur3gent 1g2ha 1g2he lg2hi 1g2ho 1g2hy igi 1g i0 1821 4gle 4gles 2glent 1g2n sta2g3n wa2g3n Agne Agnes 2gnent 1go 1g o 1g2r 4gre 4gres 2grent 1gu 1gV u g1s2 Ague 4gues 2guent on3guent on3guent 187 iha 1hWa ihe 1h e 1hV e 1hVe h emii e h emoip2t 4he 4hes ihi 1h i0 1ho 1h o ihu 1hWu ihy hypera2 hypere2 hyperV e2 hyperi2 hypero2 hypers2 hype4ri hyperu2 hypo1a2 hypo1e2 hypoi e2 hypo1i2 hypo102 hypo1s2 hypo1u2 i4 i4 VW4 7 i4 ilalgi ilarthr i1 e2dre i121 cil31 rcil4l ucil4l vacil4l gi131 hi131 1i131 13lion mil31 mil4let emil4l semil41l rmil41 armil51 capil31 papil3la papil3le papil3li papil3lom pupil31l piril31l thril31 cyril31 ibril31 pusil31 stil31 disti131 instil31 fritil31 bouti131 vanil3lin vanil3lis vi131 avil41 chevil41 uevil4l uvil4l xi131 1informat inia2 in1a2 in2a3nit in
4. refaire le d compte sur d autres fichiers mais sans avoir la garantie gue celui qui se rapproche le plus de celui de J D SARM NIEN soit vraiment le meilleur Alors nous avons d cid non plus de comparer les motifs de c sure mais de comparer les r sultats obtenus avec la liste des 499 mots publi e en annexe de l article de J D SARM NIEN 5 nous avons ajout en fait un 500 mot correctement souvent mal coup cor re cte ment au lieu de cor rec te ment Il fallait alors automatiser ce processus de comparaison pour pouvoir le r p ter souvent 47 Daniel FLIPO Bernard GAULLE Karine VANCAUWENBERGHE Nous avons donc cr les outils permettant d effectuer les comparaisons un premier fichier de code TEX lit le fichier des 500 mots tests correctement hyph n s en ignorant les points de c sure pr sents et cr e un fichier log comportant toutes les coupures propos es par le syst me Un deuxi me relit ce fichier log et compare les points de c sure trouv s ceux du fichier test D s les premiers essais des anomalies graves apparurent dans la majo rit des fichiers de motifs de c sure disponibles les points en d but de ligne taient souvent remplac s par des doubles points ce gui a pour effet pratique d invalider totalement le motif cor respondant probablement est ce d des probl mes de transmission sur les r seaux le plus souvent tous les motifs concernant ill liste allant d
5. est pas celui de J D SARM NIEN mais il nous semble pr f rable de traiter de la m me 22 Actuellement appel CRI de l universit de Rennes 1 23 Le premier essai nous donna en fait 6 erreurs de plus avec MITEX V3 ce qui tait d des fautes de frappe Mais nous avons surtout t troubl s un temps par les 33 erreurs produites par MITEX V2 M J FERGUSON nous expliqua alors que les accents perturbaient le d compte des caract res en fin de mot De fait tous les mots suppl mentaires en erreur se terminaient par un e accent aigu 49 Daniel FLIPO Bernard GAULLE Karine VANCAUWENBERGHE mani re d sa mi don ner d sa mor cer et d sa bu ser Enfin la r introduction du motif d e2s nous a oblig s augmenter la force de la c sure des motifs pr sents dans le fichier original d e1s2c d e1s2p et d eis2t en d e3s2c d e3s2p et d e3s2t La diff rence 5 provenait vraisemblablement d une faute de frappe p e2r1 e2q au lieu de p eir2 e2q d un auteur inconnu car ce motif n existait pas chez J D SARM NIEN Le motif phyto3ph2 ajout par qui n tait pas bon il donnait phy to phthora 6 au lieu de phy toph thora nous l avons supprim Enfin le cas du mot pon tet 7 peut tre r gl en ajoutant le motif pon2tet Nous avons remplac le motif p e2n1iul par p e2nul conform ment au fichier original de J D SARM NIEN pour an t p nul ti me
6. Les r gles d emploi du trait d union varient d une langue l autre En fran ais on ne coupe pas un mot avant ou apr s un x ou un y plac entre deux voyelles En anglais on peut le faire Cette id e est reprise par 3 qui donne les exemples suivants en fran ais fixer moyen ne peuvent pas tre coup s l inverse de miz ture tex tile et cy pr s g e On vitera les coupures malsonnantes con tr le cul ture De ce fait on ne peut couper certains mots comme connexion extrait de 7 g f On ne coupe pas les noms propres on ne coupe pas non plus entre initiale et nom les abr viations les acronymes les nombres et les dates exprim s en chiffres g g On ne s pare pas un nombre de l unit gui lui est rattach e m kg F etc 3 Nous n abordons pas volontairement le probl me de la coupure entre les mots gui n est pas l objet de cet article mais qui lui tout seul m riterait une longue discussion on en trouvera un apper u avec la r gle suivante 4 En UTEK Voption de style french apporte guelgues commandes pour effectuer ce travail 5 Pour viter ce probl me les logiciels disposent en g n ral d un espace ins cable C en TEX 39 Daniel FLIPO Bernard GAULLE Karine VANCAUWENBERGHE g h On coupe les mots compos s au trait d union qu ils poss dent d j dans le cas du t euphonique on coupe naturellement au premier trait d union 6 d
7. tchin3t2 ite it e it fe ite t el eie2 t el e1i2 t el eio2b t el eio2p t el eis2 4te 4tes 2tent la3tent pa3tent comp e3tent eni3tent m econ3tent omnipo3tent ventripo3tent equipo3tent impo3tent mit3tent th4 1t2h 4th 4the 4thes thermo1s2 2t3heur 2thl 2thm 2thn th2r 4thre 4thres 2ths iti 1t 7 i0 ito 1t o 1t2r tran2s1a2 tran3s2act tran3s2ats tran2s3h tran2s102 tran2s3p tran2s1u2 4tre 4tres 2trent tri1a2c tri1a2n tri1a2t tri1o2n t1t21 itu itVu tung2s3 ity u4 gt u4 W u4 u4 uniio2v uni1a2x u2s3tr iva ivVa ive iv e iv fe ivVe v elois2ki ave Aves 2vent conni3vent sou3vent dvi 1v i0 ivo iv o vol2tiamp 1v2r 4vre 4vres 2vrent ivu ivVu ivy iwa iwe 4we 4wes 2went iwi iwo iwu 1w2r 2xent 2zent privatdo3zent izi 1zo izu izy
8. Autres modifications introduites r tablissement des motifs re2s3cisi et re2s3ciso pr sents chez J D SARM NIEN mais absents du fichier de Rennes les exceptions pr cis es en e a ont aussi t ajout es r tablissement du motif 1 c c pr sent chez J D SARM NIEN mais absent du fichier de Rennes ajout du motif cul4 m me raison que con4 et cons4 le mot r union tait mal coup r gle s c nous avons remplac le motif en cause r elu2 par r eu2 nous n avons pas voulu retirer les motifs de d but de mot 1 ca ract re ainsi que ceux de fin de mot 2 caract res qui n ont pas de sens avec TEX puisque par d faut il ne coupera jamais de la sorte mais les deux param tres righthyphenmin et lefthyphenmin qui permettent depuis la version 3 00 de TEX d imposer le minimum de lettres en fin de ligne et le minimum rejeter sur la ligne suivante peuvent avoir t malencontreusement chang es et puis il reste aussi quelques installations MITEX V2 pour lesquelles l algorithme de d nombrement des caract res de d but et de fin de mot n est par s r 100 24 Nous les avions introduites dans un premier temps dans les fichiers d exceptions mais il est beaucoup plus performant en terme de gestion m moire de les mettre sous forme de motifs de c sure 50 Motifs de c sure francais nous avons compl tement revu l ordre des motifs de c sure afi
9. avec sa connotation de r glement Il s agit plut t pour nous de r gles de conduite voire de conseils d autant que ces r gles voluent dans le temps parfois tr s fortement nous en verrons des exemples par la suite aussi ce que nous crivons aujourd hui doit tre consid r comme un recueil non exhaustif de ce que nous consid rons comme de bonnes habitudes actuelles 2 Alphabet Phon tique International 38 Motifs de c sure francais Les points de c sure figurant dans les exemples venir sont aussi ceux exactement produits par TEX apr s application des l ments fournis dans cet article 4 1 R gles g n rales g a Il faut viter au maximum de couper les mots Cela tant dit nous devrions nous en tenir l mais comme rien n est parfait et qu il 3 faut malgr tout parfois couper voyons les autres r gles g b Il est important de suivre les m mes r gles tout au long du document g c On n isole pas en fin de ligne une seule lettre et on en rejette au moins trois ex ob i n est pas coup tout comme agr voir 6 g d Les mots trangers employ s dans un texte en fran ais doivent tre divis s le cas ch ant suivant les r gles de la langue trang re extrait de 7 Il faut donc que l utilisateur de logiciel puisse indiquer de quelle langue il s agit et ce au niveau le plus bas c est dire au niveau du mot Il est pr cis par exemple dans 2 que
10. qu aucun autre motif ne le contredise voir ce sujet le paragraphe 5 1 Les motifs tymologiques sont ici pr c d s du caract re Le classement est d ordre alphab tique de gauche droite pour l essentiel mais aussi de droite gauche pour les exceptions on les remarquera par leur alignement droite patterns 22 a4 a4 a4 a4 ab3r ea ab3r ea ai e2dre ae3s4ch ae3s4ch 1alcool a211algi amino1a2c amino1a2c ana3s4tr ana3s4tr 1a2nesth esi antiia2 anti1a2 anti1e2 anti1e2 antii e2 anti2enne anti2enne antii e2 anti1s2 anti1s2 apo2s3ta apo2s3ta apo2s3tr archii e2pis as2ta as2ta a2s3tro iba iba bai2se3main ibe ibVe 1b e ibVe 4be 4bes 2bent 1bi 56 1b i0 bi1a2c bila2t bilau bio1a2 bi2s1a2 bi1u2 1b21 4ble 4bles 2blent 1bo 1b o 1b2r 4bre 4bres 2brent ibu 1b u 1by 1 c c ica 1cVa ca3ou3t2 ice ic e ic e ice 4ce 4ces 2cent ja3cent ac3cent e3cent munifi3cent r eti3cent privatdo3cent inno3cent es3cent acguies4cent is3cent immis4cent ch4 1c2h 4ch 2chb Ache 4ches 2chent ch e2vre3feuille 2chg ch21 4chle 4chles chlo2r3a2c chlo2r3V e2t 2chm 2chn 2chp ch2r 4chre 4chres 2chs 2cht 2chw ici 1c i0 ci2slalp 1c2k 4ck 2ckb 4cke 4ckes 2ckent 2ckf 2ckg 2ck3h 2ckp 2c
11. syllabe graphique conserve tout e muet plac entre une consonne et une autre consonne ou une fin de mot la syllabe graphique s pare les consonnes doubles m me si elles sont prononc es simples 1 Voir 1 R MCINTOSH Hyphenation Ronald MCINTOSH publication ISSBN 1 872757 00 6 London 1990 2 D FAWTHROP Hyphenation by Algorithm of English American and other Languages Computer Hyphenation Ltd 1990 ISSBN 1 872757 02 2 36 Motifs de c sure francais On peut voir par exemple que l on distingue graphiquement trois syl labes dans pu re t m me si l on prononce pyr te deux syllabes pho niques Il est coutume de dire que la division des mots se fait normalement entre syllabes mais aussi conform ment V tymologie lorsque celle ci est nettement perceptible 12 Il n existe malheureusement pas de trait ni de dictionnaire fran ais sur ce sujet Contrairement au domaine ortho graphique g r par l Acad mie il n existe pas d organisme d tenteur de droits sur la typographie fran aise Du cot de la linguistique domaine qui nous occupe aussi tout naturellement et o les trait s grammaires ou dictionnaires foisonnent rien n est tabli non plus concernant la division des mots Seuls quelques auteurs en nombre restreint ont publi des l ments de r ponse en donnant des exemples mais jamais on ne trouvera une liste vraiment exhaustive des r gles appliquer Notre objectif n e
12. 2 re2s3cap re2s3cisi re2s3ciso re2s3cou re2s3cri re2s3pect re2s3pir re2s3plend re2s3pons re2s3quil re2s3s re2s3t re3s4tab re3s4tag re3s4tand re3s4tat re3s4t en re3s4t er re3s4tim re3s4tip re3s4toc re3s4top re3s4tr re4sbtrein re4s5btrict re4sbtrin re3s4tu re3s4ty rVeu2 r e2uss r etroia2 dre 4res 2rent pa3rent appa3rent transpa3rent e3rent tor3rent cur3rent 1r2h 4rhe 4rhes 2r3heur 2r3hydr iri 1r i0 iro 1rV o iru ir u iry isa isa sch4 1s2caph 1s2c1V er 1s2cop 1s2ch e2s3ch i2s3ch e i2s3chia i2s3chio 4sch 4sche 4sches 2schs ise 1s e is e 1s e sesguila2 4se 4ses 2sent ab3sent pr e3sent res3sent seu2le sh4 1s2h 4sh 4she 4shes 2shent 2shm 2s3hom 2shr 2shs 1si 1s i0 1s2lav 1s2lov 1so 59 Daniel FLIPO Bernard GAULLE Karine VANCAUWENBERGHE iso 1s oe0 is2patia 1s2perm 1s2por 1s2ph er 1s2ph er 1s2piel 1s2piros 1s2tandard 1s2tein st er eois2 1s2tigm 1s2tock 1s2tomos 1s2troph 1s2tructu 1s2tyle isu isVu su2b1a2 su3b2alt su2b1 e2 su3b2 e3r su2biin su2b3limin su2b3lin su2b3lu sub1s2 su2biur supero2 supe4ri1 supers2 su2r1a2 su3r2ah su3r2a3t su2r1e2 su3r2eau su3r2ell su3r2et su2r1 e2 su2r3h su2r1i2m 60 su2riinf su2riint su2riof su2r10x isy ita itVa ita tachyla2
13. 2a3nit in2augur in2augur in1e2 in1e2 ini e2 57 Daniel FLIPO Bernard GAULLE Karine VANCAUWENBERGHE ini e2 in2effab in2effab in2 e3lucta in2 e3lucta in2 e3narra in2 e3narra in2ept in2ept in2er in2er in2exora in2exora inii2 in1i2 in2i3miti in2i3miti in2i3g in2i3g in2i3t in2i3t in1o2 in1o2 in2o3cul in203cul in2ond in2ond inis2tab inis2tab inte4r3 intera2 intera2 intere2 intere2 inter e2 inter e2 interi2 interi2 intero2 intero2 inte4r3 interu2 interu2 inters2 inters2 in1u2 in1u2 in2uit in2uit in2u31 in2u31 ioia2ct iloxy i1s2tat 1j 2jk 4je 4jes 2jent ika ikVa ike 1k e 1kV e 58 1kVe 4ke 4kes 2kent 1k2h 4kh kh4 iki 1kWVi0 iko iko 1k2r iku iku iky ila 1l1Va 1l a la2w3re ile 11 e 11 fe 11 e Ale Ales 2lent ta3lent iva3lent equiva4lent monova3lent polyva3lent re3lent do3lent indo3lent inso3lent turbu3lent succu3lent f ecu3lent trucu3lent opu3lent corpu3lent ru3lent sporu4lent 1li 11 7 i0 1lo 11 7o lis2t ilu 1iV u ily ima im Wa ma2c3k macrois2c ma211a2dres ma211a2dro ma2l1iais e ma211ap ma211a2v ma2lien ma2l1int ma211oc ma21102d ma2rix ime im e im fe im e m e2gioh m e2sa m e3san m e2sies mVe2sli
14. ANCAUWENBERGHE Ache Aches ch4 Le principe est le suivant les chiffres impairs indiquent les coupures possibles les chiffres pairs non nuls les coupures interdites Consid rons les mots en ill lorsque ce groupe se prononce ij grillage fille la coupure il 1 est interdite par le motif i121 mais cette m me coupure entre les deux l est permise dans vil lage pour le son il on ajoute pour ce faire le motif vil31 ensuite il faut apporter une correction pour que le mot cheviller phon me j ne soit pas coup entre les deux l c est l objet du motif chevi141 TEX prend en compte comme valeur paire ou impaire le maximum des chiffres rencontr s dans tous les motifs concern s si une coupure est interdite par un 2 on peut l autoriser dans certains cas particuliers par un 3 ensuite l interdire de nouveau par un 4 pour certaines exceptions et ainsi de suite On remarque dans la macro patterns des lignes commen ant ou se terminant par des points en d but de ligne un point signifie que le motif de la ligne ne s applique gu aux mots commen ant par lui le point en fin de ligne indique que le motif concerne seulement les mots se terminant par lui En francais comme nous avons rappel pr c demment on ne ren voie jamais la ligne suivant une terminaison de mot muette par exemple les coupures devant la syllabe terminale che s des mots pervenche s cra vache s fantoche s sont interdites par les motifs 4che
15. ENMANN Hyphenation in presence of accents and diacritics An easy and low cost solution Cahiers GUTenberg N 15 EuroTgX 92 1992 A FREY Manuel nouveau de typographie r ed L once Laget 1979 puis B GAULLE Manuel d utihsation du style french document lectronigue fourni avec la distribution logicielle 6 dition 1994 J GIRODET Dictionnaire du bon fran ais Bordas 1981 M Goossens F MITTELBACH and A SAMARIN The IATEX Companion Addison Wesley New York 1994 C GOURIOU M mento typographique Hachette 1973 M GR VISSE Le bon usage 13 dition Duculot 1994 Imprimerie nationale Lexique des r gles typographiques en usage l Imprimerie nationale 3 dition 1990 D E KNUTH The TEXbook Addison Wesley 1991 F M Liane Word Hy phen a tion by Comput er Ph D Thesis Departement of Computer Science Stanford University report N STANCS 83 977 1983 R THIMONNIER Code orthographique et grammatical Marabout 1978 puis 55 Daniel FLIPO Bernard GAULLE Karine VANCAUWENBERGHE Annexe Liste des motifs de c sure francais Les lettres accentu es des motifs de c sure sont exprim es en notation TEX de base ASCII c est dire 7 bits Chaque macro instruction terminale est suivie du chiffre 0 pour clore effectivement le motif Rappelons que les chiffres impairs l int reur des motifs autorisent la coupure des mots calgu s sur ce motif condition
16. GAULLE Karine VANCAUWENBERGHE 3 D finitions Le terme de c sure typographique est souvent jug quivalent aux termes plus simples de coupe coupure ou division Il nous faut cepen dant expliquer les distinctions que nous allons leur appliquer par la suite la division d un mot est une sorte d algorithme non formel qui doit tre employ lorsqu un mot arrive en bout de ligne et d borde dans la marge de fa on obtenir l endroit appropri de sa coupure marqu e par un trait d union en fin de ligne la c sure est une autre forme d algorithme qui peut tre tout fait formel comme dans le cas de TEX et qui sert d terminer tous les points possibles de coupure dans un mot donn il faut alors parler de points de c sure l algorithme de TFX est bas sur un ensemble de motifs de c sure dont nous parlerons plus loin le terme coupure sera souvent employ par la suite en lieu et place de diviston Dans ce qui suit nous allons aussi adopter les notations suivantes trait d union ou point de c sure division interdite cet endroit division interdite apr s le trait d union division propos e 1 notation phon tique API 4 Quelques r gles Avant de faire tat des r gles de coupure syllabique et tymologique voyons d abord quelques r gles g n rales puis typographiques Le terme de r gle employ ici et par la suite est probablement un peu fort s il est lu
17. c oviis2c oxy1a2 ipa ip a pal eo1 e2 pa2n1a2f pa2nia2m e pa2nia2ra pa2niis pa2n1o2ph pa2n1iopt pa2ria2che pa2ria2ch e parais2 pa2r3h e ipe ip e ip e ipV e 4pe 4pes 2pent re3pent ar3pent ar3pent ser3pent pen2ta per3h p e2nul pe4r per1a2 per1e2 per1 e2 per1i2 per1o2 per1u2 p eir2 e2q pW erilos pW eri1s2 p eri2s3s p eri2s3ta p eriiu2 1p2h ph4 4ph phalan3s2t 4phe 4phes 2phent ph21 4phle 4phles 2phn photo1s2 ph2r 4phre 4phres 2phs 2pht 3ph2talV e 3ph2tis ipi 1p i0 1p21 4ple 4ples 2plent plurila ip2nV e 1p2neu 1po 1p o poiastre poly1a2 poly1e2 polyi e2 polyi e2 poly1i2 poly1o2 poly1s2 poly1u2 pon2tet pos2t3h pos2tiin pos2t1o2 pos2t3r post1s2 1p2r 4pre 4pres 2prent prV e1a2 pr e2a3la pr e2au pr e1 e2 prVe1e2 pr e1i2 pr e1o2 pr eiu2 pr e1is2 pro1 e2 prois2c e pro2s3tat prou3d2h ip2sych psychola2n Motifs de c sure francais 1p2t er 1p2t er ipu pud1d21 ip u 1py tq 4que 4ques 2quent e3quent elo3quent grandilo3quent ira ira radio1a2 ire ir e ir e 1r e r elia2 r e2a3le r e2a3lis r e2a3lit r e2aux r e1 e2 rVele2 rVe2el rVe2er rVe2 er r e1i2 rVe2i3fi rVe102 re1s
18. cahiers y U 1 enberg t MOTIFS FRAN AIS DE C SURE TYPOGRAPHIQUE Daniel Furo Bernard GAULLE Karine VANCAUWENBERGHE Cahiers GUTenberg n 18 1994 p 35 60 lt http cahiers gutenberg eu org fitem id CG 1994 18 35 0 gt Association GUTenberg 1994 tous droits r serv s L acc s aux articles des Cahiers GUTenberg http cahiers gutenberg eu org implique l accord avec les conditions g n rales d utilisation http cahiers gutenberg eu org legal html Toute utilisation commerciale ou impression syst matique est constitutive d une infraction p nale Toute copie ou impression de ce fichier doit contenir la pr sente mention de copyright Cahiers GUTenberg n 18 septembre 1994 Motifs francais de c sure typographigue Daniel FLIPO lt Bernard GAULLE Karine VANCAUWENBERGHE R sum Cet article a pour objectif de faire un bilan des diff rentes versions de fichiers de motifs de c sure francais et de proposer une nouvelle version enti rement revue et corrig e Une introduction la division des mots y est faite ainsi qu au processus de division employ par TEX Abstract The aim of this article is to compare the various current ver sions ofthe French hyphenation files and to propose a completely new updated and corrected version short introduction is given to French hyphenation as well as to TEX word splitting mechanisms 1 La m thode LIANG Avant les ann es 80 la divis
19. de motifs disponible s est av r tre celui de la ma chine Gould de l ex CICB de Rennes qui donnait seulement 7 diff rences significatives par rapport la r f rence Le tableau 2 r capitule les 7 dif f rences observ es Nous avons choisi d en faire notre r f rence et d essayer TABLE 2 Derni res diff rences observ es Original de JD d sami don ner d s ami don ner d sen flure d s en flure d shy dro g ner d s hy dro g ner d so rien ter d s orien ter p r qua tion p r qua tion phy toph thora phy to phthora pontet pon tet de supprimer les diff rences observ es en le modifiant le moins possible Le premier type de diff rences concerne les coupures tymologiques des mots commen ant par d es Les motifs concernant ces mots semblent avoir t profond ment modifi s par rapport la version de J D SARM NIEN Nous ne disposons d aucune indication ni sur l auteur de ses modifications ni sur ses intentions Nous avons r introduit le motif d e2s qui tait pr sent dans le fichier original de J D SARM NIEN et supprim les motifs suivants d e2s1a2 responsable de la diff rence 1 d e2s1e2 responsable de la diff rence 2 d e2s3h responsable de la diff rence 3 d e2s102 responsable de la diff rence 4 De plus nous avons ajout le motif d es2a3m pour obtenir la division d sa mi don ner et non d sami don ner Ce choix n
20. es mo tifs 1121 xi131 chez J D SARM NIEN avaient disparu Est ce le r sultat d une fausse man uvre d un contributeur anonyme les motifs con4 et cons4 r gle g e pr sents chez J D SARM NIEN taient absents dans plusieurs fichiers un motif 1ct a t ajout par qui Pourquoi Il a pour effet f cheux de faire couper correctement en cor re cte ment Inversement d autres personnes semblent tre intervenues judicieusement sur les transcriptions du fichier original en vue de son utilisation par MITFX comme celles de M J FERGUSON juin 88 pour ajouter un 0 derri re les Vi et les oe de fa on permettre effectivement la coupure apr s les motifs concern s Comme on le voit ces fichiers de motifs mis la disposition de tous dans le domaine public ont pu tre utilis s par tous mais aussi modifi s avec plus ou moins de bonheur Nous tions alors encore plus confort s dans l id e qu il tait indispensable de mettre un peu d ordre et de laisser ensuite association GUTenberg seul ma tre et garant de leur p r nit Apr s toutes ces corrections notre m me fichier de motifs qui compor tait 259 anomalies donna seulement 118 mots mal divis s sur les 500 Ce n tait pas encore un exploit 21 Cet anglicisme signifie que chaque mot comportait les points de c sure sous forme de trait d union propos s par J D SARM NIEN 48 Motifs de c sure francais Le meilleur fichier
21. et 4ches De m me sans le motif ch4 la coupure ch rysanth me serait possible 5 2 Mettre l accent comment Pour les langues utilisant des caract res accentu s se pose le probl me de la repr sentation de ces caract res dans les motifs de c sure Il existe deux repr sentations possibles le choix d pend du moteur TEX utilis si on travaille avec un moteur MITEX cas de la distribution UNIX de GUTenberg il est possible d utiliser une repr sentation des caract res accentu s sous la forme V e pour comme cela est fait dans les fichiers f7hyph tex et f7hyphex tex pour les c sures fran aises 44 Motifs de c sure francais si on travaille avec TEX V3 xx et des caract res 8 bits soit avec des fontes DC EC cas de la distribution MAC de GUTenberg soit avec des fontes virtuelles cas de la distribution PC de GUTenberg base emTEX il faut utiliser une repr sentation des caract res accentu s sous la forme hexad cimale xx d crite dans 17 p 73 77e9 pour c est ce qui est fait dans les fichiers f8hyph tex et f8hyphex tex pour les c sures fran aises Rappelons enfin que pour obtenir toutes les coupures possibles des mots accentu s il faut 1 imp rativement utiliser soit MITEX soit un TEX V3 xx associ des fontes 8 bits virtuelles ou r elles comme les DC En effet si les caract res accentu s sont fabriqu s partir de la macro accent qui superpose le caract re et l accent to
22. et algorithme n utilise pas de dictionnaire mais des motifs sp cifiques chaque langue Cette m thode efficace et conomique a malgr tout sa contre partie toute alt ration m me minime d un seul motif peut casser enti rement la validit de l algorithme pour la langue en question C est pourquoi nous souhaitons que les motifs fran ais continuent d tre certifi s par l association GUTenberg en faveur de laquelle nous avons r alis ce travail Pour la petite histoire il faut dire que cet algorithme a t repris par Ronald MCINTOSH qui fournit le monde entier et en exclusivit en algo rithmes de coupure de mots pour photocomposeuses Ses fichiers de motifs sont bien entendu tr s confidentiels nous ne les avons pas approch s mais les milieux bien inform s disent qu une r vision est d j annonc e pour le francais 2 La division des mots une op ration d licate La division des mots a lieu normalement aux fronti res des syllabes graphiques la coupe en syllabes graphiques r pond un certain nombre de r gles voir plus loin page 38 la syllabe graphique se distinguant par quelques points de la syllabe phonique En fran ais la syllabe est une unit phonique comprenant obligatoirement une voyelle accompagn e ventuel lement de consonnes ou de semi consonnes qui la pr c dent et ou la sui vent Les principales divergences entre syllabe graphique et syllabe phonique sont les suivantes la
23. ion des mots se faisait souvent encore la main selon les habitudes acquises de l exp rience ou de la sagesse des anciens L auteur d un document n intervenait que rarement dans ces d cisions qui regardaient surtout les typographes L informatisation de la cha ne ditoriale a chang progressivement les m thodes et les professions Les meilleurs programmes de division de mots ne s int ressaient qu aux r gles classiques de syllabation du fran ais sur lesquelles nous reviendrons par la suite Il tait alors souvent n cessaire de se constituer des diction naires d exceptions personnels Par ailleurs l aptitude de ces programmes traiter des documents multilingues tait quasiment nulle C est de l uni versit de Stanford EUA que nous est arriv encore une fois la solution ce probl me F M LIANG 18 a publi une th se en 1983 dans laquelle il propose un algorithme capable de prendre en compte plusieurs langues pourvu que a Ma tre de conf rences universit de Lille 1 B Ing nieur de recherche IDRIS CNRS Orsay y Agr g e de lettres modernes Bordeaux 35 Daniel FLIPO Bernard GAULLE Karine VANCAUWENBERGHE lui soient fourni des donn es linguistigues adapt es C est cet algorithme que Donald KNUTH a justement choisi d impl menter dans TFX et c est gr ce A lui gue J D SARM NIEN a pu commencer en 1983 son travail 4 sur les c sures francaises dans TEX toujours a Stanford Nous verrons que c
24. ira t il par contre pour la m me raison d euphonie on divisera c est dire et non c est dire extrait de 7 4 2 R gles typographiques Traitant ici encore de r gles tr s g n rales nous n entrerons pas dans le d bat pour ou contre la justification droite dans certaines conditions ceci tant un pr alable la d cision de couper ou de ne pas couper les mots Nous ne parlerons pas non plus de la taille des justifications qui modifient parfois les donn es de la coupure on se reportera 7 par exemple pour de plus amples d tails On retiendra toutefois les quelques points suivants applicables dans la grande majorit des cas t a Aucune c sure ne doit intervenir en bas de page et sp cialement sur les pages impaires pour ne pas rendre la lecture plus difficile t b Un paragraphe ne doit pas tre termin du fait d une division de mot par une ligne de longueur inf rieure au renfoncement t c On ne doit jamais trouver 3 lignes cons cutives termin es par un trait d union Mais au temps des DIDOT on n h sitait pas couper 6 ou 7 fois de suite 4 8 R gles de coupure en syllabes graphiques Les r gles g n rales et typographiques tant nonc es il est maintenant possible de savoir si un mot donn plac un endroit pr cis du document peut tre candidat la division ou non En supposant qu il le soit il faut 6 TEX choisit l endroit o il doit change
25. ks 2ckt 1c21 4cle 4cles 2clent ico ico colacc colacg coia2d colap colar colassoc colassur colau colax 1c oe0 coi e2 coief coien coiex con4 cons4 contreis2c contre3ma i0tre co2nurb coio2 co2o3lie 1c2r 4cre 4cres 2crent icu 1cVu icy cul4 id ida ida dacryoia2 did2h ide idVe ide 1d e 4de 4des 2dent d eca3dent e3dent cci3dent inci3dent confi3dent tri3dent dissi3dent chien3dent ar3dent impu3dent pru3dent d e1a2 dVelio d e1o2 d e2s d e3s2a3cr d es2a3m d e3s2a3tell d e3s2astr d e3s2c d e2s1 e2 d e3s2 e3gr d e3s2ensib d e3s2ert d e3s2exu d e2s1ii2 d e3s2i3d d e3s2i3gn d e3s2i3li d e3s2i3nen d e3s2invo d e3s2i3r d e3s2ist d e3s203d e d e2s1 oe0 d e3s2031 d e3s203pil d e3s2orm d e3s2orp d e3s2oufr d e3s2p d e3s2t d e2siu2n 3d2hal 3d2houd idi 1d i0 di2s3cop dita2c e dila2cid dia2g3n di1ald di1a2mi di1a2tom di1e2n di2s3h 2dlent ido 1id o 1d2r 4dre 4dres 2drent d1s2 idu idu idy dy2s3 dy2s1a2 dy2s1i2 dy2s102 dy2s1u2 e4 e4 e4 7e4 e4 e4 fe4 e4 1 e2drie 1 e2drique 1 e2lectr 1 e21 ement en1a2 en1a2 1 e2nerg e2nli2vr en102 en102 epi2s3cop epi3s4cope e2s3cop
26. munication Homme Machine du CNRS ce gui nous a permis d uti liser la base de donn es lexicales du fran ais crit et parl BDLEX soit environ 330 000 formes fl chies du francais De ce volumineux fichier nous avons extrait al atoirement 3 000 mots et produit la liste des mots avec les c sures propos es par TEX Nous avons relev quelques probl mes notamment les terminaisons muettes de pluriel de verbes r gle s d telles que at t nu rent fric tion nent se ri nas sent Aussi avons nous d cid d essayer de r gler le probl me des terminai sons en ent celles ci n ayant pas t trait es par J D SARM NIEN Le probl me n est pas simple car ces terminaisons peuvent tre de trois types muettes les verbes la troisi me personne du pluriel cf ci dessus les plus nombreux et de loin tant en sent et rent imparfait du subjonctif et pass simple 25 Dans les fichiers f7hyph tex et f8hyph tex les motifs tymologiques sont indent s de 20 caract res de fa on les distinguer des motifs phon tiques Dans la liste publi e en appendice ils sont pr c d s du signe 51 Daniel FLIPO Bernard GAULLE Karine VANCAUWENBERGHE sonores principalement les adverbes en ment vraiment s rement et d autres mots comment l ment parent pr sent mixtes sonores ou muettes selon le cas pr sident ils pr sident le pr sident pressent ils pressent il pressent
27. n ajoute donc le motif de base 2cent pour interdire en g n ral la coupure devant le c Mais lorsque la syllabe cent est pr c d e de ja adjacent subjacent ou de d cent ind cent r cent elle est sonore et on corrige en ajoutant ja3cent et e3cent pour autoriser la coupure devant le c dans ce cas Les terminaisons en escent vanescent incandescent s nes cent sont galement sonores sauf acquiescent on ajoute donc es3cent et acquies4cent On comprend sur cet exemple que l ordre pertinent pour l analyse des terminaisons de mots est l ordre alphab tique de droite gauche C est dans cet ordre qu on t rang s les motifs corrigeant chaque motif de base 52 Motifs de c sure francais TABLE 3 Fr quences des terminaisons en ent dans BDLEX muettes sonores motifs muettes sonores motifs ajout s ajout s W R OOODOWNOOGOGOOR gt O DE FEREVGOE OF R NA E F H H O0 1 2 1 1 1 1 2 1 1 1 1 1 4 1 1 1 2 1 18331 2418 182 dans les fichiers f7hyph tex et f8hyph tex ainsi 2cent est plac la lettre c apr s les deux motifs 4ce et 4ces qui ont la m me fonction que lui et les exceptions ja3cent is3cent immis4cent sont class es par ordre alphab tique de droite gauche la suite tous les motifs du groupe ayant t align s sur le point final afin d am liorer la lisibilit 8 Conclusion provisoire et perspectives Le pr sent travail c
28. n d es sayer de faciliter la lecture et la maintenance ult rieure du fichier les motifs tymologiques regroup s en deuxi me partie du fichier par J D SARM NIEN ont t interclass s avec les motifs phon tiques L ordre retenu est l ordre alphab tique ceci pr s que nous avons re group les motifs agissant sur le m me groupe de lettres Par exemple le motif g n rique i121 est sa place alphab tique et les motifs com pl mentaires concernant le ill ci131 rcil41 xi131 sont ras sembl s la suite de celui ci et indent s de mani re aligner ver ticalement le groupe ill afin d am liorer la lisibilit De m me nous avons pr f r ne pas s parer les terminaisons muettes par exemple les motifs 4de 4des 2dent sont dans cet ordre les exceptions tymologiques d e1a2 d elio d e1o2 tant rel gu es apr s en l g re violation de l ordre alphab tique Le test des 500 mots demeurant pour nous trop r duit par rapport la richesse de notre vocabulaire fran ais nous avons souhait v rifier les c sures obtenues sur plusieurs milliers de mots Il aurait t souhaitable de reprendre le fichier du vocabulaire informatis du laboratoire d automa tique et de linguistique de Paris VII fourni par le professeur GROSS comme base de travail J D SARM NIEN mais nous ne l avions pas Par contre nous avons pu b n ficier d une convention de recherche avec le GDR PRC Com
29. notre travail fin 1991 de nombreuses versions diff rentes des motifs de c sure francais taient disponibles sur les r seaux Celles gue nous poss dions nous m mes taient elles correctes Les fichiers originaux de J D SARM NIEN avaient de toute vidence subi des ajouts et des modifications certaines judicieuses et d autres moins comment faire le tri Dans un premier temps nous avons d cid de travailler uniquement sur les fichiers de motifs pr vus pour MITEX et de transcoder ceux ci lorsqu ils seraient au point en version 8 bits 7 Notre travail Nous avons commenc par une comparaison la main des diff rents fichiers de c sure fran aise notre disposition dans le domaine public en vue de d terminer lequel pouvait tre consid r comme le meilleur point de d part pour notre tude Tr s vite il a fallu se rendre V vidence et re noncer devant l normit du travail Nous disposions de 5 fichiers d origines diverses mais tous taient vraiment diff rents Dans le doute nous avons pris comme r f rence le fichier de c sure dis tribu par GUTenberg depuis pr s de trois ans pour le comparer avec les motifs publi s par J D SARM NIEN Nos comptages manuels font appa ra tre 259 diff rences tableau 1 TABLE 1 Divergences survenues depuis le travail de J D SARM NIEN Motif de cere Akka phon tiques i TaT Notre fichier de r f rence n tait visiblement pas bon I fallait donc
30. onstitue une remise en ordre des fichiers de c sures fran aises de J D SARM NIEN Nous avons essay de faire le tri des am liorations apport es et des d t riorations survenues Nous ne pr tendons pas que les fichiers de motifs f7hyph tex f8hyph tex soient parfaits il y a encore beaucoup de travail faire sur ce sujet si les motifs phon tiques nous semblent bien au point les motifs tymologiques m riteraient eux d tre test s plus avant mais aucun des trois auteurs n a eu le temps ce jour de se mettre ce travail Toutes les propositions de collaboration dans ce domaine sont videmment les bienvenues 53 Daniel FLIPO Bernard GAULLE Karine VANCAUWENBERGHE Les nouveaux fichiers de c sure se trouvent dans la distribution des fichiers de style french ils seront inclus dans les distributions GUTenberg Des versions bien ant rieures gui sont encore actuellement diffus es sur les r seaux sont loin d tre satisfaisantes Nous comptons faire en sorte que toutes les versions alt r es soit retir es des archives CTAN et remplac es par les seuls fichiers frhyph tex V1 06 du 20 4 94 code TEX effectuant le chargement en m moire des motifs de c sure sous leur forme 7 ou 8 bits selon le cas le plus appropri f7hyph tex V2 0 du 20 5 94 motifs de c sure 7 bits f8hyph tex V2 0 du 20 5 94 motifs de c sure 8 bits codage DC Toutes les suggestions et am liorations peuvent nou
31. otamment tr s importants 16 Le n a pas pu trouver place dans les dix positions r serv es aux caract res grecs mais cette lettre n intervient qu en fin de mot voil ou dans des mots compos s tout l gout 45 Daniel FLIPO Bernard GAULLE Karine VANCAUWENBERGHE ni res margues de M J FERGUSON dans les fichiers semblent dater de juin 88 Ensuite est sorti TEX V3 reprenant l essentiel mais pas la totalit des id es de M J FERGUSON Cette diff rence a amen M J FERGUSON faire son MITpX V3 Une autre fa on de traiter le probl me des c sures de mots accentu s gui g n ralise l approche de J D SARM NIEN consiste disposer dans chaque fonte de tous les caract res accentu s n cessaires L adoption Cork en 1990 8 du codage de fontes EC 7 256 caract res r sout donc d finitive ment le probl me pour le fran ais comme pour toutes les autres langues europ ennes condition toutefois de disposer de fontes r elles DC par exemple ou virtuelles L apparition de cette norme a motiv le transcodage des fichiers de c sures pr vus pour MITEX en fichiers 8 bits Le transcodage na f consiste remplacer les s quences du type e par le caract re 8 bits correspondant Mais le code de ce caract re d pend bien s r de la machine utilis e les co dages PC Mac ISO Latinl et PostScript sont tous diff rents Il faudrait donc un fichier 8 bits sp cial pour chaq
32. our choisir les points de c sure est expos dans le TEXbook 17 appendice H p 449 Rappelons ici quelques notions n cessaires la lecture d un fichier de c sures Un tel fichier se compose essentiellement d une macro patterns dont le contenu est une suite de lignes contenant chacune un ou plusieurs motifs s par s par un espace Ce fichier principal peut ventuellement tre accompagn d un fichier d exceptions par exemple enhyphex tex contient les exceptions au fichier de motifs anglo am ricains f7hyphex tex contient les exceptions fran aises en format 7 bits 5 1 patterns un motif de discussion Pour pr ciser l interpr tation des motifs de c sure nous allons consid rer quelques lignes extraites du fichier f7hyph tex patterns 1121 vil31 chevil41 13 Il existe aussi f8hyphex tex qui lui est quivalent mais sous une forme 8 bits Dans la pratique c est le fichier frhyphex tex qui est appel et gui d cide quel est le fichier charger en m moire soit le 7 bits soit le 8 bits Tous ces fichiers font partie int grante de la distribution des fichiers du style french sur le serveur d archives GUTenberg ftp univ rennes1 fr dans le r pertoire pub GUTenberg french 14 C est le code contenu dans le fichier frhyph tex qui est ex cut et qui d cide quel est le fichier charger en m moire soit le 7 bits f7hyph tex soit le 8 bits f8hyph tex 43 Daniel FLIPO Bernard GAULLE Karine V
33. prononc es simples Ainsi on coupe souf fler et col 1 gue bien que l on prononce g n ralement su fle et ko leg la coupure s effectue devant la plus forte de deux consonnes for mant un groupe d croissant Un tel groupe est en g n ral consti tu d une consonne que l on peut qualifier de forte en particulier une occlusive sourde p t k ou sonore b da g ou parfois une constrictive notamment f et v suivie d un phon me plus faible une semi consonne ou le plus souvent une sonante telle la lat rale 1 et la vibrante r D o de nom breux groupes indissociables not s cr dr bl fr c bler nau frage ta bleau mais on peut aussi tenir compte de l tymologie voir 4 4 sub stan tif 1 ch gn ph th ne sont jamais coup s lorsqu ils ne transcrivent qu un son ce qui n est pas toujours le cas En effet on rel ve quelques termes gui font figure d exceptions pour lesquels les deux consonnes transcrivent deux phon mes et sont donc sus ceptibles d tre coup s J D SARM NIEN avait parfaitement not cela pour les mots suivants stag na tion vwag n rien s c Des voyelles cons cutives en hiatus ex th tre constituent des syllabes entre lesquelles on ne va pas la ligne sauf s il s agit de pr fixes 6 pr avis pro mi nent 9 Les trois semi consonnes du francais sont j comme dans ciel faille q comme dans lui nui
34. quivalent ferment etc TEX n analyse pas le contexte d un mot et ne sait pas couper ils pr sident dans un cas et le pr si dent dans l autre Nous avons donc choisi de traiter les terminaisons mixtes comme si elles taient muettes et donc ins cables nous avons pr f r interdire la coupure possible le pr si dent plut t que d accepter la c sure incorrecte ils pr si dent ce mot sera dans tous les cas coup par TFX en pr si dent L auteur a toujours la possibilit d infl chir localement ce choix en codant dans le texte pr si dent au lieu de pr sident La base BDLEX nous a t d une grande utilit pour faire le tri des termi naisons gr ce aux utilitaires standard d UNIX nous avons extrait tous les mots se terminant par ent puis nous les avons tri s par ordre alphab tique mais de droite gauche afin de d gager des r gles de classement en motifs sonores ou muets Une lecture attentive du fichier produit nous a permis d tablir la liste de motifs ajouter Le fichier BDLEX nous a sembl assez complet pour permettre une classification satisfaisante Le tableau 3 pr sente le bilan de toutes les terminaisons en ent pr sentes dans le fichier BDLEX L ajout des 182 motifs propos s permet de corriger 18331 coupures incorrectes parmi les mots du fichier BDLEX Prenons pour expliquer notre d marche l exemple des terminaisons en cent elles sont en g n ral muettes 115 contre 47 cf tableau 3 o
35. r de page en maximisant une note d aspect pour la page en cours Malheureusement aucun param tre n est pr vu pour p naliser de telles coupures de mots et il arrive que TEX produise effectivement des pages dont le dernier mot est coup voir 17 et 13 Dans ce cas il est n cessaire d intervenir manuellement 7 Cette r gle n est pas mise en uvre directement en TEX sous cette forme Dans son calcul de note d aspect TEX prend en compte le param tre finalhyphendemerits dont la valeur standard 5 000 le dissuade fortement de terminer par une c sure l avant derni re ligne d un paragraphe cf 17 p 98 8 TEX prend en compte un param tre doublehyphendemerits dont la valeur standard 10000 p nalise tr s fortement toute paire de lignes cons cutives termin es par une c sure cf 17 p 98 Dans le cas d un triplet de telles lignes la p nalit serait doubl e rendant la disposition du paragraphe inacceptable 40 Motifs de c sure francais alors s attacher en premier lieu le diviser normalement aux fronti res des syllabes graphiques Voici quelques r gles cet effet s a la coupure est possible entre voyelle et consonne unique 6 co lon s b la coupure peut tre r alis e entre les consonnes lorsqu il y en a deux col lant fac teur al bi nos par tir La coupure entre deux consonnes identiques a lieu m me si ces consonnes doubl es dans l criture sont presque toujours
36. s tre transmises l adresse lectronique suivante cesure l ens fr ou directement aux auteurs Remerciements Nous tenons remercier les diverses personnes qui ont bien voulu critiquer une version provisoire de cet article et en particulier Jacques ANDR R f rences bibliographiques 1 Association suisse des compositeurs la machine Guide du typographe romand 5 dition 1994 2 M ARRIVE F GADET et M GALMICHE La grammaire d aujourd hui guide al phab tigue de linguistique fran aise Flammarion Paris 1986 3 H BONNARD Code du fran ais courant Magnard 1981 4 J D SARM NIEN How to run TEX in a French environment Hyphenation Fonts Typography TUGboat vol 5 no 2 1984 pp 91 102 D SARM NIEN La division par ordinateur des mots fran ais application 5 J D La divisi dinat d ts f i lication TEX gt Techniques et Sciences Informatiques vol 5 no 4 1986 pp 251 265 6 B DUPRIEZ Gradus les proc d s litt raires dictionnaire Union g n rale d di tions Paris 10 18 1984 7 F d ration CGC de la communication Code typographique Choix des r gles Vusage des auteurs et professionnels du livre 16 dition 1989 54 10 11 12 13 14 15 16 17 18 19 Motifs de c sure francais M J FERGUSON Fontes latines europ ennes et TEX 3 0 Cahiers GUTenberg N 7 1990 D FLIPO and L SIEB
37. st toutefois pas d y rem dier car nous pensons qu il faut laisser la place aux diff rentes coles tout comme l innovation Les r gles que nous proposons plus loin permettront chacun de disposer d l ments de d cision lorsque l une d elles est difficilement mise en uvre dans TFX nous l indiquons en note de bas de page Pour poser clairement le probl me de la division des mots en fran ais citons Jacques D SARM NIEN 5 Comme V crit THIMONNIER 19 ceux dont le francais est la langue maternelle appliquent spontan ment les r gles de la syllabation parl e Ils n ont qu se laisser guider par la prononciation usuelle dans la pratique typographique les choses ne sont pas aussi simples on sait bien que en fran ais la correspondance n est pas parfaite entre l criture et la prononciation De fait les probl mes rencontr s pour la d termination de la coupure d un mot proviennent de la confusion faite g n ralement entre syllabation parl e et syllabation crite On ne saurait donc tre trop prudent avant d noncer quelques r gles compl mentaires Pourtant il nous est apparu qu il tait important de dif fuser quelques rudiments que l on trouve pars dans quelques livres d au teurs 2 3 6 12 19 15 10 ou dans le Code typographique 7 Ces r f rences divergent parfois sur quelques points de vue nous avons fait notre propre choix 37 Daniel FLIPO Bernard
38. t w comme dans loi Louis 10 15 pr f re la coupure syllabique ordinaire subs tan tif 41 Daniel FLIPO Bernard GAULLE Karine VANCAUWENBERGHE s d On ne rejette pas la ligne pour la commodit de la lecture une syllabe muette 6 es p rent s e On ne divise jamais apr s une apostrophe ni imm diatement apr s une lision comme dans s en tr gor ger 4 4 R gles de coupure tymologique Le Code typographique 7 fait grandement abstraction des conditions appliquer pour respecter l tymologie La division tymologique est si rarement et si difficilement observ e m me par l Acad mie et les lexicographes qu il est pr f rable de suivre l avis des techniciens du Livre tels que TASSIS FREY Th otiste LEF VRE etc gui recommandent la division d apr s l pellation fran aise Nous reconnaissons n anmoins que certains auteurs de travaux scien tifiques pr f rent la division tymologique qui fait ressortir la racine grecque ou latine Nous avions vu en g h qu il fallait couper les mots compos s au trait d union qu ils poss dent d j e a Il en est de m me pour les mots compos s sans trait d union baise main ch vre feuille contre ma tre Par ailleurs J D SARM NIEN donne ses bons exemples mais aussi les cas difficiles voire insolubles de fa on informatique usuelle Pour sch ma tiser l extr me disons e b les pr fixes tels que re r
39. ue machine Il existe malheureuse ment encore aujourd hui sur les r seaux y compris dans les toutes nouvelles archives CTAN des versions utilisant ce type de codage cf f8hyph tex r cup r le 01 12 93 sur ftp tex ac uk La seule fa on raisonnable de coder un fichier de motifs de c sure en 8 bits est d utiliser la notation hexad cimale xy de TEX V3 et de res pecter le codage le plus standard c est dire le codage DC Cette notation interne TEX a deux qualit s essentielles elle est ind pendante de la ma chine utilis e 1 et elle r siste en principe aux transferts par les r seaux puisqu elle ne fait appel aucun caract re de code sup rieur 127 C est ce codage gu a fort judicieusement choisi Y HARALAMBOUS pour cr er son fichier de motifs adapt aux fontes DC malheureusement la liste des motifs de c sure dont il est parti tait alt r e Ce fichier est en core pr sent dans les archives sous le nom de fr8hyph dc ou fr8hyph tex version 1 0 du 10 juillet 1991 17 Ce codage est d sormais appel T1 avec IATEX 2e 18 Le cr ateur de ces fontes consid re que leur nom est temporaire le nom d finitif doit tre EC 19 Sous r serve d utiliser des fontes avec le m me codage 20 Il est n cessaire de disposer du fichier de motifs adapt au codage de la police utilis e la composition du document 46 Motifs de c sure francais Au moment o nous avons effectivement commenc
40. ute coupure est inhib e apr s le premier caract re accentu du mot 6 Petite histoire de la c sure fran aise dans TEX Les premiers travaux sur l adaptation de TEX aux c sures fran aises ont t faits par J D SARM NIEN qui a commenc son travail Stanford au d but des ann es 80 Une premi re publication a t faite dans le TUGboat en 1984 4 Mais l essentiel du travail de J D SARM NIEN sur les c sures est expos dans la revue TSI 5 La solution technique utilis e par J D SARM NIEN pour parvenir des coupures correctes des mots accentu s reposait sur l utilisation de fontes francis es les caract res sp cifiques du fran ais i c 1 rempla aient les caract res grecs plac s par Don KNUTH en position 01 10 des fontes CMR 5 Dans le m me temps M J FERGUSON apportait une solution int res sante aux probl mes multilingues avec son MITEX Il devenait possible de couper des mots contenant des lettres accentu es sans recourir des fontes francis es Le fichier des motifs de c sure de J D SARM NIEN a donc t revu et adapt au codage 7 bits standard de TEX MITEX a commenc cette poque tre tr s largement diffus dans les milieux francophones aid en cela par les distributions PCTEX de Personal TEX Inc Les der 15 Ces conditions ne sont pas enti rement suffisantes les 1ccode et catcode des caract res utilis s dans le texte tant n
Download Pdf Manuals
Related Search
Related Contents
Outdoor LP Gas Barbecue Grill Model No - Parts ハンディキャリブレータ CA71 用 CA71 アプリケーション 取扱説明書 Istruzioni per l'uso Harman Stove Company Magnafire Series Coal Stoves - Mark I, II, and III Mark II User's Manual thermal arc inc., troy, ohio 45373-1085, usa Andis CW-1EA Revolucionarios actuadores para sustitución en válvulas Kyocera 85221 User's Manual Mode d`emploi adhésion au Collectif Ville Campagne ROCO LOKMAUS 2 Copyright © All rights reserved.
Failed to retrieve file