Home

Comparaisons textométriques de traductions franco

image

Contents

1. AA TRE HI FS D REMOTE MAT AT JE KT id E BS RES GE RENE Eli TH x FX RER HE
2. WT TRIR U S E 3 AA dE ERA FX
3. R GE WU EX y WD T BER A WE AG DUE KER Hv o FH fS Hy ED ZX XE 0 R MAR Ho FT D D A EA JE URS ER R JEA XE XE TB E BK X EIR K7 Pebe SEDE u GE XEHR iE
4. inti Partition ERS Cei ro rr rro rt 10 E a L j ECRANS ARMAS lt Aucune gt I seuillage s Sp cits BOCBOCMBOOOCO0DOOCOOOMOCCMOOMOOOOCMOOMOOOOOCCOMBOCOOMON 50 LIDBDOONDUODOUOOUOONNDUUDUOUD O0OOCODOMMCOCOOOCOOOBO0BOMCOMOMMC 100 popmo 0o00080 00 00m0070mg88 DOCDODCODOODOEC ODOCDODUBONDIUCODGUODBNLDUOUDUOLD 150 DBDBDBDOIDDBiugrmiuuuumuu uuuiuuuiuuuuumEmBoDiBMEICIDJDCD 200 250 300 350 400
5. i NN Gk OE IR D ERR EIK t od F Be ORE HB A d HE OS ABB zl 6 Explorations textom triques avec Lexico3 PERS Sh Pil J E gt 8 Ii JE Navigation Rapport Dictionnaire Slectionnez une couleur Recherche Formes ordre lexicomM rique Fr uence gi BER KE USE SK RE FAT 3mm EE 2 EL EM E w 3 d EL B Md FE X ER um T P K n 140 How mu WE mmm sx mI M iz n HE HE 140 y ED d amp uum a a d TAE GT B Xo RE mE 140 B MA IREE f E o EE 10 E B A H
6. Traduction chinoise par Fu Lei 1957 HE c I Nous avons utilis la version compl te r unie en 1957 par les Editions Litt raires Populaires partir d une r vision par Fu Lei de la premi re version de 1953 Comparaisons textom triques de traductions franco chinoises 9 Le tableau 1 montre un extrait du texte original suivi de sa traduction chinoise La figure 4 montre dans la fen tre de droite l affichage par Lexico 3 du texte chinois dans lequel les caract res ont t isol s par insertion d un caract re espace entre chaque caract re Dans la fen tre de gauche on peut lire le r sultat du d pouillement statistique r alis sur la base du d compte des caract res isol s Les caract res sont tri s par ordre de fr quence d croissante dans le corpus analys TextPloreur J Fichier Traitement Fen tre Navigation Rapport Dictionnaire S lectionnez une couleur E Recherche versiorn uvuaracrtuicreces Formes ordre lexicomlrique FrfHuence Al IL amp jd B PE J E Jr WE E
7. 0 0m00mm 000m 0000000 Section le nouveau n s agite dans son berceau bien que le vieux ait laiss pour zn y Fu entrer ses sabots la porte son pas a fait craquer le plancher 1 enfant Dares commence geindre la m re se penche hors de son lit afin de le rassurer et le grand p re allume la lampe en t tonnant pour que le petit n ait pas E peur de la nuit la flamme claire la figure rouge du vieux jean michel sa 3 m barbe blanche et rude son air bourru et ses yeux vifs il vient pr du berceau son manteau sent le mouill il traine en marchant ses gros chaussons bleus louisa lui fait signe de ne pas s approcher elle est d un Bsppon Effacer Comparaisons textom triques de traductions franco chinoises 21 r Qo ET ET seullage AE 5 Bis cifs EHI 50 i BOOM mimi l OOBOOBOCOC OOMB0OC0OO0COOOOOCOBOC0OCOCOCOONS M 100 150
8. de h se Jr By EX liy iE XP fo FRE ERROR fh EDGE a db DE Xm HF HRHS oK UB RM dk WRUE HU Une 0p SA ME JH HW X BE OUS H od N E Roue AUN ue BU 5 Comparaisons quantitatives partir des mots 11 Les comptages r alis s partir des mots ainsi d coup s par l algorithme de segmentation permettent de comparer les r sultats obtenus sur le texte chinois ceux que l on obtient de la m me mani re sur la version fran aise du texte r alise une cat gorisation des mots du texte orient e vers la recherche d information technico commerciale Nous n avons pas utilis cette cat gorisation pour notre tude Il existe d autres logiciels de segmentation du chinois que l on peut trouver sur l Internet ICTCLAS Institute of Computing Technology Chinese Lexical Analysis System et Java Lucene segmentation du chinois etc consensus sur la d finition de ce qu est un mot chinois aucun logiciel ne peut pr tendre fournir de r sultats parfaits Signalons qu en raison de l absence d un 12 Explorations textom triques avec Lexico3 Tableau 4 Principales caract ristiques quantitatives du d pouillement en mots r alis sur les volets fran ais JC1 Fr et chinois JC1 Chin du corpus
9. 200 250 300 350 400 R E HB ZA Wk RA P H H BE m W 2 oam L XT UE d S 8E AB RT ERE EN D NU d dB d m HE AA US RETE 9 gw t WU EN ok mb E 8 Barat Efe Ao MER MGEOXLA ROS E BOX DEE n fh RA m mm We MAT 9k T ME 6 XH WE ACER
10. HSE XT JL 6 xb E AM AE AR EROR SOC NE E 3E TE H HRF ER 20 Explorations textom triques avec Lexico3 di JE FL AX HU BCE d BE dE BU fh YE db d FE d SES xf UE X IS E 4 Z RA 2 s BU egg HU A
11. ES K E F DA FH RA ER iE bed AE E f b HU FE fh HE WH I z amp m X H RA Hk ftt E W E l J F ds Hk BH 4 T M EE f H gt HL EE por d 1 AA H H
12. 5935 formes MK zl Figure 3 Lexico 3 Affichage du texte avec le codage Chinois simplifi GB2312 Segmentetion Musiques Nombre maximum d articles 100000 Nombre des tiquettes en test Police d affichage Chinois simplifi amp Mainland China X Annuler Figure 2 Lexico 3 Fen tre de r glage du param tre encodage des caract res 4 Un corpus d application Comparaisons textom triques de traductions franco chinoises 7 Pour illustrer ces possibilit s nous utiliserons un corpus bilingue dont le volet fran ais est constitu par le premier chapitre du roman Jean Christophe publi en 1904 par Romain Rolland 1866 1944 On trouve au tableau 1 ci dessous un extrait du texte original de Romain Rolland Le second volet du corpus est constitu par la traduction de ce texte en chinois par Fu Lei 1908 1966 Nous appellerons respectivement ces deux corpus JC1 Fran ais et JCI Chinois 41 Segmentation du texte en caract res Comme on l a vu plus haut sans que cela constitue une g ne pour le lecteur exp riment le systeme d criture chinois n utilise pas d espace entre les unit s lexicales plac es c te c te Cette circonstance constitue une difficult sp cifique pour l exploitation textom trique des textes chinois Sur quels crit res peut on s appuyer pour d couper des unit s statistiques au fil du texte afin de r aliser
13. Partie Occurrences Formes Hapax F Max JCI Chin 34 743 7 196 3 781 2313 JCI Fr 39 666 6 673 3 970 1578 de Partie Occurrences Formes Hapax F Max JCI Chin 37 479 5 922 3 069 2 797 BJ JCI Fr 41 060 6 022 3 497 1 886 il Comme on le voit au tableau 4 la traduction chinoise compte nettement moins de mots graphiques que le texte frangais On notera qu elle compte cependant nettement plus de formes diff rentes aussi moins de formes diff renttes La proportion des formes qui n apparaissent qu une seule fois dans chacun des textes est moindre dans le texte chinois alors que la forme la plus fr quente y trouve nettement plus d occurrences que dans le texte francais La comparaison entre le syst me des mots chinois et celui des caract res chinois pour lequel nous avons pr sent plus haut des d comptes comparables montre que les mots chinois sont compos s en moyenne de 1 6 1 5caract res et que le mot le plus fr quent rassemble presque toutes les occurrences du caract re le plus fr quent dans les deux cas le caract re de n Il nous a sembl int ressant de publier ces premiers comptages sur la comparaison textom trique entre textes chinois et textes fran ais Cependant ces r sultats pr sent s dans le but de fournir une comparaison sur deux syst mes d criture tr s diff rents doivent tre pris avec de grandes pr cautions Nous tudierons par la suite l influence que peut avoir la lem
14. 10 000 15 000 20 000 25 000 30 000 35 000 Position dans le texte nombre d occurrences Figure 6 Courbes d accroissement du vocabulaire r alis e sur les volets fran ais JC1 Fr et chinois JC1 Chin du corpus 16 Explorations textom triques avec Lexico3 Diagramme de Pareto version chinois francais Fr quence F 100 Nombre de formes gt F Figure 7 Diagramme de Pareto pour les deux volets du corpus Guide de lecture pour la figure 7 Pour un texte T d pouill en unit s statistiques appel es formes le Diagramme de Pareto permet de visualiser la structure de la gamme des fr quences m L axe vertical permet de repr senter la fr quence F des formes du textes laquelle varie de 7 Fmax fr quence maximale calcul e pour le texte T m Sur l axe horizontal on porte la quantit nombre de formes du texte dont la fr quence est sup rieure F m Avant de tracer le Diagramme on transforme chacune de ces quantit s en son logarithme d cimal Le Diagramme ainsi obtenu prend alors approximativement la forme droite que l on appelle Droite de Zipf en l honneur de Georges Kingsley Zipf qui a montr que ce type de proc dure r alis e partir de larges cat gories de textes permet de mettre en vidence une propri t statistique commune aux d pouillements en unit s lexicales Cette propri t est parfois pr sent e sous la forme
15. FU LEI f amp 8 1998 La grande s rie de la traduction de Fu Lei f8 g E X 44 He fei ditions de l art d An Hui FLEURY S MKAlign Manuel d utilisation http tal univ paris3 fr mkAlign mkAlignDOC htm GRANGER S LEROT J PETCH TYSON S eds 2003 Corpus based Approaches to Contrastive Linguistics and Translation Studies Amsterdam New York Editions Rodopi HABERT B NAZARENKO A et SALEM A 1997 Les linguistiques de corpus Paris Armand Colin Masson HOA M 2005 C est du chinois I volume Lire et crire 3 dition Paris dition You F eng LEBART L SALEM A Statistique textuelle Paris Dunod 1994 t l chargeable sur le site http www cavi univ paris3 fr lexicometrica livre st94 st94 tdm html OLOHAN M 2004 Introducing Corpora in Translation Studies London and New York Routledge SALEM A Introduction la r sonance textuelle Actes des 7 mes Journ es d analyse des donn es textuelles Louvain la neuve 2004 WEI N et alii 2005 Corpora in use IZ EMITTE Shanghai ditions de l enseignement des langues trang res de Shanghai ZIMINA M 2004 Approches quantitatives de l extraction de ressources traductionnelles partir de corpus parall les Th se de doctorat Universit de la Sorbonne nouvelle Paris3 ZIMINA M 2005 Topographie bi textuelle et approches quantitatives de l extraction de ressources traduction
16. etc pour rendre accessible aux lecteurs chinois le sens original Tableau 7 Extrait de la concordance autour du p le Z lao vieux me B m AE D ff B C 4 REX KT t J R KE K H go RO IK FX m JL BA u 8 D J BUE SEA KAK NE MA Hj HECH AE OM s 4k We 8 XA TT
17. 7 Conclusion La complexit apparente le Systeme d criture chinois ne constitue pas un obstacle incontournable l exploration textom trique des textes Les traitements informatis s labor s pour les textes cod s l aide d critures alphab tiques peuvent tre adapt s moyennant des modifications mineures l tude des textes chinois Malgr des difficult s importantes dans la d finition de l entit mot en chinois l introduction de cette notion et sa prise en charge par des logiciels de segmentation automatique permet d augmenter l efficacit de l exploration textom trique du bitexte franco chinois et de d passer l exploration fond e sur les caracteres hanzis consid r s comme des entit s isol es Les r sultats obtenus sur la base de la comparaison textom trique du bitexte align d coup en mots ouvrent au plan traductologique des pistes de comparaison qui semblent extr mement prometteuses Elles permettent d envisager la comparaison simultan e des moyens lexicaux utilis s dans les corpus de traduction mis en confrontation et des proc d s employ s par les traducteurs pour faire saisir leurs lecteurs les diff rents sens nuances et connotations v hicul s par le texte d origine Comparaisons textom triques de traductions franco chinoises 23 8 R f rences ALLETON V 1997 L criture chinoise lt Que sais je 5 dition corrig e 1 dition 1970 Paris Presses universitaires de France
18. Principales caract ristiques quantitatives r sultant du d pouillement en caract res hanzi du volet chinois du corpus Partie NB de caract Caract diff rents hapax FMax Caract res 56 797 2 478 579 2959 10 Explorations textom triques avec Lexico3 Le tableau 2 montre que les 56 797 caract res que compte le corpus JC1 Chin sont des occurrences de 2 478 hanzis diff rents Un quart environ de ces caract res soit 579 ne trouvent qu une seule occurrence dans le corpus Le caract re le plus fr quent est le caract re BJ qui correspond plus ou moins la pr position de en fran ais La figure 5 qui rend compte de l apparition de nouveaux caract res au fur et mesure que l on parcourt le texte permet de pr ciser ces observations La courbe d accroissement r alis e partir des caract res hanzis montre qu on atteint d s les 5 000 premiers caract res du texte le seuil de 1 000 caract res diff rents Les 5 000 caract res suivants n apportent que 500 nouveaux hanzis Comme dans le cas des courbes d accroissement de vocabulaire constitu es partir des mots les tranches successives apportent de moins en moins d unit s nouvelles Dans le cas des hanzis cependant on peut remarquer que l accroissement initial est plus fort que dans le cas des courbe d accroissement r alis es partir d unit s lexicales cf 5 infra Accroissement de vocabulaire 2 400 2 300 2 200 2 100 2 0
19. est un point tout petit mais infiniment tendre b WR DUE EN f m EC KER AA RE 22 q Ei GEN RAR HAE 8 W RE I Bi EM T JES R 3E XE XI TS BU WK lt CH m gt Bs dat EE T l enfant s veille et pleure son regard trouble s agite quelle pouvante les t n bres l clat brutal de la lampe les hallucinations d un cerveau peine d gag du chaos la nuit touffante et grouillante qui l entoure l ombre sans fond d o se d tachent comme des jets aveuglants de lumiere des sensations aigu s des douleurs des fant mes ces figures normes qui se penchent sur lui ces yeux qui le p n trent qui s enfoncent en lui et qu il ne comprend pas il n a pas la force de crier la terreur le cloue immobile les yeux la bouche ouverts soufflant du fond de la gorge sa grosse t te boursoufl e se plisse de grimaces lamentables et grotesques la peau de sa figure et de ses mains est brune violac e avec des taches
20. res puis le code ASCII tendu 255 caract res qui permettait de coder en outre les voyelles accentu es du fran ais 3 Nous avons utilis pour cette tude la version 2003 du logiciel Word distribu par Microsoft 1 Plusieurs versions de la s rie Lexico en cours d ach vement permettent d j de traiter les cha nes de caracteres unicodes Le logiciel MKAlign d velopp par S Fleury dans l quipe Syled Cla2t permet galement de traiter les textes encod s sous ces formats Comparaisons textom triques de traductions franco chinoises 5 Conversion de fichier MiaaGmcf txt i x Choisissez le codage utiliser pour rendre ce document lisible Codage de texte C Windows par d faut C MS DOS Autre codage Direction du document C De droite gauche De gauche droite Aper u Sversion chinois f m 4I 58 4515 s E EG MX EX STE Sete KE SUR MERE AT SECO ED A iE ER 1 ER EB Hab PR SE VR st T E Ab Qm lt 49 4p qg J CRY BE MA SUB HE UE sa to KI SE SQ RS qr GERE si E mW gt ARLU C 5454 TET Ah JA POZE Ah 2473 LF PD gt om Figure 1 Word 2003 Param trage de l enregistrement du texte Lexico3 TextPlo
21. excessivement simplifi e Rang x Fr quence Constante Pour en savoir plus Zipf GK 1935 The Psychobiology of Language an introduction to Dynamic Philology Boston Houghton Mifflin Lebart L Salem A Statistique textuelle Paris Dunod 1994 t l chargeable sur le site http www cavi univ paris3 fr lexicometrica livre st94 st94 tdm html Comparaisons textom triques de traductions franco chinoises 17 La comparaison des deux courbes fait apparaitre des diff rences assez nettes dans la structure des gammes de fr quences des deux textes Le texte frangais poss de nettement plus de formes dans la zone de fr quences qui s tend de 50 occurrences 1000 occurrences environ De son c t le chinois cr e plus de formes diff rentes dans la zone des tr s basses fr quences 6 Un exemple d tude parall le Aligner un bitexte c est construire une repr sentation qui met en correspondance des unit s textuelles en rapport de traduction mutuelle Le tableau 6 montre un alignement des deux volets du bitexte r alis partir du corpus JC1 au niveau du paragraphe A partir d un tel alignement on peut s int resser aux traductions de ce qui constitue une unit dans la langue source dans l autre volet du corpus Cette comparaison peut tre men e simultan ment du point de vue distributionnel l aide de l outil concordance cf tableau 7 et d un point de vue spatial cf figure 8 6 2 Le groupe vieux vieillard et
22. jaun tres BT EUX X D J 8L 6 lt we mp WI S BU XI PJ tH 2 fh By HN Pg LA EUR XE dE dE xe wW XB Comparaisons textom triques de traductions franco chinoises 19 Pour rendre le sens vaguement p joratif associ en fran ais vieux v tement il faut en chinois avoir recours d autres mots La traduction mot mot en chinois de vieux rideau et vieille caisse ne signifierait pas forc ment que les objets consid r s sont en mauvais tat mais soulignerait simplement leur anciennet sans liaison explicite avec leur tat au moment du r cit Fu Lei emploie po ab m d chir et po jiu ab m us d chir
23. literature translation studies 3 484 5 S 6 MAY 1 Contexte de la recherche Parmi les nombreuses raisons qui peuvent expliquer le fait que les m thodes d analyse des textes sur ordinateur de plus en plus largement r pandues dans le monde occidental ne se sont d velopp es que plus tardivement dans la sph re culturelle chinoise on doit consid rer les facteurs li s l existence d un systeme d criture tr s ancien dont certaines qualit s sont indiscutables mais dont l informatisation s est r v
24. 00 1 900 1 800 D y ooo c 1500 1 400 1 300 1200 1100 Nombre de farmes diff rentes D in D J CO e e eo e e 5 O e ea O a ae h a a a o 5000 10000 15000 20000 25000 30000 35000 40000 45000 50000 55000 Position dans le texte nombre d occurrences Figure 5 Apparition progressive des caracteres dans le volet chinois 4 2 Segmentation automatique en mots Certains professionnels du Traitement Automatique des Langues proposent sur le web des proc dures qui permettent de d couper un texte chinois en mots Dans cette section nous utiliserons un d coupage automatique en mots r alis par un logiciel de segmentation sp cialement congu pour les textes chinois On peut voir au tableau 3 le r sultat de cette segmentation en mots r alis e partir de l extrait de texte pr sent au tableau 1 10 Pour cette premi re tude nous avons utilis le logiciel Hailanda Segmentation intelligente version d essai r alis par le Centre d intelligence artificielle Hailanda disponible l adresse suivante http Wwww mydown com code 234 234301 html En plus de la segmentation ce logiciel Comparaisons textom triques de traductions franco chinoises Tableau 3 Extrait du volet chinois JC1 Chin segment en mots Chaque mot isol par le logiciel Hailanda est suivi d un blanc
25. 55 convaincre JJ force Produit courant RAJIE S mo li hua cha le th au jasmin est un mot dont les composants identifiables sont difficiles segmenter On peut consid rer Rij mo li jasmin comme un mot bi syllabique compos de deux caract res d pourvus de sens propre Mais en combinaison avec le caractere hua fleur le mot qui d signe toujours le jasmin renvoie la fleur de l arbuste On peut consid rer le caract re 2 cha th comme un mot monosyllabique Mais pr c d par le caract re E hua fleur on peut galement consid rer que les caract res combin s hua cha th aux fleurs qui sont diff rents de l ch th vert ou de h ng ch th noir forment un nouveau mot 2 3 Les phrases et la ponctuation Comme dans le cas des mots il est difficile de d finir clairement les limites de la phrase chinoise Les d finitions et les classifications de la phrase que l on trouve dans les grammaires chinoises phrases nonciatives interrogatives imp ratives exclamatives etc permettent difficilement de segmenter un texte en phrases de mani re automatis e La ponctuation est d usage r cent en chinois En 1919 on a commenc utiliser la ponctuation moderne en se r f rant au syst me de ponctuation occidental Le syst me utilis actuellement conserve la trace des r formes successives de l criture chinoise C est pourquoi la ponctuation chinoise moderne malgr
26. Comparaisons textom triques de traductions franco chinoises Traductions franco chinoises Jun MIAO Andr SALEM silaomiaomiao yahoo fr salem msh paris fr R sum Apr s un bref rappel sur le systeme d criture chinoise et ses prises en charge par diff rents systemes de codage informatique 83 on compare les d pouillements textom triques d un texte fran ais et d une de ses traductions chinoises Apr s le d pouillement du texte chinois en caract res isol s 4 on compare un d pouillement automatis en mots de ce m me texte avec le texte francais original 5 La derni re section est consacr e l tude des perspectives ouvertes par la d marche textom trique pour l analyse des diff rentes traductions chinoises utilis es pour rendre un m me mot fran ais 6 Mots cl s textom trie caracteres chinois hanzi litt rature traductologie Abstract After a short recall of the Chinese writing system and on its various encoding systems 3 the authors apply textometric methods to compare a French text with its Chinese translation After an examination of the Chinese text with isolated characters 84 the same text cut into words with a Chinese word separation program is compared with the French original 85 The last section aims at studying the perspectives of textometric approaches in the analysis of different Chinese translations of French words 6 Key words Textometry Chinese characters Hanzi
27. XK EX M 2269 AES bt W WG lt Ff E K amp EF 27T A 10 a s d x AR d A SL At 5B GE F OR BI dx XR R j RE gt TE JE RU Um RA W H GE By OT 8 P 5 f 9 3 7E BS xe f HOMO a 69 RE fb s jy HU NF 8 S OX cmn amp X yb cE CES puc X GL AKKE LE X 2 E B S On D Hy SE dT Sk Y o WO e 4E DIO KE du amp amp 69 JE UE K EH 2 3 E HE j H BE j Xk GE d 8 D k R HER L m E s t d so bo HE O01 X OBS M f FR FER ET Ta OD OBS HE B 3E JL amp L 6 u F M rx By m NE F 20 B Jt 3 NE q BOB GL Rx E dy ZJ ow V in 35 FJ x DA B OBS Om BERR 2490 formes A ET X Bu EH amp rH o aF 4 Xe BS Hu Ye 6 B ovS 2 Ipr t IC Documents and Settinas Salem Bureau Moour4S miao7carC var Figure 4 Exploitation avec Lexico3 du texte chinois d coup en caract res Le texte ainsi modifi va nous permettre d obtenir un premier d pouillement en caract res hanzi du volet chinois du corpus On peut voir les principales caract ristiques quantitatives de ce d pouillement au tableau 2 Tableau 2
28. des comparaisons entre textes Pour cette premi re analyse nous nous appuierons sur une segmentation automatique relativement facile formaliser et mettre en oeuvre sur un ordinateur qui isole chaque caract re hanzi 8 La A ql Pour r aliser cette segmentation en caract res nous avons remplac en utilisant pour cela une expression r guli re chaque caract re du texte de d part par ce m me caract re pr c d d un espace code ASCII 32 Le fichier ainsi modifi r alise l isolation de tous les caract res du corpus Une proc dure de ce type est disponible l adresse http www cavi univ paris3 fr 8 Explorations textom triques avec Lexico3 Tableau 1 Extrait des corpus JC1 Fr et JC1 Chin Le grondement du fleuve monte derri re la maison La pluie bat les carreaux depuis le commencement du jour Une bu e d eau ruisselle sur la vitre au coin f l Le jour jaun tre s teint Il fait ti de et fade dans la chambre Le nouveau n s agite dans son berceau Bien que le vieux ait laiss pour entrer ses sabots la porte son pas a fait craquer le plancher l enfant commence geindre La mere se penche hors de son lit afin de le rassurer et le grand pere allume la lampe en t tonnant pour que le petit n ait pas peur de la nuit La flamme claire la figure rouge du vieux Jean Michel sa barbe blanche et rude son air bourru et ses yeux vifs Il vient pr s du berceau Son manteau sent le mouill il t
29. ed Et RERE Gk AIRE Figure 8 Localisation des correspondances de vieux et dans le bitexte l aide du logiciel Lexico3 version francais lt version chinois gt le grondement du fleuve monte derri re la EAS B EF EE maison la pluie bat les carreaux depuis le E KF SUR SNR FE commencement du jour une bu e d eau f ROR o ruisselle sur la vitre au coin f l le jour E jaunatrg s teint il fait ti de et fade dans la chambre Chargement Source et Cible f Z ma SIC le nouveau n s agite dans son berceau bien d que le vieux ait laiss pour entrer ses sabots Alignement Source Cible la porte son pas a fait craquer le plancher Recherche de cognats l enfant commence geindre la m re se penche hors de son lit afin de le rassurer et le arand b re allume la lampe en t tonnant pour FA i X FES LE b F kb 0 waa i TN i bon dieu qu il est laid fit le vieux d un ton convaincu il alla reposer la lampe sur la table Recherche Cible x 22 Explorations textom triques avec Lexico3 Figure 9 V
30. gle actuellement l emploi des caract res chinois 3 Cf par exemple ALLETON 1997 p 11 18 Comparaisons textom triques de traductions franco chinoises 3 2 2 Les mots chinois C est la combinaison de deux caract res ou parfois de trois caract res qui constitue le mot ni tu toi h o bon bien nin o Bonjour Comment a va Dans la langue moderne il existe beaucoup de mots bi syllabiques voire tri syllabiques Par suite de l volution de la langue et de l adoption de mots emprunt s d autres langues Par exemple D 2 3 4 EE sh u Shou ji xi h u qi o ke li main portable rencontre par hasard chocolat Dans le premier exemple le caractere sh u signifie main il constitue une syllabe et correspond en m me temps un sens ind pendant Dans ce cas il peut tre consid r comme un mot Dans le deuxi me exemple le m me caractere est associ au caractere ji machine appareil Il garde dans ce cas le sens main mais la combinaison des deux caract res prend un nouveau sens t l phone mobile portable Dans le troisi me exemple la combinaison des deux caract res xie h u signifie se rencontrer par hasard mais ces caract res perdent leur sens lorsqu il sont isol s Dans le mot anglais chocolate chacun des caract res 15 JJ poss de un sens propre sans rapport imm diat avec le mot 15 adroite habile
31. ine des tudes comparatives entre textes r dig s dans des langues diff rentes Dans ce cas en effet les caract ristiques quantitatives calcul es partir de chacun des volets du corpus peuvent tre directement utilis es pour cerner les diff rences entre les langues mises en pr sence C est ce que nous allons tenter de faire dans l tude qui suit afin de poser les premiers jalons d tudes traductologiques que nous nous proposons d entreprendre par la suite 2 Le syst me d criture chinois Les critures chinoise japonaise et cor enne utilisent toutes trois les caract res Han caract res d origine chinoise dits hanzi en chinois ainsi que des caract res nationaux propres chacune des langues Le chinois poss de pour sa part un syst me d criture qui n est ni alphab tique ni phon tique On peut dire que chaque caract re correspond plus ou moins un morph me et une syllabe de l oral Le nombre de hanzis diff rents utilis s par ces syst mes d criture se compte en milliers parfois en dizaines de milliers d passant de tr s loin le nombres des lettres qui permettent de transcrire les critures alphab tiques On dit que pour lire un journal un lecteur chinois doit pouvoir identifier sans mal 5 000 hanzis environ 2 1 Les caract res chinois Chaque caract re chinois est compos d un certain nombre de traits que l on peut retrouver dans une s rie d autres caract res Les caract res corresponde
32. isualisation des correspondances de vieux et dans le bitexte l aide du logiciel mkAlign La localisation des concordances et des discordances dans la localisation des termes qui qui sont r put s constituer des quivalences traductionnelles permet d approfondir l tude traductologique et de mieux cerner les techniques propres chaque traducteur pour rendre compte du sens v hicul par le texte source Tableau 8 Traductions attest es dans le volet chinois pour le terme vieux fran ais traduction chinoise fran ais traduction chinoise vieille maison maison ancienne de vieux amis vieux amis vieille ficelle ficelle usag e vieux grand p re grand pere de vieux habits IHZX42 v tements usag s vieux grand p re vieux grand p re vieux veston bleu veston usag le vieux jean michel vieux grand p re vieille chanson zi m lodie ancienne le vieux un vieil homme vieille chanson chanson ancienne pauvre vieux vieil homme vieil escalier FE WR AK HIRE escalier noir vieilles dames vieilles dames vieux rideau rideau usag vieilles dames LE vieilles dames vieille caisse caisse abim e il vieillissait il prenait de l ge
33. l e beaucoup plus complexe que celle des syst mes bas s sur l utilisation d un alphabet r duit Dans la p riode r cente parallelement aux efforts entrepris par les linguistes chinois pour simplifier la repr sentation des caract res hanzi les probl mes li s l informatisation des syst mes d critures complexes ont t d pass s par la mise en place de normes d Les auteurs remercient Kim Gerdes Serge Fleury et C dric Lamalle pour leur aide et leurs conseils pr cieux dans la r alisation de ce travail dd 07 yyyy 2 Explorations textom triques avec Lexico3 internationales telle la norme Unicode et de technologies permettant la saisie et l affichage de textes crits dans des langues jusqu alors difficilement accessibles au traitement sur ordinateur Ces avanc es technologiques ouvrent la voie un formidable d veloppement des tudes textuelles appliqu es des gisements textuels que les codages traditionnels taient incapables de prendre en charge Au del de l exploration des corpus lectroniques des fins de recherches linguistiques ou sociolinguistiques la fouille de donn es textuelles concerne dor navant un tr s vaste ensemble de textes saisis dans le cadre d activit s entreprises dans tous les secteurs de la vie socio conomique d un pays en plein d veloppement L tude de bitextes dont l un des volets est constitu par la traduction de l autre constitue une entr e privil gi e dans le doma
34. l es plus haut 18 Explorations textom triques avec Lexico3 Tableau 6 Alignement en paragraphes sur les deux volets du corpus le grondement du fleuve monte derri re la maison la pluie bat les carreaux depuis le commencement du jour une bu e d eau ruisselle sur la vitre au coin f l le jour jaun tre s teint il fait ti de et fade dans la chambre ER dE SE KE WE AR Wu WX n EN K PA zo le nouveau n s agite dans son berceau bien que le vieux ait laiss pour entrer ses sabots la porte son pas a fait craquer le plancher l enfant commence geindre la m re se penche hors de son lit afin de le rassurer et le grand p re allume la lampe en t tonnant pour que le petit n ait pas peur de la nuit la flamme claire la figure rouge du vieux jean michel sa barbe blanche et rude son air bourru et ses yeux vifs il vient pr s du berceau son manteau sent le mouill il tra ne en marchant ses gros chaussons bleus louisa lui fait signe de ne pas s approcher elle est d un blond presque blanc ses traits sont tir s sa douce figure mouton est marqu e de taches de rousseur elle a des l vres p les et grosses qui ne parviennent pas se rejoindre et qui sourient avec timidit elle couve l enfant des yeux des yeux tr s bleus tr s vagues o la prunelle
35. matisation de chacune des listes de formes sur les r sultats produits de la sorte ainsi par exemple la fr quence de la forme chinoise la plus fr quente 2313 27970cc renvoie la forme fran aise de 1578 1585 occ mais aussi aux formes du 243 2450cc des 447 466 occ etc Comparaisons textom triques de traductions franco chinoises Tableau 5 Les formes les plus fr quentes pour chacun des volets du corpus Francais Chinois 1 de 1578 2313 2 il 1044 1581 3 et 1034 638 Y 4 le 908 373 5 la 841 368 6 les 575 276 X 7 Il 515 275 A 8 se 463 ii ERJEN 9 Im 448 Ben 10 des 447 aus 11 ne 439 d 12 un 407 Tos 158 X 13 en 399 156 14 que 394 147 15 pas 376 143 16 qui 375 142 17 son 362 139 18 dans 329 139 AM 19 une 314 136 14 Explorations textom triques avec Lexico3 Fran ais Chinois 1 il 1 886 2 979 2 de 1 585 3 et 1 098 1 854 4 le 1019 f 991 5 la 913 T 741 6 l 668 614 7 les 631 E P9 8 un 542 dum 9 qu 307 jl dd 10 en 481 11 des 466 133 12 se 463 133 13 se 463 133 14 lui 453 133 15 ne 432 x 133 16 d 428 133 17 tait 428 133 18 Une 422 133 19 que 405 133 20 pas 383 E 133 fcr 133 133 133 La comparaison entre les formes les plus fr quentes dans chacun des volets du corpus montre que les fr
36. mbl dans le tableau 8 des paires s lectionn es partir du concept frangais vieux qui se trouvent tre en rapport de traduction avec des expressions chinoises L analyse des discordances dans la localisation de ces formes r v le avant tout un cart entre le champ s mantique du mot fran ais vieux et celui du hanzi chinois Z Lao vieux ancien etc En fran ais le mot vieux poss de un lien troit avec l ge et le temps mais il v hicule aussi une valeur parfois p jorative lorsqu il s applique des objets ou des personnes dans certains contextes vieux v tements vieille caisse En chinois tout au contraire le mot dont le champ s mantique est un peu plus large est employ pour d signer des personnes anciennes respectables honorables professeur vieux ma tre u Cet alignement a t r alis en utilisant le logiciel MKAlign propos par Serge Fleury ce logiciel peut etre t l charg sur le site http tal univ paris3 fr mkAlign mkAlignDOC htm s Maria Zimina Poirot a tudi dans sa th se Zimina 2004 des correspondances traductionnelles de ce type Les logiciels de textom trie permettent d sormais l tude syst matique de ce genre de correspondances traductionnelles Les termes de la correspondance peuvent tre tendus par l utilisation du syst me des expressions rationnelles Dans notre cas le motif vie iu permet de localiser toutes les occurrences des formes d tail
37. mg XE WE X K EM ZT KT EE E FE amp NA EN LH G t3 E KA X MA E Mi amp EF rm H L MT gt H AUR jJJ AE TE HE ERE ER
38. nelles partir de corpus parall les Actes des 7es Journ es scientifiques du R seau de chercheurs Lexicologie Terminologie Traduction Institut sup rieur des traducteurs et interpr tes ISTD Bruxelles ZIPF G K 1935 The Psychobiology of Language an introduction to Dynamic Philology Boston Houghton Mifflin ZHOU Q DUAN H J amp 2007 Traitement de segmentation et de marquage des mots dans les corpus chinois modernes HUIC IEM L PETRI RIPE RSEAMEZ disponible sur http hi baidu com jagard blog item dcdb653844fd842097ddd8ec html 9 Fonctionnalit s Lexico3 utilis es dans cette exploration N Fonctionnalit R sultat 5 6 Courbe d accroissement des caract res hanzis Figure 5 5 Principales car lexicom PCLC Tableau 4 5 6 Accroissement du vocabulaire chinois et fran ais Figure 6 5 7 Diagramme de Pareto chinois et fran ais Figure 7 7 Carte des sections volets frangais et chinois Figure 8
39. ns ses versions actuelles 3 5 0 2 Lexico3 manipule des chaines de caract res cod s sur un seul octet Cette limite qui est en voie d tre d pass e n entraine cependant pas l impossibilit de traiter des chaines de caract res cod es sur plusieurs octets Comme on comprend en les comparant octet par octet il est possible de conclure que deux chaines de caract res multioctets sont identiques ou qu elles sont diff rentes De plus les syst mes informatiques modernes permettent d afficher correctement certaines repr sentation multioctets qui ne sont pas des repr sentations unicode Pour le pr sent travail nous avons utilis un codage Chinois simplifi Mainland China propos par le logiciel Word On prend en charge ce codage sous Lexico3 en activant l article Chinois simplifi Mainland China propos par le menu Options couteau suisse de Lexico3 Les composants utilis s dans Lexico3 Edition du texte Concordances Carte des sections etc affichent ce codage correctement lorsqu on choisit de le visualiser avec le codage Chinois GB2313 des navigateurs Bouton droit gt Codage gt Plus gt Chinois simplifi GB2312 s A l instar de tr s nombreux syst mes d criture parmi lesquels ceux de l antiquit latin grec h breu sum rien etc Un grand nombre de syst mes d criture occidentaux dont le syst me du frangais ont utilis jusqu une date r cente le code ASCII 127 caract
40. nt la fois un segment sonore la syllabe et une unit de sens ren homme XK d grand tan ciel m bois l n f ret seng grande for t Chaque caractere v hicule une signification mais ne constitue pas n cessairement lui seul un mot Certains caracteres changent de sens dans la combinaison avec d autres dong Est H xi Ouest dongxi chose 2 42 Le Consortium Unicode et PISO consid rent que les caract res chinois cor ens et japonais sont les m mes que seuls les glyphes diff rent On peut rapprocher cette diff rence d aspect des traditions diff rentes qui ont longtemps pr valu en allemand police de caract res gothique en fran ais police s rifs et en anglais police sans s rifs Les caract res sont cod s de la m me facon Chaque tradition utilise une police appropri e pour afficher les caract res dans le style qui convient le mieux aux habitudes locales Apr s l tablissement de la R publique Populaire de Chine en 1949 les autorit s ont entrepris des efforts pour simplifier les caract res chinois En 1955 le Comit pour la R forme de l criture Wenzi gaige wei yuanhui a publi une proposition de caract res simplifi s En 1964 il a publi une deuxi me liste de simplifications Cette derni re liste r
41. quences d croissent plus rapidement dans le volet chinois L tude compar e des courbes d accroissement du vocabulaire figure 6 pr cise les r sultats obtenus par la comparaison des principales caract ristiques lexicom triques des volets fran ais et chinois du corpus La courbe situ e dans le haut du graphique correspond l enrichissement du vocabulaire chinois au fil du texte Le fait que ce texte comporte moins d occurrences est responsable de l interruption de la courbe correspondante abscisse 34 743 avant la courbe qui correspond au texte fran ais abscisse 39 666 La courbe correspondant l apparition de nouveaux mots chinois est situ e d s que l on atteint le premier tiers du corpus largement au dessus de celle qui correspond l apparition des mots frangais ce qui confirme l existence d un plus grand nombre de formes en chinois On peut remarquer que des paliers cr s par le ralentissement de l accroissement du vocabulaire au cours du r cit peuvent tre mis en rapport d une courbe l autre Au ralentissement qui survient sur la courbe correspondant au texte frangais abscisse 20 000 correspond un ralentissent dans la traduction chinoise abscisse 17 000 A celui qui survient pour le texte frangais abscisse 32 500 correspond galement un ralentissent dans la traduction chinoise abscisse 28 000 Comparaisons textom triques de traductions franco chinoises 15 Accroissement de vocabulaire francais chinois
42. raine en marchant ses gros chaussons bleus Louisa lui fait signe de ne pas s approcher Elle est d un blond presque blanc ses traits sont tir s sa douce figure mouton est marqu e de taches de rousseur elle a des l vres p les et grosses qui ne parviennent pas se rejoindre et qui sourient avec timidit elle couve l enfant des yeux des yeux tr s bleus tr s vagues o la prunelle est un point tout petit mais infiniment tendre l enfant s veille et pleure son regard trouble s agite quelle pouvante les t n bres l clat brutal de la lampe les hallucinations d un cerveau peine d gag du chaos la nuit touffante et grouillante qui l entoure l ombre sans fond dou se d tachent comme des jets aveuglants de lumi re des sensations aigu s des douleurs des fant mes ces figures normes qui se penchent sur lui ces yeux qui le p n trent qui s enfoncent en lui et qu il ne comprend pas il n a pas la force de crier la terreur le cloue immobile les yeux la bouche ouverts soufflant du fond de la gorge sa grosse t te boursoufl e se plisse de grimaces lamentables et grotesques la peau de sa figure et de ses mains est brune violac e avec des taches jaunatres Romain Rolland Jean Christophe 1904 RENE KAROR UBER F
43. reur loj Fichier Traitement Fen tre la T e 59m Navigation Rapport Dictionnaire S lectionnez une couleur Recherche Foxmes ordre Frfuence J Hi n ET Wk EX EE F3 ECKE CD S E T XT OSA ZA MY EA AH Bi m Wig 68 T EDGE J RE ROM BOT 978 em MS KR 8 E Hae E ARA R W W X dU Wo amp Wi dod mj EE 08 IT TO METUS EDD HHE per H 2 XE J D NOE ET X bebe 4 z t ATH PERRO HOS 8 B Ap Good d EDAD J D 63 E NER H de
44. ses similarit s avec celle utilis e en occident reste distincte de cette derniere 4 Explorations textom triques avec Lexico3 L utilit des reperes li s la notation de la ponctuation chinoise est d autant plus importante que comme on s en souvient les mots ou plut t les caracteres chinois sont crits l un apr s 2 H 4 l autre sans tre s par s par des espaces 3 Le codage informatique des caract res chinois En raison de leur nombre lev et contrairement ce qui se passe pour les systemes d criture des langues qui utilisent un alphabet restreint les caract res chinois ne peuvent tre repr sent s l aide d un codage sur un seul octet La norme Unicode qui permet de repr senter chaque caract re sur plusieurs octets fournit une bonne solution pour repr senter les caract res chinois 3 1 Logiciels supportant le traitement de textes chinois Dans leurs versions r centes les logiciels de traitement de textes permettent de manipuler en plus des textes cod s en unicode qui vont rapidement constituer la norme des polices multioctets qui permettent d afficher correctement les textes chinois entre autres critures non latines Avec le logiciel Word par exemple lorsqu on tente d enregistrer un texte chinois avec l option texte seulement une boite de dialogue permet de s lectionner le codage Chinois simplifi GB2312 comme on peut le voir sur la figure 1 3 2 Lexico3 et les textes chinois Da
45. son correspondant lao ren A titre d exemple nous examinerons les traductions chinoises d un ensemble de mots qui is 13 rendent en fran ais le concept de vieillesse vieux vieillard etc Pour cette famille de mots nous obtenons une fr quence globale de 95 occurrences qui se r partissent comme suit vieux 77 vieille 7 vieil 3 vieillard 3 vieilles 2 vieillards 1 vieillissait 1 vieillots 1 On trouve au tableau 7 un extrait de concordance r alis e autour du p le 1ao vieux dont les lignes sont tri es par ordre d apparition dans le texte chinois La localisation des occurrences de chacun de ces termes dans la carte des sections tablie pour le texte fran ais figure 8 permet de rep rer des sections correspondantes du texte chinois dans lesquelles on peut s attendre ce que soit rendue en chinois l id e de vieux La liste des mots les plus sp cifiques dans le texte chinois qui correspond ces derni res sections nous laisse penser que le concept vieux vieillard etc est souvent rendu en chinois par les termes lao ren vieil homme et lao vieux qui constituent par ailleurs les quivalences traductionnelles les plus adapt es pour traduire le concept de vieux Dans une seconde tape nous introduisons les mots et Z sur la carte des sections d coup es partir du texte chinois La comparaison des deux volets montre que la correspondance est loin d tre parfaite On a rasse

Download Pdf Manuals

image

Related Search

Related Contents

GE A1050  The Beast manual - English  KOHLER K-R10430-N-BN Installation Guide  mise en garde  Thermalright HR-03 Rev.A  WaterWick GP6WWHD Instructions / Assembly : Free Download, Borrow, and Streaming : Internet Archive  ENGLISH DEUTSCH - Centre Tank Services  Series 5 Miscellaneous Invoicing- User Help  Compaq Washer/Dryer TRU64 User's Manual  7827K Byte  

Copyright © All rights reserved.
Failed to retrieve file