Home

Alignement textométrique des unités lexicales à

image

Contents

1. DDOLDODDOODUEBaaagiuuuuuaauaadgauaaauuauu ou iJumid L uiii ouUldJdguuuuu DDODODELDLDLCDEC 0880808000 DIDIDICLCIEIFEICICIC DDCICICICICICIEIE ooog po0o0o000000 eaaaauuaauauaauaagauaaauuuuuDmnulJl iiuiuuul U DJuumi 9p pompogogoaoaaodgapgaapaapapbogugaggaagaaaag 0000000000 oroa 00 OOCOOOOOBOC imiaagauaaauauaouaagadaaadauaadoagagaaadauauaadauiadagagabuuadcocd ooooo00000 DODCODOLCDLCULCLC DCCOCCOCOCDOLDLC ooog ooog op0o000 0000 DOCOCDCOLDLCLCLCLC DCCCCCCCELC OOO0OOOOOC DCCCOLCLDLLCLIC OOOCOCCOCC oouo BPPEBPBDBELDDEETLDCDDDOIDUCDI ooroo LILILIDDDoabuouauoaououuiumucuLbd 3j diii uir u pooo ooroo ooroo ooon COCCOCOCRO p000 OOCOCCOOOC CODE Lg Lu COODCOOOOCC DIDI ub oui Lu il IL ILTEILIETET ooo ILI IEICIETET Il Ooni Ooni DOC CCOOOOCOOCE OCCODOOOOE Big uiii CCOOOROCOCC 0000000000 OOCCOCOOO0 0000000000 0000000000 DDLDLDDODLDDLDC ouuo ogoogo ooog Ludger 00008 0000 0000000000 0000000000 uuum 0000000000 LIDILIEICIDIEIDIEIE EIEICICIEIDIDICIEIC CDOIEIEIOIEIETOIET EIEICIEIETO D EIEIOI DICIETICIEIEICIDIET
2. 22 10 E17 political loyalty 25 10 E16 loyaut politique 24 10 E16 of political 29 10 E15 de fonctionnaires 7 7 E16 duty of 45 11 E15 obligation de loyaut 15 8 E14 officers 38 10 E14 politique obligation de loyaut 21 8 E13 duty of political 23 9 E14 loyalty service 110 14 E14 civil service 58 11 E13 CONSTITUTIONAL 146 14 E13 Guide de lecture Le tableau repr sente un extrait de la liste des sp cificit s positives majeures cal cul es pour l chantillon des phrases o est attest e la forme fonctionnaires et le fragment corres pondant en anglais Tableau 3 Sp cificit s majeures pour la s lection bi textuelle La fr quence globale de la forme fonctionnaires F 49 est sup rieure celle de la forme anglaise servants dans le fragment f15 44731 Nous pouvons en conclure que la forme fonc tionnaires recoit d autres traductions dans le corpus Pour d couvrir l ensemble des quiva lences lexicales correspondant la forme p le on soumet au calcul des sp cificit s les seules phrases du fragment anglais dans lesquelles la forme servants est absente cf Figure 2 La r it ration du calcul des sp cificit s dans ce sous ensemble de phrases met en vidence une s rie d unit s les plus caract ristiques de ce nouveau fragment Actuellement les outils statistiques de la carte des sections rendent possible une s lection automatique des sections dans lesquelles le type tudi est pr sent c est
3. Salem 2002 Zimina 2000 et 2002 La cartographie des pr sence absence de correspondances bilingues au sein des traductions fournit des moyens automatis s pour le recensement des quivalences Dans ce qui suit nous allons d crire une m thode d analyse permettant la d couverte de corres pondances lexicales entre les deux volets parall les pour des mots qui poss dent plusieurs traductions au sein d un m me corpus Une approche hybride qui allie la topographie tex tuelle et l analyse des sp cificit s est l origine de cette m thode La recherche de corres pondances lexicales s appuie sur l alignement du corpus au niveau de la phrase L exploration d bute par le marquage au fil du texte dans l un des volets du corpus bilingue d un sous ensemble d occurrences correspondant un type quelconque forme graphique lemme seg ment r p t etc Le rep rage des phrases correspondantes dans l autre volet permet de construire deux fragments de texte quivalents qui seront confront es dans chacun des cas au reste du corpus des fins de comparaison Sur la description de pratiques de la textom trie on consultera Heiden 2002 La topographie textuelle a pour objectif une localisation graphique des ph nom nes mis en vidence par l tude statistique Le rep rage des sp cificit s ou vocabulaires caract ristiques met en vidence pour un groupe de phrases donn les unit s dont la fr quence connait une variation i
4. gris fonc L appariement des phrases tant repr sent sur la carte il est possible d envisager l activation de la s lection parall le des phrases quivalentes dans le volet anglais 3 2 2 Les outils textom triques de la carte des sections Le calcul des sp cificit s permet de s lectionner parall lement pour chacun des fragments La carte des sections permet une visualisation du corpus d coup en sections par la promotion d un ou de plusieurs caract res particuliers au statut de d limiteurs de section Lamalle ef al 2003 Dans le cas des corpus parall les le d coupage en sections peut tre effectu parall lement en s appuyant sur des codes attribu s aux phrases en correspondance 7 Le garde mots est une fonctionnalit de Lexico3 permettant de m moriser formes segments etc pour une utilisation ult rieure Pour stocker un type dans le garde mots 1l suffit de le faire glisser sur l ic ne de cette fonc tionnalit Il est possible d obtenir un coloriage plus ou moins sombre des sections en cochant d abord la case seuil Cette fonctionnalit permet de r gler deux seuils en probabilit s qui entraineront l intensit du coloriage sur la carte La r alisation informatique de la s lection parall le des sections correspondantes est actuellement en cours de d veloppement Elle s appuie sur les fonctionnalit s existantes de la carte des sections de Lexico3 et utilise des principes formels de la segmentat
5. 0000000000 0000000000 0000000000 0000000000 0000000000 ogoogo DIPICIDLDLDCOLCILDC goood DOCROCOOCC COCO oooi OOCOOCOOOC ogg gl uJD p DDDODODODODO DOBOIaaaaaauauuJImiUauiuuuroiuuuuauauauagagt aalgaguuues po000000r00 OOOOOOCOCOOC OOOOOOOOO0 OOOOOOOOOC ooo ILILIEILIEIEIETES ETHICIETEIETEIETETEI EJCIEIETEIETEIETETET COOCOCOCDOO EIETEIEIEIEIETETI E Donum mpiuu 0000000000 0000000000 mpm imi iar oomo ouuo oouo ooa BODDPDDBLDBLDCE por 000 00000000 mold COOOOCOCO0 00000000C ooog ouuo ooreo ooog oouo 0000000000 0000000000 0000000000 0000000000 0000000000 COOODOCOCOO EIEICICIEIDICICIIC CDICIEIEICIEIETOLEIEI DOCOOCOOC COCO 0000000000 0000000000 0000000000 ng mm 0000000000 ogoogo DILDCCLDLDOLCLDC DOLDLDOLCILCLCLE PLDOCIEDCCOLDIC COCO aooga DLDODLDDOLCLDO DO griglia rl SIU SUE J9 0A 0o1xoT Ve Q zu is uonoas poo00000000 OOOOOCOOOC OOCCOOOOOC 0000000000 0000000000 OOCOOOB0B0C ooog BODCCOCOCDCCCOC DOCOCDCCCODC oomoo poo0o0000000 OS00B0000C r000 OOCCOOOOOO0 OOCOOOOOOD poooo0o0o0000 ogoogo ggo ooog ooa poo0o0000000 OOOOBSOB00C S0B800000O0 DOCDIIDIIDIOUDOC DOCOOCDCDCOCDBICI Co DOIDIDIDDLCICIEIC DOCDOCIBSICICIBIEI DCICICIEICICICHBSICI oomoo DDOLDODDODOODU 8080000000 BODpDOOUBODO ooroo OOCOOOOOOOD pooo0o0mr000 CSISIDISICIHSICIEIE CIDIDICICHSEISEETETET DIC
6. Alignement textom trique des unit s lexicales correspondances multiples dans les corpus parall les Maria Zimina EA 2290 SYLED Universit de la Sorbonne nouvelle Paris 3 19 rue des Bernardins 75005 Paris France zimina msh paris fr Abstract The approach suggested in this article enables statistic identification of multiple word correspondences in bilin gual texts aligned on phrase level Corresponding lexical units are discovered through characteristic element computation in parallel contexts The calculation undergoes systematic reiteration within a corpus The explora tory results show that the use of quantitative methods in combination with bilingual text topography offers new means for automatic description of lexical equivalences R sum Dans les corpus bilingues align s au niveau de la phrase le rep rage de correspondances lexicales multiples peut tre effectu sur des bases quantitatives Fond e sur la pratique du calcul des sp cificit s notre m thode explore parall lement les contextes quivalents pour rep rer des correspondances dans les emplois caract ristiques des diff rents types d unit s textuelles La r it ration syst matique de ce processus dans le corpus appuy e sur l uti lisation des principes de topographie bi textuelle offre de nouveaux moyens automatis s pour l extraction et la description d quivalences lexicales Mots cl s corpus parall les alignement lex
7. ICIEIETETETCTISEISE ooog enbnuo eunone jueoJexe u inb S amp 3iEUUoT ouo ep Jesodsip e 1919jut 04e jueAnad eu 8181006 El je jeje poo0o0000000 au nu bu 0000000000 0r00C0C0C0000 000000000 poompoo00o00 pooooooo00o0 0000000000 0000000000 00008 4f ioo OOOOOOOBO0 OOOO0OO000 0000000000 ooon ooooouaudiog COOOOCOCOC DODCODOLCLCLCLC DCCCCOCOCDODC gooo DCOCOCOCLDLDLCLCLC OOOOOCOOOC DOCDCDCODLCLCLCL ocra DCDDLCDLCCCCCLC UCOCOCDLCLDLCLCLCLC pooooo00000 gooo DCCCCCCCDLDLC CODCCBLCCCLC ooog poo00000000 OOOOOOB00C DOCOOOOOOC opomin 0000000000 Co DOOCODOOCOCOOC DOO gogogo goooooooumu oo0o0000000 COOOO0O00C DOCCCCLCODLCLC OCDCOLCDLCCCCCLC DCOCCIBLCLCLCLCLCI poooo0o00000 DODCOCDLOLDLCLCLC DOCCCEBCOCCOLD COCDCOLDCCLCLCLC ooog poo0o0000000 0000000000 O00COCOOOC ooon ooog oooo000000 DOCOCOCOODCULCC DDCCCCCCOCC DOCOOLDLCUCLCLCLC DCCCCCCCLDLCI OOO0O0BOOOOC 000000000 DOICICICICICIDIEIE ooon ooog pooo0o000000 COCDCODLDLDLCCILC ogoogo ooog ooog Ce 000000000 o0r0000000 orro ouri pooooo00000 COCDCOCLDOLDLCLCLC ooog ooog ooog Cm 0000C0C0C0000 0000C0C0C0000 0u00r0C0C0000 0000000000 poooo0o0o0000 ooo0o00o0000 DOCCCCCCOCOD oomoo ooog DDODCOCOOOODOO OCOOOO000C ooon ooroo omrum poooooo0o000 ogoogo ooo ooog oomoo poo00000000 OOOOOOOOO0 omun oorun oo00000000 poooooo0o000 ooo opoooooooo ooog ooog poo0o000r0000 0or000C0020 000 0000C0C0 0000 0000000000 00000000M ooo0oo0o00m0 DODCDDCOCCOCC ogooro ogoogo oouo poo0o0000000 DODDODODCOCOOCO BOOOODULCLCLC DCCOCCOCOLDLCLC D
8. LDCCCCCLCLCL DIDIDLDLCCICICLCLC DOCICCOCCOCLCDLC COCCOLCISLDDCCH ooog ooog o0o00000000 000C0OC0C0C0000 000C0O0OC0OC0000 0000000000 0000000000 poooo0o00000 DBODOODUCOISI DOCCOCCCCOCDCC DODOCODCCIC DCCCOCICCIHCICICI o0o00000000 00000000000 0000000000 0000000000 0000000000 poooo0o00000 go0o0o000000 gogogo DCODOCODCCLC DCCCOCILCLCLCICI po0o0000000 COOOOOOOOOC OOCOOCOOOOC ooon OOCOOCOOOD SIBSUCAJ J9 0A JADT 2004 7 Journ es internationales d Analyse statistique des Donn es Textuelles ALIGNEMENT TEXTOM TRIQUE DES UNIT S LEXICALES CORRESPONDANCES MULTIPLES 1199 Guide de lecture de la figure 2 Les fonctionnalit s d velopp es au sein du logiciel Lexico3 per mettent d envisager la visualisation de l alignement des phrases d un corpus parall le l aide d une carte des sections Sur la figure 2 l appariement des phrases d un extrait du corpus Convention est mat rialis par des carr s positionn s sur deux colonnes La ventilation de la forme fonctionnaires est repr sent e par les carr s gris fonc m Dans le fragment quivalent en anglais les carr s gris clair correspondent aux occurrences de l une de ces traductions en anglais la forme servants La s lection des phrases activ e sur la carte est mat rialis e par des carr s noirs m Elle correspond des phrases du volet anglais o la forme fonctionnaires re oit d autres traductions que servants Note La description des fonctionnalit s de la carte des secti
9. an ais mort F 44 est le plus souvent traduit en anglais par death F 26 On rencontre cette correspondance au sein des quivalences lexicales la Les syst mes actuels d alignement des phrases de textes parall les multilingues ont fait r cemment l objet d une tude d valuation men e au sein du projet ARCADE Les r sultats de l tude t moignent d avanc es m thodologiques importantes dans les techniques d alignement des phrases Lorsque les textes ne pr sentent pas de divergences importantes au niveau structurel pas d omissions etc le taux de pr cision des syst mes valu s est estim en moyenne 98 5 cf V ronis 2000 Le corpus a t constitu partir des documents contenus dans la Convention d une douzaine de proto coles et d une s rie d arr ts rendus par la Cour europ enne des Droits de l Homme de Strasbourg en 1995 Cha que volet du corpus compte approximativement 300 000 mots graphiques On peut trouver les textes de la Convention en anglais et en frangais sur le site officiel de la Cour Europ enne des Droits de l Homme http www echr coe int JADT 2004 7 Journ es internationales d Analyse statistique des Donn es Textuelles ALIGNEMENT TEXTOM TRIQUE DES UNIT S LEXICALES CORRESPONDANCES MULTIPLES 1197 peine de mort death penalty les circonstances de la mort the circumstances of the death un danger de mort a risk of death et beaucoup d autres Cependant l quivale
10. cet ensemble de sections que l on compare l ensemble du corpus JADT 2004 7 Journ es internationales d Analyse statistique des Donn es Textuelles ALIGNEMENT TEXTOM TRIQUE DES UNIT S LEXICALES CORRESPONDANCES MULTIPLES 1201 forme segment Frq Tot frq locale Spec officers 38 10 E19 officials 16 7 E16 senior 18 6 E13 senior police 5 4 E11 police 216 9 E10 senior police officers 3 3 E09 Le retour au contexte confirme que les unit s officers spec E19 senior police officers spec E09 officials spec E16 constituent bien des traductions de la forme fonction naires au m me titre que la forme servants et le segment civil servants d couverts pr c demment cf Tableau 4 L exploration contextuelle s appuie sur les outils de navigation textom trique de la carte des sections Sur la figure 2 les boutons situ s gauche de la fen tre de visualisation de la s lection en forme de mains permettent de passer respectivement la section suivante pr c dente ou l occurrence suivante pr c dente du type tudi Pour ex plorer parall lement les deux volets bilingues du corpus les sections en correspondance sont li es Toute s lection dans une fen tre est r percut e dans l autre volet francais volet anglais introduction de proc dures disciplinaires the institution of disciplinary proceedings against l encontre de fonctio
11. e pour lequel la traduction n a pas t identifi e par notre exploration Nous pouvons affiner nos constats travers un retour au texte Il suffit d carter toutes les phrases du fragment anglais o la forme fonctionnaires est traduite par officers officials ou servants Pour ce faire on proc de la s lection des phrases du fragment anglais dans lesquelles ces trois formes sont absentes ou contenues en nombre inf rieur au total d occurrences de la forme fonctionnaires dans la phrase correspondante en frangais Cette recherche aboutit la localisation sur la carte du corpus du couple de phrases suivantes JADT 2004 7 Journ es internationales d Analyse statistique des Donn es Textuelles 1202 MARIA ZIMINA volet francais volet anglais Aux termes de la loi cadre sur les fonctionnaires by virtue of the civil service general principles des l nder seul peut tre nomm fonctionnaire act for the nder appointments to the civil service celui qui offre la garantie qu il prendra constamment are subject to the requirement that the persons con fait et cause pour le r gime fondamental lib ral et cerned satisfy the authorities that they will at all d mocratique au sens de la loi fondamentale times uphold the free democratic constitutional system within the meaning of the basic law Corpus Convention Dans ces derni res phrases la forme f
12. ent un r seau complexe Les unit s lexicales d un volet peuvent recevoir plusieurs traductions dans l autre volet Pour illustrer ce type d quivalences nous emprunterons des exemples un corpus de textes juridiques anglais frangais de la Convention de sauvegarde des droits de l homme et des libert s fonda mentales d sormais Convention cf Tableau IY volet francais volet anglais conv a0 pl 1 1 Les gouvernements signataires membres du Conseil de l Europe conv a0 pl le 2 The governments signatory hereto being members of the Council of Europe conv a0 p2 1 3 Consid rant la D claration conv a0 p2 le 4 Considering the Universal universelle des Droits de l Homme proclam e par l Assembl e g n rale des Nations Unies le 10 d cem bre 1948 Declaration of Human Rights proclaimed by the General Assembly of the United Nations on 10th December 1948 conv a0 p7 1 13 Sont convenus de ce qui suit conv a0 p7 le 14 Have agreed as follows Guide de lecture Chaque couple de phrases quivalentes est introduit par un code Les num ros indiquent dans l ordre le type de document convention protocole etc le num ro de l arr t la partie de l arr t le num ro de la section et ou du paragraphe le num ro de la phrase dans le corpus pr c d par la lettre e pour les phrases en anglais Tableau 1 Corpus Convention extrait Dans le corpus Convention le mot fr
13. expression pour laquelle les solutions propos es par des ouvrages de r f rence dictionnaires bases de donn es terminologiques etc sont insatisfaisantes En lexicographie l alignement des donn es de traduction met en lumi re la sp cificit et la JADT 2004 7 Journ es internationales d Analyse statistique des Donn es Textuelles 1196 MARIA ZIMINA richesse du vocabulaire bilingue Les corpus align s permettent de d couvrir des usages et des expressions ne figurant pas encore dans les dictionnaires 2 Alignement lexical probl mes et enjeux Les comptes rendus d exp riences publi s r cemment d crivent des algorithmes permettant d apparier les phrases d un corpus parall le avec un taux de r ussite lev V ronis 2000 En revanche l alignement lexical c est dire la mise en correspondance de mots et locutions entre les deux volets d un corpus parall le demeure un probl me difficile Lors de l aligne ment de ce type d unit s il faut tenir compte de plusieurs ph nom nes complexes li s notam ment la d tection des emplois polys miques de mots et de leur fonctionnement dans des s quences fig es et locutions dont la traduction varie selon le contexte 3 Corpus Convention navigation textom trique 3 1 Unit s lexicales correspondances multiples Lorsqu il s agit de mots dot s d un large ventail de sens les correspondances traduction nelles entre les deux volets d un corpus parall le form
14. ical correspondances de traduction textom trie topographie bi textuelle 1 Les corpus parall les align s Dans le contexte multilingue les corpus de documents parall les sont constitu s de plusieurs volets qui correspondent chacun une version d un m me texte dans plusieurs langues diff rentes Il s agit en g n ral de textes sources et de leurs traductions effectu es par des tra ducteurs humains pr sent s sous forme lectronique ou de textes dont chacun est une traduc tion de l autre sans qu il soit possible de d terminer lequel a servi de source Le traitement de corpus parall les suppose une phase pr alable d alignement c est dire la mise en corres pondance d unit s textuelles de diff rents types entre chacun des volets du bi texte De nombreux travaux ont montr l utilit des corpus parall les align s pour le d veloppement des applications de traitement automatique des langues Isabelle et Warwick Armstrong 1993 V ronis 2000 La cr ation automatique des lexiques bilingues align s permet de nor maliser la terminologie dans un champ de communication Elle est indispensable la mainte nance de la documentation technique multilingue Les travaux sur les corpus align s contri buent aussi au d veloppement des moteurs de recherche multilingues sur le Web Pour le tra ducteur les corpus align s fournissent un acc s au savoir faire de la communaut lorsqu il s agit de traduire une
15. ion parall le des corpus bilingues o chaque couple de phrases quivalentes est introduit par le m me code JADT 2004 7 Journ es internationales d Analyse statistique des Donn es Textuelles 1200 MARIA ZIMINA ainsi constitu s une s rie d unit s textuelles caract ristiques de ces fragments Les listes des sp cificit s s affichent dans les fen tres des deux c t s de la carte des sections bi textuelle Le Tableau 3 pr sente quelques unes de ces unit s sp cifiques mises en vidence par cette m thode On constate sur ce tableau que les unit s bilingues issues de l exploration consti tuent bien des correspondances de traduction Ainsi la forme frangaise fonctionnaires spec E109 ayant servi de point d entr e pour la construction de l chantillon de phrases pour cette analyse peut tre appari e avec la forme servants spec E55 et le segment r p t civil servants spec E52 qui se sont r v l s les plus caract ristiques du fragment anglais cf Tableau 3 forme segment Frq frq Spec forme segment Frq frq Spec Tot locale Tot locale fonctionnaires 49 49 E109 rl servants 50 31 ESS les fonctionnaires 14 14 E31 civil servants 46 29 ES2 des fonctionnaires 14 14 E31 civil 304 41 E40 de loyaut 36 14 E22 loyalty 43 14 E20 loyaut 42 14 E21 duty 109 15 E16 de loyaut politique
16. le traducteur In Bouillon P et Clas A Eds La Traductique tudes et Recherches de traduction par ordinateur Les Presses de l Universit de Montr al 288 306 Lafon P 1984 D pouillements et statistiques en lexicom trie Slatkine Champion Lamalle C et Salem A 2002 Types g n ralis s et topographie textuelle dans l analyse quantitative des corpus textuels In Actes des JADT 2002 403 412 Lamalle C Martinez W Fleury S Salem A Fracchiolla B Kuncova A et Maisondieu A 2003 Lexico3 Outils de statistique textuelle Manuel d utilisation Syled CLA T Universit de la Sor bonne nouvelle Paris 3 http www cavi univ paris3 fr Ilpga ilpga tal lexicoW WW Lebart L et Salem A 1994 Statistique Textuelle Dunod V ronis J Ed 2000 Parallel Text Processing Alignment and use of translation corpora Kluwer Academic Publishers Zimina M 2000 Alignement de textes bilingues par classification ascendante hi rarchique In Actes des JADT 2000 171 178 Zimina M 2002 Rep rages lexicom triques des quivalences basse fr quence dans les corpus bilingues In V ronis J Ed Lexicometrica n sp cial Corpus align s http www cavi univ paris3 fr lexicometrica thema thema6 htm JADT 2004 7 Journ es internationales d Analyse statistique des Donn es Textuelles
17. mportante dans ce fragment de texte Fond e sur le model hyperg om trique la m thode des sp cificit s permet d effectuer une comparaison entre l ensemble du corpus T et l chantillon des contextes contenant l unit p le t En fonction de la fr quence globale des unit s attest es dans ce fragment F et de leur fr quence locale f on leur affecte un indice de sp cificit Le diagnos tic est fourni sous la forme Z Exx o le signe indique un sur emploi ou un sous emploi de l unit et la valeur indique son degr de sp cificit cf Lafon 1984 Lebart et Salem 1994 JADT 2004 7 Journ es internationales d Analyse statistique des Donn es Textuelles MARIA ZIMINA 1198 SLeL DOLeL s c L 000 L OSGLL 006 LL 0S8LL BUS LL 0S2 LL DQZ LL 0S3LL 0026 0596 0006 0668 D ea 0688 0026 0696 D rt Dat OOGE OSYE DOFE EE IDEE ISEE 009 ossz OUM UOTJUSAUOS sndaoo np sanssi s2214Dddp sose1qd sop 97189 V ap JIDAIX UN Z 24n81 ponuoun Ajeunue eue IAD Aey 0 8100S pue ejejs eui 10 sjseJejul eui ui eq JOUUEO y gai i uonoas popo00000000 00000030000 0000000000 0000000000 0000000000 DIDIEICIDEICIEIDIE ogoogo gogoo ooog oam poo00000000 OB00B00000 DBOIDIODCDDCOLCLC DECGCOCDDCDUC BODUOCDUULDL oooo0o00000 ogoogo gogoo ooog OOOOOOOOOD poo0o0o000000 DEECGOECDELDDO 8080000000 OO0BO0OOO0 noorima D DICDOLCIEICICIEIL DICCICICCICICIEICI DCICICICIEICICIE E
18. nce mort death n est pas pr serv e dans les contextes suivants volet francais volet anglais La mort n est pas consid r e comme inflig e en Deprivation of life shall not be regarded as inflicted violation de cet article in contravention of this article l article vise certes les cas o la mort a t infli this provision extends to but is not concerned g e intentionnellement mais ce n est pas son unique exclusively with intentional killing objet Corpus Convention Dans les deux couples de phrases ci dessus le mot mort est utilis dans le sens fin provo qu e de la vie r pertori par exemple par le dictionnaire Le Robert dition 1996 L ab sence de cette signification dans l univers s mantique du mot anglais death explique la pr sence des quivalences mort deprivation of life mort killing dans le corpus Comme on va le voir ci dessous une description automatique de correspondances traductionnelles multiples peut tre envisag e si l on fait appel des m thodes d analyse quantitative 3 2 Topographie bi textuelle et outils statistiques d appariement Les travaux r cents montrent qu il est possible de faire appel des principes d analyse texto m trique et notamment une repr sentation topographique du texte pour l appariement des mots et des syntagmes des corpus parall les cf Lamalle et
19. nnaires en raison de leur enga civil servants on account of their political activities gement politique violerait la convention de breached international labour organisation ilo l organisation internationale du travail oit convention il s agissait en fait d un document destin aux agents du bvd binnenlandse veiligheidsdienst et d autres fonctionnaires appel s accomplir des mis sions pour lui it was in fact a document intended for bvd bin nenlandse veiligheidsdienst staff and other lofficials who carried out work for the bvd il d nonce les propos tenus lors de la conf rence de he complained of the remarks made by the minister of presse par le ministre de l int rieur et les hauts fonc the interior and the senior police jofficers accompany tionnaires de police qui l accompagnaient ing him at the press conference Tableau 4 Retours au contexte extrait 3 3 Analyse des r sultats L exploration du corpus Convention l aide de la topographie bi textuelle a permis de d couvrir les principales traductions de la forme p le fonctionnaires F 49 officers locale 10 officials f 154477 et servants f iocae 3 1 Un l ger cart entre la fr quence glo bale de cette forme p le et le cumul des fr quences locales de ces correspondances en anglais montre qu il existe au moins un context
20. onctionnaires a t traduite par civil service Cette qui valence rel ve de la notion d quivalence contextuelle Sur le plan s mantique il s agit d unit s traductionnelles singuli res qui n cessitent un traitement particulier Il appartient l expert humain de s appuyer sur les blocs align s pour examiner dans le d tail les parall les et les divergences entre ce type de s quences a loi cadre sur les fonctionnaires the civil service general principles act Conclusions Au terme de cette tude nous avons d fini une approche qui permet d acc der la description automatique de relations de correspondance entre des unit s polys miques qui poss dent plu sieurs traductions au sein du corpus bi textuel Privil giant le point de vue textom trique notre approche repose enti rement sur les ressources construites base de corpus Appuy e sur l utilisation de la repr sentation topographique de textes align s au niveau de la phrase cette approche offre l utilisateur de nouveaux moyens informatis s pour explorer la struc ture des quivalences qui se forment au niveau des mots et des syntagmes dans les textes ori ginaux et leurs traductions R f rences Heiden S 2002 Weblex Manuel Utilisateur Version 4 1 interm diaire UMR 8503 ENS Lettres et Sciences humaines http lexico ens Ish fr doc weblex pdf Isabelle P et Warwick Armstrong S 1993 Les corpus bilingues une nouvelle ressource pour
21. ons prend en compte l tat final d un ensemble de proc dures en cours de d veloppement qui devraient tre disponibles dans la prochaine version de Lexico3 3 2 1 Construction de la carte des sections Les fonctionnalit s d velopp es au sein du logiciel Lexico3 Lamalle ef al 2003 permettent l utilisateur de visualiser une carte des sections ex phrases ou paragraphes du corpus puis de constituer une s lection arbitraire de sections dont on tudiera ensuite le vocabulaire sp cifique L utilisateur dispose d un ensemble d outils permettant de choisir partir du dic tionnaire du garde mots de la liste des segments r p t s etc un type sur lequel portera son exploration Apr s avoir s lectionn le type il est possible de le faire glisser sur la carte glis ser d poser La ventilation du type tudi devient alors visible Les sections dans lesquelles il est pr sent sont colori es Ce processus peut tre r it r Pour illustrer notre propos nous consid rerons les phrases du corpus Convention qui contien nent la forme fonctionnaires F 49 et le sous ensemble de phrases quivalentes en anglais Sur la figure 2 l appariement des phrases du corpus est mat rialis par des carr s positionn s sur deux colonnes Les carr s sont li s et toute s lection dans un volet est automatiquement r percut e dans l autre La ventilation de la forme frangaise fonctionnaires est repr sent e par des carr s

Download Pdf Manuals

image

Related Search

Related Contents

Manual de instrucciones  Manhattan 393966 USB cable  presentation AVPU et grille IOP-Vers 31-01 - Le Quartier Bel  Philips LivingWhites Spiral energy saving bulb 872790092618700  UPS ステーションエクスプローラ  AlwaysUp Web Service User`s Manual  the Tripy II user`s Manual MAN0020_RevB (English  平成26電気工作物保安規定  Homesoft Manual  CHAPITRE 1 CONCEPTS GENERAUX  

Copyright © All rights reserved.
Failed to retrieve file