Home
Tutoriel n°3: - Lexicometrica
Contents
1. chaque volet 4 2 Mise au jour de la variation entre les 2 volets du corpus align Dans l exemple trait dans ce tutorial les volets fran ais sont issus par une d rivation de traduction du m me texte original Dans ce cas pr cis si on choisit 2 volets fran ais particuliers ces deux textes sont th oriquement proches mais diff rents les traductions n tant pas compl tement similaires 2 2 On peut donc vouloir essayer de mettre au jour les diff rences entre ces volets traduits du m me texte de d part Cette mise au jour de la variation est possible dans mkAlign une fois les textes align s le module de variation donne voir globalement les diff rences entre les 2 volets charg s Ce processus s appuie sur l impl mentation de la commande di ff dans la biblioth que Tk DiffText composite widget for colorized diffs guide de lecture param trage du calcul graphique des comptages ut d a de la variation sauvegarde HTML Figure 20 param trage du calcul de la variation Apr s avoir choisi le grain de la variation mot ligne caract re on lance la visualisation de la variation en activant le bouton idoine L Mas chere cantitayaht i a 1 Chers genpatriotat 1 Je ne pr sence dEFVANC VOUS aujourd hui En couce humilit face la chche qui nous acten m l 4e me tiens aujourd hui devant vous avec un sentiment d husilic devanc La t che qui mous an 1 J c muscie Lu pr sident Push das serylens zandu
2. lt tu gt lt t lt tuv xnl lang en gt lt seg gt I stand here today humbled by the task before us grateful for the trust you have bestowed mindful of the sacrifices borne by our ancestors lt sed gt lt tuy gt lt tuv xnl lang r gt lt seg Je me pr sente devant vous aujourd hui en toute humilit face la t che qui nous attend reconnaissant de la confiance que vous n avez accord e et conscient des sacrifices consentis par nos anc tres lt seg gt lt tuv gt lt t lt t lt tuv xnl lang en gt lt seg gt I thank President Bush for his service to our nation throughout this transition lt seg gt lt tuv gt lt tuv xnl lang fr gt as well as the generosity and cooperation he has shown lt seg gt Je remercie le pr sident Bush des services rendus notre nation ainsi que de la g n rosit et de la coop ration dont il a fait preuve durant toute la transition lt sed gt lt tuv gt Figure 5 Code source du fichier d alignement au format TMX 6 Explorations textom trigues avec Lexico3 et mkAlign 2 2 Etape n 2 G n ralisation de l alignement L op ration d crite dans l tape pr c dente a t r p t e sur les diff rents couples de textes disponibles Les fichiers TMX construits chaque tape ont ensuite t fusionn s pour fournir au final un fichier regroupant les diff rents volets align s l alignement construit ici est compo
3. FR 2 nation co freq 2 seuil 3 nation 3 4 1 envers 2 3 gt c nation 2 3 1 grandeur Le graphique des chemins de polycooccurrences permet aussi de r aliser des retours au contexte en s lectionnant des n uds forme Control Clic sur un n ud que l on peut ensuite projeter sur la carte des sections de l alignement ic ne carte des sections dans la partie haute de la zone d dition du graphe dans l onglet Cooc Cette projection permet de mettre au jour les sections contenant l ensemble des formes s lectionn es Option Global coch e ou celles contenant au moins l une des d entre elles On peut ainsi visualiser rapidement les sections contenant des chemins complets de polycooccurrences mKAlign Polycooccurrences v Dans l onglet Coocs s lectionner la forme p le volet source et volet cible Charger ventuellement une liste de forme exclure du calcul stop liste sur chacun des 2 volets Choisir une fr quence minimale et un seuil de probabilit pour les cooccurrents Appuyer sur l ic ne des cooccurrences Appuyer sur l ic ne des polycooccurrents Le graphe des polycooccurrents appara t dans la zone sup rieur de la zone d dition de l onglet Coocs Les chemins de cooccurrence seront accessibles dans le rapport si les r sultats produits y sont ajout s t Les chemins de polycooccurrence sont accessibles apr s sauvegarde des r sultats du calcul dans le rapport d exploration cf s
4. Figure 10 Accroissement de vocabulaire sur les 2 volets de l alignement Le Diagramme d accroissement du vocabulaire permet d observer l apparition de nouvelles formes au fur et mesure que l on avance dans le corpus Comme c est toujours le cas pour les corpus textuels la courbe conna t une croissance rapide au d but du corpus cette croissance ralentit mesure que l on avance dans le corpus On remarque par del cette caract ristique globale des zones d accroissement plus fort ainsi que des paliers durant lesquels l apport de nouvelles formes est plus faible Dans le cas de mkAlign on peut observer cette ventilation sur les 2 volets charg s mkAlign Accroissement du vocabulaire v Dans l onglet Graphe activez le bouton AC v Le diagramme appara t dans la zone d dition de l onglet Graphe 2 3 3 Les types complexes Les segments r p t s La fonctionnalit Segments r p t s permet d tablir la liste de toutes les s quences de formes r p t es pour les 2 volets align s sans changement diff rents endroits du corpus dont la fr quence totale d passe un seuil minimal F pr alablement fix par l utilisateur Les segments ainsi s lectionn s peuvent ensuite tre tri s selon diff rents crit res longueur fr quence etc Tutoriel n 3 Investiture Obama 9 Liste des segments Source p E fE et de la que nous sommes que nous avons ne peut pas que nous sommes que n
5. cren CONRSRTAIE par DO amc rr r Mis ramercis ls pr midane Ihish den terrices M tis ls reuer is ls pr eidante Tnieh pour l t earvicas qu il r Nation ingi pus d l g n r nit E ds l ran hie nobrs Nn ti n Mini que pur La g nm rasit Mecep racion done il a isit preuve durant trute la ar la COGp ERE Lo donc il a isit preuve toar au Long transition da catta Crasie ion DusranT UAcre AM TICO RS ont J sSERA S Ait ce S rim nt pr sidentiel lies mecs one dti pouki prononc e dans la saria EANGE de la prosp ric ec dans les eaux calses de zi l palin RPC EE E Tutoriel n 3 Investiture Obama 7 2 3 1 Le d pouillement en formes graphiques Comme pour toute exploration textom trique la premi re phase de l exploration textom trique est constitu e par la segmentation du corpus textuel en unit s qui serviront de base aux d comptes ult rieurs les occurrences en anglais tokens Dans le cas de mkAlign cette segmentation des 2 volets en unit s est r alis e au chargement des fichiers Le d pouillement des 2 volets en formes graphiques d limit es par les d limiteurs propos s par d faut conduit aux r sultats suivants visibles dans l onglet Rapport de mkAlign Fichier Trait fr0 tut Fichier Trait frl txt Encodage UTF S Encodage UTF S D limiteurs 1 77_ 1 85 D limiteurs 14 7s_ 85 Nombre des occurre
6. des sections etc au dessus de chaque liste Cooccurrences et polycooccurrences pour un type donn Un alignement induit un d coupage du corpus en sections les diff rentes cellules align es Pour une forme p le nous prendrons comme ci dessus l exemple de la forme nation il est possible de constituer la liste des formes qui trouvent d apr s un calcul statistique particulier un nombre lev d occurrence dans les m mes sections que la forme p le sur chacun des volets deeurons de envers chacue crandeur Figure 12 Les cooccurrents de nation Nous trouvons ici pour la forme p le sur le volet FR 1 demeurons de envers chaque grandeur et pour cette m me forme p le sur le volet FR 2 envers grandeur Un calcul hyperg om trique est utilis ici pour comparer le nombre des occurrences du candidat cooccurrent dans les sections ou est attest e la forme p le avec sa fr quence dans l ensemble du corpus 10 Explorations textom trigues avec Lexico3 et mkAlign Le retour aux contextes confirmera que ces formes entrent avec le p le choisi dans des associations r currentes Concordance de grandeur Concordance de grandeur l SECTION di SECTION d En r affirmant la grandeur de notre nation no lamant nouveau la grandeur de notre nation Ho oMpPrenons que cette grandeur nest jamais un du nous savons que la grandeur n est jamais un d retour a
7. contextes communs on calcule pour les p les A B les cooccurrents sp cifiques E et F e Les p les A B E ont pour cooccurrent sp cifique H e Les p les A B E H n ont pas de cooccurrent sp cifique et l exploration s interrompt pour ce chemin e Les p les A B F ont pour cooccurrents sp cifiques I etc e Durant l exploration diff rents filtrages conditionnent l puisement des explorations contextuelles et r duisent le bruit dans les r sultats pour privil gier l information la plus sp cifique seuils maximaux de fr quence et de sp cificit du cooccurrent Tutoriel n 3 Investiture Obama 11 Le calcul des cooccurrents tant termin l activation du module de polycooccurrence construit les chemins de polycooccurrence le graphique suivant construit par mkAlign synth tise l ensemble de ces chemins que nous ins rons plus bas 2 31 2 3 1 2 3 4 213 2 3 1 2 3 1 2 4 1 311 3141 3 4 1 2 3 Figure 14 Les polycooccurrents de la forme nation Dans ce graphique les formes en jaune sont pr sentes dans les 2 volets les formes en rouge sont pr sentes dans le volet source FR 1 et les formes en bleu sont pr sentes dans le volet cible FR 2 Polycooccurrents FR 1 nation co freq 2 seuil 3 nation 2 demeurons 21 3 1 Nous 21 3 1 gt 11 2 3 1 est nation 28 4 1 de 2 3 1 grandeur nation 28 14 1 de 3 1 1 envers nation 28 1 1 de 3 3 1 chaque Polycooccurrents
8. cunsdguence d la rapecit ag de l irreiponsibilit i Len Admicilaf Anei 4E perdu desk Sploie ont t dlisind d t nt tipe i nE E riris 1 Das BAINS ME E p riasn d s lite dik St ASE rUIE E d s enEr prit s ont AIt faillites Horre syst me de SANT ert ariei comeu nos coles B RE teop soavarnt l chec ec chag Frere systime de SANT est crop on reux nos decolez laissent trop de Jeunes au bord de is ren LE Ce sont l des indi us da ris qu FL pr tant au analyses da duruvbes at mit Sais ques E Voils les CREER de Le crise quu Dion paut exprimur an donies et itatiitiyuisi S Mois m jurtabl mais Cour mudi pro onla a it Lu parta da confianca qui siyir dans Cour L ik S a ne st moin uasucabilu maid Lol aussi grave C eit ls samidre dont H ous ayons parda soi 7 aajmara mai j veiit ais gis Les itis ghia miaa d ve rilara Bart r sls TIE fnt grarss 7 Auj urd nin je t w t dir que hga foxas cantrent n da miritablar difin lt fare Lif ne Seront pas faciles relever et cela nu pourra pos za faire rapidement Hais sachiez Ei LE POUEEONS paS les relever facilement ou rapidement Mais je vaun dire ceci M 1 Am riqui 15 Nous souses asramhl s en ce jour parce Que nous avons Choisi de faire triompher l espoir sur 3 En c jour BOUS FORRES FUNIS PACE QUE NOUS AVANT pr f r A espoir la crainte l union m ED Noui fozas raii an c Jour proclawur la fin des musquineries des auisses prcn
9. l ensemble du corpus constitu ic1 de 2 volets et donc de 2 cartes Chacun des carr s repr sente un l ment particulier du texte d coup en sections les sections correspondent ici aux sections de l alignement construit les cellules align es dans l diteur de l alignement Chacun des carr s de la s quence du haut repr sente une des sections du texte original volet source gauche et volet cible droite La forme nation a t projet e sur la carte des sections 14 Explorations textom trigues avec Lexico3 et mkAlign partir du dictionnaire source provoquant ainsi le marquage par une croix et le coloriage du contour des sections ou elle est attest e Le texte d une des sections s lectionn e par utilisateur est affich en bas de la figure Les occurrences de la forme s lectionn e y sont mises en vidence mkAlign Carte des sections v Dans l onglet Map Activez la construction de la carte v Projet une forme sur la carte partir du dictionnaire par exemple nation v Choisir ventuellement un regroupement par parties si une partition a t s lectionn e 4 M thodes textom triques Plusieurs m thodes statistiques permettent d clairer la structure d un corpus textuel partir de comparaisons r alis es entre les fragments du corpus La partition du corpus constitue une tape tr s importante dans l analyse comparative des textes dans la mesure o les oppositions qu
10. l Am rique a pers v r non seulement du fait des comp tences et de la perspicacit de ses dirigeants mais parce que nous le Peuple sommes demeur s loyaux envers les id aux de nos anc tres et envers les documents fondateurs de notre nation So it has been Il en a t ainsi So it must be with this generation of Americans Et il doit en tre ainsi pour cette g n ration d Am ricains That we are in the midst of crisis is now well understood Le fait que nous traversons une crise est d sormais bien compris Our nation is at war against a far reaching network of violence and hatred Notre pays est en guerre contre un r seau tentaculaire de violence et de haine Man nannnnanm t n hanlesr rammlemmerdl s nm amas ee an Maten nnnnmin ante mianstemnpanm a te aFfFfnibhlin nnnnianimn an Figure 4 Alignement au format TMX affichage dans le navigateur La seconde montre un extrait du code source de ce fichier au format TMX lt xml version 1 0 encoding UTF 8 2 gt lt tux version 1 4 gt lt header adminlang en creationdate 20090712T110800z creationtool mk liqn creationtoolversion 2 00 2 0b116 datatype xml o tumf unknom segtype block srclang en gt lt body gt lt t lt tuvy xnl lang en gt lt seg gt My fellow citizens lt seg lt tuv gt lt tuv xnl lang fr gt lt seg gt Mes chers concitoyens lt seg gt lt tuv gt
11. univ paris3 fr lexicometrica jadt jadt2002 PDF 2002 martinez zimina pdf V ronis Jean Alignement de corpus multilingues in Pierrel J M diteur Ing nierie des langues Informatique et syst mes d information chapitre 6 pages 151 172 Herm s Sciences 2000 http www up univ mrs fr veronis pdf 2000hermes6 pdaf Zimina Maria Approches quantitatives de l extraction de ressources traductionnelles partir de corpus parall les Pr sentation la soutenance de th se Universit de la Sorbonne nouvelle Paris 3 le 26 novembre 2004 http www cavi univ paris3 fr ilpga ED student stmz ED268 PagePersoMZ _ fichiers stmz page6 fichiers 26novembre MZ zip Zimina Maria L alignement textom trique des unit s lexicales correspondances multiples dans les corpus parall les Conf rence aux 7es Journ es internationales d Analyse statistique des Donn es Textuelles JADT 2004 Louvain la Neuve Belgique 2004 http www cavi univ paris3 fr lexicometrica jadt jadt2004 pdf JADT _118 pdf Zimina Maria Topographie bi textuelle et approches quantitatives de l extraction de ressources traductionnelles partir de corpus parall les in Actes des 7es Journ es scientifiques du R seau de chercheurs Lexicologie Terminologie Traduction Institut sup rieur de traducteurs et interpr tes ISTI Bruxelles 8 10 septembre 2005 http perso univ lyon2 fr thoiron JS 20LTT 202005 pdf Zimina pdf Zimina Maria Corpus mu
12. GENERAL Chargement Source et Cible Fichiers charg s les 2 volets ont t align s sur la base du segmenteur d alignement A o E I stand here today humbled by the task before us grateful for the trust you have bestowed mindful of humilit face la t che qui nous attend the sacrifices borne by our ancestors reconnaissant de la confiance que vous m avez accord e et conscient des sacrifices consentis par nos MODE ALIGNEMENT AUTO Alignement Source Cible Recherche de cognats S _ I thank President Bush for his service to our as well as the generosity and cooperation notre nation ainsi que de la g n rosit et de la MODE Import Export TMX he has shown throughout this transition coop ration dont il a fait preuve durant toute la eje Outils Alignement juluje Modes SPLIT MERGE The words have been spoken during rising tides of prosperity and the still waters of peace montante de la prosp rit et dans les eaux calmes de la paix ERRES EL nE Figure 2 Chargement des fichiers aligner Les 2 volets tant charg s on peut ensuite affiner l alignement en utilisant les outils 1doines pour scinder certaines sections ou en fusionner d autres imk lign 2 00 2 0b116 MODE GENERAL Chargement Source et Cible I stand here today humbled by the task before us Pr traitement grateful for the trust you have bestowed mindful of humilit face la
13. Tutoriel n 3 Exploration du corpus Traductions align es du discours d investiture de B Obama Corpus align s m thodes textom triques pour l alignement Obamal Sommaire OO CS a a 0 a 2 1 Le corpus Traductions align es du discours d investiture de B Obama Investiture OO E E E 2 2 Constuction d corps al dN detente eee eine es on 2 2 1 Etape n 1 alignement de 2 volets initiaux 3 2 2 Etape n 2 G n ralisation de l alignement 6 2 3 Etape n 3 Exploration textom trique de l alignement nnesseoonennssessssseeeessssssseeeeees 6 2 3 1 Le d pouillement en formes graphiques u 7 2 5 2 Edo tl bale des types SIMDI S esse tsar 8 PA EE LD CORDES ne en tee ae dde a a te to 8 J Pude ECS CD OO TE De a 12 SOS CDS a eo 12 LE OA CON OC E E E E E E E 12 3 1 2 L outil ventilation par sections d alignement 12 ALL onl eare d eO e E S 13 4 Methodes textom IQ sirosis en ea i eian Oar ANni eaaa 14 4 1 Analyse des SD CIEICILES dU COFDUS den cadenas sessions lies Eia 14 4 2 Mise au jour de la variation entre les 2 volets du corpus align onesssseeenssssssseeeeees 16 DOS E 17 2 Explorations textom trigues avec Lexico3 et mkAlign Objectifs Apprendre e Construire une ressource textom trique align e e Utiliser les outils textom triques de base sur un alignement de textes e Conduire
14. ans les g durig Ti ing tigas GT hir n ne n AARS LA mar e W EARTE h ndsne d s V diss d prosp rit prosperity and the ecill de la prosp cic ec dans les F MAIA 11 AAE arrive i De serment Lananitant en d auiEres Lemna Em mass ii Arrive de Lens AUETA Ai cilea dr l pris EE b mega calmi de j paix VALEES S pence ERUN calmes de La paly eaux calmes de la paix Figure 6 Alignement du corpus Obama Investiture Affichage dans un navigateur 2 3 Etape n 3 Exploration textom trique de l alignement mkAlign permet de mener des explorations textom triques sur des couples de textes align s Dans notre cas le fichier TMX tant compos de 5 volets 1l est n cessaire de s lectionner au pr alable 2 volets avec de d marrer cette exploration Dans les exemples qui suivent nous travaillerons avec les 2 volets FR I et FR 2 La figure qui suit montre l tat de l alignement de ces 2 volets Figure 7 Alignement Volets FR 1 et FR 2 LE abs tique 00 2 01 16 MODE GENERAL Mes chars cuneitoyars Cheyemuenl Source ul Cibe E RE Pr sence devant vous aujourd hui en toate imilit lace d la Lhele qui nuus attend d humilic devant la t hae quil mous abtend de cecveusissant de la confiance que vous m aya aceucd s rascnomissance pour la confiance que vous m avus SE C NMM LENE dif HaACTITICRE C ONmESN LE p r Hf ati fast d ar dlanE L ssprie ler Es rTiricst lanc
15. ar section d alignement Dans l onglet Dic et dans chaque onglet donnant voir des listes de formes S lectionner une ou plusieurs forme s Activez le bouton Ventilation la ventilation concernera l ensemble des formes s lectionn es dans le volet source et dans le volet cible 3 13 L outil carte des sections dhift clic sur carr affichage clic drait sur carr sp cificit s Control clic sur carr s lection Shift Control clic sur s lection d s lection source cible IO0G0o0 0G000 08G000 00000 G00640 IO00o0 00000 00000 00000 00000 IOCO00o 0000o8 00000 00000 00000 IOCO00 O00000 00000 00000 00000 IO0000 00000 amp G0000 00080 00000 Jpg ooon eee 0 2 E E EEE IO000o0 G0000 00000 00000 00000 IO000o0 00000 00000 00000 00000 IO0G00 00000 08G000 000 IO000o0 00000 00000 00000 0 sections s lectionn es KE Mm rs de la section Lffich e Je remercie le pr sident Eush des services rendus notre JTe remercie le pr sident Bush pour les services qu il a nation ainsi que de la g n rosit et de la coop ration dont rendus notre nation ainsi que pour la c n rosit et la il a fait preuve durant toute la transition coop ration dont il a fait preuve tout au long de cette transition Figure 17 Carte des sections projection de la forme nation sur le volet source L outil carte des sections permet une visualisation globale de la r partition des occurrences qui rel vent d un type donn dans
16. auvegarder un rapport dans le manuel d utilisation 12 Explorations textom trigues avec Lexico3 et mkAlign 3 Etude la distribution d un type 3 1 Les outils de base 3 11 L outil concordances L outil concordances permet de rassembler toutes les occurrences relatives un type donn en les munissant d un petit fragment de contexte En faisant varier la taille du contexte l ordre de pr sentation ici les contextes sont tri s en fonction de la forme qui suit le p le s lectionn A l aide de cet outil le chercheur peut op rer des rapprochements qu une lecture cursive du texte ne lui aurait sans doute pas permis de saisir La concordance est ici disponible pour chacun des volets du corpus align Concordance de nation 21 Concordance de nation SECTION 3 SECTION 3 ices rendus notre nation ainsi que de la g il a rendus notre nation ainsi que pour la SECTION 7 SECTION 11 fondateurs de notre nation Notre nation est en guerre contr SECTION 12 SECTION 12 t de pr parer notre nation une nouvelle donn es et pr parer la nation une nouvelle re SECTION 21 SECTION 21 demeurons une jeune nation mais comme il est Nous restons une nation jeune mais selon SECTION 24 SECTION 24 a grandeur de notre nation nous comprenons qu a grandeur de notre nation nous savons que la SECTION 35 SECTION 35 Nous demeurons une nation prosp re et puissan sommes toujours la nation la plus pr
17. ersion TMX de l alignement La figure suivante donne voir l interface de mkAlign permettant de construire un alignement Be OUPAUE EAST Chargement Source et Cible Editeur de l alignement l ali Editeur de l alignement aa wW 1 P du segmenteur 2 chargement du fichier source 3 Chargement du fichier cible MODE ALIGNEMENT AUTO Alignement Source Cible Recherche de cognats ES cible SCO JIE 2 Zone d dition du Zone ES dition du fichier source oUUIe ol E ol E sefa ERRA SEE ET nE Figure 1 Interface de l alignement avec mkAlign Pour cette tude nous avons choisi d aligner au niveau de la phrase mkAlign permet de s lectionner un caract re le segmenteur d alignement permettant de d couper les textes aligner pour ensuite charger les diff rentes sections r sultantes dans les zones d dition disponibles chaque page contient 5 zones d dition align es permettant de visualiser chaque couple de sections textuelles align es Notre objectif d alignement phrastique nous a conduit 1 http tal univ paris3 fr mkAlign http en wikipedia org wik1 Translation Memory _eXchange 2 4 Explorations textom triques avec Lexico3 et mkAlign pour amorcer grossi rement les choses charger les 2 volets initiaux en choisissant comme segmenteur d alignement le caract re retour la ligne 4mk lign 2 00 2 0b116 MODE
18. h pour Ja remercia Le pr sident Bush Je remercie le pr sident Bush T chark Eresidenr Dask for SEVRES fihia potit nnLi n LEA AELVICES pu dl vendus BOLLE GES M EVICER C sar l pour Eh HECYLS S CERAUS JA his secvice CO OUE CSC 10 4 mir 4 88 Vell as che generosite la coop racion donc il a fait ni Que de l generosile FPL de n lrs WALIN AIBALE ue par LA mal don ALHA ue pour LA nait ALAI Que pit outre 1A 1al g n rcairt et la coop cacion dont g n conic ec ja coop racion donc g n romir er la gpop rarcion and cocperation h Bas shown PEewre darant toute La il a sirt preuve COUR Mu long de il a sit preuve cout su long de fkgail a moncr es loro de toute EhE WgEOL ERLA Cramsiltion CESASLE LE CECE CESASIE IE cette Passer ion de pouvoirs jperre p riode de transition ASC ANESATSETE AmM TiERENS GNE DFE Tissr m risRins nE Quaranes quAatrs LE ICRLES RE Fostpofoir Jericans kate mom Cunrante quatre Am ricains ne CI d ecrammis ait CE BECENT avant moi prc serment pour Le wintenant Er r Le marmant Raken Eh PITALGTELEA GAER f d i pr t actetaL pr sidentiel pr sidence pr sidence l The ortda Eve ben Spuken Les pots One t agauveni Less paroles ne Le pronomoess E r Ils l ont fairt alors que genilait bes mets ont T pronseac s lacs 7 la houle de la pessp ric sus Les Me bas es roglLantes de DESSS ELRE ER alora que neua vVivions d
19. herche html Etape n 2 calcul des cooccurrents de la forme p le gt recherche des mots sp cifiques dans les sections contenant la forme p le ce calcul est fait dans les sections source contenant la forme nation et en parall le dans les cellules associ es du volet cible Zone miroir RES E EE ni Figure 18 Calcul des cooccurrents d une forme par la carte des sections Le r sultat est constitu par deux listes donnant voir d une part les mots sp cifiques de la forme p le pour le volet source et les mots sp cifiques dans les sections associ es du volet cible Specificites du vocabulaire sur les sections SOURCE contenant le motif lt nation gt AiSpecificites du vocabulaire sur les sections CIBLE associees aux sections SOURCE Nombre d occurrences du texte global 2726 Nombre d occurrences du texte global 29656 Nombre d occurrences dans la partie visee 284 Nombre d occurrences dans la partie visee 297 Seuil 5 Seuil 5 Specificites positives en haut de liste negatives en bas Specificites positives en haut de liste negatives en bas Le fichier construit EXPORT TXT resultspecif source 12474 16002 txt Le fichier construit EXPORT TXT resultspecif cible 1247416003 txt Forme Ind Specif Fq Totale Forme Ind Specif Fq Totale nation 11 93 1r nation 6 3 11 de 4 1 147 envers 4 0 3 envers 4 0 3 grandeur 3 0 2 chaque 3 0 5 la 2 9 81 demeurons 3 0 2 de Let 133 grande
20. http tal univ paris3 fr mkAlign corpus obama tmx v5 PDF libe pdi Volet FR 4 traduction fournie sur le site de RFI Cette page n est plus accessible ce jour On peut acc der une version de cette page sauvegard e pour cette tude cette adresse http tal univ paris3 fr mkAlign corpus obama tmx v5 PDF RET pdf 2 Construction du corpus align Les contenus textuels des diff rentes pages web contenant le discours ou sa traduction ont t sauvegard s dans 5 fichiers diff rents au format texte brut en txt volet EN fr 0 txt volet FR 1 fr 1 txt volet FR 2 fr 2 txt volet FR 3 fr 3 txt volet FR 4 Les volets EN et FR I ont servi d amorce pour construire l alignement global Ces deux volets tant align s on a ensuite align FR 1 avec FR 2 FR 2 avec FR 3 et enfin FR 3 avec FR 4 Tutoriel n 3 Investiture Obama 3 Cet alignement a t construit avec mkAlign qui fournit des outils d aide l alignement dans un diteur 2 volets 1l permet aussi de sauvegarder l alignement dans un format normalis le format TMX permettant de stocker pour une ressource textuelle donn e diff rents volets associ s comme ses diff rentes traductions par exemple 2 1 Etape n 1 alignement de 2 volets initiaux e Enentr e en txt fr 0 txt les 2 volets initiaux e En sortie en mkAlign txt fr 0 mkAlign txt obama alignement en fr1 tmx les 2 fichiers sauvegard s l issue de l alignement et la v
21. il sera possible de mettre en vidence entre les parties soumises comparaison d pendent troitement du choix de la partition initiale 4 1 Analyse des sp cificit s du corpus L analyse des sp cificit s permet de porter un diagnostic exprim en probabilit sur l effectif de chacune des cases d un tableau lexical on se reportera au Tutorial n 1 pour des informations compl mentaires sur la m thode des sp cificit s Exemple n 1 Calcul des cooccurrents d une forme partir de la carte des sections de l alignement La carte des sections construit par d finition un d coupage du corpus en sections correspondant l tat de l alignement Une forme p le tant choisi sur le volet source ou le volet cible la projection de la forme sur la carte des sections donne voir la localisation de la forme dans la carte des sections Nous reprenons ci dessous l exemple de la forme nation et la projection construite dans la figure pr c dente A partir de cette carte il est possible de constituer la liste des formes et des segments r p t s qui trouvent d apr s un calcul statistique particulier un nombre lev d occurrence dans les m mes sections que la forme p le les cooccurrents de cette forme L analyse des sp cificit s repose sur l utilisation du mod le hyperg om trique pour l analyse des tableaux de nombres deux dimensions Pour plus de d tails sur le mod le des sp cificit s et
22. ltilingues exploration textom trique dans l espace intertextuel in Ballard M Pineira Tresmontant C d Les corpus en linguistique et en traductologie p 107 121 Artois Presses Universit 2007
23. m siss ds 1a EQ En ca jour buus games Vems priocl an r la Lin dus do Lier essquinas t dei fmija perse FL Haira ditiiran E un J bm SELON Mais c Al ste dit dant Lee h viturses AL te Esap de d PL Wais r it ne une maEt n J un 2818 Falon Lar paralar d s N riturss l tsp ce maria d Li 23 Ii emt tamps de r niiirmer noera c nncir de choisir ce guil y a de mieux dans notre hist ii Le mome est venu de inire preuve nouveau de c nacic de choisir ce qu il y a de mieux di 23 la promessa divine QUE nous SOMMES TOUS pauk QUE nous sommes tous Libres er que nous m rir 23 La promesse divine salon Laguelle nous soumes tous gaux nous sommes tous libres et nous M E En cau irmat lu grandeis de molce nalii eus Coprs anoed CITE Lette grandeur nest jamsis Ed En proclami TETIN la grandeur de nolre hatiin mois daroia que La Trairi nuit Jamair 25 TA faut l m riter 25 Elle Ait f m rit 28 Horre prajerrnire n a jamais repos sar dasr raronarrit mu mur l acceptation de moindres kim 2 Au cours de mnor ra voyage Nour m avans jamais nhoisi de racroureis mi Fahareu RE pr sent im 27 La vois que nous avons esprunc e n a Jamais c goar les eraintiis pour ceux qai pr trer 37 Ce chemin n caic pas fnit pour les sur POUE CEAN qui pr f rent les loisirs au travaii ES Elle est pluki pour crus qui prennent des sisques i agirik qui ER LUE dus chorai 3 Au contraire ce Fonk cauz qui prennen sques Geux qui passent l acti
24. msin d rrnidns HU Hot Bienne E n C TUIiC E ns EOnE ME Maine M RITE Que la remain d mmi r l w it er 239 Hocre capacit deucure intacte Th 35 Hos capacit s demeurent intactes lt on a D Maisie tap HS am ma A protbger dus ivt s ts troita os de repousser des dicisi JD Le tempa o pous tions passifs o nous prot gima nos inc rta dtrigaks at o mous Eemstt ii L pastis d awjourd bui mous devens mous relevar sucouss La poussitce de nos sandales ar iu gt Jl partir d aujourd hui mous devani nous relever Gwd sucouer vL CORBGnCeE rofeder l An in effet DATROUE i M ur regardant il Y A dhi Evarail f ir a2 ih fft i que nue ragardi ne M LE darane NAME Att l r la tich 3 iim de nocre conomie ekige des actions audacieuses t rapides 43 L vac de motre conomie n cessice des mesures Walaciruses t Fapides NE mous agir cs nous FL ari TI dus apluis asais pOur poiar urai avoue LL Loavdar i dd ue nous allons Lus prenite pas seulemur VUE CEE de BUFU EEDA mudroits maia puur porer 1 E Nour Constuire des rotas et dus ponta at dustallucens des c suaux dlectsiques l dus li 45 ttes allons construire lus routes Les ponts et Les liens num riques dont noce Nectour marc G Hte FRS La i n n LL jutta plaz E h uE noue f rviront d t w ru ill r d La E 44 Hess allons ramdrs ls c ience l plats qui iui r ri t et noie M rvir d s merveilles d Li gt Hous e
25. nces Honbre des occurrences i Nombre des formes z Honbre des formes Fr quence maximale Fr quence maximale Hombre des hapax z Hombre des hapax Figure 8 Param tres lexicom triques des deux volets align s Cette segmentation conduit la g n ration des 2 dictionnaires de formes chacun tant associ un des volets du corpus align Dictiormaire des formes Source K pH E FA Dictiormaire des formes Cible K pH E FE Figure 9 Les dictionnaires de formes issus de l alignement Diff rents outils textom triques que l on d crira plus loin permettent d appr cier la fr quence la r partition la spatialisation des occurrences relevant de chacun des types constitu s cette tape Les r sultats fournis par ces outils ne sont pas ind pendants des types d unit s constitu s mais les m mes outils s appliquent tous les types constitu s de la sorte Dans la figure pr c dente certains de ces outils sont visibles dans la partie sup rieure sous la forme d ic ne Apr s avoir s lectionn des items dans la liste on active l op ration vis e pour ces items 8 Explorations textom trigues avec Lexico3 et mkAlign 2 3 2 Etude globale des types simples Courbe d accroissement du vocabulaire Fichier graph graph 1247391211 jpg 1045 535 4 625 8 Nombre de formes 419 2 209 6 0 0 295 590 585 1150 1475 1770 2065 2360 2655 20 Nombre d occurrences Csourceirouge cibleiwert
26. on ceux qui 2p Pour noue al d la r th re MU C est pour Aene Q AILE NE SAR FES l s LR bine q ile Pors datant Bir tre t Erau r 1 P r ne al ant pind dans der stalisrs eA mis re 7 C l niE L Ehs st lt ont n hir La I RE p ur n ue M ILE ht Eraraill dir dans der candie ten difficiles b fe f nt An E ll e l Pour nous ils se SoM Dattus ec sont conb s sur divers champs de baraille Concord ex jl C esc pour nous qu ils ont combattu ec qu ils sont EDITS Concord ec Ceccyskburg en Normand 32 Encore et ancora Ci hommasi t Cus Itamari out Luce fe ont secrifidi oc ont travaill amp JE D inuosbrsblus foid cai Hommes et Gus Imari out Lutte fait dei sacrifices ut ciavaill ju 1 Ile savaient mi l iu riens EAIN pli E granda que La bomus d lurt aubiEi nes individusell rl F1 Ile voyaient l Am rique Semma plii a l f nn ds MER asHiFi ne individuellt allant Cte mir catta Eraj stnit que noue COMELMEENE augure hi 14 C est Ca voyages m AA sieur dl ar 3E Hous deBEUEONS UNE HaTion prespia er puissante WE Fe SE jE Nous sommes RASE la nation la plus rire da plus SEE de la Terre 36 Nod ceavaillouri n int pas soins preduct ts qua Lorsque Gibt Crise Commins JE Mes Coavrailleurcs ou suuk pus acini productifs qa arane Eu c is 7 HS SATVaRUE ns F 2 J Mes fprita n ont par seins invraneits I WR Bienne E ESPMLCSR D RON pa BOIRE TD SENAIT E d il ms 1 Ebient la r
27. osp re 1 SECTION 61 SECTION 61 et qu une nation ne peut pas prosp r Une nation ne peut pas prosp r SECTION 69 SECTION 81 st l amie de chaque nation et de chaque homme Nous sommes une nation de chr tiens et de SECTION 81 SECTION 96 Nous sommes une nation de chr tiens de mu e am ricain dont la nation d pend SECTION 103 SECTION 103 vers nous m mes la nation et le monde m mes envers notre nation et envers le monde SECTION 112 SECTION 113 ue le p re de notre nation ordonna que les par e le P re de notre nation a demand que ces m Figure 15 Concordance de la forme nation sur les 2 volets du corpus mKAlign Concordances v Dans l onglet Concordances v Entrer une forme dans la zone de saisie ex nation v Choisir ventuellement un regroupement par parties si une partition a t s lectionn e 3 1 2 L outil ventilation par sections dalignement Cet outil permet de juger de la r partition des occurrences relevant d un m me type dans les diff rentes sections de l alignement Tutoriel n 3 Investiture Obama 13 Ventilation des formes s lectionn es Fichier graph graph 1247395753 jpg DUT AORC anaana NaN QHINIINNITINUN m Nombre de formes Fq absolues x Sections source nation cible nation Figure 16 Ventilation de la forme nation sur les 2 volets de l alignement Mk lign Ventilation p
28. ous avons parce que nous pour nous qu ils ont et que nous de ceux qui sont pas moins C est pour nous de notre nation C est pour nous qu ils il ya ne sont pas moins ne sont pas moins nous qu ils ont ne sont pas parce que nous o la r ponse sont pas moins et que la nous ne pouvons de notre conomie C est pour nous qu ils ont qui nous ont une nouvelle re et que nous sommes pour nous qu ils tout ce que ne sont pas d une nouvelle re chaque fois que la les gardiens de qui nous ont face la des hommes et des femmes de notre libert les gardiens de la r ponse sera chaque fois nous sommes tous chaque fois que la r ponse 5 5 4 3 3 3 3 3 3 3 2 2 2 ra 2 2 2 2 2 2 2 2 2 N OF FO PQ F9 F9 F9 C0 C0 C0 Co Co Co C0 C0 C0 C0 C0 IW la prosp rit et de notre libert A mkAlign Segments r p t s Dans l onglet Param s lectionner un seuil de fr quence minimal pour les segments Dans l onglet Segments activez le calcul Les segments apparaissent dans la zone d dition de l onglet Segments sous la forme de 2 listes Ils peuvent tre tri s selon diff rents crit res longueur fr quence ordre lexicographique en cliquant sur le bandeau situ au dessus de la colonne correspondante Chaque s lection simple ou multiple r alis e dans la fen tre des segments peut ensuite tre analys e comme un tout l aide des diff rents outils disponibles concordance histogramme carte
29. s nbre nakion windi que de lu g n rosit 7 Ju conarcis le preiidunt Puik pour Lai services qu nes se danba notre npatl n ainai qu Four Jar ant s uistrs n ent diorm ir ait c rarna ne pr ridantisL jusra nes quatres Anir rain ne are sci prit ne Peur l pr ridinss G Can BEE nE t Bannent pr m meds dis L narda s nEnnes de Li Prop rit at Jah lat miri u Eure paralar ant ES premant es parime des ragi d prarjp rit at l t is nous ViNiens i Hais il eme arriv que ce serment Bit dt prononcd alors que le TEEPE CA T CESDEUR ET que i Cependant an d EUCEES GERPE CE SEILENE n t pr c alors que las nuages s amoncelaient et i En CHi SoumuntE l L leurique pursdv r Don seulumunt du fair des conp t anus at de la par Dans ced momenta li l Aswcique a poursuivi fon chemin Pas suulumunt an raisus de La comp ts 7 Il o dc Cent ainil qua cela use paiid 3 ie ai Aie an FA ainei peia c tts g n ration d Am ricains y HE gart za mia Asie LE passat avec c tts g dn rati n d im riciine 1 Le iait que ROUE CEAVErSONS MEE crise EEE d sormais bien Coprs ous savons BA TYE EMENT tort bien que ETS SOMBRE En Crise L Notte pay it r Herra contra it L a cantaculaire du violence ak de haire Hatcs mation s TE an giarre onure ui paie r sout de vislence ut d Haine 12 Notte conoaeie use ariyan alisiblies cons quence Ja l cupidit t de Ll Eiscrespensabililt t Notes dcuntaein it ort emme alimiblis
30. s pour chaque section d alignement de 5 volets le volet anglais et ses 4 traductions CLA T U DE PARIS 3 Sorbonne nouvelle mk lign Alignement au format THX Le discours d investiture de Barak Obama le 20 janvier 2009 Washington Ssurce HEW YORE TIMES Trad Whute House MONDE LIRERATIONIAFP RET i ay elION citizenti Nez chero COoRCATOVENS i fereza CONpacricces enera COMPARE ITS it et Litres Aadjour Gui devant d Suis 164 cdEvanE vous ble m Pr sence devant vois 1 eland Rere L IGAF kimblai Dy 1 VOIR Aves uh SPAL iment G himi lits aujourd hai ampli d un aent imant sujourd hu en toute humilit Je suis l devant vous humble che cask before um grarc ful davant la c che qui poum mrterd d hiumilic face A la c cks qui ace ia t che gui nous attend ace auy tche qui nois for the trust you have de ceconntissmancte pour la mous attend CECONNSISSSNC pPrurC ri onnaitsnmnEe de La G nlimn e die AaElendent CSN ARE de VOLE beSCouEd sindful sf the penfianre QUE VOUS m aver la Contianre QUE VOUS Havez aus m as Act d a t C nsoisnt x s nfinan E MEEANELT Mu SacriEl es boshe Gy out MECIE Gasdant L ESDARIR es ESammiqnes Et CoR Tita des des FACTI CES CONSENTLE PSE BOB BST ifices de Doe SNIC CT E AS EEE AAC SonMESLIS HAT a DasTi lions Cned paf i ARC TEES Je remercie l presidene Bush des Me s mrcie le pr sident Bus
31. ses applications l tude des corpus textuels on consultera Lafon 1984 ou Lebart et Salem 19941 Nous utilisons ici un simple calcul hyperg om trique pour comparer le nombre des occurrences du candidat cooccurrent dans les sections ou est attest e la forme p le avec sa fr quence dans l ensemble du corpus Tutoriel n 3 Investiture Obama 15 Shift clic sur carr affichage clic droit sur carr sp cificit s Control clic sur carr s lection Shift Control clic sur s lection d s lection source cible 6 IO0RoO0 0WO000 0N000 00000 NG008G0 IO0000 00000 00000 00000 0 IO0000 0000 amp 00000 00000 00000 IO0000 00000 00000 00000 AAA IOD0000 00000 G0000 000 amp 0 00000 IO0000 00000 00 vi o O00 O00000 0 O0000 WO000 00000 00000 00000 IO0000 00000 00000 00000 0 O0W0O0 00000 0 amp 000 000 IO0000 00000 00000 00000 0 Etape n 1 projection de la forme p le sur la carte Visualisation des Sections projection de la forme nation sur le volet source y Source Cible gt F3 z Mr C Control clic sur marqueur de page s lection 5 sections Shift control clic sur marqueur de page s lection 5 sections l ligne A k orations Mem EE D ee o Type de S lection miroir Ib l b C1 m z o CI sections s lectionn es ME Mm ro de la section Affich e O Mm ro de la section Affich e EA Nombre de sections s lectionn es nE aE z Export Rec
32. t che qui nous attend the sacrifices borne by our ancestors reconnaissant de la confiance que vous m avez accord e E E et conscient des sacrifices consentis par nos MODE ALIGNEMENT AUTO Alignement Source Cible Recherche de cognats 9 E d Am ricains ont d sormais fait ce wi u 1 tiel Modes SPLIT MERGE le mode SPLI T per met de scinder une cellule le mode MERGE permet de fusionner 2 cellules Recherche Source Cible L_ The words have been spoken during rising tides of el n prosperity and the still waters of peace montante de la prosp rit et dans les eaux calmes de 2 la paix Bal R RES ES EE kE Figure 3 Les outils de l alignement Tutoriel n 3 Investiture Obama Au final on dispose dans l diteur de l alignement d un corpus align avec lequel on peut mener des explorations textom triques cf infra On peut aussi sauvegarder chacun des volets ainsi remodel s dans 2 fichiers ou exporter les 2 volets dans un fichier au format TMX ce type de fichier permettant de stocker de mani re s quentielle les diff rentes sections align es La premi re figure qui suit montre l tat de l alignement export au format TMX tel qu il est affich dans un navigateur avec une feuille de styles fournie CLA T U DE PARIS 3 Sorbonne nouvelle mkAlign Export Alignement au format TMX My fellow citizens Mes chers concitoyens I stand here
33. today humbled by the task before us grateful for the trust you have bestowed mindful of the sacrifices borne by our ancestors Je me pr sente devant vous aujourd hui en toute humilit face la t che qui nous attend reconnaissant de la confiance que vous m avez accord e et conscient des sacrifices consentis par nos anc tres I thank President Bush for his service to our nation as well as the generosity and cooperation he has shown throughout this transition Je remercie le pr sident Bush des services rendus notre nation ainsi que de la g n rosit et de la coop ration dont il a fait preuve durant toute la transition Forty four Americans have now taken the presidential oath Quarante quatre Am ricains ont d sormais fait ce serment pr sidentiel The words have been spoken during rising tides of prosperity and the still waters of peace Ces mots ont t souvent prononc s dans la mar e montante de la prosp rit et dans les eaux calmes de la paix Yet every so often the oath is taken amidst gathering clouds and raging storms Mais il est arriv que ce serment ait t prononc alors que le temps tait orageux et que la temp te faisait rage At these moments America has carried on not simply because of the skill or vision of those in high office but because We the People have remained faithful to the ideals of our forebears and true to our founding documents En ces moments l
34. u contexte via une concordance sur les 2 volets Figure 13 Retours aux contextes mKAlign Cooccurrences Dans l onglet Coocs s lectionner la forme p le volet source et volet cible v Charger ventuellement une liste de forme exclure du calcul stop liste sur chacun des 2 volets v Choisir une fr quence minimale et un seuil de probabilit pour les cooccurrents v Appuyer sur l ic ne des cooccurrences S On verra infra qu il est possible de d terminer cette liste de cooccurrents en utilisant dans mkAlign une autre m thode bas e sur la repr sentation graphique de l alignement A partir de la liste de cooccurrents on peut ensuite activer le calcul des polycooccurrents Ce calcul reprend la d marche mise en uvre dans le travail de William Martinez 2002 2003 2006 e Une cooccurrence d signe l apparition de deux mots en m me temps et dans le m me contexte Le module de cooccurrences mis en uvre prend appui sur l alignement en cours les contextes dans lesquels on examine la co pr sence sont donc ceux qui co ncident aux diff rentes cellules dans l diteur d alignement ou aux sections dans la carte des sections e Le terme poly cooccurrence d signe les attractions lexicales au del de la cooccurrence binaire Le module de poly cooccurrences int gr reprend l algorithme d crit dans Martinez 2006 e On calcule pour le p le A les cooccurrents sp cifiques B C et D e Dans leurs
35. une exploration textom trique sur un corpus align 1 Le corpus Traductions align es du discours d investiture de B Obama Investiture Obama Le corpus Investiture Obama est constitu de 5 volets le discours original en anglais prononc par B Obama le 20 janvier 2009 Washington et 4 traductions en fran ais de ce discours Ces diff rents volets ont t r cup r s sur diff rents site web Volet EN le discours en anglais disponible sur le site du New York Times Cette page n est plus accessible ce jour On peut acc der une version de cette page sauvegard e pour cette tude cette adresse http tal univ paris3 fr mkAlign corpus obama tmx v5 PDF nyt pdi Volet FR 1 traduction en fran ais fournie par les services de la Maison Blanche On peut acc der une version de cette page sauvegard e pour cette tude cette adresse http tal univ paris3 fr mKkAlign corpus obama tmx vS5 PDF traduction maison blanche pdf Volet FR 2 traduction fournie sur le site du Monde Cette page n est plus accessible ce jour On peut acc der une version de cette page sauvegard e pour cette tude cette adresse http tal univ paris3 fr mkAlign corpus obama tmx v5 PDF LeMonde pdi Volet FR 3 traduction fournie sur le site de Lib ration via l AFP Cette page n est plus accessible ce jour On peut acc der une version de cette page sauvegard e pour cette tude cette adresse
36. ur 3 0 Z preuve 2 3 4 En 2 2 4 re 2 3 4 ses 2 2 4 sachez 2 3 4 il 22 9 Zel 60 notre 2 1 43 sommes 2 1 17 ainsi 2 1 5 fortement 2 0 L sonnes 2 0 11 Pas 2 0 l donne 2 0 L chr tiens 2 0 L part 2 0 I aspirent 2 0 L membres 2 0 1 Ecritures 2 0 l prosp res 2 0 1 neige 2 0 l reconnaissance 2 0 I proclamant 2 0 l critures 2 0 I m mes 2 0 1 favorise 2 0 1 puissante 2 0 L affaiblie 2 0 I pairs 2 0 l loyaux 2 0 1l musulmans 2 0 l remercie 2 0 1l favorise 2 0 1 pers v r 2 0 1 nantis 2 0 l population 2 0 A affaiblie 2 0 1l assumer 2 0 1l remercie 2 0 l femme 2 0 1l vision 2 0 1l transition 2 0 1l collective 2 0 L incapacit 2 0 l restons 2 0 I rendus 2 0 1l transition 2 0 l cupidit 2 0 L moments 2 0 L pr sident 2 0 l g n rosit 2 0 l prosp re 2 0 l rapacit 2 0 l pr parer 2 0 l incapacit 2 0 L comp tences 2 0 1l rendus 2 0 l documents 2 0 1 toujours 2 0 L Peuple 2 0 l ath es 2 0 l E Figure 19 Liste des cooccurrents de la forme p le et liste des mots sp cifiques de la zone miroir Nous retrouvons normalement ici les r sultats d j vus plus haut Le corpus tant align la forme en t te de liste est sans surprise la forme nation les deux traductions convergent sur cette forme localis e dans les m mes sections dans les 2 volets par contre les divergences 16 Explorations textom trigues avec Lexico3 et mkAlign entre les traductions se traduisent par des comportements lexicaux sp cifiques propres
37. ur ce module le texte source gauche est consid r comme le texte de r f rence partir duquel on mesure les diff rences La coloration permet de mettre au jour Les l ments supprim s dans le texte source zones rouges dans le volet gauche Les l ments ajout s dans le texte cible zones vertes dans le volet droite Les l ments modifi s dans les 2 volets zones bleues dans les 2 volets Les l ments inchang s d un volet l autre restant non color s dans la seconde comparaison la seule ligne inchang e dans la partie visible l cran est cercl e de rouge Ce r sultat est exportable au format HTML on trouve en ligne plusieurs illustrations de ces exports e Deux traductions du discours d investiture de B Obama o export comparaison http tal univ paris3 fr mkAlign mkalign variation variation obama export html o graphique de comptage de la variation http tal univ paris3 fr mkAlign mkalign variation graph variation obama pg e Deux discours de S gol ne Royal campagne 2007 o export comparaison apr s alignement automatique http tal univ paris3 fr mkAlign mkalign variation variation royal export html e Deux discours de Nicolas Sarkozy conf rence de presse 2008 o export comparaison apr s alignement automatique http tal univ paris3 fr mkAlign mkalign variation variation sarko export html On peut aussi calculer des indicateurs de la variation fond commun mots ajo
38. ut s supprim s modifi s le graphique produit donne voir pour chaque section d alignement un d compte des variations sur chaque section On trouvera en ligne supra des exemples de telles sorties Bibliographie 18 Explorations textom trigues avec Lexico3 et mkAlign Fleury Serge Zimina Maria Exploring Translation Corpora with mkAlign in Translation Journal Volume 11 n 1 January 2007 http accurapid com journal 39mk htm Fleury Serge Zimina Maria Utilisations de mkAlign pour la traduction philologique PDF in Actes JADT 2008 Journ es Internationales d Analyse Statistiques des Donn es Textuelles Lyon 2008 http www cavi univ paris3 fr lexicometrica jadt jadt2008 pdf fleury zimina pdf http tal univ paris3 fr mkAlign Slides 20 20JADT2008 http tal univ paris3 fr mkAlign Demo_ mkAlign 20 20JADT2008 Leblanc Jean Marc Martinez William L analyse contrastive des r seaux de cooccurrence Le monde dans les discours des pr sidents de la Cinqui me R publique in Actes JADT 2006 Journ es Internationales d Analyse Statistiques des Donn es Textuelles Besan on 2006 http www cavi univ paris3 fr lexicometrica jadt jadt2006 PDF II 054 pdf Martinez William Zimina Maria Utilisation de la m thode des cooccurrences pour l alignement des mots de textes bilingues in Actes JADT 2002 Journ es Internationales d Analyse Statistiques des Donn es Textuelles St Malo 2002 http www cavi
39. xploicerons le solil le venc ec les sols pour alimenter nos voicures ec nire marche 47 all allons enploicer L nergie du soleil du vent er du sol pour dnire marcher nos voitures Eu nvus toanslesm enens nes coles vous eoll ges en nos taniversilb s de sgen r ponde dun 45 Bu nous milonus beanslonm r ous d vl s l mi Universit s peur Evce le hauteur des enigence Tour col mous pouvons le faira 45 Tour cola mous poeuvens le faire TuE els M ur le farene SO ME tait cela mous Allene ls faira Haincenanc il y a ceux qui Feeccentc en quescion L cendus de nos ambitcions Qui estiment El Eh bien d aucuns Vont EERGCCre en cause l ampleur de nos ambitions vont D TIERSr Que NITTI Fl rlld El J M LA Hhhh HHH A Pi de TE m in de db d b ne de o de ne ie ai D f ke Figure 21 Mise au jour de la variation comparaison au niveau du mot 7 Compare deux fichiers et affiche les diff rences cf http fr wikipedia org wiki Diff http search cpan org mjcarman Tk DiffText 0 17 lib Tk DiffText pm Tutoriel n 3 Investiture Obama 17 eai p sia e ei iara F le Le PAIE el ipren Eenes Liebe Segmont oREeSNER Yarnton ESMRONRAME LENDANE PSN LERRRRTE 45 43 cela mous pourvus Le fairs SO FE LR MOUE jet PRE 7 m ET nane il y ul remectent en question L cendue de nos GSbICiQnr qui estimant Figure 22 Mise au jour de la variation comparaison au niveau des lignes Po
Download Pdf Manuals
Related Search
Related Contents
manual for fwd testing in the long Hitachi CU-HD1000 Camera Lens User Manual Guía del usuario User's Guide Series 3.3 取扱説明書 - Panasonic Accessibility@Mason - Assistive Technology Initiative REFUEL Sensore IR da soffitto con copertura a 360° mod. GONG MANUALE Copyright © All rights reserved.
Failed to retrieve file