Home

n°1 printemps 1979

image

Contents

1. lement un dictionnaire noyau de l ancien Espagnol qui servira de base pour une lemmatisation automatique des textes tudi s ult rieurement Lexicologie du vieux russe Dans le cadre d une tude du vocabulaire politique et social partir des sources narratives Monsieur J P Arrignon a proc d l enregistrement sur l ordinateur du Sermon d Hilarion et s attache plus parti culi rement montrer la filiation de l id ologie politique entre les textes byzantins d Eus be de C sar e Discours en l honneur du 20e anniversaire du r gne de l Empereur Constantin et de Photius Introduction l Epanagog ainsi qu l tude des co occurrences LE Sources narratives et lexicologie m di vale Dans le cadre d une tude lexico logique du vocabulaire politique et social des biographies royales et princi res d Eginhard Rigord Madame Elisabeth Carpentier ma tre de Conf rence d Histoire m di vale l Universit de Poitiers a proc d l enregistrement de la Vie de Louis VI le Gros de Suger et de la Vie de Robert le Pieux d Helgaud de Fleury A partir des concordances et index tablis automatiquement elle a pu faire une analyse de fr quences s mantiques men e dans le cadre d un s mi naire de 3e Cycle Par ailleurs suivant les m mes m thodes elle a entrepris l tude de la chronique locale de Pierre de Maillezais D autres entreprises ont vu le jour dans ce centre mais elles rel vent de l poqu
2. NECESSARYE FOODE AS THE STOMAKE CALLETH FOR HYT MIGHT SONE HAPPE THAT FAYLYNGE THE BELYE FOR LAKE THE GUTTES AND INTESTINES COMPRESSED AND SHUT BY DRYNESSE ALLE THE OTHER MEMBRES SHOLLD NEDES PERYSHE TOGEDYR xxx BEST 4 POLITICORUM QUOD INGENUITAS EST VIRTUS ET DIUITIE ANTIQUE NOBELESSE I VERTU AND AUNCIENNE RICHESSE HIT SEMETHE THAT CONUENIENTLY SYCHE FERME NESSE OF GROUND AS MAY BE BEST FOUND IN THYS WORLD OUGHTE TO BE APPROVE VN TO THE LORDES AND NOBYLLE MEN AND SOO THEY TO BE SYGNIFYED AND VNDER STONDED BY THAT S00 HYT YS COMENLY SEYD THE BEST WOLLE SAUF HYT SELF On remarquera que les concordances sont ici donn es d une ponctuation forte l autre Les sorties de concordances co tant cependant cher il est possible de moduler la taille des concordances par exemple cinq mots avant le mot vedette et cinq mots apr s C est videmment ce dictionnaire de concordances qui est pour l historien le meilleur outil d exploitation s mantique d un texte En conclusion je signalerai qu ALINE est un package par cons quent une fois connue la proc dure d appel de la bande sur laquelle est catalogu ALINE une fois enregistr le texte sur lequel l utilisateur compte travailler il suffit d introduire en machine outre les cartes JOB usuelles quelques cartes commandes Nous esp rons que d ici trois mois ALINE sera accessible librement tous les utilisateurs qui le d sireraient Un manuel d utilisation sera ensuite
3. fonction de la longueur du texte Mais il est possible d obtenir une fr quence relative corrig e en fonction du statut du mot Dans l exemple donn le statut de tous les mots tant identique la fr quence relative et la fr quence corrig e sont bien s r semblables cependant il peut tre int ressant de distinguer entre les mots grammaticaux et les autres la fr quence des premiers tant si importante qu elle peut introduire des distorsions dans les indices distorsions qui peuvent avoir une signification plus stylistique que s mantique de m me chez certains auteurs le recours des citations latines est si important qu il peut tre utile de recalculer un indice de fr quence corrig qui ne tienne pas compte des mots latins mais concerne uniquement les mots fran ais ou le cas ch ant anglais Troisi me sortie la localisation des formes s lectionn es Effectivement en fonction du statut attribu aux mots il est possible par exemple de laisser de c t les r f rences des mots grammaticaux peu utiles l historien et qui tant donn les fr quences lev es de ce type de mot reviennnent cher Dans le cas pr sent tous les mots ayant le m me statut ils sont tous s lectionn s Exemple amp TEXTF ACTIVE POLICY OF A PRINCE LOCALISATION DES FORMES SELECTIONNEES FR RE RE SERRE SR RENE NE S E LE RL ERL SSS AaB 024 087 024 117 ABHOMINARLE 7 034 15 7 ABIDE 916 35 018 157 030 30 ASI DYNG 7 026 0
4. le vocabulaire conceptuel le codifier pour qu analystes et utilisateurs puissent les uns choisir les autres trouver ais ment les mots clefs qui d crivant au mieux le document permettront d y recourir bon escient le r duire pour des raisons videntes de rigueur scientifique ce qui se con oit bien s nonce clairement un trop grand affinement dans l analyse a souvent pour cons quence des inexactitudes pour ne pas dire des erreurs et de co t de traitement Il faut donc tablir des dictionnaires ou mieux des th saurus labor s en fonction du fonds exploiter Ces instruments de travail seront pour l analyste le plus s r des guides Insistons sur le r le qui doit tre bien d fini de cet analyste il a pour mission de donner d autres travailleurs scientifiques les l ments de leur recherche personnelle C est lui d extraire des documents signal s ces l ments de les expliciter de les trier de les organiser Il ne convient donc pas qu il reste passif devant un texte dans l espoir que le traitement automatique de la source consid r e full text tablissement de concordances vari es r soudra tous les probl mes La masse souvent crasante de la documentation exploiter les difficult s de son interpr tation ne peuvent tre ainsi domin es rappelons aussi que dans la quasi totalit des cas et il ne s agit pas que des sources m di vales la notion qui sera qualifi e par un des
5. liaison en v ritable revue largement ouverte aux probl mes et aux m thodes concernant l emploi de l informatique en histoire 8 Informatica e diritto c o Dr Costantino Ciampi Istituto per la Documentazione Giuridica del C N R Via Panciatichi 56 16 50127 FIRENZE Italia La revue accepte toute contribution du type Informatique et Traitement des textes 9 Informatie Nederlandse Lexicologie c o Dr F licien de Tollenaere Beatrixlaan 7 WARMOND Pays Bas 10 Informatique et Sciences Humaines c o M Philippe Cibois CNRS LISH 54 boulevard Raspail 75270 PARIS Cedex 06 L 14 11 Journal of the Association for Computational Linguistics c o Dr Donald E Walker SRI International MENLO PARK Ca 94025 U S A M me si cette revue a un caract re plus th orique que par exemple Compute and the Humanities elle n exclut pas la publication d articles concernant de applications pratiques dans le domaine de l emploi des ordinateurs pour le traitement des textes partir de cette ann e le Journal va abandonner l ancien syst me tr s malcommode de publication sur microfiche pour se transformer en revue normale sur papier 12 Meroitic Newsletter c o M le Professeur Jean Leclant 77 rue Georges Lardennois 75019 PARIS Ce bulletin contient parfois des articles concernant l emploi des ordinateurs pour les tudes d pigraphie m ro tique Gratuit 13 Newsletter of the ALLC Software Speci
6. lui interdit d introduire un pr codage par exemple en pla ant le signe devant les noms propres et en d clarant comme lettre ce qui fera sortir les noms propres en bloc en queue de dictionnaire Il y a enfin du moins le pensons nous conomie dans l exploitation Voici titre d exemple une table des co ts de l exploitation du programme aux mois de d cembre 1978 et janvier 1979 sur quatre textes de tailles diff rentes Les co ts sont exprim s en francs CIRCE si l on peut dire puisque tout d pend bien s r des tarifs pratiqu s par chaque centre de calcul Ce tableau donne cependant une id e un peu trompeuse dans la mesure o la phase la plus co teuse n est pas l exploitation mais la perforation les tarifs pratiqu s dans notre quipe permettent de faire perforer et corriger 1 500 cartes par un vacataire pour une somme de 1 000 F Mais le chercheur individuel d pourvu de cr dits peut perforer lui m me comme je l ai indiqu tout l heure c est d ailleurs ce qu a fait Madame Mireux pour le texte de Guibert de Nogent c est ce que j ai fait moi m me pour le Governance of England de Sir John Fortescue De plus m me si le vacataire a v rifi son travail une seconde v rification s impose l E R A 713 ce travail est accompli par Madame Millet i L 6 B Quelles sont les possibilit s offertes par ALINE Prenons l exemple le plus simple c est dire celui d un texte sans pr codage Voici tou
7. pr par et il sera normalement disponible la fin de l ann e J Ph Genet Notes 1 Voir Association for Literary and Linguistic Computing Bulletin I 1 et III 2 2 Voir P BRATLEY S LUSIGNAN et F OUELETTE JEUDEMO A Text Handling System dans J L MITCHELL Computers in the Humanities Edinburgh 1974 p 234 249 3 O R SMITH GENDEX GENeral DEXer of Words with Context A Concordance Generator Computer Studies III 1970 2 p 50 53 4 R L VENEZKY N RELLES L PRICE LEXICO a system for Lexicographic Pro cessing Computer and Humanities 11 3 Mai Juin 1977 p 127 137 5 Les travaux du L A S L A sont pr sent s dans la Revue de l Organisation Internationale pour l Etude des Langues Anciennes par Ordinateur pour ceux du CETEDOC on trouvera une bibliographie dans Computers and Medieval Data Processing VIII 2 Oct 1978 p 38 58 Lee 6 Une excellente d monstration des possibilit s de ces programmes est fournie dans Tracts de Mai 1968 Mesures de vocabulaire et de contenu Paris 1975 7 Un algorithme d tude s mantique dont la programmation tait initialement pr vue a du tre provisoirement laiss de c t cf J Ph GENET Ordinateur Lexique Contexte dans L FOSSIER A VAUCHEZ et C VIOLANTE Informatique et Histoire M di vale Rome 1977 p 297 317 8 Texte en cours d dition par Madame Marie Danielle MIREUX 9 ed M BATESON George Ashby s Poems Early English Te
8. texte sont d sormais utilisables par les philologues pour une op ration de routine la communication de Mme Gilbert a t extr mement convaincante ce propos En revanche la formalisation des crit res implicites que le philologue utilise pour organiser les lieux variants pour choisir entre variantes significatives et non significatives etc ne semble pas encore suffisamment m re voir communi cations de MM Duplacy et Heinemann et le colloque n a pas apport de r ponse ce sujet Fifth International Symposium on Computers in Literary and Linguistic Research Ce Colloque parrain par l ALLC Association for Literary and Linguistic Computing s est d roul l Universit de Aston in Birmingham du 3 au 7 avril 1978 il s agissait de la cinqui me rencontre biennale de ce type tenue en Angleterre la premi re avait t organis e Cambridge en 1970 Les participants ont assist quatorze sessions comprennant chacune trois quatre communications nous indiquons ici les titres de ces sessions The Variety of Work I The Variety of Work II Input Output Textual Criticism Authorship Attribution Software I Linguistic Ambiguity Software II Information Science Literary Statistics Lexicography Styliste Analysis Structures New Departures Les Proceedings comprenant un choix des communications les plus significatives vont para tre avant l t 1979 les personnes int re
9. 0 av du Recteur Pineau 86022 POITIERS CEDEX T l 49 46 26 54 et 46 27 80 o Le centre dispose d un mat riel de moyenne puissance l ordinateur IRIS 45 l unit centrale 256 K Octets 3 unit s disque 50 millions d octets unit 2 unit s bandes magn tiques 9 pistes 1600 BPI 2 imprimantes 900 lignes mn 600 1 mn l lecteur de cartes 600 cartes mn 2 perforatrices et l v rificatrice dont 9 sont la disposition des utilisateurs o Les tarifs appliqu s par le centre diff rent selon que les utilisateurs sont universitaires ou non Pour les universitaires Co t d une heure calcul 150 00 F Co t d une carte lue s 0 0030 F Co t d une ligne imprim e 0 0030 F Chargement d une unit bande ou disque 10 00 F Traitements effectu s pour des chercheurs ext rieurs Les programmes ne peuvent actuellement pas tre implant s ailleurs qu Poitiers et le centre de calcul n accepte pas de faire des traitements sur mesure Les chercheurs ext rieurs qui d sireraient tablir des index et des concordances peuvent prendre contact soit avec M C SIREDEY Ing nieur au C I C U P 49 46 27 80 soit avec M R PELLEN U E R des Lettres et des Langues 49 46 25 75 poste 33 ou au C I C U P Pour chaque traitement une tude pr alable avec le chercheur essaie de d gager les meilleures options de PECI en fonction des recherches envisag es Quand le projet est d fini le C I C U P tablit un devis et ouvre
10. 77 ARDUTE 7 925 03 7 ABQVE ZOST ERZ ASYDY fO17 277 ACCEPTABLE 034 177 ACCFPTYNG 014 217 ACCONPL ICE 7 021 147 7 La localisation des formes dans la mesure o elle donne la r f rence de toutes les formes dans le texte est d j utile en soi l historien Mais elle est surtout la base du processus qui permet de proc der la lemmatisation donc de passer des formes au mot cette lemmatisation peut se faire par regroupement par diff renciation ou par hyph nation Dans le cas d ALINE elle est semi automatique c est dire qu il faut r introduire des cartes indiquant au programme que pour trois formes identiques contenues dans un texte donn la premi re et la h 0 troisi me sont des r alisations d un verbe la seconde est celle d un substantif par exemple je porte la porte je porte La reconnaissance n est donc pas ici automatique une des raisons en est que les membres de notre quipe travaillent sur des textes en plusieurs langues et que toute reconnaissance automatique passant par l introduction en m moire de tests fond s sur les processus grammaticau propres chaque langue l alourdissement du programme aurait t consid rable 12 Le dernier produit fourni par ALINE est le dictionnaire de concordances voici un extrait de celui tir de la premi re version du sermon parlementaire de John Russel 13 Exemple 5 BELYE SLOWTHFULLE PARTE OF THE BODYE AND DENYE THE PROUYSYON OF SYCHE
11. NP ISSN 0223 3843 ALES 04 aA mn LE MEDIEVISTE ET L ORDINATEUR N 1 PRINTEMPS 1979 D epr s BR Pa Fr PLCE Pg EDITORIAL En mai 1975 le colloque franco italien r uni Rome pour discuter des pro bl mes pos s par l utilisation de l informatique en histoire m di vale concluait ses d bats en affirmant que le manque d information et de coordination tait l origine d une mauvaise ou insuffisante utilisation de l ordinateur pour l ex ploitation des sources du Moyen Age On d cida de proc der une enqu te inter nationale destin e rep rer les exploitations existantes diffuser leurs r sul tats les mettre en relations quand leurs objectifs taient voisins Cette enqu te s amorce lentement Mais de toutes fa ons il ne peut tre question de la poursuivre d une fa on satisfaisante si le m me travail n est d abord men sur le plan national D s 1976 un Comit form de quelques utilisateurs de la machine 1 a donc lanc un questionnaire distribu tous les m di vistes universitaires ou chercheurs aux conservateurs des d p ts d archives galement aux historiens du droit dont l objet a t de recenser non seulement les traitements en cours mais aussi les projets voire les simples vell it s d exploitation en effet pour les auteurs du questionnaire il ne s agissait pas et il ne s agit toujours pas d tre et de mettre autrui au courant de ce qui a march mais galement de s
12. URRIER DES LECTEURS Cette rubrique ne peut videmment tre aliment e d s le premier num ro les r flexions d un utilisateur chevronn en tiendront lieu UN ASPECT PARTICULIER DE L INFORMATIQUE EN SCIENCES HUMAINES LA DOCUMENTATION HISTORIQUE Les services rendus aux historiens par l informatique sont aussi divers que riches de possibilit s actuelles et futures L un d entre eux m rite peut tre d tre signal d s ce premier Courrier car s il r pond des ambitions modestes il a l incontestable avantage d une simplicit d acc s qui le met la port e de bon nombre de chercheurs isol s ou d quipes aux moyens limit s il s agit de la constitution et de la gestion automatis es de fichiers documentaires Ces fichiers destin s fournir aux chercheurs les mat riaux indispensables la synth se qu ils projettent sont le fruit de l analyse patiente et aussi exhaustive que possible d un ensemble de sources imprim es ou manuscrites auxquelles peut s adjoindre ventuellement 1a bibliographie relative la masse documentaire exploit e Le traitement soit des noms de personnes et de lieux soit des donn es th matiques pose certes quelques probl mes m thodologiques sp cifi ques mais comparables ceux que ma trise actuellement fort bien la science documentaire classique dont les solutions pourront tre facilement adapt es La seule exigence nouvelle est li e la n cessit de r duire et de codifier
13. alist Group c o Dr P J Wolfangel Institut f r Deutsche Sprache Abt LDV SuC Postfach 5409 6800 MANNHEIM Allemagne F d rale 14 Programmation et Sciences Humaines PSH c o M Michael Hainsworth CNRS LISH 54 boulevard Raspail 75270 PARIS cedex 06 Le titre de cette revue veut souligner par rapport par exemple Informatique et Sciences Humaines un int r t plus pragmatique pour les probl mes li s l utilisation concr te des ordinateurs dans les Sciences de l Homme 15 Revue du LASLA c o Monsieur le Professeur Louis Delatte L A S L A 110 boulevard de la S veni re 4000 LIEGE Belgique Revue dit e par L A S L A Organisation Internationale pour l tude des lan anciennes par ordinateur 16 Sprache und Datenverarbeitun c o Professor Winfried Lenders Institut f r Kommunikationsforschung und Phom tik Universit t Bonn Adenauerallee 98a BONN Allemagne F d rale Voir note propos de Informatica e diritto 17 T A Informations c o M Andr Deweze St Vincent de Mercuze 38660 LE TOUVET Revue internationale du traitement automatique du language bulletin semestri de l A T A L A Association pour le traitement automatique du language 18 Travaux de Lexicometrie et de Lexicologie Politique c o Mme Gabrielle Drigeard Lexicologie et textes politiques E N S de Saint Cloud 2 avenue du Palais 92211 SAINT CLOUD Bulletin de l U R L Lexicologie et textes politique
14. ances permettant l tude du formulaire du vocabulaire et dans certains cas la reconstitution d ins criptions m triques lacunaires Ce travail a t largement utilis pour l ta blissement des notices publi es dans les fascicules I 3 et II du Corpus des Inscriptions M di vales Sont actuellement en cours de traitement les inscrip tions en prose des VIIlIe XIIIe si cles autres que les pitaphes En outre un fichier des sources litt raires pigraphiques vient d tre mis en chantier partir des textes recens s dans l index pigraphique de la Patrologie latine Etude de la langue espagnole m di vale R alis par Monsieur Ren Pellen ma tre assistant l Universit de Poitiers l enregistrement du po me espagnol du Cid a permis gr ce aux sorties d index et de concordances et l exploitation des _ fichiers cr s par PECI gr ce de nombreux programmes compl mentaires d tu dier plusieurs aspects de la langue du document Une analyse graph mique et morphologique est en pr paration en vue de le dater 1a date estim e est irre cevable et de le localiser l origine castillane est contestable Dans la perspective beaucoup plus large d tablir une banque de donn es de l Espagnol m di val le rassemblement et la confrontation des vocabulaires de trois textes du XIIIe si cle El Poema de mio Cid Los Milagros de nuestra Senora de Berceo la General Estoria permettront d tablir une partie manuel
15. ar le bordereau utilis ne correspond pas aux normes du bordereau de perforation traditionnel et ne peut donc tre remis une perforeuse professionnelle Pour pr ciser l importance de la quantit des donn es on peut dire qu en moyenne chaque document est repr sent par une quarantaine de cartes perfor es une quinzaine de cartes pour les actes les plus courts 70 80 pour les plus longs Qualifi e support primaire de transcription G P Zarri p 402 la carte perfor e est l anc tre des moyens de saisie puisqu elle existait avant l ordinateur Loin de lui conf rer des lettres de noblesse cette long vit lui a attir depuis longtemps d j de s v res critiques qui l ont conduite un d clin bien amorc que d aucuns disent in luctable En d pit des inconv nients qu elle pr sente quelques avantages et des plus d cisifs sont mettre son actif et justifient pour nous son emploi contre vents de la mode et mar es de nouveaux mat riels Les inconv nients Consid rons directement le r sultat de la perforation car c est l le moindre d faut Ce r sultat c est du poids et de l encombrement les cartes sont lourdes les bo tes remplies de ces cartes sont volumineuses ce double handicap rend leur transport difficile et on reux Un inconv nient technique qui peut para tre d risoire mais dont seuls ceux qui ont pass des heures devant une perforatrice mesureront toute l importa
16. bligeait en effet concevoir un outil nouveau Les circonstances dans lesquelles nous avons d r aliser le programme en outre nous ont dict plus pr cis ment nos objectifs le manque de moyens financiers nous a impos la recherche syst matique de l conomie de fonctionnement la certitude de ne pouvoir disposer moyen terme des services r guliers d un informaticien nous a pouss rechercher la plus grande simplicit possible dans le maniement du programme ALINE est donc un programme qui a opt pour une lemmatisation semi automatique qui est peu sophistiqu et ne fournit que les produits de base absolument n cessaires l historien 7 c est avant tout un g n rateur de dictionnaires de r f renciations et de concordances Peu diversifi dans ses produits ALINE est donc d abord un programme conomiqui En premier lieu il est conomique par le support choisi la carte perfor e des perforatrices sont disponibles dans beaucoup de centres de recherche et la perforation peut tre effectu e soit par le chercheur soit par une personne connaissant simplement les rudiments de la dactylographie Il y a aussi conomie dans la pr paration du texte le programme ne suppose aucun pr codage puisqu il reconna t le mot la seule pr sence d un blanc avant et apr s une s quence de caract res Au reste dans la mesure o l utilisateur d finit lui m me les signes alphab tiques et les s parateurs qu il retient rien ne
17. cripteur pr cis doit tre d gag e du contexte celui ci devant s entendre parfois de l ensemble du document 1 Il va de soi que au stade de l exploitation des documents ainsi fournis au chercheur celui ci peut avoir le plus grand int r t enregistrer totalement puis traiter par telle ou telle de ces m thodes dont la mise disposition du public est de plus en plus r pandue les textes diplomatiques doctrinaux narratifs dont le choix lui aura t rendu possible par le labeur de ceux qui ont tri et en quelque sorte catalogu la masse initiale Ce travail pr liminaire toute synth se valable l historien en sait l importance aussi bien qu il en ressent le c t ingrat les moyens informatiques actuels permettent de l effectuer dans des conditions de s ret et d exhaustivit in galables par les m thodes classiques Josette Metman ee ne mem en Qu GO nn GS OU QE eee aae asan CONS aeae anea ns QU D ANS RES CNE NS Que D A QU CU A GS Se an a ao GS n AS en a ae 1 Le seigneur de avait promis de donner sa fille lorsqu elle se maria deux descripteurs contrat de mariage et en fonction de l ensemble du texte d troit coutumier conventions sp ciales soit dot soit avancement d hoirie
18. e ne portera ses fruits que si un premier bulletin de liaison a d j circul et provoqu des r actions Sans qu elles n aient rien de d finitif nous avons retenu pour ce journal les rubriques suivantes un article de fond concernant un type d exploitation donn comportant la description d taill e d un projet s y rattachant et la liste d autres projets analogues une note technique description d un mat riel etc un compte rendu d une visite effectu e un centre de calcul en Sciences Humaines un calendrier des rencontres concernant l informatique et les Sciences Humaines ventuellement assorti de notes bibliographiques enfin un courrier des lecteurs o nous accueillerons aussi bien les r flexions sur les articles parus ou les suggestions sur la composition du bulletin son rythme de parution que les demandes d information sur les programmes existants et surtout utilisables par d autres Nous le souhaitons abondant et vari car ce sont les changes de vue et les dialogues que nous aurons su tablir entre nos lecteurs qui seront pour le journal le gage de r ussite le plus concluant Caroline Bourlet Lucie Fossier Jean Philippe Gen t Christiane Klapisch Jacques Lefort Josette Metman Gian Piero Zarr UN TYPE D EXPLOITATION LE TRAITEMENT DE TEXTE Le traitement de texte c est de ce mot que l on d signe l ensemble des op rations que l ordinateur fait subir aux textes enregistr s en m mo
19. e moderne ou contemporaine Lexicologie de la prose russe au XVIIIe si cle tude de la po sie russe contemporaine du roman anglais moderne II ASPECTS TECHNIQUES Les programmes PECI permettent d diter divers index et des concordances par tielles ou compl tes avec des contextes plus ou moins larges partir de tex tes dont toutes les formes et occurrences sont r pertori es Ils ditent galement des bordereaux de lemmatisation pour pr parer la pro c dure automatique de lemmatisation cf infra Le chercheur lemmatise manuel lement chaque nouvelle forme et la d crit Les programmes PECI sont con us comme une suite de modules ind pendants et s articulent en blocs 1 2 ou 4 programmes chaque bloc sauf le premier constitue une option un m me programme peut comporter en outre plusieurs options Les programmes LEMAN ou de LEMmatisation et ANalyse sont un prolongement de PECI partir d un enregistrement des bordereaux de lemmatisation ils ditent actuellement le Dictionnaire lemmatis des formes et des r f rences d un texte Ils ditent ventuellement le manuscrit de ce Dictionnaire pour publication en format 21 x 29 5 Les programmes sont en cours de normalisation pour que les formats standards soient les m mes que ceux de PECI Le Centre de Calcul Les traitements informatiques sont effectu s au C I C U P service commun de l Universit implant dans les locaux universitaires 4
20. e renseigner sur ce qui a tourn court sur les raisons de l chec ou du renoncement ventuellement sur les moyens d y rem dier Un dixi me environ des destinataires a fourni une r ponse au questionnaire C est peu mais suffisant pour cr er entre les 25 membres de ce premier noyau un r seau d informations qui peut tre les aidera mieux orienter leur effort et qui sait persuader avec plus d assurance les r ticents lorsqu il leur semblera 1 Les signataires de cet ditorial sous l gide de l Institut de Recherche et d Histoire des Textes 2 Pour recevoir gratuitement ce bulletin ou le faire parvenir d autres pour tout apport ou demande de renseignement s adresser Section Informatique ERA 713 Institut de Recherche et d Histoire des Textes Universit de Paris I Centre National de la Recherche Scientifique 40 avenue d Iena 17 Rue de la Sorbonne 75116 PARIS 75005 PARIS Pour les destinataires C N R S Pour les universitaires b 9 que l utilisation de l informatique peut porter ses fruits L effort pour par venir cr er ce r seau est men dans trois directions se rendre sur place pour voir ce qui existe et quels sont les moyens informatiques dont disposent les auteurs de projets organiser des rencontres entre ces derniers enfin diffuser p riodiquement un bulletin de liaison La premi re t che a d j t amorc e mais il nous semble que la seconde l organisation de la rencontr
21. elques remarques que je me propose de pr senter ici n ont pas l ambition de constituer l tude approfondie d un moyen de saisir les donn es en Sciences humaines sur ce point il convient de se reporter l article de M Gian Piero ZARRI intitul Quelques aspects techniques de l exploitation informatique des documents textuels saisie des donn es et probl mes de sortie 1 qui fournit une tude comparative des diff rents mat riels existant sur le march ou du moins sur le march tel qu il se pr sentait en 1975 car ce march remarquait l auteur est en tat d bullition perp tuel Ce t moignage est uniquement fond sur une certaine pratique acquise au sein du Centre d Histoire Juridique qui utilise la carte perfor e l exclusion de tout autre moyen il ne peut donc tre le fruit de comparaisons Domin e par la contrainte sp cifique aux Sciences humaines la grande quantit de donn es la saisie telle que nous l effectuons saisie des donn es et leur correction avant l entr e en machine pr sente deux traits originaux qui m ritent d tre soulign s la saisie est faite partir d un bordereau qui est utilis une double fin le bordereau vierge sert de grille l analyse juridique d une d cision judiciaire arr t du Parlement de Paris au XIVe si cle le bordereau rempli sert la perforation des cartes Ces deux tapes sont effectu es par la m me personne en l occurrence l analyste c
22. ganis e hors programme sur la pr paration d index pour les grands corpus textuels n a eu qu un succ s mitig Nous soulignerons enfin un dernier aspect int ressant de ce Congr s la quantit et la qualit inhabituelle des communications ayant comme objet la traduction automatique voir les expos s de Mmes Hauenschild et Kulagina de MM Boitet Isabelle Thouin etc Ce probl me est en train de conna tre un regain d int r t au niveau international sous l effet de plusieurs facteurs succ s commercial du syst me am ricain SYSTRAN ou sur une plan plus politique lancement par la Communaut Europ enne du projet EUROTRA et venir Ecole Pluridisciplinaire de l Institut de Recherche d Informatique et d Automatique I R I A sur Informatique et Histoire Maison des Sciences de l Homme Paris deuxi me quinzaine d octobre 1979 Pour informations crire M Gian Piero Zarri CNRS LISH 54 boulevard Raspail 75270 PARIS Cedex 06 G P Zarri eai ce propos gt gt Seriez vous interess par une rencontre informelle d historiens m di vistes qui pourrait tre Pour les utilisateurs une confrontation de vues Pour les non initi s une information sur les applications en cours Cette r union pourrait tre r alis e selon le point de vue adopt soit dans le cadre du L I S H Marseille soit l occasion du stage pluridisciplinaire de l I R I A Cf plus haut key CO
23. gomery Operating Systems Inc 21031 Ventura Bvld WOODLAND HILLS Ca 93164 U S A Le SIGLASH est le Special Interest Group for Language Analysis and Studies in the Humanities de 1 ACM Association for Computing Machinery 3 ARITHMOI c o Professor Richard E Whitaker Central College PELLA Iowa 50219 U S A Lanc par le Prof Whitaker comme quivalent pour les tudes bibliques de Calculi ou de CAMDAP voir plus bas il semble avoir cess de para tre ces derniers temps Gratuit 4 Bulletin of the ALLC c o Mrs Susan M Hockey Oxford University Computing Laboratory 19 Banbury Road OXFORD England Revue dit e par l ALLC Association for Literary and Linguistic Computing 5 CALCULI c o Professor Stephen V F Waite Kiewit Computation Center Dartmouth College HANOVER New Hampshire 03755 U S A Bulletin d information d di principalement aux applications des ordinateurs dans les tudes classiques Gratuit 6 Computers and the Humanities c o Professor Joseph Raben Queens college of the City University of New York FLUSHING New York 11367 U S A Il s agit de la revue la plus connue et peut tre la plus prestigieuse dans le domaine Informatique et Science de l Homme 7 Historical Methods c o Professor Reginald Baker University of Pittsburgh Faculty of Arts and Sciences Department of History PITTSBURGH P a 15260 U S A Ce bulletin s est transform de simple bulletin de
24. ire pour les pr senter l utilisateur sous une forme diff rente de celle qu ils rev taient l entr e est bien de tous les types d exploitation appliqu s aux Sciences Humaines celui qui conna t le plus de vogue On ne compte plus les index et les concordances produits dans les officines informatiques du monde entier et consi d r s tort ou raison comme les moyens indispensables de connaissance d un auteur ou d une oeuvre Ce succ s est videmment d en premier lieu ce que l enregistrement de masses consid rables de donn es justifie l utilisation de l ordinateur mais surtout ce que le travail accompli par la machine en ce cas satisfait pleinement l utilisateur parce qu il a ses limites tel le texte a t livr par l homme l automate tel il lui sera restitu avec seulement une modification de forme qui en facilitera l tude la machine reviennent manipulations m caniques rep rages innombrables comptages fastidieux l homme d ductions subtiles et constructions intelligentes Mais il est bien vident que le traitement de texte s av re surtout indispen sable pour qui a m tier d tudier la litt rature Qu en est il pour l historien dont les soucis grammaticaux ou stylistiques sont tout de m me assez limit s surtout dans la pratique des sources documentaires et pour lequel la grande affaire sera toujours de saisir le contenu s mantique d un document contenu qui il faut bien le dire ne trans
25. it la r f rence reproduit le plus souvent celle de la publication Mais l essentiel est que pour l utilisateur elle permette de situer le mieux possible un mot ou une phrase qui lui seront fournis au sortir de la machine isol s de l ensemble du texte dont ils manent si par exemple l utilisateur est historien toujours d sireux de situer son information dans le temps et l espace et s il a affaire un corpus reconstitu de textes diss min s il peut pr f rer voir figurer dans sa r f rence une indication m me approximative de date et de lieu plut t qu une simple cote de conservation encore que cette derni re lui soit galement indispensable Les autres indications entr es en m moire en m me temps que le texte 1 et qui constituent ce que l on appelle le pr codage sont uniquement fonction des produits de sortie que l utilisateur souhaite obtenir par exemple des codes pr c dant des noms propres permettent l dition de ces derniers l exclusion des autres mots et par cons quent la constitution imm diate d index de noms de lieu ou de personne Les codes peuvent galement servir rep rer une phrase un membre de phrase une partie du discours citation formule etc sur lesquels l historien souhaite porter particuli rement son attention et dont il pr f re disposer sans que l ensemble du texte vienne encombrer son champ de vision Codage ou pr codage ne sont pas les seuls moyens utilis s pour limite
26. les formes flexionnelles sous un m me lemme peut tre en partie automatis e si l on pourvoit l ordinateur d une grammaire l aide de laquelle il puisse d cliner et conjuguer ou bien plus simplement d un dictionnaire lui fournissant pour un lemme toutes les flexions qui s y rattachent Mais il faut aussi procurer la machine une autre liste celle des homographes dont on r glera le sort manuellement moins que l on utilise des programmes tr s sophistiqu s permettant la machine d tablir elle m me des discriminations entre homographes Pour le m di viste enfin qui se trouvera toujours confront des textes o abondent les diversit s orthographiques il sera bon de disposer d une liste de regroupement des formes vari es sous une forme normalis e cette liste pourra au choix tre distincte ou non de la liste de lemmatisation Les r sultats Munie de ces instruments de recherche la machine s efforcera de fournir les r sultats voulus et qui bien entendu varient selon les besoins Les produits primaires ceux qui en tout tat de cause seront les premiers tre produits par la machine sont l index et la concordance l index donne la liste alphab tique des formes regroup es ou non sous un lemme selon ce que l on aura demand chacune d entre elles tant munie d une r f rence La concordance donnera chacune de ces formes dans le contexte choisi nombre d fini de mots groupe de mots compris entre deux signe
27. licy of a Prince ed M BATESON E E T S Extra Ser 76 1879 9 E DUDLEY The Tree of Commonwealth ed D M BRODIE Cambridge 1948 10 An Mum and the Sothsegger ed M DAY et R STEELE Orig Series 199 1936 11 J FORTESCUE diverses petites oeuvres en anglais ed PLUMMER et ed CLERMONT En pr paration 12 Th ELYOT The Boke Named the Governour ed H S C CROFT Londres 1883 13 J YONGE The Governaunce of Princes ed R STEELE Extra Ser 74 Londres 1898 14 An Version anglaise du Secreta Secretorum de University College MS 85 ed MANZALAOUI E E T S 15 An The Libelle of Englyshe Polycye ed G WARNER Oxford 1926 b Texte fran ais r alisations supervis es par Madame Claude GAUVARD 16 J GERSON Discours Vivat Rex in J GERSON Oeuvres compl tes ed GLORIEUX VII p 1137 1185 17 J GERSON Discours sur l unit de l Eglise ibid p 1093 1100 18 J GERSON Discours au roi pour la r conciliation ibid p 1100 1123 19 Ch de PISAN Le livre de la paix ed WILLARD 20 30 lettres de r mission du registre JJ 143 des Archives Nationales transcrites par Mademoiselle Verduron 21 30 lettres de r mission du registre JJ 150 des Archives Nationales transcrites par Mademoiselle Br s c Textes latins 22 De Sanctis et Pignoribus Sanctorum en d p t de Madame Mireux L 10 UN PEU DE TECHNIQUE PLAIDOYER POUR LA CARTE PERFOREE Les qu
28. nce tient l impossibilit dans laquelle on se trouve de voir les caract res que l on vient de perforer jusqu ce que les six suivants l aient t leur tour Ce d faut de conception impose de fournir une attention soutenue Enfin et c est l le plus grave soulignons la lenteur des op rations de correction apr s contr le des cartes dit es sur listing lenteur qui r sulte des manipulations impos es alors l utilisateur il faut soit sortir la mauvaise carte et la reproduire en modifiant le caract re erron soit perforer une nouvelle carte et la mettre la place de la carte fautive L op ration se r v le encore plus lourde s il s agit d un texte continu et si la correction ou l addition de mots entra nent des d calages en cha ne qui vont imposer une seconde perforation de plusieurs cartes 1 Voir L FOSSIER A VAUCHEZ et C VIOLANTE Informatique et Histoire M di vale Rome 1977 p 399 413 Lails Les avantages La perforation de cartes ne n cessite pratiquement aucun apprentissage et dans notre cas qui n est pas isol en Sciences humaines l analyste peut s en charger sans difficult Pr cisons cependant que la vitesse ne sera acquise que par une longue pratique Ce syst me de saisie est une fa on simple et commode de charger un fichier pour la premi re fois Les cartes constituent un bon syst me d archivage permettant de conserver le fichier initial sans frais condition
29. olonnes 3 10 La carte T est la carte titre Second type de produits les dictionnaires Voici ici deux exemples tir s d un m me texte The III Consideracions tout d abord un dictionnaire alphab ti que puis un dictionnaire par ordre de fr quence Exemple 2 TEXTE THE III CCNASIDERACIONS IRE CES FCRMNES SELECTIONNEES LELLLELELLLLLL LL LE ELLE ELLE FIFME FREQUEN kkk KA EX FR QUENCE RELATIVE FREQUENCE CORRIGEE STATLI Me OKON He km MCE OMR RON EE R bta 0 Am A 128 st102 30282 ccann AEASHT 1 2C201 sVUCI 2C09 PEAYSFT 1 2 2501 o3 9C1 con AEICE PT Re 20093 coo AEICING 1 PES OL 99C1 a000 AELAME i 50331 029301 ocoo AELE 1 olte so 2CC1 0c29 PAELEMENTIS i FLEURS 99001 ocoo AECLTE 14 SCOTT 20011 ocoo AECVE 22 jce 1e 2001 ncoo Exemple 3 TEXTE THE III CONSIDERACICNS DICTIONNAIRE DES FORMES SELECTICNNEES L LLLLLLELLELL ELLE ELLE LELLLLLELL SELLE LS FORME FREQUENCE FREGUENCE RELATIVE FREQUENCE CURRIGEE STATUT DELLE ERERX E X KER ERL ER RER XS K EX ESRER R ELRER ERES rr tsee AND 1089 0873 0875 0000 THE 505 0487 0487 0000 OF 507 0408 0408 0000 TO 320 90257 0257 0000 THAT 310 0249 0249 0000 IN 275 9221 0221 0000 HIS 267 0215 0215 0000 HE 247 0199 0199 0000 15 216 0174 0174 0000 A5 154 0124 0124 0000 Ces dictionnaires donnent non seulement une liste mais aussi des indications quantitatives Outre la fr quence nombre d occurrences on a ici la fr quence relative en
30. para t pas toujours clairement au travers du texte Disons tout d abord que les nouveaux champs d investigation du m di viste favorisent le recours aux textes suivis et leur examen minutieux l tude des mentalit s des soci t s ne peut se faire sans connaissance de ce que les contem porains ont pu dire ou penser et qu on d couvrira dans les textes litt raires et narratifs assur ment plus que dans les sources documentaires Ces derni res toutefois sont tout aussi susceptibles d une exploitation sur ordinateur l histoire institutionnelle et sociale des premiers si cles s appuie sur un examen minutieux du vocabulaire des actes Qui mieux que la machine pourra rep rer la premi re apparition d un mot en suivre l volution de sens en calculer la fr quence par poques par texte ou de tout autre mani re qu il plaira l histo rien de demander ee Pour toutes ces raisons nombreux sont les historiens m di vistes que l enregistrement et le traitement des textes en machine int ressent Nous en aurons tout l heure un aper u mais peut tre est il utile auparavant de donner quelques br ves indications sur la fa on dont on peut enregistrer un texte et sur les pr cautions prendre pour cette op ration nous parlerons ensuite du parti qu en peut tirer le m di viste L entr e en machine Le traitement de texte est une appellation globale qui recouvre des op rations tr s diverses et aboutit des r sultats va
31. ploitation et qui permettront aux lecteurs au vu d un exemple pr cis de mieux valuer les possibilit s offertes par le traitement de texte Lucie Fossier Un exemple de programme de traitement de texte ALINE Il existe l heure actuelle un assez grand nombre de programmes de traitement de texte A l tranger signalons des packages comme COCOA 1 JEUDEMO 2 GENDEX 3 LEXICO 4 ou les programmes du CETEDOC de Louvain ou du L A S L A de Li ge 5 En France plusieurs quipes de recherche ont mis au point des biblioth ques de programmes plus ou moins importantes celle de Madame Gallais Hamono pour l tude de la langue des conomistes anglosaxons Universit Paris I celle du Centre de Lexicologie Politique de l Ecole Normale Sup rieure de St Cloud programmes de Ren Pellen Poitiers Mais chacun de ces programmes a t con u pour r pondre des besoins pr cis Mon but est aujourd hui de pr senter un de ces programmes le package ALINE mis au point dans le cadre de l E R A 713 C N R S Paris I quipe de traitement automatique des sources du bas Moyen Age dirig e par le Professeur Guen e L id e de r aliser ce programme est n e d un besoin sp cifique la difficult d utiliser les programmes existants pour des textes m di vaux d pourvus d orthograph r guli re et r dig s dans des langues vari es les membres de l quipe travaillant sur des textes en fran ais en anglais et en latin nous o
32. r les produits de sortie Il est galement possible en entrant le texte tel quel de donner l ordinateur des indications pour que tels mots ne figurent pas sur les listings d index au lieu de les coder l entr e manuellement on en constitue des listes anti dictionnaires dictionnaires de mots vides enregistr s en m moire et que la machine consultera au fur et mesure qu elle laborera l index pour savoir si tel ou tel mot doit ou non figurer dans ce dernier Mais d j les anti dictionnaires proc dent d un autre type d instruments ceux dont on pourvoit la m moire de l ordinateur pour qu il puisse mener bien les op rations command es par les programmes de sorties du texte 1 Signalons que ces indications peuvent aussi tre entr es dans un second temps s il semble plus ais d enregistrer d abord le texte simple dans ce cas les codes report s la main sur le premier listing de sortie font l objet d une insertion automatique au lieu o ils doivent intervenir pour influer sur les produits de sortie L 4 Le texte en effet peut tre produit sous l aspect d une liste alphab tique des formes r clam e par exemple par tous les travaux de lexicographie Mais en r alit cette liste sera plus ais ment consultable si les formes d un mot sont regroup es sous une rubrique pratique peu pr s indispensable pour les langues flexions comme le latin La lemmatisation qui consiste pr cis ment regrouper
33. ri s selon les cas Le principe en est simple le texte est enregistr dans une m moire d ordinateur par l interm diaire de cartes ou de rubans perfor s ou de plus en plus fr quemment par impression directe d une bande magn tique d une cassette d un disque Il en ressort sur listings ou fiches ou microfilms et sous des formes diverses texte suivi concordances formes tri es alphab tiquement selon les besoins de l utilisateur Il n est certes pas plus compliqu d entrer un texte en machine que de le dactylographier Cependant cette premi re op ration exige plus d attention et de rigueur qu il n y para t de prime abord puisqu une fois le texte enregistr en m moire l intervention humaine n est plus possible et le produit de sortie comportera toutes les erreurs faites l entr e et portera la marque des n gli gences et des inattentions qui auront pr sid l introduction en machine une simple virgule un point mal plac risquent de perturber un ordre alphab tique des signes sp ciaux guillemets parenth ses tirets impr vus peuvent bloquer les op rations etc Toutes les r gles d criture doivent tre soigneusement d termin es au d but des op rations puis attentivement suivies Il est rare qu un texte soit enregistr en machine tel quel sans la moindre indication suppl mentaire Au moins doit il dans tous les cas tre accompagn d une r f rence S il s agit d un texte litt raire d j d
34. rnational Committee on Computationa Linguistics dont le pr sident est M le Professeur B Vauquois de l Universit Scientifique et M dicale de Grenoble s est tenu l Universit de Bergen en Norv ge du 14 au 18 ao t 1978 Il a t suivi par deux cents chercheurs environ qui ont cout soixante et onze communications Un certain nombre de Tables Rendes officielles propos de langages de programmation pour les humanit s de traitement des textes de probl mes de terminologie etc et de r unions infor melles ont compl t un programme d j tr s riche Si le Symposium ALLC du mois d avril permettait de percevoir certaines tendances nouvelles dans le domaine Informatique et Sciences de l Homme ces tendances ont profond ment marqu le COLING 78 de mani re presque caricaturale En coutant les communications en effet on avait parfois l impression de se trouver un congr s d Intelligence Artificielle plut t que de Linguistique L impression tait videmment renforc e par la pr sence au Congr s d un groupe nombreux de vedettes am ricaines de cette discipline l A I maintenant tellement la mode MM Carbonnell Jr Joshi Schubert Steels etc du c t europ en nous n oublierons pas de citer les communications tr s appr ci es de Mme Schwind et de M P tofi Les expos s de type statistique ou portant sur les techniques lexicographiques traditionnelles ont t tr s rares et une rencontre or
35. rons ici quelques remarques qui semblent avoir t partag es par la majorit des assistants propos de la pol mique entre m thodes statistiques voir communications de Mme Galloway et de MM Berghaus et Griffith et m thodes non statistiques g n alogiques pour reprendre le terme propos par M Irigoin voir communi cations de Dom Froger MM Dearing Poole Zarri etc il semble qu un certain accord se soit d gag sur l utilit potentielle des m thodes statistiques pour une r partition pr liminaire des manuscrits en familles dans le cas de traditions tr s riches Une repr sentation suffisamment pr cise des relations r ciproques entre les manuscrits ne pourra toutefois tre obtenue que par le recours aux m thodes du deuxi me groupe A remarquer que certaines m thodes g n alogiques voir communication de MM Najock et Zarri semblent d sormais permettre le traitement automatique du moins partiel des ph nom nes de contamination En ce qui concerne l utilisation de techniques automatiques pour le probl me de la reconnaissance d abord et de la s lection ensuite des variantes utiliser comme base des op rations critiques nous ne ferons ici que deux observations Les techniques de collation automatique dont les limites sont bien connues voir par exemple l inutilit de leur emploi pour les traditions romanes o tr s souvent chaque manuscrit pr sente une version pratiquement diff rente du m me
36. s de l Institut de la Langue Fran aise du C N R S B D un colloque l autre Quelques rencontres pass es Colloque International du C N R S sur La pratique des ordinateurs dans la critique des textes Ce Colloque organis par MM les Professeurs Gl nisson Irigoin Marichal e Monfrin dans le cadre de l Institut de Recherche et d Histoire des Textes s est tenu Paris du 29 au 31 mars 1978 Le secr tariat scientifique a t assur par Mme Fossier et M Zarri Le but du Colloque apr s plus de dix ans d utilisation de l ordinateur dan le domaine de la critique des textes tait de faire le point des diverses m thodes mises en oeuvre dans plusieurs pays de confronter les r sultats obtenus et de d gager les grandes lignes des d veloppements futurs de ces recherches Ce souci semble avoir t partag par un bon nombre de philologues et d informaticien car le Colloque qui r unissait vingt deux conf renciers appartenant aux organisme scientifiques de sept nations diff rentes a t suivi par quatre vingt chercheurs environ repr sentant douze pays Deux Tables Rondes Probl mes de s lection et d utilisation des variantes et Le classement des manuscrits et son approche for melle ont conclu les travaux Les Actes para tront dans le courant de l ann e da la collection Colloques Internationaux des Editions du C N R S IL 15 Sans pr tendre donner des jugements de caract re d finitif nous nous limite
37. s de ponctuation etc Pour les tudes lexicographiques pour la recherche d un mot les index et concordances seront parfois suffisants Cependant m me sous cette forme l historien ne pourra mener une tude de ce type que si formes et contextes sont tout de suite replac s dans un environnement g ographique et chronologique pr cis qui peut ainsi que nous l avons indiqu plus haut se trouver sous une forme cod e dans la r f rence Mais l historien aura souvent besoin de bien plus si c est l tude d un mot qui l int resse il voudra en conna tre au moins la fr quence absolue et relative en fonction des dates et des lieux Si c est l tude d une pens e ce n est plus le mot isol qui l int ressera mais le discours dont il pourra percevoir l orientation le sens l volution au travers de l tude de groupes de mots et ce moment les concordances simples ne suffisant pas toujours interviennent les recherches de co occurrences de coefficients de voisinage d environnement de classement des proximit s On entre ce moment dans le domaine de la statistique lexicale voire de l analyse factorielle et de correspondances si l on tient visualiser les r sultats Ce n est pas le lieu ici d insister davantage sur les produits obtenus qui encore une fois varient avec les besoins des utilisateurs Nous pr f rons laisser la parole aux historiens m di vistes qui ont adopt et souvent mis au point eux m mes ce type d ex
38. ss es peuvent s adresser M le Professeur D E Ager Department of Modern Languages The University of Aston in Birmingham Gosta Green BIRMINGHAM B4 7ET England Nous nous limiterons remarquer ici qu un certain nombre de nouveaut s int ressantes ont t voqu es alors que les rencontres pr c dentes s taient d roul es de fa on tr s traditionnelle Les techniques dites d Intelligence Artificielle ont fait une apparition timide par le biais des communications de M Cercone sur les r seaux s mantiques de Mme Galloway sur l analyse automatique des k 16 lt textes narratifs et de M Zarri sur le projet RESEDA D autres communications inhabituelles ont trait de traduction automatique M Loh de s mantique MM Clark et Rieger de Rhetorical Punctuation by Machine Mme Mastermann etc Les applications de techniques statistiques ont fait naturellement l objet d un grand nombre d expos s nous voulons signaler ici celui de l quipe Saint Cloud sur Les co occurrences une nouvelle approche statistique Par contre rares ont t les communications qui ont fait allusion aux techniques lexicographiques les plus habituelles index et concordances envisag es d ailleurs surtout sous des aspects strictement techniques constitution de packages par exemple voir expos de Mme Hockey 7th International Conference on Computational Linguistics COLING 78 Le Congr s COLING 78 organis par l Inte
39. t d abord la fa on dont se pr sente le texte Exemple 1 ANALYSE DU TEXTE GUIBERT DE NOGENT N CAR REFERENCE TEXTE 1 T 4 il DOMNO ET PATRI SANCTI SIMPHORIANI ABBATI ODONI GUITBERTUS 2 S DEI GENITRICIS UTINAM MINISTER AC SERVUS LETOS IN DEI 3 1 1 3 SERVITIUM HABERE PROCESSUS 14 1 1 14 QUAM ADORSUS FUERAM ORATIONE LIBELLULUM IN SEQUENTI RE QUAM 15 l 1 15 DICERE DEVOVERAM JAM LIBATA DUM DE DOMINI CORPORE SERMO 16 1 1 16 INCIDIT TOTUM ETIAM NUNC QUOD LOQUI SUPER DENTE CEPERAMUS On voit ici comment se pr sente le texte chaque ligne correspond une carte qui consiste donc en une zone de r f renciation et en une zone texte On note aussi que certains signes sp ciaux ont t introduits en l occurrence par Madame Mireux pour d limiter des titres ou des extensions du texte toile Y Pour que la machine puisse correctement analyser le texte il lui faut donc pr alablement lire un certain nombre de cartes de commandes par exemple eo E S SRE i F 03 10 17 80 T GUIBERT DE NOGENT La carte 0 est une carte d option l option E est celle qui demande un comptage des cartes des formes des mots et des s parateurs l option A permet trait de red finir l alphabet La carte S donne la liste des s parateurs La carte F indique le format selon lequel le texte a t perfor par exemple le texte de Guibert de Nogent est perfor sur les cartes de la colonne 17 la colonne 80 les r f rences occupant les c
40. toutefois de disposer de place pour le stockage et d y acc der sans recourir un moyen technique La correction ponctuelle est facile quand l erreur est d cel e imm diatement apr s la perforation de la carte la possibilit de reproduire une zone conserver permettant une modification rapide Enfin l avantage le plus d terminant est le faible prix de revient A la diff rence de l emploi de cartes ou bandes magn tiques disques souples voire lecteurs optiques terminaux conversationnels et autres mat riels sophistiqu s l utilisation de la carte perfor e aboutit des prix d fiant toute concurrence Bernadette Auzary VOYAGE AU CENTRE DE POITIERS Le groupe de recherche de Poitiers sur l analyse informatique des textes a commenc fonctionner en 1974 Il regroupe les enseignants des 3 U E R de Lettres et Sciences Humaines de l Universit de Poitiers qui poursuivent des travaux de recherche sur les textes partir de l informatique I PRESENTATION DES RECHERCHES ENTREPRISES AU SEIN DE L EQUIPE LL TS A9 SEEN DE L EQUIPE Epigraphie m di vale Monsieur Robert Favreau professeur d Histoire m di vale l Universit de Poitiers et Monsieur Jean Michaud attach l ERA 441 ont mis sur ordinateur les inscriptions m triques m di vales pour l ensemble du terri toire Le m me travail a t men pour les pitaphes du VIIIe au XIIIe si cle Ces fichiers ont abouti l tablissement de concord
41. un compte au cher cheur s il veut donner suite son projet L exploitation a lieu d s que le compte est aliment D lai de r alisation selon l importance des donn es et des options de quelques jours deux ou trois semaines Deux chercheurs ext rieurs l universit ont d j utilis les programmes PECI et tous les traitements demand s seront effectu s dans la mesure du possible C Bourlet L 13 L INFORMATION A Nous proposons ici une liste de bulletins revues p riodiques susceptibles de contenir des articles ou plus g n ralement des renseignements utiles l historien utilisateur de l informatique Nous avons volontairement exclu de ce panorama toute publication de caract re exclusivement th orique pour chaque l ment de la liste nous donnons l adresse du responsable ou de l un des respon sables de la publication 1 Signalons en tout premier lieu parce que la revue int resse sp cialement le m di viste Computers and Medieval Data Processing CAMDAP c o M le Professeur Serge Lusignan Institut d tudes m di vales Universit de Montr al C P 6128 Succursale A MONTREAL P Q H3C 3J7 Canada Ce bulletin contient entre autres un recensement p riodique l chelle mondiale de tous les projets en cours dans le domaine Informatique et Moyen Age et une bibliographie tr s d taill e sur le m me sujet Gratuit 2 ACM SIGLASH Newsletter c o Mrs Christine Mont
42. xt Society E S vol 76 1899 10 ed J Ph GENET Four English Political Tracts of the Later Middle Ages Camdem 4th Series vol 18 Londres 1977 p 180 209 11 ibidem p 5 19 12 Les proc dures de lemmatisation semi automatique propres ALINE sont expos es dans J Ph GENET F HUCHER J MONDELLI E VALENSI Un programme de traitement automatique des textes ALINE Bulletin du Centre d Analyse du Discours de l Uni sit de Lille III 1974 p 96 121 13 Ed S B CHRIMES Constitutional Ideas in Fifteenth Century England Cambridge 1936 14 Ce sera chose faite dans deux trois mois le programme sera accessible de Paris I et peut tre m me directement du C I R C E Appendice La Cartoth que de l E R A 713 a Textes anglais 1 J WYCLIF on the seven deadly sins J W Select English Works ed ARNOLD III p 119 167 2 An Tractatus de Regibus Four English Political Tracts ed GENET Camden 4th Series 18 1977 p 5 19 3 Th HOCCLEVE The Regement of Princes ed F FURNIVALL E E T S Extra Ser 61 1892 4 An The III Consideracions Four English Political Tracts p 180 219 5 J FORTESCUE The Governance of England ed Ch PLUMMER Oxford 1896 6 W WORCESTER The boke of noblesse ed J G NICHOLS Roxburghe Club 1860 7 J RUSSEL Three versions of the Parliamentary Sermon ed S B CHRIMES English Constitutional Ideas Cambridge 1936 8 G ASHBY The Active Po

Download Pdf Manuals

image

Related Search

Related Contents

  Bibliographie - Gériatrie  Ferm GGM1002 glue gun  Al&Rtour Sebastien Brant 2013  SOFTWARE-HANDBUCH  Samsung Beat S 2" 101g Silver  EZ Vinyl/Tape Converter - Quickstart Guide  Sanyo 52SR1  Martha Stewart Living TG90P4417S00 Instructions / Assembly    

Copyright © All rights reserved.
Failed to retrieve file