Home
- SHS Web of Conferences
Contents
1. Mode de vie X Politique B Sant Sciences et technologies Soci t communaut travail 2003 2004 2005 2006 2007 2008 2009 2010 15 de bs 10 Figure 5d volution de tablette domaine fix et dans les ventilations de 2004 2010 Analyse de la cible tablette figure 5d domaine fix l volution des domaines est relativement stable jusqu en 2009 et elle conna t un pic en 2010 dans tous les domaines sauf en Sant La ventilation des domaines a une configuration similaire d ann e en ann e jusqu en 2009 A partir de 2009 une Article en acc s libre plac sous licence Creative Commons Attribution 2 0 http creativecommons org licenses by 2 0 SHS Web of Conferences 1 2012 Congr s Mondial de Linguistique Fran aise CMLF 2012 DOI 10 1051 shsconf 20120100304 SHS Web of Conferences aux auteurs publi par EDP Sciences 2012 reconfiguration s amorce puis se renforce en 2010 SAN s efface ECO s impose gain de trois rangs passage d une sous repr sentation une surrepr sentation en 2010 SCI se renforce L volution des domaines t moigne d une amorce de changement apparue de fa on assez brutale Le changement pourrait amener une reconfiguration des domaines d emploi avec plusieurs nouveaux domaines d emploi notamment ECO et SCI Comme le changement se produit en 2010 le recul n est pas suffisant pour savoir si l volution de sens perdure ou non Les tapes pr c demment d crites correspo
2. aux auteurs publi par EDP Sciences 2012 r gularit de la diffusion est utilis e titre compl mentaire pour distinguer les candidats selon leur profil d volution Dans nos exp riences le corpus d tude est d coup en plusieurs p riodes cons cutives sans discontinuit L volution des domaines de 2004 2010 pour les cibles toxique tsunami temp te et tablette est d taill e ci dessous Pour chaque cible deux graphiques d volution sont pr sent s et comment s 1 les courbes d volution des sp cificit s domaine fix 2 les volutions des ventilations obtenues par calcul de sp cificit s sur l ensemble des domaines p riode fix e toxique volution des sp cificit s domaine fix de 2004 2010 volution des ventilations de 2004 2010 Arts et spectacles Binformations conomiques Environnement Mode de vie X Politique Sant Sciences et technologies Soci t communaut travail 2009 2010 2003 2004 2005 2006 2007 20068 2009 2010 GO ps E 40 Figure 5a volution de toxique domaine fix et dans les ventilations de 2004 2010 Analyse de la cible roxique figure 5a domaine fix pour la plupart des domaines il n y a pas de variation marqu e au cours du temps En revanche en ECO et POL il y a un contraste entre les p riodes de 2004 2007 o les emplois sont sous repr sent s et 2008 2010 o 1ls sont surrepr sent s avec un pic en 200
3. notre approche param tr e et que nous articulons un cadre statistique g n ralement utilis pour l analyse des cooccurrences 1928 Article en acc s libre plac sous licence Creative Commons Attribution 2 0 http creativecommons org licenses by 2 0 SHS Web of Conferences 1 2012 Congr s Mondial de Linguistique Fran aise CMLF 2012 DOI 10 1051 shsconf 20120100304 SHS Web of Conferences aux auteurs publi par EDP Sciences 2012 3 1 Empreintes de fr quence par domaine Les empreintes de fr quence c est dire l volution dans le temps de la fr quence d une unit lexicale peuvent tre utilis es pour mettre en vidence la diffusion d une unit lexicale dans les discours Dans notre cadre nous cherchons observer l apparition de nouvelles lexies et leur implantation dans les discours Nous faisons l hypoth se qu une n ologie de sens peut s accompagner d un accroissement de fr quence m me de repr senter la diffusion d un nouvel emploi dans les discours Cet accroissement de fr quence peut se produire lorsque le sens de la lexie volue d un emploi propre un domaine particulier vers un emploi plus g n ral C est notamment le cas de mutualiser initialement associ au domaine de l assurance puis employ dans un cadre plus g n ral partir de la fin des ann es 90 et le d but des ann es 2000 Viprey et Schepens 2010 Les informations purement quantitatives d livr es par les empreintes de fr quen
4. 1 travers un accroissement significatif de la pr sence de la cible au cours du temps et au sein du domaine consid r tude domaine fix 2 travers l mergence d un nouveau domaine dans la t te de liste des domaines d emplois comparaison des ventilations de domaines Pour combiner ces deux axes d analyse le calcul des sp cificit s domaine fix d j r alis est compl t par des calculs de sp cificit s p riode fix e qui pr cisent la ventilation des domaines c est dire leur importance les uns par rapport aux autres Les r sultats selon chaque axe d analyse sont pr sent s en figure 3 avec un tri par sp cificit d croissante des domaines pour chaque p riode et chaque cible Figure 3 Ventilation des domaines pour chaque cible en 2004 et 2010 tri s par sp cificit d croissante Les domaines mergents sont s lectionn s partir des sp cificit s calcul es domaine fix Les ventilations sont utilis es pour pr ciser l analyse l mergence d un domaine n est plus consid r e isol ment mais relativement aux autres domaines cf figure 4 Article en acc s libre plac sous licence Creative Commons Attribution 2 0 http creativecommons org licenses by 2 0 1933 Congr s Mondial de Linguistique Fran aise CMLEF 2012 SHS Web of Conferences 1 2012 SHS Web of Conferences DOI 10 1051 shsconf 20120100304 aux auteurs publi par EDP Sciences 2012 Domaines avec un Evolutio
5. 2003 Un autre indice est celui des empreintes de fr quence Picton 2009 qui correspondent l volution au cours du temps de la fr quence d une unit lexicale donn e Les empreintes de fr quence sont a priori plus adapt es pour participer la d tection d un nouveau sens qu sa qualification mais leur tude relativement un espace d fini par une structure s mantique les rend pertinentes pour qualifier le sens comme nous le verrons en 3 1 L int r t des empreintes de fr quence est qu elles accordent la diffusion et au param tre temps un r le central C est cet indice que nous retenons pour la suite des d veloppements avec un objectif de qualification du nouveau sens Nous abordons donc l mergence d un nouveau sens comme un processus qui se construit en contexte et qui se caract rise par une double diffusion dans le temps et dans des domaines La d tection d un nouveau sens n est pas trang re notre approche mais la qualification du nouveau sens est notre objectif principal Nous cherchons y parvenir partir d indices mesurables et porteurs d information s mantique sp cifique de l unit lexicale cibl e 3 Indices pour analyser la diffusion par domaine d un nouveau sens Nous proposons d aborder la diffusion du nouveau sens en jouant sur deux param tres le temps et les domaines d emploi Pour cela nous nous appuyons sur l indice de diffusion que sont les empreintes de fr quence que nous adaptons
6. changement est vraisemblablement d clench par un pic v nementiel et 1l s accompagne d un accroissement des emplois dans l ensemble des domaines L volution de la ventilation des domaines peut s interpr ter comme la diffusion d un emploi m taphorique qui se g n ralise car apr s le pic les d s quilibres entre domaines sont de moins en moins nets tous les domaines deviennent domaines d emploi De plus la configuration n est pas stable avec des variations marqu es d une ann e sur l autre comme si la position tait plus un ph nom ne ponctuel d l actualit qu une tendance intrins quement li e la cible tsunami temp te volution domaine fix de 2004 2010 volution des ventilations de 2004 2010 Arts et spectacles Minformations conomiques Environnement Mode de vie X Politique Sant Sciences et technologies Soci t communaut travail 2009 2010 2006 2007 2068 20b9 2o Figure 5c volution de temp te domaine fix et dans les ventilations de 2004 2010 Analyse de la cible temp te figure 5c domaine fix les volutions sont tr s variables ECO Informations conomiques POL Politique et SOC Soci t pr sentent globalement un accroissement mais qui n a pas la m me allure et avec des irr gularit s Il n appara t pas de coh rence globale chaque Article en acc s libre plac sous licence Creative Commons Attribution 2 0 http creativecommons org licen
7. deux p riodes pour montrer l existence d une rupture puis travers l analyse plus fine d une succession de p riodes pertinente pour d crire le processus qu est la diffusion d un nouveau sens Les nouveaux domaines ont t recherch s par recoupement de deux axes d observation l volution temporelle domaine fix et l volution de la ventilation des domaines Enfin les domaines du corpus susceptibles de qualifier le nouveau sens ont t confront s aux domaines des d finitions lexicographiques des cibles lexicales Les recoupements avec le sens cod ont permis de faire des hypoth ses sur le type d volution du sens cod en termes de reconfiguration ou d enrichissement des d finitions Le protocole s est construit gr ce aux structures complexes propres aux ressources textuelles et lexicographiques m me si ces structures n ont t exploit es que partiellement La structure textuelle a t analys e de fa on relativement pouss e La structure du dictionnaire est apparue en terme de macrostructure organisation globale des domaines et de microstructure d pendance des d finitions aux domaines Elle n a t exploit e que de fa on limit e de m me que l articulation de la structure textuelle la structure lexicographique Pour progresser dans l automatisation des interactions entre corpus et dictionnaire la mise en uvre de techniques d appariement plus approfondies est n cessaire Par ailleurs la qualification du
8. volution de tsunami domaine fix et dans les ventilations de 2004 2010 Analyse de la cible tsunami figure 5b domaine fix on constate que quel que soit le domaine il y a un pic en 2005 et la p riode o les sp cificit s sont les plus fortement n gatives est 2004 les emplois cette p riode sont sous repr sent s par rapport ceux des autres p riodes autrement dit il y a accroissement des emplois par rapport 2004 dans toutes les p riodes ult rieures m me si cette volution est faible pour SAN Dans l volution des ventilations quelques domaines sont stables les domaines ENV Environnement et SCI Science et technologie ont un positionnement peu pr s stable parmi les domaines les plus surrepr sent s toujours compris entre le 1 et le 3 rang tandis que SAN est g n ralement sous repr sent Le positionnement des autres domaines est en revanche instable avec des volutions 1936 Article en acc s libre plac sous licence Creative Commons Attribution 2 0 http creativecommons org licenses by 2 0 SHS Web of Conferences 1 2012 Congr s Mondial de Linguistique Fran aise CMLF 2012 DOI 10 1051 shsconf 20120100304 SHS Web of Conferences aux auteurs publi par EDP Sciences 2012 irr guli res et marqu es d une ann e sur l autre L volution p riode par p riode confirme l mergence d un nouveau sens mais leur analyse am ne reconsid rer la liste des domaines mergents Le
9. amp Schepens P 2010 D rivation lexicale et d rive du discours mutualiser mutualisation In 70th International Conference Journ es d Analyse Statistique des Donn es Textuelles JADT 2010 489 498 1942 Article en acc s libre plac sous licence Creative Commons Attribution 2 0 http creativecommons org licenses by 2 0
10. discours sa diffusion et notamment sa stabilisation dans les discours la qualification du nouveau sens son articulation au sens existant Certaines r alisations notamment des plateformes de rep rage et de stockage de n ologies telles que celle de l Observatoire de N ologie Cabr et al 2003 ou la Wortwarte Lemnitzer et Ule 2011 contribuent une facette du probl me savoir la d tection de n ologies mais elles laissent g n ralement de c t la question de la qualification du nouveau sens et de son articulation aux sens existants Deux types de travaux fournissent des l ments de r ponse qui peuvent se combiner pour une analyse des diff rentes facettes du ph nom ne des descriptions th oriques essentiellement linguistiques des m canismes s mantiques en jeu dans les ph nom nes de n ologie de diffusion s mantique ou d mergence de nouveaux sens Rastier et Valette 2009 Sablayrolles 2000 des travaux orient s vers une perspective applicative qui r pertorient des indices de n ologie ou de diffusion d un sens Picton 2009 Nous nous positionnons l intersection de ces travaux pour proposer ce qui pourrait constituer la premi re tape de l acquisition d un nouveau sens la caract risation de l volution de sens en fonction de domaines Article en acc s libre plac sous licence Creative Commons Attribution 2 0 http creativecommons org licenses by 2 0 1927 Article available at http www shs con
11. domaine en 2010 relativement 2004 calcul es domaine fix pour l ensemble des cibles lexicales en gras sp cificit s sup rieures au seuil de 5 Les cibles valident le crit re de diffusion s il y a accroissement significatif de la pr sence de la cible en deuxi me p riode dans au moins un domaine L accroissement est consid r comme significatif s il franchit un seuil de sp cificit que nous fixons ici 5 Apr s application des seuils de sp cificit les cibles tablette temp te toxique et tsunami sont retenues tandis que les cibles dangereux d l t re mol culaire et raz de mar e sont limin es Pour les cibles retenues nous distinguons deux types de diffusion selon qu un ou plusieurs domaines mergent L int r t est de dissocier deux ph nom nes linguistiques correspondant soit l ajout d un nouveau domaine d emploi soit la g n ralisation d un emploi jusqu alors propre un domaine donn Cette information est utile au niveau de la mise jour du sens cod dans un cas il y aura ajout d une tiquette de domaine et d une nouvelle d finition sp cifique ce domaine dans l autre la d finition sera g n rale sans tiquette de domaine Dans le premier cas l accroissement permet d isoler un domaine particulier C est le cas de foxique o seul le domaine ECO pr sente un accroissement significatif nettement sup rieur celui des autres domaines Dans le second cas l accroissement est
12. emplois entre les diff rents domaines reste relativement homog ne 5 3 Analyse de la r gularit de la diffusion des domaines Aux tapes pr c dentes les r sultats sur les domaines ont t obtenus par comparaison de deux p riodes de temps disjointes Il est ainsi possible d identifier un contraste mais cela ne renseigne pas sur la progression de la diffusion Celle ci peut avoir des profils vari s diffusion lin airement croissante pic de diffusion puis recul progressif ph nom ne de mode ou v nement marquant par exemple croissance irr guli re etc Avec deux p riodes seulement on accro t le risque de s lectionner tort certaines cibles candidates un nouveau sens par exemple si la deuxi me p riode correspond un pic ponctuel ou d carter des candidats valables par exemple si la deuxi me p riode correspond un creux dans une volution irr guli re La r gularit de la diffusion n est pas utilis e pour effectuer un nouveau tri des candidats mais pour nuancer l analyse Le contraste de deux p riodes sert de crit re initial pour l allocation de signifi m me s il n exploite pas l information li e la continuit du processus La 1934 Article en acc s libre plac sous licence Creative Commons Attribution 2 0 http creativecommons org licenses by 2 0 SHS Web of Conferences 1 2012 Congr s Mondial de Linguistique Fran aise CMLF 2012 DOI 10 1051 shsconf 20120100304 SHS Web of Conferences
13. existants nous utilisons comme vivier de sens cod s une ressource lectronique le Tr sor de la Langue Fran aise informatis TLFi Les d finitions du TLFi sont accessibles en ligne mais elles sont galement encod es dans une base de donn es SEMEME d riv e du TLFi dans le cadre d un projet interne chaque entr e est associ un fichier XML qui encode la subdivision des entr es associ es des mots vedettes en d finitions Le balisage pr cise si la d finition est d pendante d un domaine Cette base de donn es est coupl e la plateforme SEMY Grzesitchak 2008 qui extrait les tiquettes de domaines associ es chaque entr e Par ailleurs au niveau de la macrostructure les domaines du TLFi s organisent selon une structure hi rarchique avec diff rents niveaux d imbrication Cette structure est indirectement accessible partir du moteur de recherche int gr au TLFi Elle est galement encod e dans un fichier tabli partir de la nomenclature originelle des domaines utilis e lors de la r daction du TLFi Les informations de la macrostructure sont utilis es pour ramener les domaines trop pr cis des d finitions des domaines de premier niveau c est dire des domaines correspondant des subdivisions principales Ce sont ces domaines principaux qui sont appari s aux domaines du corpus Pour relier les domaines de niveau principal du dictionnaire et ceux du corpus deux crit res sont utilis s e De
14. se sur le nouveau sens en fonction des Sens sp cifiques Sens g n raux non domaines certains domaines domanialis s Sens sp cialis en ECO Sens en ENV SCI SAN tsunami Un sens g n ral multidomaines Il y a une Sens en ENV SCI Pas de sens g n ral relative instabilit dans l mergence de domaines tablette Un sens g n ral ou plusieurs sens sp cifiques en Sens dans un domaine Plusieurs sens SCI et ECO principalement absent du corpus g n raux Figure 7 Mise en relation des domaines de l ancien sens en dictionnaire et du nouveau sens en corpus La confrontation des deux ressources permet de faire les hypoth ses suivantes e Pour toxique il n y a pas de sens sp cialis correspondant celui qui merge en corpus propre un seul domaine ce qui va dans le sens de l mergence d un nouveau sens sp cialis en conomie e Pour tsunami seul un sens sp cialis existe dans le dictionnaire alors que des domaines multiples mergent en corpus ce qui invite voir l apparition d un nouveau sens g n ral e Pour tablette plusieurs hypoth ses se pr sentent Il peut y avoir soit une reconfiguration des emplois les sens g n raux prennent le pas sur les sens domanialis s en histoire soit l mergence de plusieurs sens sp cifiques en Science et en conomie vraisemblablement soit l apparition d un sens g n ral distinct des sens g n raux existants qui pourrait tre plus proche du domaine scientifi
15. sens que nous avons propos e reste de haut niveau elle repose sur des descripteurs g n riques Pour voluer vers une caract risation plus compl te et plus pr cise du nouveau sens le protocole pourrait tre tendu d autres niveaux de description notamment lexicaux et infra lexicaux L acquisition de contenu s mantique s appuierait sur une recherche d information par strates avec l analyse successive d unit s de granularit s mantique de plus en plus fine selon un protocole dont les grandes lignes ont t propos es dans Reutenauer 2012 Les domaines joueraient un r le central et seraient la premi re tape de qualifications successives du sens de plus en plus nuanc es Leur analyse servirait de cl de structuration principale de l information et elle serait r utilis e pour s lectionner ou structurer les unit s plus pr cises par exemple des unit s lexicales ou un niveau encore plus fin des traits s mantiques R f rences bibliographiques Bauer L amp Renouf A 2000 Contextual clues to Word Meaning International Journal of Corpus Linguistics 5 2 231 259 B joint H 2009 Lexicographie et linguistique le domaine anglais Lexique 19 117 158 Brunet E 2007 Fr quences et s quences mise en uvre dans Hyperbase Lexicometrica 7 Cabr M Domenech M Estopa R Freixa J amp Sole E 2003 L Observatoire de n ologie conception m thodologie r sultats et nouveaux travau
16. 9 Dans la ventilation un domaine volue nettement ECO se renforce au cours du temps Il est l un des domaines les plus fortement sous repr sent s de 2004 2007 6 et 7 rangs avec des sp cificit s n gatives puis 1l rejoint les principaux domaines d emploi En revanche POL reste parmi les derniers domaines d emploi quelle que soit la p riode L volution est relativement stable pour les autres Article en acc s libre plac sous licence Creative Commons Attribution 2 0 http creativecommons org licenses by 2 0 1935 Congr s Mondial de Linguistique Fran aise CMLF 2012 SHS Web of Conferences 1 2012 SHS Web of Conferences DOI 10 1051 shsconf 20120100304 aux auteurs publi par EDP Sciences 2012 domaines Le recoupement des deux axes d observation montre une mergence nette d un domaine particulier ECO conform ment l analyse des deux ann es 2004 et 2010 L accroissement est progressif avec un basculement en 2008 qui se maintient en 2009 et 2010 Ceci va dans le sens d une domanialisation de foxique en conomie tsunami Arts et spectacles Binformations conomiques Environnement Mode de vie X Folitique B Sant Sciences et technologies soci t communaut travail volution des sp cificit s domaine fix de 2004 2010 volution des ventilations de 2004 2010 L 2005 2006 2007 2008 2009 2010 Lu me 4 2003 2004 2005 2006 2007 2008 2009 2010 20 A Figure 5b
17. Le corpus compte 1 2 million d articles Sa restriction aux deux ann es 2004 et 2010 utilis e pour les exp riences des sous sections 5 1 et 5 2 est d environ 300 000 articles L unit textuelle est l article et elle sert galement d unit de d compte des occurrences la taille d un sous corpus ou encore les occurrences d une cible lexicale seront valu es en nombre d articles 4 2 Des cibles lexicales profils vari s Les cibles pr s lectionn es sont toxique dangereux d l t re tsunami temp te raz de mar e mol culaire tablette Elles se r partissent en deux cat gories e des cibles pressenties ou identifi es comme n ologiques La premi re est l adjectif toxique en contexte de crise financi re qui qualifie des produits ou instruments financiers l origine de la crise financi re de 2008 les actifs toxiques troitement rattach s aux subprimes La deuxi me cible est tsunami employ dans un sens m taphorique l instar de temp te ou de s isme pour qualifier des v nements d sastreux ou catastrophiques Notre hypoth se est que la diffusion des emplois m taphoriques est d clench e par la catastrophe naturelle qui a frapp l Asie du Sud est le 26 d cembre 20047 La 3 cible est mol culaire qui conna t de nouveaux emplois dans le domaine de la gastronomie cuisine mol culaire Ceux ci renvoient un jeu sur les textures les couleurs et les formes en cuisine cr ant un effet artistique et v
18. SHS Web of Conferences 1 2012 Congr s Mondial de Linguistique Fran aise CMLF 2012 DOI 10 1051 shsconf 20120100304 SHS Web of Conferences aux auteurs publi par EDP Sciences 2012 Nouveau sens et volution des domaines d emploi m thodologie pour l acquisition lexicale Reutenauer Coralie ATILF CNRS amp Universit de Lorraine coralie reutenauer atilf fr 1 introduction Le sens se construit travers des interactions permanentes entre langue et discours Les traitements automatiques disposent de ressources et d outils de plus en plus d velopp s pour simuler les interactions entre langue et discours Des ressources lectroniques en nombre croissant proposent des repr sentations de la langue sous forme d ontologies de terminologies ou encore de dictionnaires informatis s dont le format est plus ou moins largement enrichi par rapport des versions papier pr existantes voire m me sp cifique au format lectronique B joint 2009 Ces ressources sont utilis es diff rents niveaux pour analyser des corpus textuels repr sentatifs des discours Rayson et al 2004 proc dent une annotation de corpus en parties du discours et en domaines issus du Longman Lexicon of Contemporary English dans une perspective d analyse de contenu s mantique et de d sambigu sation ou encore Victorri et Fuchs 1996 utilisent des r seaux de synonymie labor s partir de dictionnaires de synonymes pour calculer le sens d u
19. ation du sens Les m thodes commun ment utilis es en lexicom trie pour identifier les cooccurrents saillants au voisinage de la cible lexicale et pour extraire des unit s en affinit s mantique avec celle ci s appuient sur le calcul d indices statistiques tels que le x l information mutuelle ou les sp cificit s Ces indices d pendent g n ralement d un d coupage de l espace textuel en un sous corpus d tude et son compl mentaire ainsi que de 4 param tres 1 la taille totale du corpus 2 la taille du sous corpus i e le voisinage de la cible 3 le nombre total d occurrences de l unit observ e dans le corpus 4 son nombre Article en acc s libre plac sous licence Creative Commons Attribution 2 0 http creativecommons org licenses by 2 0 1929 Congr s Mondial de Linguistique Fran aise CMLEF 2012 SHS Web of Conferences 1 2012 SHS Web of Conferences DOI 10 1051 shsconf 20120100304 aux auteurs publi par EDP Sciences 2012 d occurrences dans le sous corpus Autrement dit les fr quences qui constituent l unit de d compte la base des empreintes de fr quence sont int gr es dans les indices statistiques et le r sultat du calcul peut se voir comme des fr quences r ajust es en fonction de param tres suppl mentaires Dans notre cadre nous fondons nos analyses sur de tels indices Plus pr cis ment nous utilisons les sp cificit s de Lafon 1984 comme indice statistique Dans nos exp riences l
20. ce doivent toutefois tre manipul es avec pr caution En effet l existence d un accroissement de fr quence ne garantit pas qu un nouveau sens s implante Tous les n ologismes de sens ne pr sentent pas n cessairement un accroissement global d emplois Un nouvel emploi peut rester mineur par rapport aux emplois pr existants et n influer que faiblement sur les variations de fr quence ou un nouveau sens peut remplacer un sens pr existant donc en l absence de d sambigu sation la fr quence de l unit lexicale peut stagner voire diminuer L apport des empreintes de fr quence se limite la d tection d un nouveau sens tant que leur analyse n est pas tay e par des pr cisions suppl mentaires sur leur environnement s mantique c est dire tant qu elles sont d coupl es d un profilage s mantique des discours Mais si elles sont corr l es des profilages s mantiques des discours par exemple des profilages th matiques ou domaniaux elles peuvent contribuer la qualification du nouveau sens en plus de sa d tection 3 2 Indices statistiques et d coupages de l espace textuel Pour les empreintes de fr quence telles que nous les avons pr sent es l observable est la cible lexicale Cependant avec les empreintes de fr quences th matiques 1l est possible d adopter plusieurs perspectives et de se focaliser soit sur la cible soit sur le param tre d tude que sont les domaines Autrement dit 1l est possible d avoir une a
21. cessivement les domaines les uns par rapport aux autres Les deux modes de calcul correspondent deux axes d analyse compl mentaires Le premier permet d appr hender la diffusion au sein d un domaine c est dire l accroissement des emplois au cours du temps pour le domaine consid r Le deuxi me permet d observer l volution de la ventilation c est dire la fa on dont se reconfigure le sens au cours du temps travers l volution de l quilibre relatif entre domaines Les deux points de vue doivent contribuer l acquisition d informations qualitatives nuanc es destin es mettre en vidence une vari t de sous ph nom nes l existence d une diffusion domaniale simple ou multiple la reconfiguration du sens la fa on dont progresse la diffusion et les affinit s ou oppositions entre domaines en particulier entre anciens et nouveaux domaines d emploi Chacun de ces points fera l objet d un d veloppement tay par des exp riences en corpus 4 Ressources textuelles ressources lexicographiques et cibles lexicales La diffusion d un nouveau sens est abord e sous l angle de la linguistique de corpus 4 1 partir de ressources textuelles o sont observ es diff rentes cibles lexicales 4 2 4 1 Un corpus multidomaines Le corpus d tude est issu de la base de donn es d actualit internationale Factiva Cette base de donn es constitu e de plus de 10 000 sources notamment journalistiques presse nationale et in
22. e calcul est r alis par un module de la plateforme Semy Grzesitchak 2008 Il est similaire celui du logiciel Lexico3 Salem et al 2003 Les valeurs retourn es sont des entiers positifs en cas de surrepr sentation n gatifs sinon Plus la sp cificit est grande en valeur absolue plus la saillance de l unit est consid r e comme significative Le calcul des sp cificit s repose sur une partition du corpus en deux sous ensembles un sous corpus et son compl mentaire Pour analyser le sens d une cible lexicale le sous corpus correspond au voisinage de la cible Dans notre cadre la structure du corpus est plus complexe les domaines et les p riodes de temps sont des param tres qui permettent des d coupages multiples Il est ainsi possible de d finir un voisinage de la cible propre tout couple domaine p riode Deux modes de calcul des sp cificit s permettent d appr hender cette structure de l espace textuel Le premier est effectu domaine fix p riode par p riode ce qui permet d obtenir une suite de sp cificit s caract ristiques d un domaine donn ind pendamment des autres domaines Le deuxi me est destin refl ter le poids relatif des domaines autrement dit la ventilation des domaines et la fa on dont volue cette ventilation dans le temps Les sp cificit s sont calcul es p riode fix e et ce pour chacune des p riodes ce qui permet d avoir un aper u de la fa on dont se r partissent suc
23. en acc s libre plac sous licence Creative Commons Attribution 2 0 http creativecommons org licenses by 2 0 1931 Congr s Mondial de Linguistique Fran aise CMLEF 2012 SHS Web of Conferences 1 2012 SHS Web of Conferences DOI 10 1051 shsconf 20120100304 aux auteurs publi par EDP Sciences 2012 plusieurs domaines Une pr cision compl mentaire est apport e dans un second temps pour d terminer si la diffusion est nouvelle ou si elle amplifie un usage d j r pandu ce stade nous recherchons une caract risation relativement tranch e Le tri des cibles et la qualification de la diffusion sont obtenus par une approche contrastive de deux p riodes de temps disjointes l une ancienne l autre r cente Dans notre corpus les p riodes choisies sont les ann es 2004 et 2010 On utilise un crit re d accroissement de la diffusion valu partir des sp cificit s calcul es domaine fix pour le sous corpus de l ann e 2010 par rapport au corpus des deux ann es r unies cf figure 1 2 ART ECO ENV MOD POL saN sct soc dangereux 14 a 4 3 6 2 27 a l i re 2 1 0 1 4 4 o 37 mol culaire 0 0 0 2 1 1 3 07 raz de mar e 2 2 2 6 10 2 1 47 iableite 14 9 3 2 8 o 5 37 tempe 3 27 1 1 22 0 1 toxique 3 23 a 1 4 2 0 27 tsunami s s 2 5 33 2 1 137 Figure 1 Sp cificit s dans chaque
24. ferences orgl or http dx doi org 10 1051 shsconf 20120100304 Congr s Mondial de Linguistique Fran aise CMLEF 2012 SHS Web of Conferences 1 2012 SHS Web of Conferences DOI 10 1051 shsconf 20120100304 aux auteurs publi par EDP Sciences 2012 2 Probl matique Dans notre approche la recherche d informations s mantiques pertinentes repose sur un crit re de variation s mantique marqu e et r p t e dans le temps Si la variation s mantique est faible l int r t de l acquisition d un nouveau sens est limit puisque l ancien sens fournit l essentiel des l ments n cessaires l interpr tation du nouveau sens Sans r p tition dans le temps le nouveau sens n est qu un ph nom ne accidentel qui ne correspond pas un emploi qui vit effectivement dans les discours Les m canismes en jeu dans la n ologie s mantique reposent notamment sur des ph nom nes g n riques qui se situent au niveau des domaines ou des th mes Rastier et Valette 2009 mettent en vidence diff rents m canismes l origine de la n ologie s mantique des ph nom nes de domamialisation qui correspondent l mergence d un sens propre un nouveau domaine comme le domaine de la gastronomie pour mol culaire cuisine mol culaire spaghettis mol culaires des ph nom nes de d domanialisation o le nouveau sens s affranchit du ou des domaines sp cifiques d emploi notamment pour voluer vers un emploi g n ral par exemple mutuali
25. iciel Lexico3 Salem ef al 2003 qui utilise le m me mode de calcul des sp cificit s 1932 Article en acc s libre plac sous licence Creative Commons Attribution 2 0 http creativecommons org licenses by 2 0 SHS Web of Conferences 1 2012 Congr s Mondial de Linguistique Fran aise CMLF 2012 DOI 10 1051 shsconf 20120100304 SHS Web of Conferences aux auteurs publi par EDP Sciences 2012 r alis es jusque l ne sont pas suffisantes pour trancher entre de nouveaux emplois et l expression d un sens figur pr existant Les tapes ult rieures serviront la question partir du 5 3 5 2 Affectation d un ou plusieurs domaines chaque cible L objectif de cette tape est de s lectionner des domaines saillants pour les cibles retenues Les donn es pr c dentes peuvent tre r utilis es pour associer chaque cible un ou des domaines o se diffuse vraisemblablement le nouveau sens Jusque l l information a servi valider certaines propri t s ou quantifier le ph nom ne de diffusion plut t qu qualifier le nouveau sens par des l ments nouveaux L attention tait focalis e sur des informations quantitatives telles que des franchissements de seuils ou le nombre de domaines mergents Les informations recherch es ici sont qualitatives Les sorties du traitement sont des tiquettes de domaines susceptibles de qualifier le nouveau sens Les domaines mergents peuvent tre rep r s de deux fa ons
26. iffusion des emplois simple ou commune plusieurs domaines identification des domaines mergents pour les cibles retenues analyse de la progression de la diffusion dans le temps relativement aux diff rents domaines 5 1 Existence d une diffusion dans un ou plusieurs domaines La premi re tape consiste valider ou liminer les cibles lexicales pr s lectionn es selon qu elles pr sentent ou non une diffusion et d terminer si la diffusion est propre un domaine ou commune Dans nos exp riences les r sultats sont calcul s par tranches de temps annuelles et l ann e 2004 est utilis e comme ann e de r f rence pour les anciens emplois Pour viter un biais d au pic v nementiel des derniers jours de 2004 nous avons limin les documents datant du 25 au 31 d cembre 2004 pour l tude de tsunami La tablette graphique existe depuis plusieurs d cennies mais ce produit a connu un bond technologique tr s r cemment l origine du changement L amorce du changement a eu lieu en 2007 avec le lancement de l iPhone proche des tablettes en termes de fonctionnalit s et de technologie et le v ritable tournant a eu lieu en 2010 avec la mise sur le march de l iPad A titre d illustration lorsque Perlerin 2004 voque le paradigme de la m t orologie boursi re une m taphore conceptuelle il cite fr quemment temp te raz de mar e n appara t qu une fois au d tour d un exemple et tsunami est absent Article
27. ines mergents varie selon les cibles Pour toxique ECO se distingue nettement des autres domaines Il s impose en terme de diffusion et de poids relatif par rapport aux autres domaines Pour tsunami la diffusion concerne les domaines rattach s aux sciences humaines et sociales moins les domaines des sciences du vivant ou les autres sciences dures Pour temp te la diffusion concerne trois domaines dont deux principalement ECO et POL La diffusion s accompagne d une reconfiguration de l importance relative des domaines m me si les contrastes sont peu marqu s Pour fablette la diffusion affecte plusieurs domaines mais elle semble plus sp cifique deux domaines SCI et ECO qui connaissent un accroissement domaine fix et qui supplantent au cours du temps d autres domaines dans la ventilation De fa on g n rale il y a convergence entre les deux axes d analyse domaine fix et selon la ventilation des domaines L int r t est qu ils fournissent des clairages compl mentaires notamment lors d une diffusion dans plusieurs domaines Les exemples de tsunami et tablette sont particuli rement frappants tablette se diffuse dans certains domaines en particulier mais la ventilation des domaines reste presque la m me en 2004 et 2010 et les contrastes demeurent tsunami se diffuse dans plusieurs domaines mais la ventilation volue vers une hi rarchie assez diff rente et l chelle de sp cificit s est tass e l importance de ses
28. n nonc L interaction entre des dictionnaires lectroniques et des ressources textuelles s effectue alors dans un sens les dictionnaires sont au service de la dynamique en corpus l inverse diff rents travaux utilisent les ressources textuelles pour enrichir des ontologies ou des ressources lexicographiques Ainsi Kilgarriff et al 2004 proposent un outil d extraction de portraits de mots le Sketch Engine qui participe la construction d un dictionnaire le MacMillan English Dictionary for Advanced Learners Les travaux voqu s gravitent autour de la question de la mise jour de dictionnaires mais celle ci est loin d tre r solue notamment en lexicographie fran aise et pour le fran ais standard De fait la mise jour de ressources lexicographiques reste tr s largement manuelle et rel ve le plus souvent d un artisanat Rey 2008 L automatisation de l acquisition lexicale reste un d fi particuli rement dans le cas de mots existants qui acqui rent de nouveaux sens c est dire des n ologies s mantiques Le changement est plus difficile d tecter car il ne peut s appuyer sur des crit res formels tels que l absence du mot de la ressource de r f rence De plus la construction du nouveau sens n cessite d articuler le nouveau sens aux sens existants Dans une perspective d automatisation de l acquisition lexicale il est n cessaire de prendre en compte quatre aspects l existence d un nouveau sens en
29. n de la ventilation des domaines accroissement marqu en 2010 domaine fix toxique ECO Informations conomiques s impose dans la ventilation il est le deuxi me domaine le plus sous repr sent en 2004 et il prend le pas sur trois autres domaines en 2010 tsunami POL SOC ART ECO MOD Les ventilations sont faiblement contrast es en 2004 et en 2010 mais la configuration volue entre les deux ann es ART Arts et spectacles et MOD Mode de vie s effacent devant les autres domaines l inverse SOC Soci t Communaut Travail et plus particuli rement POL Politique Relations internationales s imposent temp te ECO POL SOC Il y a volution d une ventilation contrast e vers une ventilation plus faiblement contrast e ECO Informations conomiques et POL Politique Relations internationales se renforcent par rapport aux autres domaines tandis que SOC Soci t Communaut Travail volue de fa on moins remarquable tablette ART ECO POL SCI La ventilation est moyennement contrast e en 2004 et en 2010 et sa configuration reste approximativement la m me Deux domaines gagnent des rangs dans la ventilation savoir ECO Inforamtions conomiques et SCI Science et technologie Figure 4 Domaines associ s chaque cible partir des sp cificit s calcul es domaine fix et analyse compl mentaire l aide des ventilations Par recoupement des figures 3 et 4 le profil des doma
30. ndent diff rentes fa ons d extraire de l information des empreintes de fr quence th matis es l issue du processus nous avons obtenu d abord une liste r vis e de cibles lexicales avec limination des cibles sans variations domaniales remarquables dangereux d l t re mol culaire et raz de mar e Pour les cibles retenues nous disposons d une premi re qualification du nouveau sens partir d tiquettes de domaines chaque cible lexicale sont associ s un ou plusieurs domaines dans lesquels la cible s est diffus e de fa on significative Dans le cas o plusieurs domaines sont pr sents des coefficients leur sont affect s pour valuer l importance de la diffusion 6 Articulation du profil domanial en corpus au sens lexicographique Une fois les informations analys es en corpus il convient de les articuler l information s mantique ant rieure c est dire aux sens cod s dans des ressources lexicographiques Pour cela nous utilisons les d finitions d un dictionnaire le Tr sor de la Langue Fran aise informatis TLFi Dendien et Pierrel 2003 L articulation des informations textuelles et lexicographiques n cessite d tablir des correspondances entre les domaines propres chaque ressource puis d interpr ter les changements en corpus relativement aux sens cod s 6 1 tablir les correspondances entre domaines textuels et lexicographiques Pour mettre en parall le les informations du corpus avec les sens
31. oquant une pratique r gie par des principes scientifiques La derni re cible est tablette Les nouveaux emplois sont li s une innovation technologique la tablette num rique qui conna t mat riellement une diffusion de grande ampleur dans la soci t en 2010 et de fa on corr l e sur le plan linguistique une diffusion massive dans les discours e des cibles non n ologiques utilis es comme t moin Il s agit de raz de mar e temp te d l t re et dangereux Temp te et raz de mar e appartiennent au paradigme des ph nom nes m t orologiques comme tsunami Ils peuvent tre employ s au sens figur Les emplois m taphoriques de temp te sont particuli rement r pandus Ils permettent de qualifier des bouleversements importants De ce fait les domaines d emploi sont susceptibles de varier en fonction des v nements dominants de l actualit et de pr senter une volatilit d un domaine l autre qui pourrait tre le propre de tels emplois m taphoriques Dangereux et d l t re ont t choisis pour leux proximit s mantique avec toxique Le premier est d usage tr s r pandu l autre est plus rare Ils se distinguent par leur importance dans l usage par rapport laquelle toxique se situe de fa on interm diaire 5 Construction du profil domanial des cibles lexicales Pour tablir le profil d une cible lexicale en corpus en fonction des domaines nous proc dons en trois tapes v rification de l existence d une d
32. our l acc s au document et l exploration de son contenu Th se de doctorat Universit de Caen Basse Normandie Picton A 2009 Diachronie en langue de sp cialit D finition d une m thode linguistique outill e pour rep rer l volution des connaissances en corpus Un exemple appliqu au domaine spatial Th se de doctorat Toulouse 2 Rastier F 1987 S mantique interpr tative Paris PUF Rastier F Valette M 2009 De la polys mie la n os mie Le fran ais moderne 77 97 116 Rayson P Archer D Piao S amp McEnery T 2004 The UCREL semantic analysis system Workshop on Beyond Named Entity Recognition Semantic labelling for NLP tasks LREC 2004 7 12 Reutenauer C 2012 Vers un traitement automatique de la n os mie approche textuelle et statistique Th se de doctorat Universit de Lorraine Rey A 2008 De l artisanat des dictionnaires une science du mot Images et mod les Paris A Colin Sablayrolles J 2000 La n ologie en fran ais contemporain examen du concept et analyse de productions n ologiques r centes Paris Champion Salem A Lamalle C Martinez W Fleury S Fracchiolla B Kuncova A amp Maisondieu A 2003 Lexico3 Outils de statistique textuelle Manuel d utilisation Syled CLA2T Universit de la Sorbonne nouvelle Paris 3 Victorri B amp Fuchs C 1996 La polys mie construction dynamique du sens Paris Herm s Viprey J
33. peu pr s similaire dans plusieurs domaines Cette configuration t moigne d une diversification des domaines d emploi et potentiellement de la diffusion d un emploi m taphorique Ce cas se pr sente pour tsunami 5 domaines mergents tablette 4 domaines mergents et temp te 3 domaines mergents Le crit re d accroissement de diffusion permet donc d effectuer un premier tri entre les cibles globalement conforme aux connaissances pr alables sur les cibles et leur caract re n ologique deux exceptions pr s Trois des cibles pressenties comme n ologiques savoir toxique tsunami et tablette sont identifi es comme n ologiques En revanche mol culaire n est pas retenu bien qu il ait t pressenti comme n ologique Son emploi en gastronomie rel ve d un champ trop sp cialis pas suffisamment repr sent par rapport aux autres domaines De plus la diffusion n est pas suffisamment importante pour que les seuils de significativit soient franchis Les cibles t moins non n ologiques savoir dangereux d l t re et raz de mar e sont limin es par la proc dure conform ment aux attentes En revanche temp te n a pas t limin Une explication possible est que l accroissement est d aux emplois figur s de temp te et que les domaines saillants d pendent d v nements majeurs de l actualit Les observations Pour le choix du seuil nous avons repris le seuil de sp cificit propos par d faut par le log
34. pproche duale qui participe soit la d tection lorsque l attention se focalise sur la cible soit la caract risation lorsque l attention se focalise sur les domaines on tudie la diffusion de la cible x dans le domaine y ou l mergence du domaine y au voisinage de x Dans le second cas lorsqu on se focalise sur les domaines la perspective rejoint celle des approches cooccurentielles cela pr s que ce ne sont pas des unit s lexicales mais des domaines qui sont tudi s l analyse porte sur la distribution d entit s linguistiques au voisinage de la cible lexicale par rapport au reste du corpus L approche cooccurrentielle respecte deux contraintes particuli res lorsqu elle est articul e aux empreintes de fr quence th matiques d abord le niveau d observation est supra lexical au lieu de lexical car les observables sont les domaines qui apportent de l information s mantique plus g n rale et de granularit moins fine que les unit s lexicales ensuite le param tre temps fait partie int grante de l analyse Selon les hypoth ses de distributionnalit de Harris 1968 des entit s cooccurrentes c est dire partageant les m mes contextes ou encore qui pr sentent les m mes distributions dans l espace associ aux ressources linguistiques sont suppos es de sens proche Le parall le avec les approches cooccurrentielles renforce l argument selon lequel les empreintes de fr quence th matiques participent la qualific
35. que ou conomique que d autres domaines A ce stade les informations d livr es par les domaines ne permettent pas de pr ciser davantage le nouveau sens L information g n rique qu ils donnent n cessite d tre compl t e par des informations plus pr cises 1940 Article en acc s libre plac sous licence Creative Commons Attribution 2 0 http creativecommons org licenses by 2 0 SHS Web of Conferences 1 2012 Congr s Mondial de Linguistique Fran aise CMLF 2012 DOI 10 1051 shsconf 20120100304 SHS Web of Conferences aux auteurs publi par EDP Sciences 2012 7 Conclusion et perspectives Nous avons propos une m thodologie outill e pour qualifier la diffusion d un nouveau sens lexical en corpus Cette m thodologie a t tay e par des mesures statistiques et par le jeu sur diverses structurations de l espace textuel en fonction du temps de domaines d emploi et du voisinage de l unit lexicale cibl e L volution de sens a t d crite l aide de descripteurs g n riques les domaines Ceux ci ont servi d tecter l mergence du nouveau sens en discours le qualifier et articuler l information s mantique provenant des ressources textuelles avec le sens cod dans un dictionnaire Les tapes successives ont permis d obtenir des informations de plus en plus pr cises et structur es La diffusion temporelle d une cible lexicale dans de nouveaux domaines a d abord t analys e travers le contraste de
36. s analogies de premier niveau entre tiquettes de domaines Ainsi le domaine Arts du TLF1 est associ au domaine du corpus Arts et spectacles ART le domaine Economie du TLFi est associ Informations conomiques ECO le domaine Politique du TLFi est associ Politique et relations internationales POL e Des analogies de second niveau entre sous domaines des nomenclatures ou dans le cas des domaines du corpus avec les mots cl s des d finitions de chaque domaine Ainsi dans le corpus Mode de vie MOD est d fini par le mot cl loisirs Il est associ au domaine Loisirs du TLFi De m me SAN est associ Biologie 6 f ER Dans la base de donn es Factiva une note d information est associ e chaque domaine ou sujet Cette note pr cise le champ que recouvre le domaine Nous consid rons comme mots cl s les noms et adjectifs de ces notes d information Article en acc s libre plac sous licence Creative Commons Attribution 2 0 http creativecommons org licenses by 2 0 1939 Congr s Mondial de Linguistique Fran aise CMLEF 2012 SHS Web of Conferences 1 2012 SHS Web of Conferences DOI 10 1051 shsconf 20120100304 aux auteurs publi par EDP Sciences 2012 Environnement ENV est associ Sciences de la terre et Biologie la d finition fournie par le corpus pr cise que les documents de ce domaine abordent des questions de risques pour la sant Dans certains cas ces crit res ne suffi
37. sent pas et n cessitent des connaissances externes compl mentaires Ainsi Science et technologie SCT est associ aux domaines du TLFi Astronomie Chimie Information Math matiques Physique et Sciences de la terre Soci t SOC est associ Droit Ethnologie Philosophie et Religion Une fois l appariement r alis les domaines pr sents dans les d finitions des cibles peuvent tre reli s aux domaines du corpus cf figure 6 ce stade nous observons seulement les domaines qui apparaissent ventuellement dans les entr es de chaque cible lexicale sans prendre en compte l existence de d finitions non d pendantes de domaines Les correspondances sont propres aux sens cod s donc aux anciens sens ind pendamment des sens mergents Elles r sultent des informations des dictionnaires comme Comp Domaines des d finitions Domaines de niveau principal Domaines correspondants Pharmacologie Physiologie Figure 6 Appariement des domaines des d finitions aux domaines du corpus 6 2 Analyse du nouveau sens en termes d enrichissement et de reconfiguration des domaines d emploi L information relative aux anciens sens est articul e l information obtenue en corpus La figure 7 pr cise le type de nouveau sens en fonction des domaines mergents en corpus ainsi que les domaines sp cifiques et l existence de d finitions non domanialis es emplois g n raux m taphoriques etc D Corpus Dictionnaire Hypoth
38. ser pass du domaine de l assurance des emplois g n raux Viprey et Schepens 2010 L importance des informations g n riques telles que les domaines dans le ph nom ne de n ologie s mantique appara t galement chez Sablayrolles 2000 En effet les proc d s l origine de la n ologie s mantique sont essentiellement des figures de style notamment des m taphores ou des m tonymies Or celles ci reposent sur des transgressions qui se situent un niveau g n rique que ce soit entre domaines ou champs s mantiques Rastier 1987 Les informations g n riques telles que les domaines ne fournissent pas une information exhaustive sur le changement de sens mais elles jouent un r le fondamental De ce fait dans nos exp riences le changement de sens sera d crit exclusivement l aide de domaines Par ailleurs divers travaux ont mis au jour des indices adapt s pour appr hender la n ologie s mantique dans un contexte applicatif Les indices de n ologie s mantique peuvent tre exploit s sous deux angles et contribuer principalement la d tection d un nouveau sens indices tels que les guillemets cf Bauer et Renouf 2000 ou sa qualification Les indices qui contribuent la qualification du nouveau sens sont notamment les cooccurrents lexicaux sur l axe syntagmatique et sur l axe paradigmatique les concurrents issus du foisonnement n ologique par exemple le triplet manageur d cideur directeur Cusin Berche
39. ses by 2 0 1937 Congr s Mondial de Linguistique Fran aise CMLF 2012 SHS Web of Conferences 1 2012 SHS Web of Conferences DOI 10 1051 shsconf 20120100304 1938 aux auteurs publi par EDP Sciences 2012 profil diff re ce qui donne une impression d anarchie au niveau de l volution de l ensemble des domaines Au niveau de la ventilation tout comme pour tsunami il y a stabilit pour ENV SCI et SAN tandis que les autres domaines connaissent des variations nettes dans la ventilation ECO Informations conomiques et POL Politique voluent de domaines fortement sous repr sent s vers les domaines les plus fortement surrepr sent s avec un basculement respectif en 2008 et 2007 SOC Soci t reste parmi les domaines aux sp cificit s les plus faibles l inverse ART Arts et spectacles s efface de fa on spectaculaire passage progressif du premier au dernier rang Par recoupement des deux axes d analyse 1l y a apparemment mergence progressive de deux domaines ECO et POL qui apparaissaient d j ans les r sultats sur deux p riodes disjointes Cependant le manque de stabilit dans la ventilation et les irr gularit s d volution similaires celles de tsunami pourraient tre l indice d un comportement caract ristique des emplois m taphoriques volution domaine fix de 2004 2010 volution des ventilations de 2004 2010 Arts et spectacles Binformations conomiques Environnement
40. ternationale a t restreinte une s lection de journaux francophones et de th matiques ainsi qu une p riode donn e Les sources s lectionn es sont les journaux Lib ration Le Figaro L Humanit Ouest France La Tribune Les Echos et L Expansion Les th matiques sont les suivantes informations conomiques ECO arts et spectacles ART environnement ENV mode de vie MOD politique relations internationales POL sant SAN science et technologie SCT soci t communaut travail SOC Ces th matiques 1 La plateforme Semy est une plateforme d annotation s mantique qui enrichit les corpus en informations extraites du Tr sor de la Langue Fran aise informatis Elle est dot e de modules lexicom triques permettant d effectuer des calculs statistiques dont le calcul des sp cificit s Elle fait partie de ressources internes encore en d veloppement et n est actuellement pas en libre diffusion 1930 Article en acc s libre plac sous licence Creative Commons Attribution 2 0 http creativecommons org licenses by 2 0 SHS Web of Conferences 1 2012 Congr s Mondial de Linguistique Fran aise CMLF 2012 DOI 10 1051 shsconf 20120100304 SHS Web of Conferences aux auteurs publi par EDP Sciences 2012 sont choisies parmi les sujets int gr s au moteur de recherche de Factiva Nous les qualifierons par la suite de domaines Le corpus s tend de 2004 2010 il est subdivis en tranches annuelles
41. x L innovation lexicale Paris Honor Champion 125 147 Cusin Berche F 2003 Les mots et leurs contextes Paris Presses Sorbonne Nouvelle Dendien J amp Pierrel JM 2003 Le Tr sor de la Langue Fran aise informatis Un exemple d informatisation d un dictionnaire de langue de r f rence TAL 44 2 11 37 Grzesitchak M 2008 Annotation s mantique profilage textuel et lexical Lexicographie et informatique bilan et perspective colloque l occasion du 50 anniversaire du projet du Tr sor de la Langue Fran aise Nancy Harris Z 1968 Mathematical Structures of Languages New York John Wiley and Sons Article en acc s libre plac sous licence Creative Commons Attribution 2 0 http creativecommons org licenses by 2 0 1941 Congr s Mondial de Linguistique Fran aise CMLEF 2012 SHS Web of Conferences 1 2012 SHS Web of Conferences DOI 10 1051 shsconf 20120100304 aux auteurs publi par EDP Sciences 2012 Kilgarriff A Rychly P Smrz P amp Tugwell D 2004 The Sketch Engine Euralex 105 116 Lafon P 1984 D pouillements et statistiques en lexicom trie Gen ve Paris Slatkine Champion Lemnitzer L amp Ule T 2011 Die Wortwarte auf der Suche nach den Neuwoertern von morgen Rapport technique Berlin Brandenburgische Akademie der Wissenschaften URL http www wortwarte de Perlerin V 2004 S mantique l g re pour le document Assistance personnalis e p
Download Pdf Manuals
Related Search
Related Contents
User's Guide - MediaSolution Eaton Basic ePDU IEC60309 16xC19 32A 3m 79 Series Service Equipment Le store pare-soleil AMZ Solar Z-Wave RESPIRATION DU POISSON ROUGE Manuel d`installation de Business Object Rich Client Nominal Accounting Software User Guide Copyright © All rights reserved.
Failed to retrieve file