Home

Eye of the Tagger - Sébastien Laborie

image

Contents

1. Les outils de visualisation la carte la frise chronologique et l affichage des themes Lote POCO Bao ET opas on Sie Resa ni span A A 3 3 3 4 4 4 4 2 PS Em Orsantsati n du DO E E E coi oiea Conception et programmation e eee eee e eee ee eee esee eoe eesescsees OF DAS OMS CS Se GUC CES 2 5250 0250600 0395960 09 999 9180069905998 00 0000 EO EE EA aE bip URP DDUD ESO pcOd OR CU ariaa MaMa Sy PC OO e Poo A A 4 2 1 OR GS UNS aia 4 2 2 Pere JU I CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste 23 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 NEED P 5 40 4 3 1 IRA ULIS REESE 40 4 3 2 UNIT AT q A E E EE A E E E E N EEEE 40 4 3 3 RO E S ete 40 4 3 4 COCO GDS Re T E 41 4 3 5 ANI E PO E E A EEE 41 4 3 6 CHAF L La 41 5 Perspectives et DA sens seen esse ses sense AA o On ee ee T 42 De US CCS ag xc are ase cscs eects eaters UI ves cease ene A e MI UNIT DUE ERES 43 O PROS UT ACE PR EE Te CROSS ium 40 S VWeODOPLEADII orto eU Table des illustrations c cce ee eee eee ee ee ere ee ee eee eee eoeoeese os 48 CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste DUT Info
2. cette tude une nouvelle difficult est apparue puisque cet outil n a qu un seul format de retour le Json voir Langage et Technologie Partie 4 3 Il a donc fallu que nous trouvions un moyen de convertir cette r ponse en XML CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 24 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 afin de pouvoir l int grer notre application et ainsi tester l int gration de la frise chronologique qui avait t d velopp e entre temps Pour ce faire nous avons cherch de nombreuses m thodes et solutions notre probl me mais la plupart des solutions trouv es sur Internet forum comme Developpez ou commentcamarche s apparentaient plus du bricolage et ne nous fournissaient pas le rendu esp r Apr s plusieurs essais de diff rentes m thodes nous avons t contraints de choisir un module d extension Php appel PEAR voir Langage et Technologie Partie 4 3 qui contient notamment le package XML Serializer lui m me constitu de diff rentes classes et permettant relativement simplement de convertir une structure de donn es Php de type Array tableau de donn es en un objet XML de type SimpleXML Il faut savoir qu il existe galement une fonction Php json decode permettant tr s simplement de convertir du Json en un tableau de donn es Cependant l utilisation de ce packa
3. Les limites de notre projet sont tablies par le fait que pour d velopper notre application nous nous appuyons sur l utilisation de services web en tant que simples clients Nous sommes donc enti rement d pendants de ces services ainsi que de leurs performances et qualit s de r sultats respectives Seuls des textes pourront tre analys s par notre application et seule l int gration de deux outils nous est demand e Notre but est de mettre en place une structure qui soit la plus modulaire possible afin de pouvoir y int grer tr s simplement de nouveaux outils ou interfaces de visualisation CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 12 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 2 Analyse Fonctionnelle 2 1 DIAGRAMME DE CAS D UTILISATION DCU Lors de notre premiere rencontre avec nos commanditaires nous avons pu pr ciser ce que nous avions compris du sujet et ainsi d gager un cas d utilisation CU principal savoir faire analyser son texte par l outil de Reconnaissance d Entit Nomm e REN de son choix et en faire ressortir les Entit s Nomm es EN d tect es En consid rant un CU comme un ensemble d tapes passer afin de tirer profit d une des fonctionnalit s d un systeme nous avons d cid de d tailler notre CU principal par une inclusion CU obligatoire qui est la saisie de ce texte En effet cet tap
4. semblable GeoMediaTagger int grant un ou deux outils parmi ces 9 Cicero Lite ES CALAIS gt Alchemy AP Powered by Thomson Reuters AlchemyAPI CICEROLITE OpenCalais http www alchemyapi com http www languagecomputer com http www opencalais com GATE general architecture Lor text engineering ANNIE A Nearly New IE ANNIE HeidelTime SIANDFORD NER http gate ac uk ie annie html http dbs ifi uni heidelberg de http nlp stanford edu CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 6 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 BBroccoli N E R D YAHOO NAMED ENTITY RECOGNITION AND DISAMBIGUATION BOSS Broccoli NERD Yahoo BossPlaceSpotter http broccoli informatik uni freiburg de http nerd eurecom fr http developer yahoo com boss geo Figure 6 tableau d outils de R E N Open Source Les enjeux sont dans un premier temps d tudier ces 9 outils afin de mettre en vidence le ou les outils un ou deux qui r pondent le plus aux besoins des commanditaires Cette s lection se fera donc en fonction de crit res de qualit de service et de format de r ponse et sera valid e par les commanditaires lors de r unions Pour les outils retenus il faudra centraliser leur acc s depuis un m me site internet et ainsi permettre l utilisateur de choisir l outil avec lequel il veut ana
5. Sc narios r els CU Fournir un texte a analyser CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 20 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 2 4 DEROULEMENT DE L APPLICATION Apres avoir produit deux versions simplifi es du sch ma de d roulement g n ral de l application nous avons produit la derni re version incluant tous les traitements que voici Sch ma V3 D taill du d roulement de l application EOTT Eye Of The Tagger D coup en vues r sultat visuel pour l utilisateur et en tapes de traitements VUE 3 OPTIONNEL L gende Principales tapes de traitements EA Outils et modules utilis s mi Description de la vue correspondante Transitions obligatoires gt Transitions optionnelles E Ex Fichiers et formats manipul s a Seulement si Seulement si l outil utilis ne fournit pas E r uu toutes les informations n cessaires l outil utilis ne m la constitution d une r ponse XML retourne qu une s conforme au Format Pivot r ponse au format Json et non XML Figure 18 Sch ma d taill du d roulement g n ral de l application V3 CATANESE ANTOINE DULON JEREMY LAGREOU MARC SABUCO BAPTISTE Page 21 sur 48 DUT Informatique Projet N 7 Eye Of
6. convertir convertit Si v rification non conforme d Fichier conforme Sauvegarde du fichier au format pivot Si telecharger 9 Telecharger reponse au format origina Si visualiser Visualiser at pivot Ke Annotation des informations 4 4 Interaction avec les differents modules Si retour tape pr c dente Retour tape pr c dente Si r initialiser Reinitialiser Reinitialisation de l applicatio Deconnexion de l application Figure 24 Diagramme de S quence d taill Partie 2 CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 36 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 4 2 LANGAGES ET TECHNOLOGIES 4 2 1 Langages utilis s CSS Cascading Style Sheets est un langage qui sert d crire la pr sentation des documents HTML et XML Il permet d appliquer un style aux pages web et de g rer s par ment la forme du contenu Nous l avons utilis pour structurer la page c est dire positionner les l ments o on le souhaite Le CSS nous a permis de mettre en forme notre application php HyperText Preprocessor plus connu sous son sigle PHP Acronyme r
7. du sc nario nominal 1 L utilisateur choisit de lancer l analyse sans avoir renseign de texte analyser 2 Le syst me signal l utilisateur qu il n a pas saisi de texte et lui propose de r initialiser l application ou de revenir en arriere afin de r cup rer un ventuel texte renseign pr c demment 3 L utilisateur revient l tape pr c dente 4 Le syst me affiche le dernier texte saisi Le syst me reprend au point du sc nario essentiel d taill du CU Fournir un texte a analyser CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 17 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 E3 Conversion au format pivot non valid e L enchainement E3 d marre au point 10 du sc nario nominal 10 Le syst me ne valide pas le format de la r ponse 11 Le syst me signale l utilisateur qu un probl me s est produit lors de la conversion au format pivot 12 Le syst me propose le t l chargement de la r ponse au format original de revenir l tape pr c dente ou de r initialiser l application 13 L utilisateur revient l tape pr c dente 14 Le syst me affiche le dernier texte saisi Le syst me reprend au point du sc nario essentiel d taill du CU Fournir un texte a analyser Une fois les sc narios essentiels d taill s finalis s nous avons produit les sc narios r els afin de pouvoir clairement id
8. narios r els du CU Fournir un chemin local Le sc nario nominal reprend au point 4 A3 L utilisateur importe un texte depuis une URL apr s en avoir saisi un manuellement L enchainement A3 d marre au point 5 du sc nario nominal 5 L utilisateur clique sur l onglet Saisir URL 6 Lesyst me ne conserve pas la saisie en cours Voir sc narios r els du CU Fournir une URL Le sc nario nominal reprend au point 4 A4 L utilisateur importe un texte depuis sa machine apr s en avoir saisi un manuellement L enchainement A4 d marre au point 5 du sc nario nominal 5 L utilisateur clique sur l onglet Importer texte 6 Lesyst me ne conserve pas la saisie en cours Voir sc narios r els du CU Fournir un chemin local Le sc nario nominal reprend au point 4 Texte analyser Nous sommes le Groupe de Projet num ro 7 qui se constitue d Adrien Neto qui est originaire du Gers Antoine Catanese qui est originaire de la banlieu parisienne Mehdi Besse qui vient de Casablanca au Maroc et Baptiste Sabuco qui lul vient de Bordeaux Nous sommes tudiants l IUT de Bayonne dans les Pyr n es Atlantiques Nos commanditaires pour ce projet tutor sont M Christian Sallaberry et M Albert Royer tous deux chercheurs l UPPA Universit de Pau et des Pays de l Adour Nos tuteurs sont M Cristophe Marquesuzaa et M Sebastien Laborie tous deux enseignants chercheurs l IUT de Bayonne Figure 17 Maquette VUE 1
9. 1 3 Promotion 2013 2014 GeoMediaTagger poss de comme nouvelles fonctionnalit s de d tecter les themes et les dates qui sont galement repr sent es sur une frise Cette version permet en outre d annoter manuellement non seulement du texte mais galement des photos Suite au d veloppement de ces deux applications et dans une volont d aller plus loin dans la conception et l impl mentation d un outil web de reconnaissance d entit s nomm es REN nos commanditaires ont exprim le besoin de disposer d une application web regroupant plusieurs outils existants de REN afin de pouvoir comparer leur outil dans le but de l enrichir et de le perfectionner C est donc dans le cadre de notre projet de fin de cycle qu il nous a t demand de concevoir et d velopper une solution leurs besoins appel e Eye Of The Figure 5 Logo de application Tagger Figure 5 Eye Of The Tagger Pour ce faire nous sommes accompagn s de Monsieur Christophe MARQUESUZAA et Monsieur S bastien LABORIE en qualit de tuteur Ils tous deux enseignants chercheurs et ma tres de conf rences en informatique l IUT de Bayonne et du Pays Basque mais galement membres de l quipe T2i de LIUPPA 1 2 ENJEUX Suite la s lection par nos commanditaires d outils open source de REN Figure 6 qu ils consid rent comme tant les plus pertinents pour leurs recherches ils nous ont demand de r aliser une application sous la forme d un site web
10. Extensible Markup Language est un m talangage formalisme con u pour d crire un langage informatique de balisage g n rique Il sert essentiellement stocker et ou transf rer des donn es de type texte structur es en champs arborescents CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 46 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 8 Webographie API Google Maps https developers google com maps documentation javascript v2 https developers google com maps documentation javascript reference API Chap Links http almende github com chap links library JavaScript http javascript developpez com JQuery http jquery com PHP www php net SIMILE http simile mit edu http www simile widgets org timeline Wikipedia http fr wikipedia org wiki Service_Web http fr wikipedia org wiki PHP http fr wikipedia org wiki JavaScript http fr wikipedia org wiki JQuery http fr wikipedia org wiki Xml http fr wikipedia org wiki XPath http fr wikipedia org wiki Resource_Description_Framework http fr wikipedia org wiki SPARQL http fr wikipedia org wiki Interface de programmation http www dicodunet com definitions google api google map htm http fr wikipedia org wiki NetBeans http fr wikipedia org wiki Notepad 2B 2B http www w3 org RDF Validator XML XSLT XPATH http slaborie perso univ pau fr in
11. Final 1 3 Promotion 2013 2014 Cette vue propose galement deux liens permettant l utilisateur de r cup rer son texte analys au format original ou pivot Enfin l utilisateur pourra cette tape demander la visualisation des entit s spatiales et temporelles d tect es dans son texte sur une carte et une frise Ce dernier choix conduira au d clenchement de l tape 4 du sch ma de d roulement de l application Figure 9 qui fournira ainsi la troisi me et derni re vue Figure 12 A Web Page OD X A D R initialiser l application Texte analyser avec Alchemy API Personnes Nous sommes EI qui se constitue d Adrien Organisa E TF igure 12 Troisi me vue de l application Elle se d coupera en quatre zones contenant respectivement le texte surlign de la vue pr c dente une carte contenant les entit s spatiales d tect es une frise contenant les entit s temporelles enfin une zone de texte contenant le reste des entit s d tect es tri es par th me 1 5 CONTRAINTES NON FONCTIONNELLES Afin d accroitre la robustesse de notre application nous la d velopperons selon les r gles du Mod le Vue Contr leur MVC l aide d un Framework que nous n avons pour l heure pas encore d termin En outre tant donn e l utilisation par notre application de services web relativement lourds services de REN services d annotation de cartes ou de frises 11 nous a t sugg r d utili
12. Lagreou Ils se sont tr s bien int gr s au projet pourtant pas vident maitriser Marc qui tait sur un projet totalement diff rent d veloppement d une application Android a eu un peu plus de mal trouver sa place mais a finalement pris en charge l ancien r le d Adrien et Mehdi en reprenant les bauches de structures existantes et ainsi constituer un corps et une interface l application CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 33 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 J r my quant a lui a t tr s b n fique l quipe puisqu il manipulait des outils de cartographie et de frises chronologiques dans son pr c dent projet et que pr cis ment nous r fl chissions aux diff rentes APIs existantes afin d en int grer notre application Il a pu prendre en main cette partie du d veloppement en int grant l application une carte voir 3 2 3 1 La carte partir de l API Google Maps et une frise chronologique voir 3 2 3 2 La frise partir de l API SIMILE outils qu il utilisait d j et qu il a donc apport s au projet Nous avons galement d cid afin de tenter de corriger les probl mes d organisation de changer de chef de projet et ainsi de nommer J r my afin qu Antoine puisse se consacrer 100 aux diff rents aspects techniques qu il ma trisait le mieux ainsi qu la lourde t che
13. POST pos pos 59 lt pos gt lt lengihe10 lt leagth gt ind ne temporal entity lt Jentity gt 19 03 2014 20 03 2014 19 03 2014 Figure 22 Exemple de fonctionnement de SIMILE Timeline 3 2 4 La mise en page Bootstrap Afin de r aliser la mise en page de cette application web nous avons d abord commenc par faire des maquettes afin de comprendre ce que les commanditaires voulaient en termes d interface et de charte graphique Une fois ces maquettes valid es nous avons commenc mettre en place cette interface classiquement gr ce aux feuilles de style CSS Seulement au cours du d veloppement de l application nous avons rencontr des difficult s de mise en place car les modules tels que le module d affichage de la carte ou encore le module d affichage des themes avec ChapLinks demandaient des param trages CSS complexes Nous avons donc d cid d utiliser Bootstrap qui est un framework CSS cr par la soci t Twitter Ce framework int gre d j plusieurs outils basiques qui permettent la mise en forme de composants simples comme par exemple des formulaires ou encore des boutons De plus Bootstrap permet de mettre en place le design d un site web plus simplement car ce framework fonctionne avec un syst me de rangs et de colonnes et permet de redimensionner les colonnes selon la taille de la fen tre afin de l adapter la r solution de l utilisateur L autre avantage d utiliser ce framework est qu il est possible de l
14. adapt e au d veloppement de petits projets s appuyant sur des technologies nouvelles ou non maitris es repose essentiellement sur la communication rapide et r guli re entre les sous quipes de toutes les volutions du projet En effet au moment de la r partition des t ches chaque quipe se sp cialise sur une probl matique pr cise et r duite du projet Puis suite une premi re analyse concise du probl me elle d veloppe directement un premier prototype Une fois que la faisabilit du module est prouv e par la pr sentation au reste de l quipe de ce prototype fonctionnel le module est int gr la structure de l application et l quipe s attaque alors au probl me suivant En r sum cette m thode de d veloppement au cycle de vie it ratif et incr mental repose sur une sp cialisation des r les une formalisation de processus l gers une architecture de r alisation imbrication des it rations une forte utilisation des r unions et moyens de communications par une organisation r guli re de diff rents types de r unions technique organisationnel afin de maintenir une coh sion entre les membres du projet et faire en sorte que chacun soit en quasi temps r el mis au courant de l avanc e du projet CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 22 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 3 2 RECHERCHE ET DEVELOP
15. cursif est un langage de scripts libre principalement utilis pour produire des pages Web dynamiques via un serveur HTTP mais pouvant galement fonctionner comme n importe quel langage interpr t de facon locale en ex cutant les programmes en ligne de commande PHP est un langage imp ratif disposant depuis la version 5 de fonctionnalit s de mod le objet compl tes En raison de la richesse de sa biblioth que on d signe parfois PHP comme une plate forme et non plus comme un simple langage Source http fr wikipedia org wiki PHP Nous avons utilis le PHP pour g rer les actions entre les diff rentes pages de l application et pour automatiser les t ches Quelques fois abr g JS JavaScript est un langage de programmation de scripts principalement utilis dans les pages web interactives mais aussi c t serveur C est un langage orient objet prototype c est dire que les bases du langage et ses principales interfaces sont fournies par des objets qui ne sont pas des instances de classes mais qui sont chacun quip de constructeurs permettant de cr er leurs propri t s et notamment une propri t de prototypage qui permet d en cr er des objets h ritiers personnalis s Source http fr wikipedia org wiki JavaScript Le Javascript nous a permis entre autres d utiliser diverses API qui seront cit es plus loin dans le rapport De plus ce langage nous a permis de dynamiser nos interface
16. d velopp e en programmation orient e objet et que des classes soient faites car pour le moment nous m langeons programmation proc durale fonction Php classique et programmation objet avec l utilisation des outils de REN classes Php fournies par les quipe de d veloppement respectives des outils utilis s ou la manipulation du XML objet Php DOMDocument et DOM Xpath ainsi que l utilisation des APIs JavaScript Ainsi voici une proposition d volution vers une application orient e objet partir de ces diagrammes de classe Afin de repr senter l application sous forme de classe nous avons labor une premi re version Entite spatial type string 55 type string coordonnes string pertinence number libell strina Ad n Composer 1 Entite temporel fou Outi Er r analyser type convertisseur Composer ne nom string 1 1 r ss type string ne n libelle string nT pe string PUN Composer Entite thematique pertinence number os nom string Figure 25 Diagramme de classe V1 Ainsi un Analyseur se compose d un convertisseur caract ris par un nom et du type de format accept pour la conversion et d un outil de d tection d entit s caract ris par son nom Un Analyseur analyse un texte Un texte est analys par un analyseur et est compos d une ou plusieurs Entit s Entit s spatial Entit s temporel Entit s th matique Puis au cours du semestre 4
17. es lieux dates noms de personnes CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 8 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 Elle proposera galement l utilisateur de pouvoir t l charger la r ponse aux formats bruts de l outil choisi XML JSON RDF ou dans le format pivot mais galement de pouvoir faire apparaitre au moyen de puces sur une carte et une frise les lieux et dates d tect s D coup en vues r sultat visuel pour l utilisateur et en tapes de traitements VUE 2 A la fin de l tape 5 A la fin de l tape 4 Visualisation du texte A la fin de l tape 1 Visualisation du texte balis et balis et visualisation des Visualisation du texte possibilit de t l charger le ou entit s nomm es sur une fourni et de l outil choisi les fichiers de r ponse carte et une frise Possibilit de revenir l tape 1 Possibilit de revenir I sun Principales tapes gt Outils et modules utilis s Transitions obligatoires ae Transitions optionnelles 1 4 CONTRAINTES FONCTIONNELLES En termes de crit re ergonomique il nous a t pr cis que chaque cran ou vue de l application devra tenir sur une page c est dire sans avoir utiliser de barre de d filement Il nous a aussi t impos que l utilisation de l application se d roule en trois tapes distinctes tr
18. et d un module de conversion d montre la modularit de notre application Ce crit re tait d ailleurs primordial comme nous l avons vu dans les contraintes fonctionnelles voir Contraintes fonctionnelles 1 4 3 2 2 Le format pivot Afin de constituer un format pivot format standard r pondant aux exigences des commanditaires tout en int grant un maximum d informations venant de sources diff rentes nous nous sommes tout d abord appuy s sur un premier sch ma appel mod le pivot fourni par les commanditaires et labor partir de nos premiers appels d Alchemy API Nous l avons enrichi au fur et mesure de l avanc e du projet en fonction de nos besoins ou des nouvelles exigences de nos commanditaires puis traduit en anglais afin d internationaliser le code Le modele pivot fourni par nos commanditaires n tait qu une bauche suffisamment toff e pour nous indiquer la voie suivre Celui ci permettait la prise en compte de deux types d entit s spatiale et autres pour les visualiser sur une carte ou sous forme d un arbre Ce premier mod le nous a permis de prendre en main le processus de conversion et ainsi de produire un premier prototype de convertisseur conforme aux restrictions impos es par le mod le pivot CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 25 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 Cepend
19. le plan relationnel ce projet nous a tout d abord montr l importance d une communication r guli re avec les commanditaires et les tuteurs en effet cela a permis au groupe de garder clairement l objectif en t te mais galement de v rifier chaque nouvel avancement si nos choix taient pertinents et si des rectificatifs taient n cessaires Nous avons galement eu l occasion d tre confront s aux diff rents probl mes de restructuration qui apparaissent r guli rement dans le milieu professionnel Cette situation particuli re et relativement peu courante dans le cadre de projets de synth se a entrain comme vue plus haut la reconstitution d une quipe partir de trois morceaux d quipes Il nous a fallu communiquer nous transmettre les informations et nous r organiser rapidement en milieu d ann e afin de ne pas mettre en p ril le projet Nous avons fait preuve cette tape d une motivation qui a permis l int gration de deux membres nouveaux et l avanc e du travail Nous sommes conscients de la rigueur et du s rieux dont a fait preuve notre chef de projet dans ce contexte malgr ses difficult s de gestion et d organisation Il tait essentiel qu il ait et conserve une vision globale du projet Comme nous l avons vu notre projet d coule de la volont de nos commanditaires de poss der un outil regroupant plusieurs outils de REN et ainsi dispos d une base de test pour leurs propres travaux De par sa nature notr
20. nous avons eu un cours sur les design patterns ce qui nous a sembl coh rant avec les besoins de notre application Nous avons donc labor une deuxi me version du diagramme de classe CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 43 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 amp outil Outil convertisseur Expression Litteral airin analyser E DE MH dk nom string nom string be string D dk Entite spatial Entite temporel Entite th matique type string type string pertinence number 55 type string Ss type string libelle string coordonnes string libell string pertinence number libelle string Figure 26 Diagramme de classe V2 Dans cette version 2 nous avons d cid de le mod liser par le mod le composite des design patterns Nous avons gard la m me structure que la version 1 la diff rence pr s que nous avons introduit une classe Expression Litt ral dont la classe texte h rite De plus les entit s deviennent des sp cifications de la classe Texte Nous avons pas eu l occasion de proposer ces diagramme un enseignant ce qui signifie que nous ne sommes pas certain de leur justesse Pour finir nous pouvons dire que cette exp rience fut certes par moments difficile mais elle nous a appris g rer les probl mes qui se pr sentaient aussi bien t
21. 0 21 10 28 10 04 11 11 11 18 11 25 11 02 12 09 12 16 12 06 01 13 01 20 01 27 01 03 02 10 02 17 02 24 02 03 03 10 03 17 03 24 03 31 mars e PHASE 1 PHASE 2 PHASE 3 PHASE 4 PHASE 6 Recettes et P les t ch PHASE 5 Principales t ches X X X X X X X X X X X X X X X X X X Veille technologique tude pr liminaire des outils propos s tude des diff rents langages utiliser rise en main des outils s lectionn s Z gt lt gt lt EN tt plo UN C ab e ge ji e gt ec a C ES c C C Un O em UN O O 5 B Un p z 2 X X A e 7 A laboration d un format standard de sortie Baptiste lap EU Nn x D 0 Ze m3 a 8 3 O 2S d e i a e mm dE E 9 a O O mat a O C a O UN S O ec O un e to c I 3 O lt jas panem c O jew A Al x XK Min 4 m AI4 4 m X Z C Sh e S 5 e d e A A A Ip lt Q o 2 19 2 E o S Jj amp e qe s O O IS a s a o SE zZ an A A yA A A A cix O lt O O B O gt ar a ec z Dy eo O o e E N e ga O ex ec ur O Pes or O E d en Eh C O en p p z b3 XML retourn nt gration du module et tests unitaires orrection des bugs relev s pendant les tests D veloppement du module de repr senta
22. DUT Informatique Promotion 2013 2014 PAYS DE L ADOUR PROJET N 7 INTERFACE WEB POUR DES SYSTEMES EXISTANTS DE RECONNAISSANCE D ENTITES NOMMEES RAPPORT FINAL DE REALISATION 1 3 Equipe de projet CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Commanditaires M SALLABERRY Christian M ROYER Albert Tuteurs M LABORIE S bastien M MARQUESUZAA Christophe DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 Remerciements NOUS TENONS A REMERCIER TOUTES LES PERSONNES QUI NOUS ONT AIDES AU COURS DE NOTRE PROJET ET EN PARTICULIER M Christophe Marquesuzaa notre tuteur qui s est rendu disponible tout au long de notre projet afin de r pondre nos questions et nous donner de nombreux conseils avis s M S bastien Laborie notre tuteur pour le temps pass nous conseiller et r pondre nos nombreuses questions sur les langages nouveaux pour nous en particulier le XML et les requ tes XSLT Nos commanditaires M Albert Royer et M Christian Sallaberry pour la richesse du projet propos et leur disponibilit M Thierry Nodenot pour nous avoir rapidement mis en place un espace de travail sur le serveur Erozate Le groupe de projet de GeoMediaTagger Mathieu Capdeville Corentin David L o Dumouch pour la documentation ainsi que le code source fourni qui nous a permis de gagner du temps sur nos phases d analyse et de
23. PEMENT 3 2 1 tude de faisabilit les outils de R E N Comme nous l avons vu dans les enjeux Partie 1 2 Figure 6 les commanditaires nous ont fourni en d but de projet une liste d outils de REN pr s lectionn s par leurs soins en fonction de leurs performances Dans un premier temps nous avons donc d les tudier afin d en s lectionner deux Nos crit res de s lection ont d abord t la possible utilisation de l outil depuis une application tiers ou en d autres termes savoir s il s agit d un service web ou d une simple application En effet CiceroLite ou encore Broccoli ne peuvent tre utilis s que depuis les sites originaux et ne sont donc pas exploitables depuis une autre application Le deuxi me crit re et non des moindres est de pouvoir utiliser ces services web depuis une application web d velopp e en Php un langage de programmation sp cifique au web voir partie 4 3 Langages et technologies Nous avons donc d retirer de notre liste le service ANNIE de Gate ainsi que le service Stenford Ner qui ne proposent qu un environnement de d veloppement Java et sont donc inexploitables aux vues de nos objectifs Un autre outil HeidelTime ne r pond pas compl tement nos besoins puisqu il ne d tecte que les entit s temporelles Etant donn que notre application est un outil de d tection d entit s spatio temporelles et th matiques cet outil n est pas assez complet et a donc t lui aussi sup
24. The Tagger Rapport Final 1 3 Promotion 2013 2014 3 Gestion de projet 3 1 DEMARCHE DE DEVELOPPEMENT La premiere quipe mise en place pour r aliser ce projet pr sentait des caract ristiques int ressantes puisque qu elle rassemblait des profils tr s diff rents En effet certains membres moins performants en analyse et programmation pure compensaient par de r elles qualit s de designers et ergonomes Nous avons donc d cid de tirer profit de cette situation en scindant l quipe La premi re sous quipe ayant plus de capacit s techniques a t affect e aux t ches de recherche et d veloppement la deuxi me poss dant davantage une fibre artistique s est charg e de la partie graphique c est dire du design et de l IHM Interface Homme Machine XN Nous avons d prendre tr s t t en compte une contrainte forte savoir l utilisation des outils existants de REN Reconnaissance d Entit s Nomm es Cette contrainte nous obligeant nous adapter aux outils disponibles nous avons d mettre tout de suite en place des tests de faisabilit afin de d terminer si l outil pr s lectionn r pondait bien nos besoins et correspondait nos attentes Dans cette optique nous avons d cid d utiliser une m thode de d veloppement appel e RAD2 Rapid Application Developpement et appartenant la famille des m thodes de G nie Logiciel GL dites m thodes AGILE Cette m thode particuli rement bien
25. aissait assez simple utiliser puisqu elle avait d j servi lors du projet pr c dent et que le r sultat tait dans l id e que nous nous faisions d une frise chronologique Durant notre phase de recherche sur cet outil nous avons galement pens utiliser Simile Timeline car J r my qui tait arriv dans notre projet en milieu d ann e l avait utilis dans son projet pr c dent Apres r flexion il nous a sembl plus facile d utiliser le widget de Simile puisque l un des participants avait d j utilis cet outil Mais il est toujours possible de remplacer cette Timeline par celle de Chap Links CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 28 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 Dans le fichier pivot que nous utilisons les entit s temporelles se pr sentent ainsi Grace l outil Simile nous pouvons afficher des v nements ponctuels repr sent s par les points ou bien des v nements qui s effectuent sur la dur e repr sent s par des rectangles bien que TextRazor ne reconnaisse pas les v nements comme La lt pelevance gt 0 100375 lt relevance gt o Deuxi me Guerre Mondiale en tant qu un v nement Pourtant SXiext 725 03 2014 1ext uu si un outil de reconnaissance d entit s nomm es est susceptible posiions ae de retourner il sera possible d afficher ce type d entit
26. aliser l application 14 L utilisateur choisit de visualiser les entit s nomm es Voir sc narios essentiels d taill s du CU Visualiser les Entit s Nomm es Post conditions Enchainements alternatifs Al T l chargement de la r ponse originale de l outil choisi L enchainement A1 d marre au point 14 du sc nario nominal 14 L utilisateur demande le t l chargement de la r ponse au format original Voir sc narios essentiels d taill s du CU Telecharger fichier reponse Le sc nario nominal reprend au point 12 A2 T l chargement de la r ponse de l outil choisi convertie au format pivot L enchainement A2 d marre au point 14 du sc nario nominal 14 L utilisateur demande le t l chargement de la r ponse au format pivot Voir sc narios essentiels d taill s du CU Telecharger fichier reponse Le sc nario nominal reprend au point 12 A3 Retour l tape pr c dente L enchainement A3 d marre au point 14 du sc nario nominal 14 L utilisateur choisit de revenir l tape pr c dente 15 Le syst me affiche l utilisateur la vue pr c dente de saisie de texte contenant le dernier texte qu il a renseign Le sc nario nominal reprend au point 1 CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 16 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 A4 Apr s un retour l tape pr c den
27. ant nous nous sommes heurt s quelques difficult s quant la mise en ceuvre de ce premier mod le notamment lors de la formation de la balise texte qui contenait trois attributs la position du mot dans le texte sa taille et ses coordonn es g ographiques De plus un attribut tant unique la formation de cette balise ne nous permettait pas de r cup rer toutes les positions d une entit apparaissant plusieurs fois dans un texte Pour y rem dier nous avons choisi de changer ces attributs en balises distinctes Au fur et mesure de l avanc e du projet nous en sommes venus toffer ce sch ma en y ajoutant la prise en compte d entit s temporelles permettant la possibilit de collecter des informations temporelles en vue de les afficher sur une frise chronologique Ce sch ma se compose donc de trois types d entit s distinctes disposant chacune d un contenu sp cifique dont l arborescence compl te est disponible en annexe Afin d illustrer ce sch ma nous allons examiner l arborescence d une entit spatiale se type Type spatial type d L spatial tpe JO xsd string Built in primitive type The string datatype represents character strings in XML MF subtype o spatial NF L xsd string Type spatial MF Built in primitive type The string datatype represents character strings in XML geometry PA xsd string Type xsd string r Built in primitive type The stri
28. ation Nous l avons utilis pour cr er les diaporamas n cessaires pour les pr sentations orales Xa Ls Microsoft Office Excel 2013 est un tableur Ce logiciel nous a servi pour faire les diff rents plannings pr visionnels durant toute la dur e du projet ou encore pour le planning final CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 39 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 Mozilla Firefox est un navigateur internet personnalisable bas sur le moteur d affichage libre de pages Web Gecko Ce navigateur contient galement un plug in tr s int ressant lors de phase de programmation ou de test Firebug que nous avons galement utilis e chrome Chrome est un navigateur web d velopp par Google fond sur le projet libre Chromium fonctionnant sous Windows Mac Linux Android et 10S Google Chrome est identique a Chromium hormis un logo diff rent et quelques fonctionnalit s en moins ou en d veloppement Source http fr wikipedia org wiki Google chrome 4 3 APIS 4 3 1 D finition Une interface de programmation Application Programming Interface ou API est une interface fournie par un programme informatique Elle permet l interaction des programmes les uns avec les autres de mani re analogue une interface homme machine qui rend possible l interaction entre un homme et une machine Du point de vue technique un
29. conception Mme Corine Ospital notre professeur de communication pour tous ses conseils concernant la r daction de nos documents la pr paration de l oral et la gestion de groupe ainsi que sa relecture durant la r daction M Pierre Gastellu notre professeur de gestion de projet pour tous ses conseils sur l organisation et l avancement de notre projet ainsi que sa relecture durant la r daction Nos parents et amis pour avoir accept de relire et de corriger notre rapport ainsi que de tester notre application CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 Table des mati res 1 Pr sentation du projet eee e eee eee eee esee ee ee eesesseseeeees F 1 1 1 2 1 3 1 4 1 5 1 6 2 oa PS 2 3 2 4 3 3 1 3 4 Analyse Fonctionnelle eee eee eee eee eee eee ee eese esescseessss 13 Diagramme de Cas d Utilisation DEV iaa Scenarios essentiels detalles ne Uns sx ee den uela pers een Scenarios Feels a a eee E duque mU PED LN oi 6d D roulement de appeal emisario den oil Gestion de DEOIGL S seen essence De DEI TI De marche de develop poemas Recher icer Developers S2 E 44 3 29 3 2 4 Etude de faisabilit les outils de REN trente trente treten terrent tn tton at E ITI
30. de chaque CU voir annexe CDCF Ces sc narios ont pour vocation de d crire tape par tape tous les changes possibles entre l utilisateur et le syst me C est cette occasion que l on a pu concevoir les comportements pr cis qu adopte le syst me pour chaque action de l utilisateur notamment en cas de mauvaise utilisation Voici pour exemple les sc narios essentiels d taill s correspondant au CU Afficher un texte balise Page 14 sur 48 CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 Sommaire d identification Titre Afficher un texte balise Type Essentiel d taill R sum Apr s avoir saisi un texte et choisi un outil l utilisateur demande au syst me une analyse de son texte Le syst me retourne alors le texte fourni en surlignant chaque entit d tect e Une couleur sp cifique est attribu e chaque type d entit L utilisateur peut ensuite t l charger sa r ponse dans le format de son choix ou afficher les entit s spatiales et temporelles d tect es sur une carte et une frise Acteurs Utilisateur principal Outil de R E N secondaire Convertisseur secondaire Date de cr ation 11 janvier 2014 Version 1 0 Description des sc narios Date de mise jour Responsable Antoine Catanese Pr conditions L utilisateur a saisi un texte sur l appl
31. dex php fr enseignement xml CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 47 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 Table des illustrations arre 1 Liosode OR er ey nn ent ere eee ee eee ee en ee 4 sue 2 Logod E ER A etde feguipe DAT 4 gba ome pd Copied ee OR QAAE PETER enn nen ee Sry eee renee een err nn ee eee een eee er ee ee 5 Figure CO DIS ecin Geo media Tap get cc a e e a ee a 5 Pouco Doeode dapDICdUO fl ee een en nn nO ener enna re eee rere eee E ee 6 Fisure 6 Tableau d outils de RE N Open QUITE seriinin ia E EE NE EOR al Powe Exemplesde COAST ee ee ne eee eee ee 7 Figure 8 Sch ma simplifi du d roulement g n ral de l application VI 8 Figure 9 Sch ma simplifi du d roulement g n ral de l application V2 9 Prone 10 Premiere vue de applicable 10 Risute LL Deuxieme vue de PApDACATION id id tel 10 Fic re 12 lt Troisicme vue de LappHc ali nara ia 11 SE A O e o Po o A 12 Figure 14 tableau de Framework MVC utilisant AJAX ii non nro nono nono non eniin iii i nnnnnnnnnnnnnos 12 SAA e UE O II II A 13 Se Wy AAPP PP e O E 14 Figure 17 Maquette VUE 1 Sc narios r els CU Fournir un texte a analyser 20 Figure 18 Sch ma d taill du d roulement g n ral de l application V3 21 Figure 19 Sch ma produit parir d u
32. du transfert de connaissances en vue de la bonne int gration des nouveaux membres Malgr tous nos efforts la complexit du sujet coupl e aux probl mes rencontr s de restructuration nous ne sommes jamais parvenus r gler ces probl mes d organisation et bien que nos tuteurs et commanditaires soient assez satisfaits du travail que l on a pu produire sur le plan technique ils le sont nettement moins au sujet de notre gestion et organisation du projet Quoi qu il en soit ceci nous a rappel qu un bon technicien n est pas forc ment un bon gestionnaire Toutes ces difficult s d organisation nous ont finalement port pr judices puisque nous ne serons tr s certainement pas pr ts temps et allons devoir rendre notre M moire avec du retard Dans le m me temps ce retard nous a emp ch s de constituer convenablement notre Cahier des charges techniques qui par cons quent est relativement inexistant puisqu il contient un Diagramme de S quence d taill et non de diagramme d activit pr vu initialement 4 Conception et programmation 4 DIAGRAMMES DE SEQUENCES Suite aux nombreux sc narios que nous avons produits nous avons trouv plus pertinent de ne faire qu un seul Diagramme de S quences DS d taill reprenant l ensemble des sc narios nominaux afin de pouvoir visualiser la majorit des messages chang s entre les diff rents acteurs de notre syst me Voici donc notre DS d coup en deux parties afin qu il a
33. du wiki SIMILE About 4 3 6 CHAP Link Library CHAP Link Library est une biblioth que de visualisation bas sur le Web pour l affichage des graphiques de r seaux et d ch anciers Les outils sont d velopp s comme les graphiques de visualisation de Google pour JavaScript CHAP Link Library est d velopp par Almende dans le cadre du CHAP Common Hybrid Agent Platform Nous avons utilis CHAP pour g rer l affichage des th mes sur la derni re vue de notre application CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 41 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 5 Perspectives et Bilan 5 1 BILAN Ce projet l aboutissement de nos deux ann es pass es en DUT Informatique nous a permis d exploiter une grande partie des connaissances acquises en cours Il a repr sent une exp rience de vie enrichissante tant par son aspect professionnel que par son aspect relationnel Il nous a galement permis d approfondir nos connaissances en mati re de programmation web Nous avons dans ce cadre d velopp de nombreuses comp tences techniques car nous avons utilis plusieurs technologies que nous n avions pas tudi es durant notre formation comme par exemple le JavaScript ou encore le XML ainsi que de nombreuses API GoogleMaps et Alchemy API notamment Ce contexte nous a conduits faire un travail de recherche personnel important Sur
34. e tant r alisable selon trois mani res distinctes nous avons jug pr f rable d en faire un CU a part Enfin nous avons fait apparaitre sous forme d extensions CU optionnels les possibilit s de pouvoir apr s l analyse de son texte t l charger les r ponses g n r es ou visualiser les EN d tect es sur une carte et une frise chronologique Cette premi re analyse a donc donn lieu la premi re version de notre Diagramme des Cas d Utilisation DCU VI Figure 15 ci dessous EyeOfTheTagger actor APIs de visualisation Visualiser Entites Nommees Carte Frise Themes extend Outils de REN d Convertisseurs Detecter automatiquement des Entites Nommees A p A COMMU cate Utilisateur vexiendo include Choisir un texte p a analyser Telecharger un fichier reponse au format de son choix Figure 15 DCU VI CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 13 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 Suite cette premi re proposition nous avons voulu pr ciser encore le CU Choisir un texte analyser et ainsi produit une version plus d taill e de notre DCU DCU V2 Figure 16 Nous avons pour cela commenc par renommer le dit CU en fournir un texte analyser puis nous lui avons ajout un CU optionnel ap
35. e API est un ensemble de fonctions proc dures ou classes mises disposition par une biblioth que logicielle un syst me d exploitation ou un service La connaissance des API est indispensable l interop rabilit entre les composants logiciels Source http fr wikipedia org wiki Interface de programmation 4 3 2 Alchemy API gt 7 AlchemyAPl AlchemyAPI permet d extraire des donn es s mantiques sous forme de m tadonn es comme des personnalit s des lieux des soci t s ou des faits Le r sultat d une analyse peut ensuite tre transmis un site web qui peut l utiliser pour enrichir sa base de donn es ou pour traiter ses donn es et les afficher un utilisateur sous forme de cartes ou de frises Source http www alchemyapi com api 4 3 3 TextRazor Le service de TextRazor API fournit une analyse de certains passages de textes pour identifier les entit s et les nonc s de faits cit s par homonymie et distinguer des chaines de textes similaires Elle utilise des machines avec des algorithmes d apprentissage et un traitement du langage naturel pour connecter un chantillon de textes avec une base de connaissances et identifier les l ments connus et leurs relations CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 40 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 Source http www programmableweb com ap
36. e Catanese et Bap tiste Sabuco 3 Validation du format de sortie et du CDCT 4 5 6 Remise et validation des tests unitaires des lers 2 mes et 3 mes quipe responsable de l aspect graphique et ergonomique modules 7 Validation de la charte graphique Adrien Neto et Mehdi Besse 8 Remise du produit fini 9 Remise du m moire accompagn des manuels d utilisation et de maintenance L quipe au complet 10 Pr sentation de la soutenance de fin de projet Bien que cette planification soit plus d taill e que la pr c dente elle ne s est pas av r e tr s pratique car elle ne permet pas de diff rencier les taches accomplies des t ches en cours ou non commenc es En outre elle fait apparaitre chaque semaine comme tant quivalente en temps alors qu elles ne se valent pas toutes En effet certaines semaines comme les semaines de vacances ou de programmation nous laissent plus de temps pour avancer dans le projet qu une semaine durant laquelle nous avons des partiels ou d autres projets rendre L une de nos difficult s galement r side dans le fait que nous avons tenu mettre en place une planification claire pr cise et d taill e en la faisant tenir sur une seule page afin de conserver en permanence une vision globale de l avancement du projet Enfin nous avons d cid de ne pas utiliser d outils comme Gantt que nous consid rons comme trop contraignant or force est de constater que nous aurions d N
37. e coupler avec jQuery un framework JavaScript afin de mettre en place facilement de nombreux plugins comme par exemple des listes d roulantes des onglets ou m me un effet accord on comme le permet le module de ChapLinks que nous avons utilis pour l affichage des th mes CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 29 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 3 3 PLANNINGS Afin de s adapter notre organisation en quipes tout en gardant une coh sion globale nous avons dans un premier temps organis la r partition des taches selon le planning suivant V1 le 30 Octobre 2013 Semaines IUT 6 17 LS 9 Lo 1 hm O E Prise en main dip dud Validation des Pen choix des diff rents oe Etude sur la d OpenCalais et diff rents formats et standardisation formats et protocoles E Etude des deux outils q AjchemyAPI Ls R daction de Protocoles choisis des formatede pr liminaire s lectionn s choisis la charte du retours et analyse des outils OpenCalais HAN E Suse in oa Pr sentations de la projet Validation de la des differents proposes AlchemyAPI d une premi re charte graphique charte graphique modules de e finale g n rale finale g n rale Hecate l application finale Semaines civile Semaines IUT 16 17 18 19 eon pron D veloppement des diff rents modules de l application des diff rents a
38. e poss dait pas selon lui les qualit s d organisation requises pour un chef de projet Malgr sa volont forte de mener bien ce travail force a t de constater que notre organisation ne nous a pas permis de progresser uniform ment Nous avons avanc rapidement sur l aspect recherche et d veloppement et pris du retard sur la production de documentation technique et organisationnelle planification compte rendu de r unions Nos commanditaires tant sur Pau la quasi totalit de nos r unions se sont d roul es par visioconf rence ce qui a constitu une difficult suppl mentaire en mati re d organisation et de pr paration des r unions Nous avons p ch par d faut de pr paration syst matique d ordre du jour d taill pour nos r unions qui ce titre n ont parfois pas t efficacement men es En janvier la fin du troisi me semestre deux des membres de l quipe Adrien et Mehdi qui avait compenser la non obtention de leur deuxi me semestre n ont pas r ussi atteindre leurs objectifs ont t contraints de redoubler et ainsi de quitter l quipe du projet A ce stade nous ne pouvions plus continuer le projet puisqu une quipe doit tre compos e de trois tudiants au minimum Par chance deux tudiants galement abandonn s par leurs co quipiers respectifs ont pu se joindre notre projet et ainsi nous permettre de continuer Ces deux nouveaux membres sont J r my Dulon et Marc
39. e projet avait donc pour vocation de prouver la faisabilit d un tel outil Il nous a donc t demand de d velopper notre application comme un prototype jetable qui servirait de base de travail a un ventuel futur projet Ainsi bien qu il ait t pr vu dans un premier temps de d velopper notre application selon l architecture MVC modele vue contr leur cette optique a t abandonn e et laiss e au rang des perspectives d volutions Cependant tant donn que l application produire n tait pas d une taille tr s importante nous avons conserv l esprit du MVC lors du d veloppement de notre outil et ainsi produit un code qui sans utiliser aucun Framework respecte dans les grandes lignes ce concept de MVC Le seul Framework que nous maitrisions puisque nous l avions tudi durant notre formation est le Framework p dagogique d velopp par M Patrick Etcheverry Malheureusement il est peu adapt une utilisation de l Ajax et nous a donc tout de suite t d conseill par nos tuteurs qui en avaient fait l exp rience l ann e pr c dente Afin d utiliser un Framework il aurait donc fallu apprendre en maitriser un autre mais cela n a pas t possible faute de temps CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 42 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 5 2 PERSPECTIVES Il est envisageable que cette application soit
40. e_Spatiale gt lt Entite gt lt Type gt Pays lt Type gt lt Sous_Type gt R publique lt Sous_Type gt lt Appellation gt France lt Appellation gt lt Monnaie gt Euro lt Monnaie gt lt Type gt Entit Spatiale lt Type gt lt Sous type gt Pays lt Sous type gt lt Nom gt France lt Nom gt lt NbHabitants gt 660000000 lt NbHabitants gt lt HabitantParKm2 gt 103 8 lt HabitantParKm2 gt lt Surface gt 641185 lt Surface gt lt Superficie gt 641185 lt Superficie gt lt Population gt 660000000 lt Population gt lt Densite gt 103 8 lt Densite gt lt Entite gt lt Entite_Spatiale gt Figure 7 Exemples de formats XML CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 7 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 C est pourquoi avant de mettre en place une structure d exploitation de ces r sultats il faut dans un premier temps mettre en place des convertisseurs qui vont transformer chacune de ces r ponses en conservant les informations transmises mais en les restructurant toutes au m me format afin que l on puisse les traiter automatiquement Ce format final commun sera donc notre format pivot Suite ce premier traitement nous pourrons d velopper un module qui r cup re des informations au format pivot et les exploite en affichant par exemple les informations spatiales sur une carte et les temporelles sur une
41. echniques qu humains CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 44 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 6 Abstract For several years the research laboratory of the UPPA University of Pau and Adour s Lands focused their work on spatial temporal and thematic information retrieval They decided to create an automated information retrieval from documents collections like texts from books or databases like website s ones In this context they asked us to develop a new application which includes many free existing textual lexical syntactic and semantic analysis tools The purpose of the application is to recognize different types of data such as spatial like Bayonne New York Brazil and temporal entities like 14 03 2014 We also need to group them into themes like Sport City Actor Then this data will be converted into visual information like timelines and maps For this we use various tools including the Google Maps v3 API Application Programming Interface and the Chap Link Library Timeline API but we must also invoke web services to be able to recognize these types of entities As our application is a mash up of many tools it can be easily modified by adding or deleting of some tools After a text analyze the application gets the response of the chosen tool and highlights all the enti
42. entifier les l ments d interfaces n cessaires l application 2 3 SCENARIOS REELS ET MAQUETTES Contrairement aux sc narios essentiels qui d crivent les interactions possibles avec l application sans se pr occuper du comment les sc narios r els vont de paire avec des maquettes et permettent de pr senter explicitement les moyens utilis s pour manipuler l application En voici un exemple sommaire d identification Titre Fournir un texte a analyser Type R el R sum Un utilisateur saisie un texte manuellement et choisit un outil Acteurs Utilisateur principal Date de cr ation 21 f vrier 2014 Date de mise jour Version 1 0 Responsable Antoine Catanese Description des sc narios Pr conditions L utilisateur est connect Internet et poss de un navigateur Web CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 18 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 Sc nario nominal 1 L utilisateur se trouve sur la page d accueil de pag 4 2 Le syst me affiche un formulaire contenant l application une zone de saisie Texte analyser servant accueillir le texte de l utilisateur Des boutons radios Choix outil permettant l utilisateur de choisir un outil un bouton Analyser texte permettant de lancer l analyse b3 un onglet Saisir URL permettant l utilisateur d
43. es rendus r unions MARC Afaire Besoindes notes de MARC Page 32 sur 48 CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 DOCUMENTATION Cette planification a t tablie pour tenter de palier le retard pris sur la r daction du M moire n anmoins son manque de pr cision nous a t nouveau pr judiciable En effet l absence de dates butoirs de r alisation pour chaque t che a eu pour cons quence le fait que nous nous sommes dispers s sur plusieurs t ches la fois alors que nous aurions d nous concentrer sur chaque point en se r partissant mieux les r les Nous avons port ces probl mes d organisation et de dispersion tout au long du projet sans que nous parvenions r ellement les r soudre 3 4 ORGANISATION DU PROJET Comme nous l avons vu dans la planification au d part du projet nous nous sommes r partis les taches en fonction des comp tences de chacun Antoine et Baptiste ont pris en charge la veille technologique et le d veloppement des diff rents modules Adrien et Mehdi se sont occup s de l aspect visualisation et de la structure de l application corps cod en HTML CSS Antoine a t d sign chef de projet en raison de son age plus lev que le reste de l quipe et de ses comp tences Nous savions cet instant que nous prenions un risque tant donn qu Antoine n
44. ez selectionner un outil R initialiser l application Passer l tape suivante Figure 10 Premi re vue de l application Le lancement de l analyse par l utilisateur d clenche l enchainement des tapes deux et trois du sch ma de d roulement de l application Figure 10 et conduit la deuxi me vue de l application Figure 11 qui pr sente le texte pr c demment choisi sur lequel chaque entit est surlign e d une couleur propre son type A Web Page Co XQ ie D R f rencement d entit s nomm es Texte analyser avec AlchemyAPl L gende Nous sommes le Groupe de PSA se constitue d Adrien Neto qui est originaire dug Antoine Catanese qui est originaire de la MMS Mehdi Besse qui vient de BBSBBIEEN su ITE et Baptiste Sabuco qui lui vient de HOMER Nous sommes tudiants l IUT de BEEN dans c EON Th me Nos commanditaires pour ce projet tutor sont M Christian Sallaberry et M Albert Royer tous deux chercheurs BBA Universit de Billet des Pays de l Adour Nos tuteurs sont M Cristophe Marquesuzaa et M Sebastien Laborie tous deux enseignants chercheurs l IUT de BRENNEN Espace T l charger format pivot T l charger format original R initialiser l application Revenir l tape pr cedente Visualiser carte et frise CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 10 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport
45. frise chronologique Le principe de l application produire est donc r sum sur le sch ma suivant Sch ma simplifi du d roulement de l a Figure 8 Sch ma simplifi du d roulement g n ral de l application V1 L objectif est galement de pouvoir envisager dans un futur projet de combiner la puissance de chacun des outils disponibles en leur soumettant le m me texte en m me temps et ainsi fusionner toutes leurs r ponses en une seule gr ce ce format pivot La mise en place d un tel outil sera l occasion pour nos commanditaires de poss der une base solide et fiable d valuation et de comparaison de leur propre outil afin de l enrichir et le perfectionner efficacement De nombreux membres de l quipe du T2I pourraient ainsi int grer cet outil maison leurs propres travaux de recherche 1 3 FONCTIONNALITES L application web que nous devons produire devra se pr senter sous la forme d un site internet accessible depuis n importe quel ordinateur fixe ou portable connect I est important de noter que nous ne g rerons pas l affichage sur petits crans de type tablette ou smartphone L utilisateur pourra soumettre un texte l application en le saisissant manuellement en le t l chargeant ou en fournissant son URL d acc s Il sera ensuite invit choisir un outil d analyse Une fois analys l application lui retournera son texte dans lequel elle aura surlign toutes les entit s d tect
46. ge a soulev de nouvelles difficult s puisque ce dernier n tant disponible qu en version beta encore en phase de test son utilisation entrainait l apparition d une multitude de messages d avertissement dus notamment l utilisation de m thodes de classes qui n tait pas d clar es comme telles absence de l indicateur static devant les m thodes concern es Apr s avoir bien tudi la mani re dont les trois ou quatre classes que nous utilisions tait impl ment es nous d cid mes de les r cup rer ind pendamment de leur package et de se les approprier en les corrigeant de mani re ce qu elles r pondent le plus possible nos besoins En outre cette solution tait n cessaire afin de pouvoir d ployer notre application sur Erozate le serveur de recherche de nos commanditaires sans avoir lui installer de modules suppl mentaires ou modifier sa configuration Nous nous trouvions donc pr ts d velopper un convertisseur pour ce nouvel outil ainsi qu faire voluer notre format pivot afin qu il int gre les nouvelles informations r cup r es par TextRazor qu AlchemyAPI ne traitait pas comme les entit s temporelles ou les esp ces animales saumon Enfin nous avons pu finaliser notre application en d montrant par l utilisation de TextRazor que notre module de frise chronologique tait fonctionnel En outre l int gration d un nouvel outil par le simple ajout l application d un module d appel
47. i textrazor 4 3 4 Google Maps v3 API l Google Maps est une API de Google permettant de g olocaliser des lieux sur une carte l aide de leur latitude et de leur longitude Cette API permet de localiser tout type de donn es sur une carte routi re satellite mixte partir de son adresse postale Cette API s av re tr s utile pour proposer aux internautes une vision globale et g ographique de donn es membre d une communaut restaurants d un quartier Les r sultats sur la carte apparaissent sous la forme d un marqueur de la forme d une goutte d eau invers e que l on peut choisir de colorer en rouge par d faut Source http www dicodunet com definitions google api google map htm 4 3 5 SIMILE Timeline SIMILE Projet a t cr par le World Wide Web Consortium W3C dans le but de chercher am liorer l interop rabilit entre les actifs num riques de sch mas vocabulaires ontologies de m tadonn es et de services Un d fi majeur qui a t r solu tait de rendre interop rables les collections qui sont distribu es travers les individus les communaut s et les magasins institutionnels en s appuyant sur les l ments d actif de sch mas vocabulaires ontologies et les m tadonn es d tenues dans ces magasins C est dans ce contexte qu ont t cr s les SIMILE Widgets dont Timeline un outil permettant de cr er des frises chronologiques faisait partie Source http simile mit e
48. ication Cependant AlchemyAPI ne fournissant pas des r ponses suffisamment compl tes pour r pondre aux exigences du format pivot nous avons d d velopper diff rents modules d enrichissement de ces r ponses notamment en faisant appel de nouveaux services comme geonames afin de r cup rer les coordonn es GPS des entit s spatiales ou des fonctions php pour r cup rer les positions des EN dans le texte Une fois AlchemyAPI totalement int gr appel conversion nous nous sommes concentr s sur la constitution du module d affichage de la frise chronologique afin de finaliser compl tement la structure de l application avant d envisager l int gration d un nouvel outil Malheureusement AlchemyAPI ne d tectant pas les entit s temporelles nous avons t oblig s de revoir notre organisation et de reprendre notre recherche d outil en ayant cette fois comme contrainte forte l obligation de trouver un outil qui en plus de remplir les crit res de s lection expos s plus haut soit capable de d tecter des entit s temporelles Nous avons donc repris notre pr s lection d outils et nous sommes cette fois orient s vers le choix de TextRazor qui se trouve tre un des outils de REN utilis par N E R D En effet cet outil nous est apparu comme l un des plus complets en mati re de d tection de dates et p riodes temporelles et a donc fait l objet d une tude approfondie en vue de son int gration notre application Suite
49. ication et a choisi son outil d analyse Sc nario nominal 1 Ce cas d utilisation commence apr s le CU Fournir un texte analyser 2 L utilisateur lance l analyse 4 L outil r cup re le texte et l analyse 5 L outil renvoie au syst me le texte analys dans le format original XML 10 11 Le syst me envoie le texte l outil choisi Le syst me r cup re la r ponse originale et l enregistre sur le serveur dans un fichier xml Le syst me convertit la r ponse originale au format pivot Le syst me enrichit la r ponse convertie afin de la faire correspondre au format pivot en vue de la validation Le syst me soumet au validateur la r ponse obtenue Le syst me valide le format de la r ponse Le syst me enregistre la r ponse au format pivot sur le serveur dans un fichier xml CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 15 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 12 Le syst me pr sente le texte de l utilisateur en surlignant les E N d tect es dans la r ponse au format pivot Chaque type d E N Personnes Lieux Dates etc est surlign d une couleur sp cifique 13 Le syst me propose le t l chargement de la r ponse au format original ou pivot d afficher le texte balis accompagn d une carte et d une frise de revenir l tape pr c dente ou de r initi
50. ichier pivot XML sous cette forme lt entity gt lt spatial_entity gt Repr sentation sous forme d arbre se type Country c se tvne gt lt relevance gt 0 100375 lt lt text gt France lt text gt geometry 53 28 ge lt pos gt 134 lt pos gt lt positions gt lt spatial_entity gt dei HER NER ER Figure 21 Arborescence d une entit spatiale dans le format pivot Gr ce ces informations nous avons pu afficher les l ments sur la carte directement gr ce aux coordonn es pr sentes dans la base de donn es d Alchemy API Apr s traitement par Alchemy API le texte analys tait retourn avec certaines couleurs permettant ainsi d identifier et de diff rencier les entit s que l outil avait reconnues Cette identification tait d clin e pour les diff rentes entit s spatiales tels que les pays balis s Country ou les villes balis es City Ainsi pour permettre un affichage plus clair sur la carte il a t convenu que les couleurs des marqueurs de la carte correspondraient avec le type d entit spatiale qu Alchemy API avait reconnu Par la suite l int gration de TextRazor n a pas modifi l int gration de ce module 22 12 La frise Pour permettre la visualisation des entit s temporelles nous avons d cid d utiliser un module de Timeline Un de nos tuteurs nous a conseill d utiliser la librairie Chap Links qui poss dait une Timeline et qui par
51. importer un texte depuis une URL un onglet Importer texte permettant l utilisateur d importer un texte depuis sa machine Un onglet Saisir manuellement permettant l utilisateur d acc der la zone de saisie manuelle un logo Eye of The Tagger permettant l utilisateur de retourner la page d accueil et de r initialiser l application VOIR VUE 1 Note Le logo Eye Of The Tagger restera pr sent tout au long de l utilisation 3 L utilisateur r dige un texte manuellement 4 Le syst me affiche le texte dans la zone de saisie 5 L utilisateur clique sur le bouton radio 6 Le syst me affiche l outil choisi correspondant l outil de REN de son choix Post conditions L analyse du texte s lectionn est pr te tre lanc e Enchainements alternatifs Al L utilisateur importe un texte depuis une URL L enchainement A1 d marre au point 3 du sc nario nominal 15 L utilisateur clique sur l onglet Saisir URL Voir sc narios r els du CU Fournir une URL Le sc nario nominal reprend au point 4 CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 19 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 A2 L utilisateur importe un texte depuis sa machine L enchainement A2 d marre au point 3 du sc nario nominal 3 L utilisateur clique sur l onglet Importer texte Voir sc
52. ion 2013 2014 m Doeessus Fiba la Go hspcinuuon Espoli Lem IEEE bi tati d t les ll Ce mada fc ania pali hadia Plis bce n eum d ural vali La RHENUS MS cuz ceca Pois sanas dca a Muon Lisle e pastel pas be trii aed parer wey mem s Ebro agde sc birra on ena thins k oxi aink mada sa kewl Fi 1 i TE m m Fogle ee e y Bjus ur fau aaa mai ni T so Passi Ltgcade du terre Lim valid mm V sie dual clie Figure 3 Copie d cran GeoText2Map Par la suite cette application toujours existante en l tat a t enrichie par un nouveau groupe d tudiants en 2012 2013 galement dans le cadre de leur projet de synth se nomm GeoMediaTagger Figure 4 http erozate iutbayonne univ pau fr geotext2maptime201 3 Stable Geo Media Tagger Texte Espace Temps Theme Au d but du printemps 2011 Lescar las glaieuls ant magnifiquement fleuri La meme vari t de glaiculs a d etre prot g e de la gel e en avi 2012 au mord de Lescar Ir Sr Yer at Tut r yan b mms E E wh IE T AR me Tanan E Cg dou mte ud m Ma UL i COCOS Bee intro nt EH x DES Tan Vm po O Y x Li uer y e Ep E dh pare j Ex Fa aUa a a a 2 priques 22013 Google basaca en EICH TGN Espera Cordilcnd yin Figure 4 Copie d cran Geo media CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 5 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final
53. l ou HTTP est un protocole de communication entre un client et un serveur JavaScript JavaScript est un langage de programmation principalement utilis dans les pages Web interactives c t client Media queries Une media query ou requ te m dia consiste en un type de m dia et une expression CSS qui met profit les particularit s des supports multim dias largeur hauteur couleurs M tadonn es Les m tadonn es servent d crire ou d finir une autre donn e photo texte son ou vid o Elles sont d finies dans le cadre du mod le ressource description Framework RDF PHP PHP Hypertext PreProcessor est un langage de script libre de droit principalement utilis pour produire des pages Web dynamiques via un serveur HTTP mais pouvant galement fonctionner comme n importe quel langage interpr t c t serveur SOAP Le SOAP pour Simple Object Access Protocol est un protocole qui permet les messages entre objets Il peut autoriser un objet invoquer des m thodes d objets qui sont pr sentes physiquement sur un autre serveur RDF RDF Resource Description Framework est un mod le de graphe destin d crire de facon formelle les ressources Web et leurs m tadonn es RDF est une surcouche bas e sur XML REST Le REST ou REpresentational State Transfer est une architecture web la mani re de SOAP la diff rence qu il s appuie sur des ressources et non des m thodes XML XML
54. l aide d outils de visualisation que nous verrons par la suite 3 2 3 Les outils de visualisation la carte la frise chronologique et l affichage des th mes 3 2 3 1 La carte Pour permettre d organiser les l ments obtenus par l analyse d Alchemy API il a t convenu que les entit s spatiales seraient dispos es dans la mesure du possible sur une carte Pour se faire nous avons d cid d utiliser 1 API de Google Maps qui poss dait une documentation compl te et suffisante pour effectuer les g olocalisations Dans premier temps lors de l analyse d un texte AlchemyAPI retournait seulement le nom d une entit spatiale apr s l avoir rep r e Ainsi le module Google r cup rait le nom de ce lieu en d duisait les coordonn es par rapport sa base de donn es gr ce une proc dure d j existante et placait des marqueurs correspondant ces coordonn es gr ce une seconde proc dure Toutes ces informations s affichaient de cette mani re Belg a que Deutschland L Germany _ Figure 20 Exemple de fonctionnement de la carte Google Maps CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 27 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 Dans un second temps nous avons r ussi a r cup rer les coordonn es d une entit spatiale a partir d AlchemyAPI et ces donn es se trouvaient directement pr sentes dans le f
55. l on tournait en rond Il a donc t d cid apr s deux mois de recherches d abandonner cet outil ce regret car il comptait parmi les plus complets et les plus puissants des diff rents outils de R E N valu s Nous nous sommes donc concentr s exclusivement sur Alchemy API afin de mettre en place un premier prototype de l application qui d roulerait toutes les tapes d crites pr c demment voir Fonctionnalit Partie 1 3 ce en vue de prouver la faisabilit de l application en n y int grant qu un seul outil Par suite il s agissait de montrer que l int gration d un outil suppl mentaire resterait simple et rapide Pour ce faire nous avons utilis un module fourni par l quipe de d veloppement d Alchemy API Alchemy Team contenant une classe nomm e AlchemyAPI Celle ci permet d invoquer le service en cr ant un nouvel objet AlchemyAPI puis en utilisant sa m thode pr vue cet effet Le probl me que nous avons rencontr est que cette m thode retournait un fichier Json converti en array tableau en php Il nous a fallu modifier les param tres d appel l int rieur m me de la classe puisqu aucune m thode ne permettait de modifier ce param tre A ce stade le convertisseur tait pr t et nous avions donc pu produire des r ponses converties au format pivot partir desquelles nous avions d velopp le module d appel de la carte Ce module ainsi que le convertisseur ont donc t int gr s l appl
56. lyser son texte puis de r cup rer la r ponse dans le format sp cifique l outil choisi Dans un second temps seront mis en place des modules de transcription des formats de sortie des diff rents outils en un format commun de maniere standardiser la r ponse En d autres termes il s agit de mettre en place pour chaque outil une m thode de conversion de la r ponse dans un format choisi selon les directives de nos commanditaires que nous appellerons format pivot En effet chaque outil utilis retourne diff rents formats de r ponse Json XML RDF Ces dits formats sont plus pr cis ment des nomenclatures langages permettant de structurer d organiser des donn es tout en faisant apparaitre des relations entre ces derni res la mani re d une Base de Donn es voir Langage et Technologie Partie 4 3 Exemple pour le XML m me si deux r ponses peuvent contenir exactement les m me informations elles peuvent tre organis es diff remment et poss der des noms de rubriques diff rentes Voir sur les deux exemples de fichier XML ci dessous Figure 7 que bien que contenant peu pr s les m mes informations contenu en gras pr sent entre les balises certaines apparaissent sur l une et non sur l autre elles ne sont pas organis es ordonn es de la m me mani re et surtout elles n ont pas les m mes noms de rubrique noms des balises diff rents d un exemple l autre lt Entit
57. ne entit spatial dans le format pivot 26 Figure 20 Exemple de fonctionnement de la carte Google Maps 21 Figure 21 Arborescence d une entit spatiale dans le format pivot ss 28 Figure 22 Exemple de fonctionnement de SIMILE Timeline 20 Figure 23 Diagramme de S quence d taill Partie 1 i ccccccccccvccsessssesesssssedenesssesesssesecseansedeasessebaassosedesenssessannsanenanecs 35 Figure 24 Diagramme de S quence d taill Partie 2 0 0 0 cece eeceesessseeeeeeeeeeeeeeeeeeeeeeeeceeeeeeeeseeeseeseeeseeeseeseeneaagaqaqagggs 36 E1956 75 Diagramme de Classe V D ascen caret tuii dtes e no 43 ie the 20 Diagramme de classe PATRE ee nisina 44 CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 48 sur 48
58. ng datatype represents character strings in XML xsd string i Built in primitive type The string datatype represents character strings in XML relevance Type xsd string text xsd string Type xsd string Built in primitive type The string datatype represents character strings in XML position positions o o O i Type xsdinteger xsdinteger Built in derived type The integer datatype is derived from decimal by fixing the value of fractionDigits to be 0 This length Type xsdinteger PA xsd integer Built in derived type The integer datatype is derived from decimal by fixing the value of fractionDigits to be 0 This Figure 19 Sch ma produit parir d une entit spatial dans le format pivot CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 26 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 On observe ainsi qu une entit spatiale est caract ris e par Un type Ex City Country Natural Feature Un texte qui lui est associ Un sous type lorsque le type est Natural Feature Sa ou ses positions dans le texte Des coordonn es g ographiques GPS Sa taille en nombre de caracteres Un indicateur de pertinence L int r t de ce format pivot est d unifier les r ponses fournies par les diff rentes Api utilis es afin de retravailler ces informations
59. ntendons une unit textuelle faisant r f rence un nom de personne d entreprise de lieu ou encore une date une heure ou une unit mon taire rep rable Par exemple dans la phrase Mardi 17 janvier 2014 j ai rendez vous avec Mathieu Dupont pour aller voir un match de fagby au nord de Pau nous pouvons imaginer que cet outil est capable de reconna tre la date le fiom de la personne le li8Wet le MEME Afin de pouvoir exploiter cet outil de mani re simple rapide et intuitive un premier site web a t d velopp par un groupe d tudiants en 2010 2011 l occasion de leur projet de fin de DUT Ce projet intitul GeoText2Map Figure 3 http erozate iutbayonne univ pau fr geotext2map consistait en la r alisation d une application web permettant un utilisateur de renseigner un texte manuellement en le t l chargeant ou via son URL d acc s et de le soumettre cet outil L utilisateur r cup rait ensuite son texte enrichi de marqueurs indiquant les lieux d tect s La r ponse tait accompagn e d une carte sur laquelle on retrouvait les lieux signal s sous forme de puces L utilisateur avait galement la possibilit d annoter du texte manuellement en le s lectionnant et en le faisant correspondre l endroit de son choix sur la carte CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 4 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promot
60. ois crans diff rents pour lesquelles nous avons fait des maquettes La premiere vue Figure 11 contiendra un formulaire onglets permettant l utilisateur de saisir un texte selon trois m thodes manuellement ou en le t l chargeant ce depuis sa machine ou une URL Cette vue sera galement l occasion pour l utilisateur de choisir un outil l aide de boutons radio et enfin de lancer l analyse de son texte avec l outil choisi Cette vue correspond l tape 1 du sch ma de d roulement de l application Figure 9 CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 9 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 A Web Page Co NN Y 2 R f rencement d entit s nomm es Entrer manuellement Texte analyser Nous sommes le Groupe de Projet num ro 7 qui se constitue d Adrien Neto qui est originaire du Gers Antoine Catanese qui est originaire de la banlieu parisienne Mehdi Besse qui vient de Casablanca au Maroc et Baptiste Sabuco qui lui vient de Bordeaux Nous sommes tudiants l IUT de Bayonne dans les Pyr n es Atlantiques AlchemyAPI Nos commanditaires pour ce projet tutor sont M Christian Sallaberry et M Albert Royer tous deux chercheurs l UPPA Universit de Pau et des Pays de l Adour OpenCalais Nos tuteurs sont M Cristophe Marquesuzaa et M Sebastien Laborie tous deux enseignants chercheurs l IUT de Bayonne Veuill
61. ormat serait pr f r tant donn qu il est pour le moment le plus r pandu sur la toile Alchemy API retournant une r ponse au format XML nous avons pu tr s vite commencer travailler sur son convertisseur au format pivot En revanche Open Calais retourne une r ponse au format XML RDF c est dire un document RDF rang au format XML Il faut savoir que le RDF voir Langage et Technologie Partie 4 3 bien que pouvant tre rang au format CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 23 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 XML peut galement tre rang au format Json ou textuel Ce format repr sente en r alit une organisation compl tement diff rente de l organisation d un fichier XML simple puisqu elle repr sente un graphe et non une arborescence Cela en fait donc un format bien plus riche qu il est quasiment impossible de convertir en XML puisqu il y a n cessairement une perte d informations Automatiser le traitement de s lection de ce que l on garde ou non est compliqu et g n re bien souvent des erreurs ainsi que des pertes d informations importantes et non souhait es Apr s avoir essay de passer par la r ponse Json propos e par OpenCalais afin de solutionner notre probl me nous avons remarqu que la r ponse Json tait galement une r ponse RDF et qu d faut de trouver une solution
62. ous l utiliserons certainement l avenir lors de futurs projets car la planification est un secteur dans lequel nous avons vraiment p ch lors de ce projet Il a t malais pour nous de rendre par crit chacune des t ches accomplir et se fixer des dates butoirs La planification n a d ailleurs que peu t mise jour cependant nous avons mis en place des petites planifications parall les dont voici un exemple Planification r daction M moire 11 mars 2014 TRAVAIL A FAIRE Pr cisions I Charte 2 Analyse Fonctionnelle 2 1 DCU ANTOINE JTemin e _2 2 Maquettes ANTOINE Termin 2 4 Enchainement vues ANTOINE Encours Int gr auxsc narios _2 3 Sc narios essentiels ANTOINE Encours 3 Gestion de projet MEE MERE MEE _3 1 D marche de dvpt _3 2 Reflexions de recherche _3 3 Planning lere Equipe ANTOINE HAUTE nt po Po 3 5 Organisation du projet JEREMY HAUTE Termin 00 4 Conception et programmation 4 1 Diag Seg et ou Diag Activ BAPTISTE Affaire _4 2 DET ou quivalent TE A ES 4 3 Langages et Technologies ANTOINE Afaire 0 0 po Es A AAA IS AAA A _4 4 APIs JEREMY Temin e 5 Perspectives et Bilan es MEME MUN _5 2 Bilan MARC HAUTE 6 Abstract JEREMY Termin e Manuel d installation MARC Manuel d utilisation MARC HAUTE Manuel de maintenance JEREMY ANTOINE Compt
63. pel Importer un texte qui se sp cialise en deux CU distincts Ceci a t d cid afin de faire clairement apparaitre la possibilit pour l utilisateur d importer son texte depuis sa machine ou une URL Nous avons galement d cid de sp cialiser le CU T l charger un fichier r ponse au format de son choix renomm T l charger un fichier r ponse en deux CU pourtant quasiment similaires afin de bien montrer que lors du traitement d un texte par l application les deux formats de r ponse taient conserv s et ainsi disponibles au t l chargement EyeOfTheTagger APIs de visualisation extend Visualiser les Carte Frise Themes _Entites Nommees i Afficher un texte balise Utilisateur j y include extend AN hy n Fournir un texte a analyser Telecharger Outils de REN un fichier reponse h Convertisseurs extend Importer un texte Telecharger dans f Telecharger dans 5 le format original le format pivot Fournir un Fournir chemin local une URL Figure 16 DCU V2 A partir de cette version finale nous avons produit les sc narios d rivants chacun des CU identifi s en cherchant couvrir le plus de cas de figures possibles sans pour autant tre exhaustifs 2 2 SCENARIOS ESSENTIELS DETAILLES Nous avons suivi les recommandations de nos enseignements d UML et commenc par produire les sc narios essentiels d taill s
64. pour convertir les r ponses obtenues gr ce aux api et pouvoir les manipuler en utilisant un langage de manipulation de donn es au format XML le XPATH X ATH XPath est un langage non XML pour localiser une portion d un document XML Initialement cr pour fournir une syntaxe et une s mantique aux fonctions communes XPointer et XSL XPath a rapidement t adopt par les d veloppeurs comme langage d interrogation simple d emploi Source http fr wikipedia org wiki XPath Nous avons utilis le langage XPath pour retrouver les valeurs souhait es dans le fichier XML retourn par les services XSLT XSLT eXtensible Stylesheet Language Transformations d fini au sein de la recommandation XSL du W3C est un langage de transformation XML de type fonctionnel Il permet notamment de transformer un document XML dans un autre format tels que PDF ou HTML pour tre affich comme une page web L objectif principal est la transformation d un document XML vers un autre sch ma ou format XHTML XSL FO HTML etc Cependant le langage XSLT permet aussi les transformations vers tout autre type de documents au format texte ou dans un format binaire bien que ceci ne soit pas originellement pr vu par la recommandation XSLT tant donn es CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 38 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 deu
65. pparaisse plus clairement La premi re partie ne concerne que l utilisateur et le syst me et correspond la phase de saisie d un texte La deuxi me partie quant elle d marre au lancement de l analyse et concerne donc l ensemble des acteurs CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 34 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 onnexion a la page d accueil Fournir texte Rediger texte Importer texte depuis URL Fournir un chemin local Rediger texte Importer texte depuis URL Afficher URL Valider importation Importer texte et ea neuarde torta Valider importation Importer texte et sauvegarde texte Choisir outil de REN Afficher outil choisi uum as ieee Gee eee eee imme ee Gea ner ees Gael ducens pa came Figure 23 Diagramme de S quence d taill Partie 1 CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 35 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 Lancer analyse du texte a T Ha verifier conformite du texte a ee nee gt m Conversion Envoi du fichier convertit 1 3 V rification de la conformit du fichier Envoi du fichier
66. prim de la liste Enfin nous avons retir l outil N E R D de notre pr s lection dans la mesure o cet outil n en est pas un proprement parler puisque qu il int gre en r alit de nombreux outils existants notamment des outils pr sents dans notre s lection Cet outil s apparente donc plus au type d application que nous devons mettre en place qu un outil de R E N pure Cependant nous avons pu nous en inspirer en ajoutant notamment notre pr s lection certains des outils qu il utilise et que nous ne connaissions pas comme par exemple TextRazor Attps www textrazor com Une fois cette deuxieme pr s lection effectu e nous avons tudi chacun des outils restants afin de connaitre la richesse de leurs r sultats de leurs documentations et de leurs communaut s activit sur les forums de d veloppeurs utilisant ces outils En raison de ces trois crit res nous avons dans un premier temps s lectionn Alchemy API et Open Calais Apres avoir tudi plus en d tails ces deux outils nous avons effectu nos premiers appels l aide de formulaires HTML partir desquels nous avons effectu de simples requ tes HTTP POST et ainsi r cup r nos premi res r ponses originales Ces deux outils tant param trables ce qui nous permettait de choisir le format de r ponse souhait XML Json RDF nous demandions des r ponses au format XML En effet il avait t d cid avec les commanditaires que ce f
67. rmatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 Pr sentation du projet 1 1 CONTEXTE DU PROJET Le projet dont nous avons la charge a t propos par Monsieur Albert ROYER enseignant chercheur et maitre de conf rences en informatique au d partement Statistique et informatique d cisionnelle de l Institut Universitaire de Technologie IUT des Pays de l Adour et Monsieur Christian SALLABERRY maitre de conf rences Habilit Diriger des Recherches HDR en informatique en poste l UFR de Droit Economie et Gestion de l Universit de Pau et des Pays de l Adour UPPA Figure 1 Ils sont tous deux membres de l quipe de recherche du T2I au sein du Laboratoire Informatique de l UPPA LIUPPA Figure 2 http liuppa univ pau fr live EquipesdeRecherche Equipe T21 et leurs LIUPPA T21 team DE PAU ET DES travaux s inscrivent dans le domaine de la recherche d informations dans PAYS DE L ADOUR Figure 1 Logo de leurs dimensions spatiale temporelle et th matique Figure 2 Logo du LIUPPA TURIS et de l quipe T2i Ces recherches d informations consistent en l analyse de corpus textuels comme des biblioth ques num riques fonds documentaires territoriaux par exemple Dans ce cadre ils ont notamment d velopp GeoPot un outil puissant d analyse lexicale syntaxique et s mantique du langage crit afin d y d tecter des Entit s Nomm es EN Par Entit s Nomm es nous e
68. s en utilisant la librairie JQuery cit e au paragraphe suivant CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 37 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 Y Query sw c JQuery est une biblioth que JavaScript libre qui porte sur l interaction entre JavaScript comprenant Ajax et HTML et a pour but de simplifier des commandes communes de JavaScript La premi re version date de janvier 2006 Source http fr wikipedia org wiki JQuery Nous avons utilis JQuery afin de rendre nos interfaces dynamiques Par exemple les onglets comprenant le texte saisi les lieux les dates ainsi que les themes sont interchangeables gr ce cette technologie X mi gt L Extensible Markup Language XML langage de balisage extensible en fran ais est un langage informatique de balisage g n rique qui d rive du SGML Cette syntaxe est dite extensible car elle permet de d finir diff rents espaces de noms c est dire des langages avec chacun leur vocabulaire et leur grammaire comme XHTML XSLT RSS SVG Elle est reconnaissable par son usage des chevrons lt gt encadrant les balises L objectif initial est de faciliter l change automatis de contenus complexes arbres texte riche entre syst mes d informations h t rog nes interop rabilit Source http fr wikipedia org wiki Xml Nous avons utilis le XML
69. ser de la technologie Ajax pour la d velopper CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 11 sur 48 DUT Informatique A AX Asynchronous Javascript And XML Figure 13 Logo de l AJAX Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 En effet Ajax est une solution permettant de ne pas rafraichir la totalit de la page chaque action demand e par l utilisateur Une partie du contr leur de l application est d port e c t client de sorte qu une action de l utilisateur ne d clenche que le rafraichissement de la zone n cessaire Permettant de fluidifier la navigation de l utilisateur lui vitant des temps de chargements lourds longs et inutiles Cette technique est possible gr ce la combinaison du JavaScript de l XML et de communications asynchrones entre le client et le serveur d o AJAX pour Asynchronous Javascript And Xml Il est possible d utiliser un Framework de type JavaScript facilitant l impl mentation en Ajax puisque cette m thode peut sembler relativement complexe au premier abord Parmi les Framework JavaScript nous retenons NGULARJS Query by Google write less do more AngularJS Ouer http angularjs org http jquery com S a Foundation 4 Foundation Bootstrap http foundation zurb com http getbootstrap com 1 6 LIMITES Figure 14 tableau de Framework MVC utilisant AJAX
70. te nouveau lancement de l analyse L enchainement A4 d marre au point 14 du sc nario nominal 14 L utilisateur choisit de revenir l tape pr c dente 15 Le syst me affiche l utilisateur la vue pr c dente de saisie de texte contenant le dernier texte qu il a renseign 16 L utilisateur lance l analyse nouveau avec le m me texte 17 Le syst me ne refait pas l analyse et affiche directement les informations collect es pr c demment Le sc nario nominal reprend au point 12 A5 R initialisation de l application et retour l accueil L enchainement A5 d marre au point 14 du sc nario nominal 14 L utilisateur choisit de r initialiser l application 15 Le syst me supprime tout ce qui n est pas enregistr sur le serveur 16 Le syst me affiche la page d accueil Le sc nario nominal reprend au point du sc nario essentiel d taill du CU Fournir un texte a analyser Enchainements d erreurs exceptionnels El Outil de R E N Inaccessible L enchainement El d marre au point 4 du sc nario nominal 4 Le syst me ne parvient pas se connecter l outil de R E N 5 Le syst me signal l utilisateur qu il n a pas r ussi se connecter l outil de R E N demand et l invite r essayer ou choisir un autre outil Le syst me reprend au point 1 du sc nario essentiel d taill du CU Fournir un texte a analyser E2 Texte non renseign L enchainement E2 d marre au point
71. ties which are found in the user s text For each type of entity one specific color is used Then the application puts markers on a map and a timeline on all of places and dates which are identified on the response Authors Antoine Catanese Jeremy Dulon Marc Lagreou Baptiste Sabuco Keywords Computer Science IT geo location spatio temporal data CATANESE Antoine DULON Jeremy LAGREOU Marc SABUCO Baptiste Page 45 sur 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 7 Glossaire Ajax Ajax Asynchronous Javascript and XML est la combinaison de technologies telles que JavaScript CSS XML dans le but de r aliser des applications internet riches Rich Internet Application ou RIA sans recharger toute la page Cela offre une maniabilit et un confort d utilisation sup rieurs API Application Programming Interface ou Interface de Programmation biblioth que de fonctionnalit s mises disposition afin de faciliter la programmation CSS CSS Cascading Style Sheets est un langage qui sert d crire la pr sentation des documents HTML et XML Il permet d appliquer un style aux pages xHTML et de g rer s par ment la forme du contenu Framework Espace de travail modulaire qui regroupe un ensemble de biblioth ques et de conventions ensemble de composants logiciels permettant le d veloppement rapide d applications HTTP L HyperText Transfer Protoco
72. tion sur une carte des lieux d tect s X A nt gration du module et tests unitaires orrection des bugs relev s pendant les tests D veloppement du module de repr sentation sur une frise des dates Al ai A x K KK A A ES ai nt gration du module et tests unitaires orrection des bugs relev s pendant les tests utilisation inalisation de la charte graphique inalisation de l int gration des diff rents modules A v A v A v A p Recette finale orrection des bugs relev s pendant les tests X X X R daction du m moire X X X X X X X X X X X X X X X r paration de la soutenance X X X X X X X X X X X 30 00 07 40 14 10 21 10 28 10 04 11 11 11 18 11 25 11 02 12 09 12 16 12 06 00 13 01 20 01 27 01 03 02 10 02 17 02 24 02 03 03 10 03 17 03 24 03 31 mars gt j koj uz m MIimizIIOIIS glo Ce 0 y OFS org on z aS SJS Os al OO gt o po fes E n iD SN le E ero 5 15 gt O ajo ala i ele sc lo ga pe Sis ey lt o Bo a O Si O O e O n B I lt q E als 5J Al o FO 5 nO E O LO z 3 A O e CATANESE ANTOINE DULON JEREMY LAGREOU MARC SABUCO BAPTISTE PAGE 31 SUR 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 Ci dessous la l gende avec le d tail des jalons Equipe responsable de l aspect technique du projet 1 Oral de pr sentation du projet 2 Remise de la charte CDCF Antoin
73. vec int gration syst matique au site d j construit Tests et Finalisation de l int eration de TE modules de ede i validation de EE l application l application ET r daction du manuel PP du produit Finalisation de la TM avant livraison Ed Construction de la structure d utilisation fini sdacti i OE ET ists ncaa R daction de la structure du site Bar al eat on daniel l application r daction du doc technique sur le plan technique graphique m moire Tout le groupe LEGENDE Adrien et Mehdi Tout en respectant la r partition des taches par sp cialit s nous avons tenu a conserver des taches en commun N anmoins nos tuteurs nous ont fait remarquer que cette repr sentation n tait pas assez d taill e dans la mesure ou elle ne faisait pas mention de t ches pr cises et cibl es dans le temps mais plut t d activit s g n rales mener par l quipe pendant une p riode donn e En outre les jalons n apparaissaient pas pr cis ment avec des dates butoirs CATANESE ANTOINE DULON JEREMY LAGREOU MARC SABUCO BAPTISTE PAGE 30 SUR 48 DUT Informatique Projet N 7 Eye Of The Tagger Rapport Final 1 3 Promotion 2013 2014 Nous avons donc d taill davantage notre planification en prenant en consid ration les d fauts soulev s et ainsi produit le planning suivant V2 15 d cembre 2013 Semaine civile N 40 9 100 4 12 13 14 4 23 4 25 26 27 28 JALONS ET DATES IMPORTANTES gt 7 8 9 10 30 09 07 10 14 1
74. x entr es un document XML transformer et un document XSLT un analyseur XSLT XSLT processor produit un fichier de sortie au format d sir Source http fr wikipedia org wiki Extensible_Stylesheet_Language_Transformations 4 2 2 Logiciels utilis s folopat source pour les langages et fichiers C C Java C XML HTML PHP JavaScript makefile art ASCII doxygen bat ASP Visual Basic VB Script SOL Objective C CSS Pascal Perl Python R MATLAB Lua TCL Assembleur NotePad est un diteur de texte g n rique cod en C qui int gre la coloration syntaxique de code Ruby Lisp Scheme Properties Diff Small talk PostScript et VHDL ainsi que pour tout autre langage informatique car ce logiciel propose la possibilit de cr er ses propres colorations syntaxiques pour un langage quelconque Ce logiciel fond sur la composante Scintilla a pour but de fournir un diteur l ger aussi bien au niveau de la taille du code compil que des ressources occup es durant l ex cution et efficace car il est galement une alternative au bloc notes de Windows d o le nom Le projet est sous licence GPL Source http fr wikipedia org wiki Notepad 2B 2B we a Microsoft Office Word 2013 est un logiciel de traitement de texte Nous l avons utilis lors de la r daction de tous les documents crits que nous avons eu produire Microsoft Office Powerpoint 2013 est un logiciel de pr sent

Download Pdf Manuals

image

Related Search

Related Contents

NOTA - Jacobsen  Direction de l`Immobilier Marchés publics Comment répondre par    Audiovox VBP3800 User's Manual  manuale MN MD 08.p65  

Copyright © All rights reserved.
Failed to retrieve file