Home

Moteur de Recherche Corese Rapport d`Activité

image

Contents

1. il a fallu r crire plusieurs requ tes A chaque nouvelle version de Corese cela nous servait galement de test suppl mentaire et a permis la correction de plusieurs bugs e Traitement des exceptions refactoring 0 75 Mois Mois J ai relev toutes les exceptions de Corese puis je les ai regroup es sp cialis es certaines taient de simples catch Exception e d autres ne conduisaient aucun traitement J ai cr un package exception et une hi rarchie des exceptions en cr ant quelques nouvelles classes d exceptions Avec Corese il y a 3 fa ons de g rer les erreurs avec des exceptions avec un logger en imprimant un message d erreur avec un tableau d erreurs et la fonction addError String message J ai essay de rendre coh rente et homog ne la gestion des erreurs ce qui a conduit a un refactoring d une bonne partie du code Deuxi me ann e 17 10 2006 17 10 2007 Bilan des t ches effectu es 17 10 2006 20 09 2007 e Documentation Manuel utilisateur refactoring et correction de bugs 2 Mois J ai r alis un manuel utilisateur pour Corese 8 en anglais actuellement en ligne et que nous mettons jour chaque nouvelle version de distribution R diger cette documentation nous a permis de trouver des bugs que nous avons corrig s au fur et mesure Plusieurs personnes de l quipe m ont aid e en la relisant et en m indiquant des fautes ou des manquements Dans u
2. Can NEED ANW wS org http Anw w3 org a gt RDF Semantics http xmins com foaf 0 1 name https www NME US http Aww w3 org1 99902 22 rdf syntax ns type mma http www ihme us http ww IAME US Patrick Hayes Repr sentation graphique du fichier RDF http xmins com foaf0 1 Mmbox mailto phayes ihmc us e Profiling suite 0 5 Mois Comme Corese est maintenant crit en Java 1 5 et que l quipe utilise Eclipse et non plus JBuilder il a fallu trouver un autre outil de profiling car nous n avons pas la licence pour Optimizelt avec cette configuration Nous avons choisi de r essayer TPTP le plugin Eclipse Ce plugin a beaucoup volu en un an mais il reste tr s gourmand en m moire c est pourquoi nous n avons pas pu utiliser toutes les fonctionnalit s souhait es N anmoins nous avons pu v rifier qu aucun code non optimis n a t introduit depuis l tude de l ann e pr c dente 10 Planning pour la fin de l ann e 20 09 2007 17 10 2007 e Mise en place du SPARQL Protocol 16 finalisation des services web de Corese 0 5 Mois Nous souhaitons mettre en place le protocole SPARQL permettant une pr sentation standardis e du web service de Corese Cela me permettra galement d appliquer ce que j ai appris lors de ma formation e Analyse conception plugin Eclipse SPARQL 0 5 Mois Enfin si le temps le permet nous aimerions effectuer l analyse d un plugin Eclips
3. possibilit de d finir un pr fixe dans les r gles lt cos rule gt lt cos if gt PREFIX humans lt http www inria fr 2007 04 17 humans rdfs gt x rdf type humans Female x rdf type humans Person lt cos if gt lt cos then gt x rdf type humans Woman lt cos then gt lt cos rule gt Exemple de r gle Si on trouve quelqu un x qui est de type humans Female et humans Person alors cet individu x est aussi de type humans Woman e Java 1 5 1 Mois Corese est d sormais cod avec Java 1 5 6 part quelques noms de variables changer car ceux ci sont devenus des mots cl s ex enum il ny a pas eu de grands changements faire pour que Corese fonctionne avec la nouvelle version Pour utiliser au mieux les optimisations apport es j ai revu une bonne partie du code de Corese en sp cifiant le type des Map Array Vector Cela a permis de supprimer les conversions de type et de d tecter certaines erreurs de typages la compilation EX vector v new Vector gt Vector lt String gt v new Vector lt String gt Certaines t ches pr vues pour la 2 ann e ont galement pu tre faites e Int gration du nouveau parser dans Sewesel 7 0 25 Mois J ai travaill avec l ing nieur qui s occupe de Sewese framework permettant la cr ation simplifi e d applications pour le web s mantique afin d int grer la nouvelle version de Corese contenant le parser SPARQL
4. Moteur de Recherche Corese Rapport d Activit 20 06 2006 20 09 2007 Virginie BOTTOLLIER Virginie Bottollier sophia inria fr Equipe ACACIA EDELWEISS INRIA Sophia Antipolis Contact Olivier Corby Olivier Corby sophia inria fr 04 92 38 78 71 R sum Ce document pr sente les travaux r alis s depuis le dernier rapport d activit 20 06 2006 1 en tant qu ing nieur associ e dans l quipe ACACIA EDELWEISS Le travail a principalement consist int grer le langage de requ te standard SPARQL au moteur de recherche Corese et d velopper celui ci La premi re ann e s est d roul e en trois parties la r alisation d un Parser JavaCC l int gration de la syntaxe de Corese et lajout de nouvelles fonctionnalit s SPARQL dans Corese En parall le jai augment la base de test et particip la gestion du projet de d veloppement de Corese GForge Subversion Java 1 5 La deuxi me ann e s est articul e autour de trois grands axes une partie documentation r alisation et publication d un manuel utilisateur benchmark Corese Jena une partie distribution cr ation d une nouvelle API pour les utilisateurs distribution de la version standalone de Corese et une partie plus d veloppement ajout de nouvelles fonctionnalit s d veloppement d un Service Web Table des Mati res Premi re ann e 16 10 2006 16 10 2007 e sessssesesscscceoescesseosssescescsoesoseoscsss
5. SPARQL j ai particip au d veloppement de Corese en l installant sur GForge avec subversion j ai galement beaucoup augment la base de tests Deux apports majeurs pour les utilisateurs consistent dans la r alisation d une documentation en ligne et la cr ation d une nouvelle API Enfin j ai aussi permis l ajout de nouvelles fonctionnalit s et le d veloppement d un service web D un point de vue plus personnel ces deux ann es au sein de l INRIA m ont permis d acqu rir de l exp rience en d veloppement informatique de renforcer mes comp tences en Java en me familiarisant avec Eclipse J ai galement d couvert les technologies du web s mantique Travailler dans un centre de recherche tel que l INRIA m a donn une ouverture d esprit sur le monde informatique cours s minaires colloquiums J ai beaucoup appr ci de travailler au sein de l quipe EDELWEISS que je remercie chaleureusement pour son accueil et sa confiance pendant ces deux ann es Enfin je tiens remercier plus particuli rement Olivier Corby et David Rey mes encadrants scientifique et technique 12 R f rences 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Rapport d activit 2006 http www sop inria fr dream rapports suivi dev 2005 ra acacia pdf SPARQL http www w3 org TR rdf sparql query Corese http www sop inria fr acacia corese TPTP http www eclipse org tptp Optimizel
6. c elements 1 1 xmlns foaf http xmlns com foaf 0 1 xmlns rdf http www w3 0org 1999 02 22 rdf syntax ns xmlns cos http www inria fr acacia corese cos graph http www w3 org gt lt rdf Description rdf about http www w3 org TR 2004 REC rdf mt 20040210 gt lt dc title gt RDF Semantics lt dc title gt lt dc creator gt lt foaf Person rdf about http www ihmc us users user php UserID 42 cos graph http www ihmce us gt lt foaf name gt Patrick Hayes lt foaf name gt lt foaf mbox rdf resource mailto phayes ihmc us gt lt foaf Person gt lt dc creator gt lt rdf Description gt lt rdf RDF gt Fichier RDF lt http www w3 org TR 2004 REC rdf mt 20040210 gt dc title RDF Semantics Source http www w3 org lt http www w3 org TR 2004 REC rdf mt 20040210 gt dc creator lt http www ihmc us users user php UserID 42 gt Source http www w3 org nt nt lt http www ihmc us users user php UserID Source http www ihmc us 42 gt rdf type foaf Person ei lt http www ihmc us users user php UserID 42 gt foaf name Patrick Hayes Source http www ihmce us lt http www ihmc us users user php UserID lt mailto phayes ihmc us gt Source http www ihmce us 42 gt foaf mbox Triplets g n r s http wa w3 orgiTR 2004 REC rdf mt 2004021 0 http Apurlorgidcielements 1 1 creatoy hip pun orgac elements t e
7. e pour le langage SPARQL Perspectives Si le travail d analyse d un plugin Eclipse pour le langage SPARQL se r v le int ressant celui ci devrait tre mis en place L quipe EDELWEISS envisage de construire une nouvelle plateforme de graphes en partenariat avec une quipe de Montpellier Pour cela la Color Griwes a t cr e 17 Corese va quand m me continuer tre maintenu car il est utilis dans plusieurs projets europ ens Le projet RIF du W3C Rule Interchange Format 18 avan ant tr s lentement nous n avons pas encore pu l int grer Corese B n fice Personnel Au cours de ces deux ann es jai pu acqu rir une formation et une exp rience cons quente et me perfectionner dans les domaines suivants 1 Organisation Cr ation d un planning avec un bilan mensuel des objectifs r alis s r aliser Travail en quipe Travail dans un contexte de recherche Connaissance du W3C 2 Outils Eclipse Ant JUnit tests de non r gressions Subversion tortoiseSVN MagicDraw Optimizelt Unix TPTP 3 Technologies Le Web S mantique RDF S OWL SPARQL les ontologies Langages Java javaCC Cr ation d un parser partir d une grammaire Les Web Services Axis XFire WSDL Conception et d veloppement d une API Sensibilisation aux probl mes de compatibilit ascendante Conclusion Pour r sumer j ai permis Corese d utiliser le futur standard du W3C
8. esesececcecesososeosssescesceceecscosossosscsscsccscssosose 2 Deuxi me ann e 17 10 2006 17 10 2007 ssesessessssssscsccscscoecosscssesececcscesoecesossosessscsecscsccsossosessssssescesesoceossosesssesessesoe 4 Bilan des t ches effectu es 17 10 2006 20 09 2007 issues 4 Planning pour la fin de l ann e 20 09 2007 17 10 2007 rrrrrrerereeeeeeenennes 11 PerSD CVeS imminent E E E den dede s ee AE can des ne nee MERS ire rene AA 11 B n fice P rsonnel 535 85 0 setissssessisrentennesnnssessasrensenneenenensi ares se nese ten EEES des end ae dense des EEES ES es sean esse 12 CONCIUSION sise TAAS ess AERIANA IENE ds dust do usa du ds cd 12 R T TENC S PSE E AEN E EEEE se ns N E rte en en st E 13 Premi re ann e 16 10 2006 16 10 2007 Comme d crit dans le pr c dent rapport d activit les 8 premiers mois ont servi int grer SPARQL 2 dans Coresel 3 d veloppement de la grammaire SPARQL ajout des fonctionnalit s de Corese dans cette grammaire et quelques taches annexes travail sur les Datatypes criture de tests passage subversion et GForge Les diff rentes t ches pr vues pour la fin de cette premi re ann e ont toutes t r alis es e Finaliser le parser 0 5 Mois Apres avoir introduit de nombreuses fonctions fonctions d agr gations fonctions bas es sur XPath j ai rendu le package correspondant au nouveau parser SPARQL fonctionnalit s sp cifiques Corese i
9. inria acacja corese triple parse fr inria acacia corese exceptions Diagramme de classe simplifi permettant de voir la nouvelle API e Relecture des sp cifications SPARQL mise jour de la grammaire 0 25 Mois SPARQL a atteint le stade de Candidate Recommandation depuis le 14 Juin 2007 La relecture de toute la sp cification a conduit l ajout de nombreux tests et la mise jour de la grammaire nouveau mot cl REDUCED e Traceur D buggueur de la projection tudier le mode debug d Eclipse 0 25 Mois Nous n avons malheureusement pas eu le temps de faire un vrai traceur d buggeur comme c tait pr vu initialement Nous avons tout de m me eu le temps d tudier ce que nous offre le d buggueur d Eclipse et les fonctionnalit s pouss es qu il nous offre Il semblerait que ce d buggueur suffise aux besoins des d veloppeurs Quelques t ches non pr vues ont galement t r alis es e Nouvelles versions de distributions V2 2 2 D cembre 2006 et v2 3 0 Mai 2007 2 0 5 Mois Pour distribuer Corese au public nous faisons une version standalone chaque fois qu une nouvelle version est mise en ligne il faut tester cette nouvelle version corriger le tutorial de Corese en rajoutant des questions r ponses sur les nouvelles fonctionnalit s corriger la documentation en ligne r crire la javadoc crire un fichier d exemples permettant d utiliser Corese La version de D cembre correspo
10. ltat sachant que la partie Corese prend environ 16 50s avec cette ontologie Nous avons galement essay de stocker un vecteur de triplets s rialis mais la lecture de ce vecteur prenant trop de temps l id e a t abandonn e et nous sommes retourn s au chargement des NTriples e int gration de RDF a 0 5 Mois RDFa 15 est une syntaxe permettant d int grer des triplets RDF S dans du XHTML C est ce qui va permettre l expansion du web s mantique Nous avons d cid d int grer un parser RDFa d velopp par un membre de l quipe dans Corese c est dire de construire et de charger des triplets partir d un document RDF a e Mise en place d un moyen pour allouer une source un document ou et un triplet 0 5 Mois Lorsque l on interroge un serveur RDF S la source des donn es peut tre importante Le langage SPARQL propose un moyen d interroger cette source or cette notion de source n existe pas actuellement en RDF nous avons voulu l ajouter Pour cela nous proposons de rajouter un attribut dans les fichiers RDF S permettant de pr ciser la source d un triplet ou d un ensemble de triplets Nous avons r cup r le code source du parser RDF que nous utilisons ARP et rajout l attribut cos graph qui permet de sp cifier la source Cette fonctionnalit a t impl ment e dans Corese Nous envisageons de soumettre ce travail au W3C Exemple lt rdf RDF xmlns dc http purl org d
11. nd pendant du reste du code en cr ant plusieurs interfaces Pour tester ce nouveau parser en dehors du reste de Corese il suffisait d impl menter une interface CoreseParser puis de tester le parsing avec la classe contenant la m thode main Corese java Corese Interface ICoreseParser e Profiling de Corese 1 Mois J ai cherch des outils pour r aliser le profiling de Corese j ai tout d abord trouv TPTP 4 un plugin pour Eclipse mais il est tr s gourmand en m moire Apres avoir r ussi r duire un peu sa lenteur en le configurant nous avons pr f r utiliser Optimizelt 5 soumis licence install sur une des machines de l quipe Avec Optimizelt j ai relev le nombre d instances l endroit o elles sont cr es le temps pass dans les m thodes la couverture du code classes non charg es faible pourcentage de code utilis dans les classes classes utilis es 100 Cela nous a permis de supprimer un bon nombre de classes inutiles Le plugin TPTP nous a quand m me permis de trouver plusieurs m thodes inutilis es et de les effacer e Langage de r gles utilisation du nouveau parser 0 5 Mois Avec Corese il est possible d crire des r gles d inf rences J ai modifi le code pour que le langage de r gles soit d sormais proche de SPARQL il correspond un sous ensemble de SPARQL plus les fonctionnalit s de Corese Jai galement rajout la
12. ndait tout le travail r alis depuis mon arriv e ici le nouveau parser SPARQL d o r criture de certaines requ tes le passage Java 15 La version de Mai correspond l ajout d une nouvelle API pour l utilisateur ainsi que de quelques fonctionnalit s OWL e Ajout de nouvelles fonctionnalit s select functions 1 Mois Apr s avoir tudi le code en profondeur jai ajout une nouvelle fonctionnalit Corese l utilisateur peut d sormais s lectionner une fonction dans la requ te SPARQL Apr s avoir modifi la grammaire il a fallu ensuite faire tout le m canisme Exemple de requ te utilisant cette fonctionnalit SELECT type function x as fun WHERE x rdf type type Par la suite j ai r crit une bonne partie du code en l optimisant e Benchmark Jena Corese 10 0 5 Mois Nous avons r dig un article portant sur les optimisations dans Corese Afin de les mettre en vidence j ai r alis une comparaison entre Jena 11 un framework pour cr er des applications pour le web s mantique contenant un moteur d inf rence et utilisant SPARQL et Corese Le benchmark comporte une centaine de tests dans environ 20 des cas Corese est meilleur que Jena et dans 80 ils sont quivalents il a abouti la r daction d un compte rendu publi sur le site de Corese e Formation sur les Services Web Application 0 5 Mois J ai suivi la formation D vel
13. ne premi re partie cette documentation pr sente Corese son interaction avec les diff rents projets europ ens de l quipe comment utiliser la version Standalone Ce manuel pr sente galement toutes les fonctionnalit s non pr sentes dans SPARQL avec pour chacune un ou plusieurs exemples Puis viennent la cr ation et l utilisation de fonctions externes et les r gles Enfin la troisi me partie plus technique aborde l API de Corese le traitement des r sultats et les fichiers de configuration e Modularisation du code package projection 0 5 Mois Comme cela avait t fait pour le parser j ai essay d isoler le package projection Pour cela j ai d cr er plusieurs interfaces et deux factories utilisant les fonctions Class forName et newinstance de Java try Class valueClass Class forName package NomDeLaClasse Object argClass arg getClass Object arg arg Object o valueClass getConstructor argClass newInstance arg catch Exception e e printStackTrace Cr ation d une instance d une classe partir de son nom e Cr ation d un service web 0 5 Mois Je me suis document e sur les Web Services avec Internet Apr s quelques r unions il a t convenu d utiliser dans un premier temps la plateforme Axis 9 J ai commenc par d velopper un service web de base pour Corese qui a t utilis par un des projets europ ens de l qui
14. opper des Services Web pour Java pendant 4 jours Paris d but Juin Cette formation riche en travaux pratiques m a appris beaucoup de choses sur les services web les piles Axis XFire WebServiceStudio les langages technologies utilis s WSDL SOAP UDDI sur la culture informatique en g n ral d couverte de Net rappel des principaux protocoles du Web rappel d UML J ai galement suivi une formation de mise niveau pour Java 6 0 qui a t dispens e l quipe EDELWEISS les 28 et 29 Aout e Nettoyage de code ajout d un parser de triple 0 5 Mois L quipe souhaite rendre disponible Corese en open source Pour cela une partie nettoyage du code a t entam e supprimant du code obsol te Charger de tr s grandes ontologies prend du temps avec Corese Apr s analyse on peut voir qu environ 50 du temps de chargement est utilis par ARP 12 le parser RDF S d velopp par HP que nous utilisons Pour r duire ce temps de chargement nous avons stock les triplets une fois g n r s dans un fichier sous la forme de NTriples 13 puis aux chargements suivants de parser ce fichier de triplets plut t que celui contenant les donn es en RDF S XML Pour l ontologie Wordnef14 une grosse ontologie de plus de 400 000 triplets il y en a 20 000 dans Corese nous sommes pass d un temps de chargement de 33 43s avec RDF S 18 54s avec le parser de triples c est un tr s bon r su
15. pe Le service d velopp prend en param tres une URL repr sentant un lien vers un fichier d crivant une ontologie une URL vers un fichier d annotations une URL vers un fichier de r gles et une requ te Il est possible de donner un chemin vers un r pertoire entier au lieu d un seul fichier Le r sultat de la requ te SPARQL est retourn sous la forme d une cha ne de caract res XML Result Format ou RDF e Utilisation du service web de Corese dans Sewese 7 0 5 Mois L ing nieur s occupant de Sewese m a expliqu rapidement les diff rentes parties de ce framework J ai rajout une nouvelle page JSP faisant appel au service web de Corese Cette page n est pas actuellement utilis e mais elle sert de preuve de concept Cela ma permis de me familiariser avec le d veloppement d une application web d utiliser JSP Java les tags tld le fichier de configuration de d une application web web xml e Cr ation d une nouvelle API pour les utilisateurs de Corese 2 Mois Nous avons rendu Corese plus compr hensible aux utilisateurs en extrayant les fonctions qui leurs sont utiles dans des interfaces Pour cela avec l aide de plusieurs membres de l quipe j ai con u une nouvelle couche logicielle au dessus de Corese compos e essentiellement d interfaces et de quelques factories permettant la communication avec le monde ext rieur fr inria acacia corese triple parser fr inria acacia corese api fr
16. t http www borland com downloads download optimizeit html Java 1 5 http java sun com j2se 1 5 0 Sewese http www sop inria fr acacia soft sewese Manuel d utilisation de Corese http www sop inria fr acacia soft corese manual Axis http ws apache org axis Benchmark Corese Jena http www sop inria fr acacia corese test html Jena http jena sourceforge net ARP http www hpl hp com personal jjc arp NTriples http www ws3 org TR rdf testcases ntriples Wordnet http www semanticweb org library RDFa htto www w3 org TR xhtml rdfa primer SPARQL Protocol htto www w3 org TR rdf sparql protocol Color Griwes http www sop inria fr acacia project griwes wakka php wiki ColorGriwes RIF htto www w3 org 2005 rules

Download Pdf Manuals

image

Related Search

Related Contents

Manuale di istruzioni ABI  L`évaluation en toxicomanie : questions préalables  Switch & Go Dinos Turbo - Bronco the RC Triceratops  DEVA is the world`s first high quality disk replacement for tape based  

Copyright © All rights reserved.
Failed to retrieve file