Home
Impact de la prise en compte d`information contextuelle sur la
Contents
1. seseessssessssssesssseseeserssssrsesseseesessesersees 30 Heure 9 Pr filtrage contextuel ionian aa 2s wate a a aco Det iu en 33 Fig re 10 Post filtrage contextuel Se a 33 Figure 11 Mod lisation contextuelle seseeeeeeeeeeseseseeeseesresressetseesrestessesereseessresrensersrerresseese 34 Figure 12 Types des composants de l architecture DISCOVER sssssseessesesseseessssesesessesereee 38 Figure 13 Etape de traitement des services 22224 entente ing 39 Figure 14 Exemple d interaction de plusieurs services ssesseeseseseseesseseressersresreesersresreeseese 39 Figure 15 L interface graphique du syst me News Hand cceeeeseeseeeeeeeeceeeceseeeeeneeeeees 41 Figure 16 Expansion et contextualisation des pr f rences de l utilisateur eee eee 42 Figure 17 Imprime cran du logiciel note 2023 A es 42 Figure 18 Fragment de m tadonn e d crivant un restaurant 43 Figure 19 Un fragment MUP d une personne nomm Dora 44 Figure 20 Exemple de r gles tendant MyMap ssssssesseessesee 45 Figure 21 Exemple de recommandation utilisant MyMap eeseeseceseceseeesseeesseeenaeenseeees 45 Figure 22 Imprime cran du site WwWW sourcetone COM 46 Figure 23 Barre d outils du site www amazon com sesesseseesesssesetsessesstsersssseesesseseesessesersess 46 Figure 24 L architecture du mod le d acc s perso
2. Rig gt he E 2 A 2 9 e R publique Alg rienne D mocratique et Populaire pa A Gt tt og tt E is a Minist re de l Enseignement Sup rieur ot de la Recherche Scientifique ne stat RT Unive r ite Facult des sciences Oran Pr sent par Mr SOLTANI R da Pour obtenir LE DIPLOME DE MAGISTER Sp cialit Informatique Option Diagnostic Aide la D cision et Interaction Humain Machine Intitul Impact de la prise en compte d information contextuelle sur la pertinence des syst mes de recommandations Membres de jury M G BELALEM Docteur Universit d Oran Alg rie Pr sident M S NAIT BAHLOUL Docteur Universit d Oran Alg rie Examinatrice M M K ABDI Docteur Universit d Oran Alg rie Examinateur M L BABA HAMED Docteur Universit d Oran Alg rie Encadreur 2011 2012 D dicaces Je d die ce travail a ceux qui m ont encourag et soutenu A ma m re et mon p re qui ont partag toutes mes joies et mes douleurs A ma s ur Im ne et mon fr re Amine A mes tantes Nadia Kheira et Fouzia Ames proches amis Sanaa Nesrine Karima ainsi que Hichem Mehdi Boubakeur Yazid Lotfi et Mohamed A Mr SABRI Kamel et sa femme Amel A tout le personnel de la conservation des for ts et la DCP A toute la famille et tous mes amis et coll gues que j ai oubli de citer Remerciements Je remercie DIEU le tout puissant qui ma donn la fo
3. lt retention gt lt UbisWorld short gt lt retention gt lt viewer gt lt UbisWorld MyMap gt lt viewer gt lt explanation confidence 0 75 creator Dora evidence Interface input method acquire pref gt lt meta gt lt Statement gt Figure 19 Un fragment MUP d une personne nomm Dora Imaginons le sc nario suivant Dora une touriste est Bari ville italienne pour la premi re fois Quand elle est l tranger elle pr f re go ter des aliments locaux dans les restaurants typiques ventuellement manger l ext rieur en t Elle arrive au centre ville et il est l heure du d jeuner il est peu probable qu il va pleuvoir En utilisant son appareil personnel elle demande des suggestions sur les endroits o manger Supposons que Dora a fait son choix et une fois 1a bas elle d couvre qu elle ne peut pas manger l ext rieur parce qu il pleut Par cons quent Dora sera d ue et peut tre qu elle dira MyMap Hey tu ne sais pas qu il pleut Pourquoi m as tu sugg r ce restaurant Une des limites de MyMap est qu il ne prenne pas en consid ration les situations exceptionnelles qui pourraient rendre inutile la suggestion et de r duire ainsi la confiance des utilisateurs envers le syst me De Carolis et al 16 ont d cid de traiter ce genre de situations en tendant MyMap avec des r gles filtrant l ensemble de suggestions recommander avant de proposer des lieux d int r
4. 5 2 1 Resnik 1999 Resnik 34 d finit la similarit s mantique entre deux concepts par la quantit d information qu ils partagent Cette information partag e est gale au contenu informationnel CI du plus petit g n ralisant PPG Plus Petit G n ralisant est le concept le plus sp cifique qui subsume les deux concepts dans l ontologie Par exemple dans la figure 7 le PPG des concepts X et Y est le concept CS Sim c1 c2 Max CI PPG c1 c2 O CI log P c 5 2 2 Mesure de Lin 1998 Lin a d fini la similarit de concepts comme le rapport entre la quantit d informations n cessaires pour indiquer le point commun entre ces deux concepts et les informations n cessaires pour les d crire 25 Cette mesure est l g rement diff rente de celle de Resnik 2 x CI PPG a b Sim a b To 5 3 Approches hybrides Ces approches sont fond es sur un mod le qui combine entre les approches bas es sur les arcs Distances en plus du contenu informationnel qui est consid r comme facteur de d cision 5 3 1 Mesure de Jiang et Conrath 1997 Pour rem dier au probl me pr sent au niveau de la mesure de Resnik Jiang et Conrath 22 ont apport une nouvelle formule qui consiste combiner l entropie contenu informationnel du concept sp cifique ceux des concepts dont on cherche la similarit combine entre les techniques bas es sur les arcs et les techniques bas es sur les n uds qui con
5. Exemple Si Samira aime les chansons interpr t es par des chanteurs similaires et que nous avons l information selon laquelle Sharika est plus similaire chante le m me style que Lady Gaga qu elle ne l est avec C line Dion alors il serait plus pertinent de consid rer les pr f rences de Samira relatives Lady Gaga lt genre chanson sentimentale 0 1 chanteur Lady Gaga gt pour valuer les chansons de Shakira Et comme Shakira n est pas Lady Gaga alors nous introduisons aussi un facteur de correction des pr f rences qui est donn par la similarit entre Shakira et Lady Gaga Algorithme 2 d crit le processus de r solution des contextes L algorithme prend en entr e l ensemble des instances de contexte donn es dans les contenus candidats ainsi que l ensemble des contextes contenus dans le profil utilisateur il renvoie un ensemble de paires contexte facteur de correction compatibles avec le profil utilisateur 5 3 Appariement profil contenu Le processus de base dans un SR est celui charg d valuer la pertinence d un contenu pour un utilisateur particulier Certains SR d cident qu un contenu est pertinent pour un utilisateur si les utilisateurs qui lui ressemblent ont consomm ce contenu et l ont consid r comme pertinent pour eux On parle alors de SR bas sur le filtrage collaboratif CF D autres SR pr disent la pertinence d un contenu pour un utilisateur en calculant la similarit co
6. Horror Sci Fi Thriller 589 Terminator 2 Judgment Day Action Adventure Sci Fi Thriller 590 Dances with Wolves Adventure Drama Western Action Crime Fantasy Thriller 593 Silence ofthe Lambs Crime Thriller Crime Drama Thriller Action Adventure Mystery Thriller Action Adventure Thriller Action Sci Fi Thriller Adventure Family Fantasy Musical Drama Mystery Action Crime Thriller Drama Family Fantasy Sci Fi Action Adventure Drama Sci Fi Thriller 1196 Star Wars Episode V The Action Adventure Fantasy Sci Fi Empire Strikes Back Action Adventure Thriller Action Horror Sci Fi Thriller Action Adventure Drama War 1210 Star Wars Episode VI Return of Action Adventure Fantasy Sci Fi aa the Jedi Horror Sci Fi Thriller Action Sci Fi Thriller Comedy Drama Romance crime Mystery Thriller 110 ANNEXE 2 1258 Horror Thriller 1259 Stand by Me 1270 Back to the Future Action Adventure Comedy Sci Fi 1291 Indiana Jones and the Last Action Adventure Fantasy Thriller Crusade 1294 M A S H Comedy Drama War 1304 Butch Cassidy and the
7. contextuelle avec laquelle l utilisateur choisit un certain article dans un contexte donn Les recommandations obtenues en utilisant la m thode 2D sont contextualis es en utilisant les probabilit s contextuelles La probabilit contextuelle Px i J avec laquelle le i me client ach te le j me l ment dans le contexte k est calcul e comme le nombre de voisins les clients similaires 1 qui ont achet le m me article dans le m me contexte divis e par le nombre total de voisins Les approches diff rent selon la fa on avec laquelle les recommandations sont contextualis es Le Weight PoF multiplie chaque valuation 2D par P i j Rating i j Rating x Px i j Tandis que Filter PoF filtre les valuations 2D partir d une valeur seuil de P i j f Rating i j if P ij gt P Rating 0 if Pij lt P O P est la valeur du seuil U Panniello A Tuzhilin M Gorgoglione 32 ont compar les approches pr filtrage et post filtrage pour g n rer des recommandations contextuelles En particulier ils ont utilis la m thode Exact Pre Filtering EPF et les m thodes de Post filtrage Weight et Filter Ils ont compar ces m thodes travers des ensembles de donn es et les exp rimentations ont montr que la m thode du Filter domine EPF et que l EPF domine la m thode du Weight Cela implique que la comparaison entre les approches de pr et post filtrage d pend de mani re signific
8. cout s Pour estimer l erreur commise se fait en hors ligne les pr dictions des pr f rences g n r es sont compar es aux pr f rences des utilisateurs obtenues explicitement Les diff rentes tapes de la m thode e Extraction des donn es implicites les pr f rences et les diviser en plusieurs segments contextualis s e Transformer chaque segment en matrice A utilisateur x item o Au i correspond aux pr f rences explicites L utilisation de ces micro profiles am liore l exactitude de la recommandation L un des probl mes pos s par cette m thode r side dans le fait que le partitionnement du temps diff re 35 CHAPITRE II Les syst mes de recommandation sensibles aux contextes d un utilisateur un autre au lieu d tre fixe pour tous les utilisateurs ce qui risque de diminuer la pr cision du syst me 8 1 2 DaVI L approche DaVI Dimension as virtual items 17 introduit la notion du contexte qui sera consid r e comme tant un item virtuel structur de la m me mani re que les autres items Par cons quent il sera trait par les diff rentes approches de recommandations de la m me fa on que les autres articles L approche utilise l un des deux algorithmes savoir le filtrage bas sur le contenu et les r gles d associations Le contexte sera obtenu partir des donn es multidimensionnelles fichiers journaux des sites web identificateur de l utilisateur page visit e
9. et permettent de d finir un ordre partiel sur les objets Les pr f rences quantitatives sont exprim es a travers des fonctions de scores qui attribuent des scores aux diff rents objets Ce type de pr f rences permet de d finir un ordre total sur les objets Dans le reste de ce chapitre nous nous focaliserons sur les pr f rences quantitatives que nous mod lisons comme suit Une pr f rence pi est un couple pi pri wi o pri est un pr dicat de type lt attribut op rateur valeur gt et wi est un nombre r el compris entre 0 et 1 qui repr sente le degr d int r t de l utilisateur par rapport au pr dicat pri La valeur 0 refl te la pr f rence minimale alors que la valeur 1 refl te la pr f rence maximale Exemple Soit R un sch ma de relation mod lisant des voitures R marque type prix couleur kilom trage puissance nbChevaux nbPlaces Un utilisateur peut d finir les pr f rences suivantes p lt couleur Rouge gt 0 9 et p2 lt Prix gt 1 4M DA gt 0 2 La pr f rence p1 exprime le fait que l utilisateur accorde un score de 0 9 aux tuples de la relation R voiture pour lesquels l attribut couleur prend la valeur rouge En m me temps cet utilisateur accorde un score de 0 2 aux tuples pour lesquels l attribut prix prend une valeur sup rieur 1 4 million de Dinars Alg riens Contexte Dans ce m moire nous d finissons le contexte du point de vu des objets et non pas de ce
10. Action Aventure Horreur Sci Fi Thrilleur R alisateur Spielberg Steven Le film 2 est d crit comme suit Film ID_Film 1610 Titre Hunt for Red Genres Action Aventure Thrilleur R alisateur McTiernan John 66 CHAPITRE III Conception et R alisation Nous remarquons que le r alisateur du film Jurassic Park Spielberg Steven figure d j dans le profil de l utilisateur Cela nous permet de calculer la similarit globale entre le profil utilisateur et le descripteur du film en tenant compte des pr f rences des genres relatifs au r alisateur Spielberg Steven SiMgiobae ID_ utilisateur 424 ID_Film 480 0 72 Enfin nous comparons cette pr diction un seuil pr d fini pour recommander ou non le film Jurassic Park l utilisateur N 424 Afin d estimer l int r t du film Hunt for Red par rapport l utilisateur N 424 le contexte R alisateur McTiernan John doit tre r solu Ceci revient trouver qui parmi Spielberg Steven et Zemeckis Robert est le plus similaire McTiernan John ce quoi la matrice de similarit s permet de r pondre Il est noter que cette matrice contient 427 r alisateurs ayant r alis un total de 4141 films Le tableau 9 montre un fragment de cette matrice Tableau 9 Fragment de la matrice de similarit s entre r alisateurs Spielberg McTiernan Zemeckis Steven John Robert Spielberg 1 0 66 0 56 M Steven McTiernan 0 66 1 0 50 John Zemeckis 0
11. Ils apprennent les int r ts de l utilisateur collectent les valuations des documents effectuent des recommandations de documents et peuvent aider localiser un type particulier de documents Le serveur FGACF lui s occupe de collecter les valuations des agents utilisateurs De plus il contient un module de traitement des documents qui permet d extraire des caract ristiques simples d un document qui seront utilis es pour d terminer une partition de l espace des documents L algorithme ACF peut tre guid par les caract ristiques des documents de deux fa ons soit des clusters sont automatiquement form s l aide des corr lations entre utilisateurs puis analys s pour trouver leurs points communs soit on utilise les caract ristiques du document pour d terminer une partition de l espace des documents 4 4 3 Exemple Comme illustr dans la figure 6 D abord le syst me applique part une ou plusieurs techniques de filtrage de base telles que filtrage collaboratif filtrage bas sur le contenu et filtrage d mographique Cette phase pr liminaire g n re les recommandations candidates et qui sont combin es par certaines m thodes d hybridation dans la phase de couplage afin de produire les recommandations finales destin es l utilisateur 19 CHAPITRE I Les Syst mes de Recommandation Classiques Th me mosraphi Evaluation a Le g LS profil donn es valuations th matique d mographiques
12. Pennock amp Horwitz 1999 Goldberg et al 2001 Kumar et al 2001 Paviov amp Pennock 2002 Shani et al 2002 Yu et al 2002 2004 Hofmann 2003 2004 Marlin 2003 Si amp Jin 2003 Combining content based and collaborative components by e Incorporating one component as a part of the model for the other Building one unifying model Representative research examples Basuet al 1908 Condliff et al 1999 Soboroff amp Nicholas 1999 Ansari et al 2000 Popescul et al 2001 Schein et al 2002 e666 806 6 0 868 6 6 CHAPITRE I Les Syst mes de Recommandation Classiques 8 Conclusion Dans ce chapitre nous avons d abord pr sent la notion des syst mes de recommandation en d taillant les trois approches les plus utilis es savoir l approche FBC FC et hybride Ensuite nous avons d fini la notion de profil utilisateur avec ses deux facettes explicite et implicite Nous avons galement pass en revue les diff rentes classes de mesures de similarit utilis es par les SRs pour faire le matching entre deux profils utilisateur deux contenus ou un profil utilisateur et un descripteur de contenu Enfin nous avons termin en citant quelques probl mes rencontr s par les syst mes de recommandation classiques Parmi les probl mes voqu s est le fait que ces syst mes ne tiennent pas compte du contexte dans lequel se trouve l utilisateur lorsqu il d sire une recommandation Les syst mes de recommandation sensi
13. Sim jn BE s im j 1 11 Sim i i2 T Sim j 1 Ix 1 rte Sim J 1 jn Sima i Simai Lee Sim jn ix Sim an ji ee 1 L application de DaVI aux r gles d associations AR il s agit ici de d duire un ensemble d items recommander pour un individu donn partir d un ensemble de sessions web pr sent es sous forme de paires lt identifiant de l utilisateur item gt en utilisant des r gles d association 8 1 3 DISCOVR Le syst me DISCOVR 20 voir figure 12 a t d velopp sous forme de services qui sont configurables via des fichiers XML Ces services peuvent tre combin s de fa on ce que la sortie de l un constitue l entr e de l autre et ce durant tout le processus de recommandation Ceci facilitera l int gration de plusieurs techniques de recommandation que ce soit en parall le ou s par ment et avec ou sans la prise en consid ration du contexte 37 CHAPITRE II Les syst mes de recommandation sensibles aux contextes Semantic Weighted Textual Model resources data Lay Sorted list of Per eee resources MOD SR WR TRS Sgr Trigger Type Semantic model _ at most one representing the __ 6 4 background data 33 Sensor source s Output Type s one or more Filter Converter MOD SR WR 123 xy 2 Recommendation Service MOD SR WR 123 Figure 12 Types des composants de l architecture DISCOVER MOD Mod le s mantique SR List
14. date heure qui sont sauvegard s dans la base de donn es L exemple ci dessous pr sente les lignes d un fichier utilisant les champs suivants Heure Adresse IP du client M thode Ressource URI tat HTTP et Version HTTP Software Microsoft Internet Information Services 5 0 Version 1 0 Date 2011 01 01 17 42 15 Fields time c ip cs method cs uri stem sc status cs version 17 42 15 172 16 255 255 GET default htm 200 HTTP 1 0 Cette entr e indique que le 1 janvier 2011 17h42 un utilisateur disposant de HTTP version 1 0 et dont l adresse IP est 172 16 255 255 a lanc une commande HTTP GET pour le fichier Default htm La demande est revenue sans erreur Le champ Date indique la date laquelle la premi re entr e de journal a t effectu e Cette date correspond la cr ation du fichier journal Le champ Version indique que le format de fichier journal W3C est utilis Tous les champs peuvent tre s lectionn s mais certains champs peuvent ne contenir aucune information pour certaines demandes Les champs s lectionn s ne comportant aucune information affichent un tiret comme marque de r servation Ce contexte sera regroup en deux patties e le contexte obtenu par les fichiers journaux e le contexte obtenu par le CMS content management systems On dispose d un ensemble I qui contient tous les items du site web A partir du filtrage collaboratif bas sur les articles Item based CF on obtient la
15. environnement d interaction de l utilisateur Il peut renseigner sur l emplacement g ographique de l utilisateur adresse IP sur la p riode temporelle de son interaction date et heure sur le media qu il utilise pour l interaction etc Tr s peu de travaux de recherche se sont int ress s au premier type de contexte Dans le cadre de notre projet nous avons utilis le premier type de contexte contexte faisant partie de l objet lui m me et avons montr en le combinant avec le profil de l utilisateur comment il peut am liorer la pr cision de la recommandation et ainsi mieux r pondre aux besoins des utilisateurs Introduction G n rale L approche adopt e est g n rale dans le sens o nous pouvons l appliquer pour la recommandation de contenus en g n ral livre Url article produit film chanson etc Nous illustrons son principe pour affiner la recommandation de films un utilisateur L valuation d un syst me utilisant cette nouvelle m thode a r v l de meilleurs r sultats par rapport ceux de l valuation d un SR traditionnel sans contexte Nos principales contributions sont les suivantes e La construction d une ontologie de films travers laquelle nous montrons essentiellement les trois premi res tapes de la construction d une ontologie de domaine e Une nouvelle classification des mesures de similarit Au c ur de la plupart des syst mes de recommandation nou
16. observation selon laquelle les utilisateurs ayant le m me comportement pass ont probablement les m mes centres d int r t Ces syst mes n ont besoin d aucune description de contenu Leurs id e principale est de recommander un utilisateur les contenus consomm s appr ci s par les utilisateurs qui lui ressemblent Les syst mes hybrides enfin combinent les techniques du filtrage bas sur le contenu et celles du filtrage collaboratif pour am liorer la pertinence des recommandations Un exemple de ces syst mes est la collaboration par le contenu dans lequel la technique FBC est utilis e pour apprendre les profils des utilisateurs Ces profils sont ensuite utilis s pour calculer des recommandations en utilisant la technique du EC 49 CHAPITRE II Les syst mes de recommandation sensibles aux contextes 8 2 2 Type de la collecte de donn es La collecte de donn es peut tre explicite ou implicite Elle est explicite quand l utilisateur introduit ses pr f rences d une mani re manuelle cas de syst me Sourcetone ou implicite lorsque le syst me d duit le profil de l utilisateur selon le comportement de se dernier cas de syst me Discover La plupart de ces syst mes ont eu recourt la collecte implicite de donn es qui ne n cessite pas un effort de la part de l utilisateur m me s il est assez difficile d obtenir ces donn es 8 2 3 Type du contexte Le Pre Filtering est la technique la plus utilis e c
17. s personnalis et l utilisateur et lui permet d acc der la base de donn es des profils et contextes et d ex cuter les services propos s par la plateforme communication layer Profile und Context Matching Reformulation Binding Query Prule Contest functional layer z f s Profik Knowledee Instuntintion of Update af Contestualisation SE Profiles aad Coste xts ALLIE and Contexts persistency layer CONTEXTCATALOG Figure 24 L architecture du mod le d acc s personnalis PAM Toutes les composantes des trois couches du PAM ont t impl ment es conform ment aux m tas mod les ce qui facilite leur adaptation plusieurs applications De plus tous les messages adress s au PAM doivent respecter le format de base 47 CHAPITRE II Les syst mes de recommandation sensibles aux contextes Le m ta mod le du profil utilisateur contient les diff rentes informations qui d crivent l utilisateur et ses pr f rences Il existe cinq dimensions principales d un profil utilisateur donn es personnelles centre d int r t donn es de qualit donn es de livraison et donn es de s curit Le profil utilisateur ne suffit pas lui seul pour d crire l utilisateur et ses pr f rences de fa on compl te par exemple un utilisateur veut couter des news le matin et de la musique quand il conduit L introduction de la notion du contexte permet de pallier cette insuffisance d informa
18. un syst me de recommandation utilisant le filtrage bas sur le contenu Nous remarquons sur la partie droite de cette figure les choix de l utilisateur concernant l achat d un PC portable La partie gauche de la figure pr sente les trois r sultats propos s par le syst me MODEL PROCESSOR amp GRAPHICS WEIGHTYr SCREEN PRICE Core 2 Duo Processor 5 8lbs 15 4 SEE Laptop seanc Integrated Graphics PRICES Manufacturer Sony x Model gt Sony VAIO BZ560N34 Core 2 Any x Duo T9400 2 53 GHz 15 4 TFT im s die Le he Laptop Type ag Any Core 2 Duo Processor 5 8lbs 15 4 SEE ALL 5 n Integrated Graphics PRICES TOSS FROM Intel Core 2 Duo Y 1 276 VAIO BZ569P40 Core 2 Duo Graphics T9550 2 66GHz 3G 320G DVD WLS Any NIC BT FR WC 15 4 F Cor t Weight m Any Core 2 Duo Processor 5 8lbs 15 4 SEE ALL a z Integrated Graphics RICES A 15in 15 9in x Price 0 to 9999 SONY VAIOBZ SERIES NOTEBOOK 2 DUO PROCESSOR P9400 Fino e Figure 5 Exemple de recommandation faite par notebookreview com 4 3 Filtrage collaboratif vs approche bas e sur le contenu A la base nous avions des informations sur le parcours hypertextuel de nos clients Dans un premier temps nous en avons d duit quelles sont les pages qui ont plu quelles sont celles qui ont d plu et quelles sont celles qui n ont pas t visit es Ceci nous a permis de former un premier profil pour nos clie
19. valuer la pertinence de cette chanson 0 9 ou 0 1 63 CHAPITRE III Conception et R alisation Algorithme 2 R solution des contextes Ent es C Instances_Contextes ensembleCandidats instances de contexte contenues dans les contenus candidats la recommandation Cau Instances_Contextes Pu instances de contextes contenues dans le profil Pu Sortie Ce ensemble de pairs ci xi o c_i est un contexte courant x_i est un facteur de correction des pr f rences utilisateurs x_1 dans 0 1 D but Ce 10 Pour chaque c dans C faire 11 Si c dans C alors 12 Ce Ce U ci 1 pas de correction 13 Sinon 14 c c lsim c c Max sim c cj j 1 11Cull 15 Ce CU c sim c c 16 Fin Si 17 Fin Pour 18 retourner C 19 sim c1 2 retourne la similarit entre les deux instances de contexte c_1 et c_2 20 Fin O OOTA ON En TR DES Pour r soudre ce probl me nous proposons une approche bas e sur la similarit entre les instances du contexte L intuition de notre approche est que les utilisateurs aiment pareillement les produits similaires Lorsqu un nouveau contexte se pr sente l utilisateur nous proc dons au calcul de similarit entre le nouveau contexte et l ensemble de tous les contextes pr sents dans le profil de l utilisateur Il conviendra ainsi de retenir le contexte existant dans le profil qui est le plus similaire au nouveau contexte qui se pr sente
20. 0 les deux courbes ne sont pas corr l es et donc ne sont pas similaire Les deux courbes sont d autant mieux corr l es que r est loin de O proche de 1 ou 1 Avec est la moyenne de Y 6 Limites des syst mes de recommandation Malgr leur popularit croissante les syst mes de recommandation ont subi quelques rat s Nous identifions quelques probl mes dont ils souffrent 24 e D marrage froid Souvent on se retrouve confront au probl me qu un utilisateur ne soit comparable avec aucun autre Ce probl me est d au fait que peu ou pas d utilisateurs ont valu un article donn ou qu un utilisateur donn a valu tr s peu ou pas d articles G n ralement ce probl me survient quand un nouvel utilisateur ou une nouvelle ressource est ajout la base de recommandation e Masse critique Afin de former de meilleures communaut s le syst me exige un nombre suffisant d valuations en commun entre les utilisateurs pour les comparer entre eux Par exemple on ne peut pas conclure que deux personnes sont dans une m me communaut si elles n ont qu une seule valuation en commun La constatation aujourd hui est que malgr la taille norme de l ensemble des documents achats etc dans les syst mes le nombre des valuations en commun entre utilisateurs risque d tre faible e Principe d induction Les syst mes de recommandation se basent sur le principe qu un utilisateur qui a exhi
21. 4 e 26 par des notes de 3 e 23 par des notes de 5 La figure 36 montre la r partition des notes dans MovieLens m1 D 2 0 3 o4 m5 Figure 36 Les r partitions des valuations Nous nous sommes bas s galement sur la repr sentation et la d finition des bases de donn es pr sent es pour l extraction des donn es de MovieLens et IMDB 33 Nous pr sentons dans ce qui suit quelques tables utilis es qui nous ont aid s dans la r alisation et l valuation au cours de ce projet La table I_movies contient les titres des films tir s des deux bases MovieLens et IMDB Cette table contient les 3340 films avec leurs titres La table I moviegenres contient chacun des films avec les genres correspondants Nous avons retenu 25 genres de films pour l exp rimentation La table I_userratings contient tous les utilisateurs et tous les films avec leurs notes rating extraites de la base de donn es MovieLens Cette table compte environ 6000 utilisateurs La table R alisateurs contient chacun des films avec le ou les r alisateur s correspondant s La constitution de ces tables est donn e dans les quatre tables suivantes 76 CHAPITRE IV Exp rimentation et Evaluation I_movies Hom De Colonne Type De Donn es Valeur Hullable Valeur Par D faut Cl Primaire MO VIEID NUMBER S 0 Yes TITLEMOVIELENS VARCHAR2 1 00 Yes TITLEIMDB VARCHAR2 250 Yes I_moviegenres Nom De Colonne Type De Donn es Valeur
22. 56 0 50 1 Robert A partir du Tableau 9 nous d duisons facilement que le r alisateur McTiernan John et plus similaire au r alisateur Spielberg Steven que ne lest Zemeckis Robert En effet Sim Spielberg Steven McTiernan John 0 66 gt Sim Zemeckis Robert McTiernan John 0 50 Par cons quent le profil de Putilisateur N 424 sera enrichi par des pr f rences contextuelles pr dites et corrig es partir de celles relatives au r alisateur Spielberg Steven en multipliant ces pr f rences par la valeur de la similarit sim Spielberg Steven McTiernan John 0 66 voir tableau 10 Tableau 10 Enrichissement du profil utilisateur 424 McTiernan John Action 0 81 0 66 424 i 424 Spielberg Steven Action 0 81 424 Spielberg Steven Adventure 0 87 424 Spielberg Steven Comedy 0 75 McTiernan John Horror 0 87 0 66 x 67 CHAPITRE III Conception et R alisation 424 Spielberg Steven Drama 0 87 424 Spielberg Steven Family 0 75 424 Spielberg Steven Fantasy 0 75 424 Spielberg Steven Horror 0 87 424 Spielberg Steven Sci Fi 0 83 424 Spielberg Steven Thriller 0 85 424 Zemeckis Robert Action 0 66 424 Zemeckis Robert Adventure 0 66 424 Zemeckis Robert Comedy 0 68 424 Zemeckis Robert Drama 0 75 424 Zemeckis Robert Romance 0 75 424 Zemeckis Robert Sci Fi 0 62 424 Zemeckis Robert Western 0 25 Finalement la similarit du film Hunt for Red par rapport l utilisateur N 424 est calcul e comme sui
23. Admin ainsi que le mot de passe 104 ANNEXE 1 Identifiant Administrateur D gt Utilisateur Mot de passe Figure 53 Authentification de l administrateur Apr s validation une fen tre s affiche pour le choix de la m thode de pr diction avec contexte ou sans contexte comme il est montr dans la figure 54 L administrateur la possibilit aussi de visualiser la matrice des r alisateurs la recherche d un profil utilisateur et d appliquer la pr diction globale ou partielle Propagation des notes des films sur leurs genres Moyennes des notes genre pour l utilisateur 424 Matrice R alisateurs Us ID Film ID Note R alisateur Genre R alisateur Genre Moyenne 424 253 4 Jordan Neil Drama a E Afficher tous les utilisateurs Jordan Neil Drama 4 0 424 253 4 Jordan Neil Fantasy FE Jordan Neil Fantasy 4 0 424 253 4 Jordan Neil Horror m Jordan Neil Horror 4 0 424 296 5 Tarantino Q Crime Tarantino Quentin Crime 5 0 424 296 5 Tarantino Q Drama Tarantino Quentin Drama 424 356 4 Zemeckis Ro Comedy Zemeckis Robert Comedy 424 356 4 Zemeckis Ro Drama Zemeckis Robert Drama 4 0 424 356 4 Zemeckis Ro Romance Zemeckis Robert Romance 4 0 424 367 4 Russell Chuck Action Russell Chuck Action 4 0 424 367 4 Russell Chuck Com
24. Conrath Avec Contexte 91 Figure 46 M thode des TOPs k Mesure globale Avec Contexte 0 eeeeeeeeeeseeeeseeeeeeeees 92 Figure 45 M thode des TOPs k Mesure de Pearson Avec Contexte 92 Figure 47 M thode des TOPs k Mesure de Jiang amp Conrath Avec et Sans Contexte pour TrammingeSet 70 occ ssecaiersvacanesdvanebaswnscie TEE E AEEA EAEE A ATR R 93 Figure 48 Figure 49 Figure 50 Figure 51 Figure 52 Figure 53 Figure 54 Figure 55 Figure 56 Figure 57 Figure 58 Figure 59 M thode des TOPs k Mesure de Pearson Avec et Sans Contexte pour TrainingSet 70 94 M thode des TOPs k Mesure Globale Avec et Sans Contexte pour TrainingeSet 70 94 M thode du seuil Mesure Globale Sans Contexte 00 cccccceccecccececeesessnseceeeeeees 95 Mesure du seuil Mesure Globale Avec Contexte 96 Choixd Une SESSIOM Re E sc aeteet is Taa 104 Authentification de administrer nn ee heal 105 Choix de la m thode de pr diction sic ssss cccssccsessctestiencstssversaavesaecusdecaeensoaeaatesunsncees 105 Choix de la m thode de pr diction sn coos ios lceocsdageoncceecvagtecdansverdeecwsesasees 106 M thode des TOP SR iian a a a a a aia i 106 Methode de Seuil ssuntasniniiiansnindisnntadinenininnntiannuinaliuie 107 Authentification de USA nr Aa oss aa densa Wats 108 Liste Ges HIS pertinents ce RSS le Se AS SR ps ne ee ease 108 xi LISTE DES TABLEAUX Tableau 1 Filtrage collaboratif bas sur les notes 20 0 ceeeceeescecee
25. Contexte TrainingSet70 Sans Contexte Figure 49 M thode des TOPs k Mesure Globale Avec et Sans Contexte pour TrainingeSet 70 94 CHAPITRE IV Exp rimentation et Evaluation Nous remarquons d apr s ces courbes que la pr cision augmente en fonction de la taille de la table Training_set Plus la taille Training_set augmente plus la pr cision est meilleure En effet la table Profil_user d pend de la taille de la table Training _set Le profil d un utilisateur est d autant plus fourni qu on a d informations dans la table Training set Nous remarquons galement que la m thode contextuelle fournit de meilleurs r sultats par rapport la m thode non contextuelle pour le cas Training set70 Nous pouvons en d duire que l utilisation du contexte un impact positif sur la recommandation 3 5 2 R sultats de la m thode du seuil Pour la m thode du seuil nous avons consid r les deux m triques pr cision et rappel Nous avons fait plusieurs exp rimentations en effectuant des changements sur les tailles de la table Training set pour un seuil fix Les tailles de la table Training_ set retenues sont 30 40 50 60 70 80 et 90 Nous avons repr sent les r sultats d exp rimentation par des courbes Chaque courbe nous donne la valeur de la pr cision ou le rappel en fonction de la variation de la taille de la table Training_set pour un seuil pr cis La valeur du seuil consid r e est seuil note 3 seuil
26. Filtrage bas sur contenu Filtrage collaboratif classique Filtrage d mographique Phase pr liminaire R Ro mogruphie Hybridation Hybridation S S I ui i Figure 6 Hybridation classique de filtrage Comme nous l avons d j mentionn pr c demment au c ur de la plupart des syst mes de recommandation nous trouvons un op rateur de matching qui mesure la similarit de deux profils utilisateurs de deux descripteurs de contenu ou bien la similarit entre un profil utilisateur et un descripteur de contenu Comme les profils utilisateurs et les descripteurs de contenu sont souvent mod lis s avec des vecteurs de mots cl s pond r s seules les mesures vectorielles comme Cosinus et corr lation de Pearson sont utilis es Or av nement du web s mantique et le d veloppement des ontologies ont mis notre disposition une panoplie de mesures de similarit s mantiques qui peuvent compl ter les mesures vectorielles cit es ci dessus Pour montrer les possibilit s offertes par les mesures de similarit s mantiques consid rons l exemple suivant 20 CHAPITRE I Les Syst mes de Recommandation Classiques Exemple Soit un utilisateur Bill qui renseigne trois de ses pr f rences cin matographiques ProfilBill Action 5 Guerre 4 Thriller 5 Soient les deux films suivants avec leurs descriptions limit es aux genres Film1 Aventure Poli
27. L approche de Post filtrage Contextuel POF sssss 33 7 3 L approche de la Mod lisation Contextuelle CM 34 Les diff rents travaux sur les syst mes de recommandation sensibles au contexte 35 8 1 Exemples de SR sensibles au CONTEXTE 253 522 se owe EP 35 8 1 1 Micro Profiling siniora A aei aani eaa 35 812 Da VE kerien re e e EE EEEE EEE EE EEA 36 8 13 DISCOVR one a e ee A in een I ne en 37 8 LANewW ha nd nre erin el lawton nes MR Mae ia eee 40 8 1 5 Extention de My Mapes ccssie sett cect ail eileen dndae inet 42 8 1 6 Sourcetone Interactive Radio Musiques selon l humeur esceeeeeseeeeees 46 SLT AMAZON ss ste ea ten ira en tte Re RER 46 8 1 8 Approche bas e sur le Mod le d Acc s Personnalis PAM oseere 47 8 2 Comparaison sa eee aeee nn ae aias ee CE e a 49 COONCIUSION E E 52 M LA LOL TON TO ntir Re 54 Modele de donn s un Line tee Rice Be ew dalle ea E 54 Conception de Pappy Cat Omi iss ces ren nuire CM Rene 57 3 LDiagramme d Cl ASS Cah rss ee e a E e a nt nl 57 3 2 Diagramme d SEQUeNCE senniein oiei iinei e AE A 57 3 3 Diagramme de collaboration ER RM asada esas das dece sadones aa neas ease 58 Architecture g n rale de lappheationssss aa AR ss een 59 Recommandation contextuelle usant 62 5 1 Cr ation des profils utiSAteUrS as midontimininnsnen din ndadevacsantses 62 5 2 R solution OL Contexte ose tats can aera caves ANR nee tenue 63 5 3 Appari
28. RERO ss ven SA me nn Rte 23 32 2 Mesure d Lin 1998 hae een ten tannins is 23 5 3 Approches hybrides issues hsstnse 23 5 3 1 Mesure de Jiang et Conrath 1997 23 5 3 2 Mesure de Leacock et Chodorow 1998 23 5 4 Approches bas es sur l espace vectoriel sessssessesessssessessessseesreseesseesseseesseesseseese 24 541 Similartt d Cosine ec sezesi sssdeedetassacecdestsdiastaceceeasd OEE AEEA EEEREN 24 5 4 2 Similarit de Pearsoni irei neee e e RE aE et Line 24 vii I ON AUN REN Ne amp nN Limites des syst mes de recommandation ss 25 Les principaux travaux dans les syst mes de recommandation 26 SORCIER etienne nina 28 CHAPITRE II Les Syst mes de Recommandation Sensibles aux Contextes lt LOUE COLE LU Le TO PAR RP D kb 30 D finition de COMMENTE eases ee A Re eG alain eee alg nee tt eae 30 Importance du contexte dans les syst mes de recommandation 31 Dimensions du Contexte inhum nul nde kannada nds 31 4 1 Context liea Utlisate ar sea ee ns ainsi 31 A COME AS NG ar A T L ns en a ne ne E nee 31 Comment Obtenir le contexte ie AR nn aa Re te 32 Pertinence d l information contextuelle 22 58 ut de A tte 32 Diff rentes m thodes d introduction du contexte 32 7 1 L approche de Pr filtrage Contextuel Pref 32 7 2
29. Sundance Adventure Biography Crime Western Kid Adventure Horror Thriller Action Comedy Crime 1396 Action Adventure Comedy Crime Drama Mystery Thriller Adventure Romance War Action Adventure Sci Fi Thriller Action Crime Drama Sci Fi Thriller Action Comedy Sci Fi Drama Mystery Romance Thriller Hunt for Red October Action Adventure Thriller Crime Drama Mystery Thriller Drama Romance Thriller Action Drama Romance Sport Comedy Drama Romance Drama Horror Thriller 2000 LethalWeapon Action Comedy Crime Drama Thriller Action Adventure Comedy Sci Fi Western Adventure Comedy Family Sci Fi Adventure Comedy Musical 2115 Indiana Jones and the Temple of Action Adventure Comedy Thriller Doom Comedy Fantasy Horror Action Adventure Comedy Fantasy Crime Drama History Thriller Action Adventure Comedy Romance Action Adventure Comedy Romance Action Drama Sport Action Drama Sport Action Drama Sport Action Sci Fi Thriller Action Adventure Fantasy Sci Fi Action Adventure Fantasy Sci Fi Horror Mystery Thrill
30. Training_set et Result_set de fa on al atoire en utilisant une proc dure al atoire Cette proc dure permet de donner les r partitions suivantes 70 30 60 40 50 50 etc Par exemple pour le premier couple 70 30 le premier composant constitue les 70 films qui servent remplir la table Training _set et le second c est dire les 30 restants parmi les 100 films initiaux constitue l ensemble des films qui servent remplir la table Result_set La table Training_set pour cet exemple contiendra 21 utilisateurs repr sent s par leurs identificateurs USERID 70 films pour chaque utilisateur repr sent s par leurs identificateurs MOVIEID les genres associ s a chacun des films le r alisateur ajout partir de la table R alisateurs et la note du film propag e sur les genres du film Le tableau 13 montre une partie de la table Training_set Par exemple nous pouvons constater sur ce tableau que l utilisateur portant l identificateur 424 a regard les films portant les identificateurs 110 et 296 Le film 110 ayant comme r alisateur Gibson Mel et comme genres Action Biography War History Drama a eu la note 4 par l utilisateur 424 Cette note a t propag e sur ses genres Tableau 13 Un extrait de la table Training_set 424 110 Action Gibson Mel 424 296 Crime Tarantino Quentin 424 296 Drama Tarantino Quentin Tarantino Quentin Tarantino Quentin La table Result_set pour la r partition
31. U2 le concept article est plus g n ral que le concept utilisateur exemple 2 5 alors que le cas I2 U1 le concept article est plus sp cifique que le concept utilisateur peut tre sup rieur par exemple 2 3 La raison de cela peut tre que dans le premier cas l article traite avec un concept plus g n ral que l int r t de l utilisateur rapportant une pr cision inf rieur que dans les autres cas ou les articles traitent un concept plus sp cifique que l int r t de l utilisateur donc rapporte une pr cision sup rieur Mais cette hypoth se ainsi que le score exact de la similitude de tous les cas est soumise l exp rimentation Nous donnons dans ce qui suit un arrangement de marquage possible pour les 9 cas possibles de la figure 4 e I1 UI1 1 12 U2 1 13 U3 1 3 cas de Matching parfait marqu a dans la figure 4 e Il U2 2 5 I2 U3 2 5 2 cas de Matching partiel le concept article est plus g n ral marqu b e 2 UI 2 3 13 U2 2 3 2 cas de Matching partiel le concept article est plus sp cifique marqu c e Il U3 1 3 cas de Matching faible le concept article est beaucoup plus g n ral marqu d e 13 U1 1 2 cas de Matching faible le concept article est beaucoup plus pr cis marqu e 15 CHAPITRE I Les Syst mes de Recommandation Classiques 4 2 4 Exemple La figure 5 montre un exemple d
32. Yes Yes Yes Valeur Par D faut Cl Primaire Figure 38 Table Training _set La figure 39 montre la table du profil utilisateur cette derni re contient les 21 utilisateurs les genres des films et la pr f rence de l utilisateur pour chaque genre Les pr f rences sont d duites par calcul Hom De Colonne Type De Donn es USERID NUMBER S 0 GENRE VARCHAR2 15 PREFERENCE FLOAT Valeur Hullable Yes Yes Yes Valeur Par D faut Cl Primaire Figure 39 Table Profil_user Dans la figure 40 nous avons la table Result_set elle contient le compl ment de la table Training_set par rapport la table T_usernote Elle est compos e des 21 utilisateurs des 100 1 films tel que 1 repr sente le nombre de films dans la table Training_set de la note attribu e par l utilisateur chaque film et des pr dictions qui sont calcul es par l application Nom De Colonne Type De Donn es USERID NUMBER S 0 MOYIEID NUMBER S 0 NOTE NUMBER 2 0 PREDICTION FLOAT Valeur Nullable Yes Yes Yes Yes Valeur Par D faut Cl Primaire Figure 40 Table Result_set 78 CHAPITRE IV Exp rimentation et Evaluation La signification des diff rents champs des tables utilis es est donn e dans le tableau 11 Tableau 11 Dictionnaire de Base de Donn es USERID L identificateur de l utilisateur MOVIEID L identificateur de film NOTE La note donn e par l utilisateur un film PREDICTION Les pr dic
33. cadeau pour ses relations Il est noter qu il existe diff rentes possibilit s pour cette g n ralisation bas e sur le contexte taxonomique granularit alors que Exact Pre Filtering est d fini uniquement par le contexte k 7 2 L approche de Post filtrage Contextuel PoF Selon l approche post filtrage l information contextuelle est utilis e apr s le lancement de la m thode principale de recommandation 2D deux dimensions Une fois les valuations inconnues sont estim es et les recommandations sont produites le syst me analyse les donn es pour un utilisateur donn dans un contexte pr cis pour trouver les mod les d utilisation des articles sp cifiques et utilise ces mod les pour contextualiser les recommandations obtenues partir de la m thode classique de recommandation 2D comme le filtrage collaboratif La figure 10 montre comment utiliser le contexte apr s la recommandation 2D j SR 2 x Donn es dimensions Recommandations Figure 10 Post filtrage Contextuel Recommandations Contextualis es gt 33 CHAPITRE II Les syst mes de recommandation sensibles aux contextes Il existe diff rentes m thodes pour la contextualisation des recommandations 2D Dans ce qui suit nous nous concentrons sur les deux approches appel es Weight et Filter Les deux approches analysent les donn es pour un utilisateur dans un contexte donn pour calculer la probabilit
34. cis pr c demment pour faire l valuation du syst me de recommandation nous nous sommes bas s sur les deux m triques pr cision et rappel Concernant la pr cision nous avons utilis les deux m thodes voqu es ci dessus Apr s les calculs de pr cision et de rappel nous avons trac les courbes correspondantes pour la m thode contextuelle et non contextuelle Nous pr sentons et discutons l allure de ces courbes dans ce qui suit 3 5 1 R sultats de la m thode TOP K Nous avons fait plusieurs exp rimentations en effectuant des changements sur les mesures de similarit s mantique num rique et globale ainsi que sur la valeur de K pour une taille de la table Training_set fix e La valeur des coefficients retenus sont coef1 0 75 pour la similarit s mantique et coef2 0 25 pour la similarit num rique Les diff rentes valeurs de K consid r es sont 5 10 15 20 25 Nous avons repr sent les r sultats d exp rimentation par des courbes Chaque courbe nous donne la valeur de la pr cision en fonction de la variation de K pour une taille de Training set pr cise Les tailles de Training set consid r es sont 30 50 70 Les figures 41 42 et 43 pr sentent les courbes de l approche non contextuelle tandis que les figures 44 45 et 46 pr sentent celles de l approche contextuelle 89 CHAPITRE IV Exp rimentation et Evaluation M thode des TOPs K Mesure de Jiang amp Conrath Sans Contexte
35. concepts et sous concepts d ajouter des d finitions chaque l ment de mettre des attributs et de cr er tout type de relations s mantiques ou taxonomiques d inclusion entre les l ments et les cat gories En outre et ce qui est loin d tre n gligeable les donn es stock es dans l ontologie peuvent tre facilement r utilis es par d autres applications 18 CHAPITRE I Les Syst mes de Recommandation Classiques 3 2 Structure d une ontologie Les ontologies sont repr sent es g n ralement par les l ments suivants 9 e Concept Appel s aussi termes ou classes de l ontologie selon Gomez P rez ces concepts peuvent tre classifi s selon plusieurs dimensions 1 Niveau d abstraction concret ou abstrait 2 Atomicit l mentaire ou compos e 3 Niveau de r alit r el ou fictif e Instance C est une d finition extensionnelle de l ontologie par exemple les individus Amina et Saloua sont des instances du concept personne e Relation Les relations d une ontologie d signent les diff rentes interactions et corr lations entre les concepts de l ontologie ces relations englobent les associations suivantes 1 Sous classe de sp cification ou g n ralisation 2 Partis de agr gation ou composition 3 Associ a instance de est un etc e Attributs Propri t s fonctionnalit s caract ristiques ou param tres que les objets peuvent poss der et partager 3 3 Les d
36. d couvrir divers domaines int ressants car le principe du filtrage collaboratif ne se fonde absolument pas sur la dimension th matique des profils et n est pas soumis l effet entonnoir Un autre avantage du filtrage collaboratif est que les jugements de valeur des utilisateurs int grent non seulement la dimension th matique mais aussi d autres facteurs relatifs la qualit des documents tels que la diversit la nouveaut l ad quation du public vis etc Le CF souffre de plusieurs gros probl mes Le probl me principal tant le d marrage froid c est le fait qu un utilisateur doit voter sur beaucoup trop d objets avant d obtenir des recommandations 4 1 2 Processus du filtrage collaboratif Le processus du filtrage collaboratif suit les tapes donn es ci dessous 4 1 2 1 Evaluation des recommandations Selon le principe de base du filtrage collaboratif les utilisateurs doivent fournir leurs valuations sur des documents afin que le syst me forme les communaut s Evaluer une recommandation peut se faire de fa on explicite ou implicite comme suit Explicite L utilisateur donne une valeur num rique sur une chelle donn e par exemple de 1 5 ou de 1 10 etc ou bien une valeur qualitative de satisfaction par exemple mauvaise moyenne bonne et excellente Implicite Le syst me induit la satisfaction de l utilisateur travers ses actions Par exemple le syst me e
37. d acc s l information th se de doctorat de l universit Nancy 2 Novembre 2008 S Chatterjee A S Hadi and B Price Regression analysis by example JohnWiley and Sons 2000 M Daoud Recherche contextuelle d information RJCRI 2007 100 BIBLIOGRAPHIE 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 B De Carolis I Mazzotta N Novielli and V Silvestri Using Common Sense in Providing Personalized Recommendations in the Tourism Domain Septembre 2009 M Domingues A Mario Jorge C Soares Using Contextual Information as Virtual Items on Top N Recommender Systems cars 2009 F Gandon Ontologies informatiques Th se de doctorat Mai 2006 N Guarino Formal Ontology and Information Systems Conf rence Proceedings of FOIS 98 Pages 3 15 Trento Italy 6 8 Juin 1998 T Hussein T Linder W Gaulke J Ziegler Context aware recommendations on rails Septembre 2009 Inote Image Annotation Tool http jefferson village edu iath inote html J Jiang et D Conrath Semantic similarity based on corpus statistics and lexical taxonomy In Proceedings of the 10 International Conference on Research in Computational Linguistics Taiwan 1998 D Koller and M Sahami Toward optimal feature selection In Proceedings of the 13 International Conference on Machine Learning pages 284 292 Morgan Kaufmann 1996 Limites des sys
38. des utilisateurs en fournissant des informations suppl mentaires qui peuvent tre exploit es afin d effectuer de meilleures recommandations Ce chapitre est consacr la partie conception et r alisation de notre application 37 38 qui consiste recommander des items comme par exemple des films livres chansons restaurants etc un utilisateur donn en tenant compte du contexte de la recommandation Dans notre tude nous avons introduit le contexte intrins que repr sent par un sous ensemble d attributs d crivant l item lui m me par ailleurs le contexte extrins que qui est d fini sur l ensemble d attributs relatifs l environnement de l utilisateur t donn comme perspectif Nous pr sentons galement l architecture g n rale de l application avec ses diff rents modules un exemple illustrant la m thode propos e l ontologie utilis e ainsi que l environnement de travail choisi 2 Mod le de donn es Dans ce qui suit nous donnons l ensemble des d finitions relatives aux concepts de base que nous manipulons dans ce chapitre Pr f rence Une pr f rence est une formule qui permet d hi rarchiser un ensemble d objets par rapport aux int r ts et aux besoins d un utilisateur Il existe deux types de pr f rences qualitatives et quantitatives Les pr f rences qualitatives sont exprim es avec des relations d ordre binaire comme par exemple la relation gt
39. diff rents scores de pr f rence sur le m me objet en fonction de son contexte courant Exemple un utilisateur peut accorder un score tr s lev au genre films de guerre lorsque le contexte est relatif un v nement historique et en m me temps associer un score tr s faible au m me genre dans les autres contextes de l ann e Descriptif de contenu Au del des tuples d une base de donn es nous nous int ressons la recommandation de contenus en g n ral livre Url article produit film chanson etc Dans ce chapitre nous consid rons que tous les contenus sont mod lis s par des conjonctions de pr dicats Dc pri prn Exemple Dc livre1 lt titre Le Chao des Sens gt lt auteur AhlamMosteghanemi gt lt Editeur France Meyer gt 55 CHAPITRE III Conception et R alisation Nous donnons dans la figure 26 le mod le Entit Association relatif notre application Contenu Caract ristique ID contenu ID caract ristique Nom gt 3 Nom Ann e de sortie Utilisateur ID attribut N ID utilisateur Pr nom ID contexte Age Type Profession Nom EF Contexte Intrins que Contexte Extrins que ID contexte ID contexte Nom_contexte Nom_contexte Figure 26 Mod le Entit Association La section suivante est d di e aux diagrammes UML correspondants notre application 56 CHAPITRE III Conception et R alisation 3 Conception de l application Po
40. en se basant sur leur qualit style ou point de vue Par exemple si on se restreint une approche bag of words et si deux articles contiennent les m mes termes on ne pourra distinguer entre un bien crit et un autre mal crit Au contraire le filtrage collaboratif n utilisant aucune information concernant le contenu des articles texte image musique etc les articles filtr s n ont pas besoin d tre pr alablement analys s grammaticalement De plus ce syst me tant bas sur l valuation des objets par les utilisateurs les articles recommand s peuvent alors tre tr s diff rents de ceux que l utilisateur a d j vus auparavant et les recommandations sont bas es sur une valuation implicite de la qualit des articles per ue par les utilisateurs Mais par contre trois limites sont pr sentes pour cette approche e La premi re est que la recommandation un client d pend des autres clients e La seconde est qu il faut associer chaque client la liste des textes lus e Et la troisi me est le fait que le syst me repose sur l hypoth se implicite que toutes les caract ristiques d un document sont de la m me importance pour l valuation de ce document par un utilisateur Or deux utilisateurs peuvent donner tous deux une bonne ou inversement une mauvaise note un m me document pour des raisons compl tement diff rentes 4 4 Filtrage hybride La recommandation peut tre faite lorsqu un article est bien a
41. et lui affecte un poids temps coul depuis le click jusqu qu il quitte la page en question Apr s cela le syst me filtre ces clicks en limitant le nombre d l ments et les poids qui leur sont attribu s Ensuite il d clenche un processus de recommandation bas sur l activation de la diffusion c est dire il recommande des pages similaires celles que l utilisateur pr f re Ce processus prend le mod le s mantique de la branche de gauche comme une source de donn es c est dire il fonctionne sur le mod le contenant les v nements locaux du climat actuel Enfin la liste des ressources pond r e peut tre limit e au dix plus importants articles par exemple La liste finale des ressources pond r es est maintenant en bonne forme et affich e l utilisateur 8 1 4New hand Le syst me News Hand 12 est un syst me de recommandation sensible au contexte La figure 15 montre l interface graphique de ce syst me Dans New hand une notion particuli re de contexte t propos e savoir le contexte d ex cution s mantique C sous lequel les activit s d un utilisateur u se produisent au sein d une unit de temps donn e t Une fois le contexte est construit une activation contextuelle des pr f rences est d clench e en trouvant les parcours s mantiques reliant les pr f rences au contexte Ce syst me de recommandation utilise les ontologies technologie s mantique qui peut tre repr
42. ge CF CF AR Hybride Hybride CBF CF CBF CF CBF recommandation Type de la collecte des a Le _ Implicite oe Implicite Implicite Type du contexte Pre filtering Post filtering Pre filtering Pre filtering Pre filtering Pre filtering Pre filtering Pre filtering Acc s a un ne Construit en j D finition du contexte item ou ass Quelconque temps r el Quelconque Etat d esprit Quelconque Quelconque 7 Article Domaine d valuation Musique Quelconque Quelconque te doi Tourisme musique e commerce Fm Flexibilit Non Oui Oui Non Non Non Non Oi CHAPITRE II Syst mes de recommandation sensibles aux contextes 9 Conclusion Dans ce chapitre nous avons d fini le contexte ainsi que son importance ses dimensions et la pertinence de son choix Ensuite nous avons pr sent les diff rentes m thodes de son introduction ainsi que les diff rents travaux sur les syst mes de recommandation sensibles aux contextes Enfin une comparaison entre les diff rents syst mes existants a t introduite sur la base d un certain nombre de crit res d finis Le prochain chapitre sera consacr la partie conception et r alisation de notre syst me de recommandation sensible au contexte 52 CHAPITRE III Conception et R alisation CHAPITRE III Conception et R alisation 1 Introduction La prise en compte du contexte par les syst mes de recommandation permet une meilleure mod lisation du comportement
43. instances du concept Nombre total d instances PPG Plus Petit G n ralisant Nous combinons ensuite ces deux mesures comme mentionn ci dessus dans la section 4 pour utiliser la similarit globale Simgrobae afin d am liorer les r sultats de la pertinence des produits pour l utilisateur actif c est dire l utilisateur demandeur de recommandations 6 Exemple illustratif pour la recommandation des films Nous allons donner dans cette section un exemple de calcul de recommandation sur des films r alis s par un r alisateur connu en premier lieu et un r alisateur inconnu en second lieu pour nos utilisateurs Nous avons pris comme exemple l utilisateur 424 avec son profil montr dans le tableau 8 Tableau 8 Profil de l utilisateur N 424 424 Spielberg Steven Action 0 81 424 Spielberg Steven Comedy 0 75 424 Spielberg Steven Sci Fi 0 83 424 Spielberg Steven Thriller 0 85 424 Zemeckis Robert Action 0 66 424 Zemeckis Robert Adventure 0 66 424 Zemeckis Robert Comedy 0 68 424 Zemeckis Robert Drama 0 75 424 Zemeckis Robert Romance 0 75 424 Zemeckis Robert Sci Fi 0 62 424 Zemeckis Robert Western 0 25 Nous constatons d apr s le tableau 8 que l utilisateur N 424 n a vu que des films des deux r alisateurs Spielberg Steven et Zemeckis Robert Imaginons maintenant que deux nouveaux films viennent de sortir Le film 1 est d crit comme suit Film ID_ Film 480 Titre Jurassic Park Genres
44. l utilisateur 424 sont 1193 1036 2918 3421 367 Alors la pr cision donn e par TOP S de l utilisateur 424 est donn par 1193 1208 1036 3421 2918 N 1193 1036 2918 3421 367 5 3 5 0 6 Les 5 premiers films not s effectivement par l utilisateur 549 sont 923 1193 1208 1219 1380 Les 5 premiers films pr dits par le prototype pour l utilisateur 549 sont 1193 1527 1208 923 2088 Alors la pr cision donn e par TOP 5 de l utilisateur 549 est donn par 923 1193 1208 1219 1380 N 1193 1527 1208 923 2088 5 3 5 0 6 Par cons quent la pr cision moyenne par la m thode des TOP S pour ces deux utilisateurs est donn e par 3 5 3 5 2 0 6 3 4 1 2La m thode du seuil Cette m thode utilise un seuil pour les notes et un autre pour les pr dictions Les tapes donn es ci dessous sont suivies pour le calcul de la pr cision 1 Nous prenons un certain seuil pour la note seuil note et un autre seuil pour la pr diction seuil pr diction comme par exemple seuil note 3 et seuil pr diction 0 5 2 Nous calculons la pr cision en utilisant la formule suivante pour chacun des utilisateurs dans la table Result_set Le Nombre de films tel que note gt seuil not N pr diction gt seuil pr diction Pr cision ee a PER Da eos ee pee CSCC Nombre de films tel que pr diction gt seuil pr diction 3 On fait la moyenne des pr cisions des 21 utilisateurs de la
45. la pr cision nous avons utilis deux m thodes La premi re consiste consid rer les TOP K films les K meilleurs films La deuxi me consiste consid rer un seuil de pr diction partir duquel les films sont consid r s comme recommandables 3 4 1 1La m thode des TOP K Cette m thode consiste faire pour un utilisateur donn l intersection entre les K premiers films not s effectivement par cet utilisateur et les K premiers films pr dis par le prototype et diviser le r sultat de cette intersection par le nombre K Nous r p tons ce proc d pour chacun des utilisateurs constituant la table Result_set La moyenne de ce calcul pour tous les utilisateurs nous d livre la pr cision pour la valeur de K La variation du nombre K nous permet d obtenir d autres valeurs de pr cision qui vont nous permettre de tracer la courbe de pr cision La formule utilis e est la suivante TopKpr dits TopKr els K pr cision Exemple En se basant sur le tableau 24 nous montrons comment calculer la pr cision pour les TOP S films des deux utilisateurs 424 et 549 Tableau 24 Exemple de la m thode des TOP K wm B U1 amp Ww WwW Uw Ss 424 3421 uw 0 8078526 86 CHAPITRE IV Exp rimentation et Evaluation aun aw ER Les 5 premiers films not s effectivement par l utilisateur 424 sont 1193 1208 1036 3421 2918 Les 5 premiers films pr dits par le prototype pour
46. lt utilisateur contexte predicat scoren gt o contexte_i est un pr dicat contextuel contexte intrins que d crivant le contenu 1 pedicat j est un pr dicat non contextuel du contenu 1 et score Ik n est autre que le score exprim par l utilisateur _k sur le contenu_l 62 CHAPITRE III Conception et R alisation 2 Calcul des profils apr s l tape de la pr paration des donn es nous calculons la moyenne des scores exprim s par l utilisateur pour chaque predicat dans chaque contextej Algorithme 1 d crit le processus de cr ation des profils partir des logs transform s L id e principale de cet algorithme est de calculer le score contextuel de chaque pr dicat dans chaque instance de contexte Ceci permettra notre syst me de capturer la variabilit des pr f rences en fonction des contextes En d autres termes ce processus permet de mod liser le fait qu un utilisateur ait diff rents niveaux de pr f rences sur un m me objet Exemple soit le profil suivant Samira lt genre_chanson sentimentale 0 9 chanteur C line Dion gt lt genre_chanson sentimentale 0 1 Ichanteur Lady Gaga gt Dans ce profil Samira exprime le fait qu elle donne un score lev aux chansons sentimentales lorsque celles ci sont interpr t es par C line Dion est un score tr s faible aux m mes genres de chanson lorsque celles ci sont interpr t es par Lady Gaga 5 2 R solution du contexte Le second composant im
47. mieux cibler la recherche 31 CHAPITRE II Les syst mes de recommandation sensibles aux contextes e Distribution de la datation des documents c est la distribution des n meilleurs documents selon le param tre date et qui permet de mettre en vidence la fra cheur de l information e Degr de couverture de la requ te par les services web ce param tre permet d orienter la r ponse retourn e vers un document ou service 5 Comment obtenir le contexte Une question cruciale est de savoir comment obtenir les informations contextuelles riches 3 Dans certaines circonstances le contexte est explicite comme une personne qui communique au syst me de recommandation les films qu elle d sire regarder D autre part l information contextuelle peut galement tre d duite par le syst me Par exemple le temps qui peut tre d duit partir de l horloge du syst me ou la localit de l utilisateur qui peut tre d duite partir de son GPS Il peut tre d duit aussi en observant le comportement d une personne qui a achet un objet partir d un site Web e commerce pendant un jour de semaine ou un week end On peut galement utiliser des informations sp cifiques au domaine qui sont g n ralement collect es partir du CMS Syst me de Gestion du Contenu Par exemple si un l ment repr sente un acc s une musique le genre de la musique peut tre utilis comme une dimension de l information contextuel
48. portabilit des applications d velopp es en Java Le langage reprend en grande partie la syntaxe du langage C tr s utilis par les informaticiens N anmoins Java a t pur des concepts les plus subtils du C et la fois les plus d routants tels que les pointeurs et r f rences et l h ritage multiple remplac par l impl mentation des interfaces Les concepteurs ont privil gi l approche orient e objet de sorte qu en Java tout est objet l exception des types primitifs nombres entiers nombres virgule flottante etc Java permet de d velopper des applications client serveur C t client les applets sont l origine de la notori t du langage C est surtout c t serveur que Java s est impos dans le milieu de l entreprise gr ce aux servlets le pendant serveur des applets et plus r cemment les JSP JavaServer Pages qui peuvent se substituer PHP ASP et ASP NET Java a donn naissance un syst me d exploitation JavaOS des environnements de d veloppement eclipse JDK des machines virtuelles MSJVM JRE applicatives multi plates formes JVM une d clinaison pour les p riph riques mobiles embarqu s J2ME une biblioth que de conception d interface graphique AWT Swing des applications lourdes Jude Oracle SQL Worksheet etc des technologies web servlets applets et une d clinaison pour l entreprise J2EE La portabilit du code Java est assur e par la machi
49. qu ils ont lus pour comparer les utilisateurs dans la phase de calcul des corr lations entre utilisateurs du filtrage collaboratif La matrice de donn es utilis e ressemble alors au tableau 2 suivant Tableau 2 Filtrage collaboratif bas sur le contenu Mot 1 Mot 2 Mot 3 Mot 4 Mot 5 Article 5 consid r Utilisateur 1 25 0 02 o O 7 Utilisateur2 11 0 11 is 0 1 Utilisateur 3 15 0 35 15 05 3 Utilisateur4 11 11 21 20 25 6 Utilisateur 5 11 22 0 0 35 4 Cette fois on cherche la note que l utilisateur 1 va attribuer l article 5 en fonction des notes que les autres utilisateurs ont attribu l article et de la similarit entre leurs vecteurs de mots repr sentant l ensemble des th mes identifi s comme pr f r s r currents dans leurs lectures Une autre alternative possible si nous poss dons des informations personnelles sur les clients est le filtrage collaboratif d mographique Celui ci consiste utiliser des informations personnelles sur les clients du type ge sexe Cat gorie Socioprofessionnelle lieu d habitation etc pour les comparer dans la phase de calcul des corr lations entre utilisateurs du filtrage collaboratif La matrice de donn es utilis e ressemble alors au tableau 3 suivant Tableau 3 Filtrage collaboratif d mographique Age Sexe CSP Code habitation Article 5 consid r Utilisateur 1 Utilisateu
50. qui concerne la construction de notre ontologie Ontologie de films nous avons respect les cinq crit res cit s ci apr s 68 CHAPITRE III Conception et R alisation La clart Pour r pondre ce principe tous les termes utilis s dans cette ontologie ont t choisis d une fa on objective et claire tous les genres de films qui peuvent exister sont pr sents dans notre ontologie La coh rence Rien qui ne puisse tre inf r de l ontologie ne doit entrer en contradiction avec les d finitions des concepts Par exemple partir du concept Aventure on ne peut pas inf rer des films de documentaire L extensibilit Il est possible d ajouter de nouveaux concepts ou individus sans avoir toucher aux fondations de l ontologie et de l application Par exemple le fait d ajouter le film TITANIC au concept romance ne change en rien la structure de notre ontologie Un Biais d encodage minimal Notre ontologie est conceptualis e ind pendamment de tout langage de programmation En effet cette ontologie est exploit e avec le langage JAVA mais on aurait pu choisir un autre langage Un Engagement ontologique minimal l ontologie ne comporte pas des connaissances suppl mentaires sur le monde mod liser 7 3 Repr sentation hi rarchique de l ontologie conceptuelle L ontologie de ce projet a t con ue avec Prot g Elle est structur e en une hi rarchie de genres de films dont la rac
51. r sultat est int gr dans la plateforme JSP afin de l afficher d une mani re lisible l utilisateur Voir figure 13 38 CHAPITRE II Les syst mes de recommandation sensibles aux contextes View Preparer JSP Template Figure 13 Etape de traitement des services L avantage de cette m thode Discover est d offrir une architecture extensible facile int grer dans les syst mes de recommandation et de prototyper d une mani re rapide gr ce au traitement qui peut se faire en parall le SONNE R RRR REE EER AREER EERE RRR RRR EERE eee e me J Ce ee EEE xy Geographic Swrcecccceccccsceccepececcoes tosssssespsssssssssssssssssse err retire reer rrr sessssssssssssssssssssssesss WR le Weather Rule Applying Service MoD wR i Local Event Rule Applying Service wR 8 Click based Spreading Activation WR Weighted Resource Filter Weighted Resources Figure 14 Exemple d interaction de plusieurs services La figure 14 montre la cr ation des recommandations pour des v nements qui sont a prenant place dans ou pr s de la ville de l utilisateur b qui sont adapt s aux conditions m t orologiques actuelles et c refl te les pr f rences g n rales de l utilisateur comme son go t de musique ou son club de sport pr f r que l on d duit des cliques de l utilisateur Comme on le voit dans le sch ma le processus de recommandation examin
52. relation gr ce au calcul de similarit entre les items dans I Tableau 5 Matrice de similarit article article SH Sim ir ik Se 11 DE Sim iz ix i een S i eee Sim ix i1 Sim e 1 36 CHAPITRE II Les syst mes de recommandation sensibles aux contextes Une partie O de l ensemble I repr sente l historique des acc s faits par l utilisateur repr sentant par exemple l ensemble des chansons cout es par un individu le syst me recommande les items les plus similaires ceux de l ensemble O Appliquer l approche DaVI sur l algorithme Item Based CF consiste ajouter des lignes et des colonnes pour chaque l ment de contexte dans la matrice de similarit De ce fait l introduction du contexte servira recommander un item ressemblant celui qui a t consult dans un contexte donn Par exemple si on s int resse au contexte date et plus exactement au contexte Jours de la semaine on pourrait recommander pour un individu qui a regard un film d horreur par un Lundi le m me genre de film tous les Lundi des semaines venir en d duisant que cet individu aime regarder les films d horreur tous les Lundi Cela permettra d am liorer la qualit des items recommand s Tableau 6 Matrice de similarit avec l attribut contextuel jour a 1 S ieee Sim i ix Sim j Sim iz jn PW sim i ie eee Sim iz ix Sim i2 ji Sim i2 jn aw Eee oe are HE SimGix in SimG i 1 Sim ix jy
53. 1 1193 1208 1036 3421 1080 2193 1193 2918 1208 367 2405 1527 1036 3421 4 10 0 4 Le d nominateur 10 repr sente le nombre d l ments constituant 1080 2193 1193 2918 1208 367 2405 1527 1036 3421 88 CHAPITRE IV Exp rimentation et Evaluation Le rappel calcul par la m thode du seuil pour l utilisateur 424 est donn par 1193 1208 1036 3421 N 1080 2193 1193 2918 1208 367 2405 1527 1036 3421 1193 1208 1036 3421 4 4 1 Le d nominateur 4 repr sente le nombre d l ments constituant 1193 1208 1036 3421 Les films qui ont un seuil note gt 4 pour l utilisateur 549 sont 923 1993 1208 1219 1380 1527 2088 Les films qui ont un seuil pr diction gt 0 75 pour l utilisateur 549 sont 923 1193 1208 1527 2088 alors la pr cision donn e par la m thode du seuil de l utilisateur 549 est donn par 923 1993 1208 1219 1380 1527 2088 N 923 1193 1208 1527 2088 5 4 5 0 8 Le rappel calcul par la m thode du seuil pour l utilisateur 549 est donn par 923 1993 1208 1219 1380 1527 2088 N 923 1193 1208 1527 2088 7 4 7 0 57 Par cons quent la pr cision moyenne par la m thode du seuil pour ces deux utilisateurs est donn e par 4 10 4 5 2 0 6 Le rappel moyen par la m thode du seuil pour ces deux utilisateurs est donn par 4 4 4 7 2 0 78 3 5 Interpr tation de l valuation Comme nous l avons pr
54. 1 00 0 95 0 90 0 85 0 80 0 75 0 70 0 65 0 60 0 55 0 50 0 45 0 40 0 35 0 30 0 25 0 20 0 15 0 10 0 05 0 00 5 2 Ez a 15 20 K Figure 41 M thode des TOPs k Mesure de Jiang amp Conrath Sans Contexte M thode des TOPs K Mesure de Pearson Sans Contexte 1 00 0 95 0 90 0 85 0 80 0 75 0 70 0 65 0 60 0 55 0 50 0 45 0 40 0 35 0 30 0 25 0 20 0 15 0 10 0 05 0 00 Pr cision Figure 42 M thode des TOPs k Mesure de Pearson Sans Contexte 90 CHAPITRE IV Exp rimentation et Evaluation M thode des TOPs K Mesure Globale Sans Contexte 1 00 0 95 0 90 0 85 0 80 0 75 0 70 0 65 0 60 6 055 3 0 50 0 45 0 40 0 35 0 30 0 25 0 20 0 15 0 10 0 05 0 00 TrainingSet70 TrainingSet50 TrainingSet30 Figure 43 M thode des TOPs k Mesure Globale Sans Contexte M thode des TOPs K Mesure de Jiang amp Conrath Avec Contexte 1 00 0 95 0 90 0 85 0 80 0 75 0 70 0 65 0 60 0 55 0 50 0 45 0 40 0 35 0 30 0 25 0 20 0 15 0 10 0 05 0 00 15 20 K TrainingSet70 TrainingSetSO TrainingSet30 Figure 44 M thode des TOPs k Mesure de Jiang amp Conrath Avec Contexte 91 CHAPITRE IV Exp rimentation et Evaluation M thode des TOPs K Mesure de Pearson Avec Contexte 1 00 0 95 0 90 0 85 0 80 0 75 0 70 0 65 0 60 0 55 0 50 0 45 0 40 0 35 0 30 0 25 0 20 0 15 0 10 0 05 0 00 Pr cision TrainingSet70 AC Traini
55. 70 30 contiendra 21 utilisateurs repr sent s par leurs identificateurs USERID 30 films pour chaque utilisateur repr sent s par leurs identificateurs MOVIEID les notes associ es chacun des films et la colonne pr diction qui sert pour le calcul de la similarit entre les genres d un film et les genres pr f r s par un utilisateur Cette colonne est initialement vide Le tableau 14 montre une partie de la table Result_set Par exemple nous pouvons constater sur ce dernier que l utilisateur portant l identificateur 424 a regard les films portant les identificateurs 349 356 380 457 auxquels il a attribu les notes 3 4 4 4 respectivement La table Result_set sert pour le calcul des pr dictions afin de tester le processus de recommandation des films aux utilisateurs 80 CHAPITRE IV Exp rimentation et Evaluation Tableau 14 Un extrait de la table Result set L tape suivante consiste construire la table Classic Profil_user Cette derni re permet de g n rer le profil d un utilisateur partir de la table Training _ set Elle contient les 21 utilisateurs les genres des films tir s de la table Training_set correspondant une r partition al atoire donn e et une colonne PREFERENCE correspondant la pr f rence d un utilisateur pour chaque genre La valeur de la pr f rence d un genre pour un utilisateur donn est obtenue par le calcul de la moyenne des notes de ce genre dans la table Training
56. Conference on Recommender Systems October 2008 Amazon www amazon com S S Anand B Mobasher Contextual Recommendation In Lecture Notes In Artificial Intelligence volume 4737 pages 142 160 Springer Verlag Berlin Heidelberg 2007 L Baba Hamed S Abbar R Soltani et M Bouzeghoub Elaboration et Evaluation d un Syst me de Recommandation S mantique in proc 1 international Conference on Information Systems and Technologies ICIST 11 PP 515 523 24 26 April 2011 L Baltrunas Exploiting contextual information in recommender systems In RecSys 708 pages 295 298 New York NY USA 2008 ACM L Baltrunas X Amatriain Towards Time Dependant Recommendation based on Implicit Feedback cars 2009 A Benayache Construction d une m moire organisationnelle de formation et valuation dans un contexte e learning le projet MEMORAe Th se en Informatique de l Universit du Maine 2005 S Bouakaz Systeme de recommandation sensible aux contextes M moire de fin d tudes Septembre 2010 L Candillier Apprentissage automatique de profils de lecteurs M moire de DEA Laboratoire d Informatique Fondamentale de Lille Juin 2001 I Cantador P Castells Semantic Contextualisation in a News Recommender System Decembre 2009 S Castagnos Mod lisation de comportements et apprentissage stochastique non supervis de strat gies d interactions sociales au sein de syst mes temps r el de recherche et
57. Nullable Valeur Par D faut Cl Primaire MO VIEID NUMBER S 0 Yes GENRE VARCHAR2 15 Yes I_userratings Hom De Colonne Type De Donn es Valeur Nullable Valeur Par D faut Cl Primaire USERID NUMBER S 0 Yes MOYVIEID NUMBER S 0 Yes RATING NUMBER 1 0 Yes TIMESTAMP NUMBER 1 0 0 Yes C1 NUMBER 1 0 Yes C2 NUMBER 1 0 Yes C3 NUMBER 1 0 Yes C4 NUMBER 1 0 Yes c5 NUMBER 1 0 Yes MOD NUMBER 1 0 Yes I director Nom De Colonne Type De Donn es Valeur Hullable Valeur Par D faut Cl Primaire MOVIEID NUMBER S5 0 Yes DIRECTOR VARCHAR2 15 Yes De la table I_userratings nous avons extrait la table T usernote repr sent e par la figure 37 Cette derni re contient 21 utilisateurs ayant regard les m mes 100 films ainsi que leurs notes 17 CHAPITRE IV Exp rimentation et Evaluation Hom De Colonne Type De Donn es USERID NUMBER S 0 MOY1EID NUMBER S 0 NOTE NUMBER 2 0 Valeur Hullable Yes Yes Yes Valeur Par D faut Cl Primaire Figure 37 Table T usernote La figure 38 montre la table Training_set cette derni re contient une partie des films choisis al atoirement a partir de la table T_usernote Elle d taille pour les 21 utilisateurs les genres de chaque film ainsi que la propagation de la note sur ses genres Hom De Colonne Type De Donn es USERID NUMBER S 0 MOY1EID NUMBER S 0 NOTE NUMBER 2 0 Valeur Hullable
58. Un extrait de la table Training set pour le genre Action 20 0 eeeeeeeeeeeeeeeeeeeeees 82 Tableau 18 Un extrait de la table profil r alisateur 83 Tableau 19 Un extrait de la matrice r alisateur r alisateur ee eeeseeceeneeceeceeceteeeceteeeenaeees 83 Tableau 20 Illustrations du vecteur User pour le calcul de la similarit num rique 84 Tableau 21 Illustration du vecteur Film pour le calcul de la similarit num rique 84 Tableau 22 Illustrations d une matrice pour le calcul de la similarit s mantique 84 Tableau 23 R sultat exp rimental selon la similarit globale 86 Tableau 24 Exemple de la m thode des TOP K ss 86 Tableau 25 Exemple de la m thode du Seuil nn ite ee eee 88 Tableau 26 Repr sentation des films avec leurs genres respectifs 110 xii INTRODUCTION GENERALE Introduction G n rale La popularisation d Internet ainsi que l explosion des services de recommandation de nos jours ont propuls la recherche d information RI au premier plan En effet la surabondance de l information a engendr la d gradation de la qualit des r sultats retourn s par un syst me de recommandation et a apport des nouveaux probl mes au domaine de la RI Les syst mes de recommandations SRs sont des outils puissants aidant les utilisateurs en mode en ligne r soudre le probl me de la surcharge d informations auquel ils sont confront s au
59. _set Le tableau 15 pr sente une partie de la table Classic_Profil_User qui sera utilis pour l valuation sans contexte Elle montre plus exactement les pr f rences de l utilisateur 424 Tableau 15 Un extrait de la table Classic_Profil_user 4 4 2 4 Crime 4 55 4 History 4 81 24 24 24 24 24 24 24 24 24 24 24 24 24 24 24 24 24 24 CHAPITRE IV Exp rimentation et Evaluation Le tableau ci dessous tableau 16 montre une partie de la table Contextual_Profil_User et plus exactement l utilisateur 424 qui est construit de la m me mani re que le profil pr c dent sauf que la pr f rence est calcul e par rapport aux genres et aux r alisateurs d un film pour un utilisateur donn Tableau 16 Un extrait de la table Contextual_Profil_ User 424 Altman Robert Comedy 4 0 424 Altman Robert Drama 4 0 424 Besson Luc Action 3 0 Burton Tim Fantasy 4 5 424 Burton Tim Thriller 5 0 424 Burton Tim Comedy 4 0 424 Burton Tim Horror 4 0 424 Cameron James Adventure 4 0 Dans ce qui suit nous montrons comment calculer la pr f rence de l utilisateur 424 pour le genre Action et le r alisateur Cameron James Tableau 17 Un extrait de la table Training_set pour le genre Action 4 1200 Action Cameron James 5 424 1127 Action Cameron James 4 42 424 1240 Action Cameron James 5 La pr f rence de l utilisateur 424 pour le genre Action 4 5 5 3 4 66 Cette derni re repr sente la va
60. aen ot e a e oai ES aiia 8 3 3 Les diff rents types d ontologie sssssssesssesessseesseeessetsseesseresseeesstessersseesseeessseesseeso 8 4 Les principales approches de filtrage sen anni nine etats 9 41 Filtrage Collaboratif esse ia ue lari ea ented eee RRT 9 ACL PTO G DU LA ER ee 9 4 1 2 Processus du filtrage collaboratif 0 0 0 cies eesecceseeseseeeseeecesceceaeeeseecnsaeseneeeens 10 4 1 3 Profils et communaut s ss 10 41 31 Profil de l utilsateur fsssstiistssens tint ss dhibitas finale tetes 11 413 2 Communaut s sun sn e Te E e a E EEE S T 11 AMA D Eaa a AE EE E E ES 11 AD Filtrage bas s r le CONTENTER NAN RSR RSR RS a 12 A2 D MO STE Re nee ne a aS 12 4 2 2 Descripteur d article et profil utilisateur 13 4 2 3Les diff rents types de matching 14 4 2 4 Exemple sn clever Me e nn Mae np nets 16 4 3 Filtrage collaboratif vs approche bas e sur le contenu 16 4 4 PUN TASE NY ec TR Rs an E E de ee 17 4 4 1 Filtrage collaboratif via le contenu 17 4 4 2 Filtrage collaboratif automatis ACF Automated Collaborative Filtering 19 44 3 OAA I sen A A en nee EN M NE SE st Mn thas 19 5 Classification des approches de mesure de similarit 0 ecccceesceceeneceeeeeeceeeeeceteeeenteeeees 21 5 1 Approches bas es sur les ATOS Re TS ne ie 21 5 1 1 Mesure de Wu amp Palmer 1994 21 5 12 Mesure de Rada etal 1989 eiciat ieee at nina seu 22 5 2 Approches bas es sur les n uds 22 5A
61. ajouter un dossier un dossier Supprimer Crauveau _sinterun dossier Lsurine_ L Annuler Aide Figure 35 Ajout de la librairie Jena 9 Conclusion Dans ce chapitre nous avons expos et expliqu les diff rentes phases suivies pour la conception et la r alisation de notre syst me de recommandation sensible aux contextes En effet nous avons explicit le mod le de donn es utilis la m thode de cr ation des profils utilisateur ainsi que la m thode de r solution du contexte Nous avons galement pr sent les deux algorithmes que nous avons labor s Le premier nous a permis la cr ation automatique des profils en exploitant les logs d interaction le second a permis l extraction du contexte intrins que directement partir des contenus identifi s comme candidats potentiels la recommandation Ensuite nous avons pr sent une instanciation de nos algorithmes en les appliquant dans le domaine cin matographique en choisissant le r alisateur comme contexte intrins que Enfin nous avons d crit l environnement de travail et les outils mis en jeu pour la r alisation de ce syst me Dans le chapitre suivant nous allons pr senter les diff rentes phases adopt es pour l valuation de notre syst me de recommandation contextuel 74 CHAPITRE IV Exp rimentations et Evaluation CHAPITRE IV Exp rimentation et Evaluation 1 Introduction Apr s avoir d taill la partie conception de
62. ar elle est beaucoup plus simple appliquer et moins co teuse que la m thode du Post Filtering Le syst me MyMap par exemple utilise la technique Pre Filtering contrairement au syst me DaVI qui opte pour la technique de Post Filtering 8 2 4 D finition du contexte Certains syst mes ont d fini le contexte en se basant sur le facteur temps comme dans l approche Micro profiling D autres syst mes ont utilis l tat d esprit humeur de la personne comme information contextuelle pour recommander de la musique cas du syst me Sourcetone Le contexte pour d autres syst mes peut tre n importe quelle entit selon les besoins de l utilisateur C est le cas de l approche MyMap o le contexte n est pas d fini sp cifi par quelconque dans le tableau 7 8 2 5 Domaine d valuation Il pr cise le domaine dans lequel les syst mes ont t valu s Le syst me News hand est valu dans le domaine des articles d informations par ailleurs le syst me DaVi est valu dans n importe quel domaine quelconque 8 2 6 Flexibilit Ce crit re indique si le syst me peut tre utilis dans plusieurs domaines plus les domaines sont nombreux mieux c est Par exemple l utilisation du syst me micro profiling n est pas flexible par contre celle du syst me Discover est flexible 50 Tableau 7 Tableau r capitulatif des diff rents Syst mes de recommandation sensibles aux contextes Approche
63. aract riser une situation d une entit Une entit peut tre une personne un endroit ou un objet que l on consid re comme tant pertinent l interaction entre un utilisateur et une application y compris ces deux derniers Exemple Dans la figure 8 l attribut contextuel K est la p riode de l ann e dans laquelle un client peut faire des achats sur le portail e commerce La classification de l attribut k est comme suit l t Juin Juillet Ao t Avril Mai et Septembre l hiver Octobre Novembre D cembre Janvier F vrier et Mars en vacances les trois premiers mois ou pas en vacances le reste des mois En s accordant cette d finition un achat effectu le 1er D cembre est tiquet en vacances d hiver Cet attribut contextuel K peut tre utilis aussi dans une application de recommandation de voyages Par exemple les voyages recommand s durant les vacances d t ne sont pas les m mes que ceux recommand s pendant les vacances d hiver Contexte Vacances Vacance Vacances Vacance Figure 8 Exemple de contexte p riode de l ann e 30 CHAPITRE II Les syst mes de recommandation sensibles aux contextes 3 Importance du contexte dans les syst mes de recommandation Dans la plupart des syst mes de recommandation personnalis s certains probl mes peuvent survenir comme par exemple recommander des produits inappropri s un utilisateur qui eff
64. ative du type de la m thode de post filtrage utilis e 7 3 L approche de la Mod lisation Contextuelle CM En plus des deux m thodes cit es auparavant il existe une troisi me m thode savoir la mod lisation contextuelle dans laquelle l information contextuelle est utilis e directement l int rieur des algorithmes de g n ration des recommandations La figure 11 montre l int gration du contexte dans le processus de recommandation 7 SR Recommandations Donn es Multidimensionnels Contextualis es gt Figure 11 Mod lisation contextuelle 34 CHAPITRE II Les syst mes de recommandation sensibles aux contextes 8 Les diff rents travaux sur les syst mes de recommandation sensibles au contexte Plusieurs travaux ont t effectu s sur les syst mes de recommandation introduisant la notion du contexte Nous d crivons dans une premi re sous section un certain nombre de ces syst mes avant de comparer leurs propri t s dans une seconde sous section Nous avons pr sent la synth se ainsi que la comparaison de ces travaux dans 38 8 1 Exemples de SR sensibles au contexte Nous pr sentons dans cette section quelques syst mes de recommandation sensibles au contexte 8 1 1 Micro profiling L approche micro profiling 8 a pour but de recommander des chansons artistes inconnus a un utilisateur Le type du syst me de recommandation est le pre fil
65. b un comportement dans le pass tendra exhiber un comportement semblable dans le futur Cependant ce principe n est pas n cessairement vrai dans le contexte r el En effet un utilisateur peut changer compl tement de domaine d int r t ou en avoir plusieurs Pour faire face ce probl me des techniques de d rive d int r t Interest drift ou de changement de contexte Context shifts ont vu le jour e Centralis ou distribu Les syst mes de recommandation tels qu Amazon sont typiquement bas s sur une architecture centralis e Le moteur de recommandation centralis permet de sauvegarder le profil de l utilisateur et le calcul des recommandations dans un serveur central Cependant en d pit de leur popularit les syst mes de recommandation centralis s souffrent de plusieurs probl mes le co t la robustesse la s curit la portabilit etc Une des solutions ces probl mes est de r partir le syst me On croit qu un syst me de recommandation distribu pourrait tre con u pour tirer profit de la puissance de calcul disponible sur les ordinateurs des utilisateurs 25 CHAPITRE I Les Syst mes de Recommandation Classiques e S curit et cr dibilit Les syst mes de recommandation ne peuvent pas emp cher les actes de tromperie Il devient ainsi facile de se forger une nouvelle identit et de se livrer au vandalisme Il est plus difficile de contr ler l identit des utilisateurs et de p nal
66. based and collaborative components using Representative research examples Melville et al 2002 Collaborative Commonly used techniques Representative research examples Recommendation Technique pproach Model based TF IDF information retrieval Clustering Lang 1995 Balabanovic amp Shoham 1997 Pazzani amp Billsus 1997 Nearest neighbor cosine correlation Clustering Graph theory Resnick et al 1994 Hill et al 1995 Shardanand amp Maes 1995 Breese et al 1998 Nakamura amp Abe 1998 Aggarwal et al 1999 Delgado amp Ishii 1999 Pennock amp Horwitz 1999 Sarwar et al 2001 Linear combination of predicted ratings Various voting schemes Incorporating one component as a past of the heuristic for the other Balabanovic amp Shoham 1997 Claypool et al 1999 Good et al 1999 Pazzani 1999 Billsus amp Pazzani 2000 Tran amp Cohen 2000 21 Commonly used techniques e Bayesian classifiers Clustenng Decision trees e Artificial neural networks Representative research examples Pazzani amp Billsus 1997 Mooney et al 1998 Mooney amp Roy 1999 Bilisus amp Pazzani 1999 2000 hang et al 2002 Commonly used techniques Bayesian networks Clustering Astificial neural networks Linear regression Probablistic models Representative research examples e Billsus amp Pazzani 1998 Breese et al 1998 Ungar amp Foster 1998 Chien amp George 1999 Getoor amp Sahami 1999
67. bles au contexte les CARS Context Aware Recommender Systems apportent une solution ce probl me Nous les d taillons dans le chapitre suivant 28 CHAPITRE II Les syst mes de recommandation sensibles aux contextes CHAPITRE II Les syst mes de recommandation sensibles aux contextes 1 Introduction Les syst mes de recommandation jouent un r le important dans la manipulation de grandes quantit s d informations Souvent le contenu et les objets qui pourraient int resser une personne d pendent de sa situation sp cifique l emplacement actuel la saison le r le de l utilisateur la temp rature etc Les syst mes de recommandation sensibles aux contextes tentent d exploiter l utilisation du contexte afin d am liorer le processus de g n ration des recommandations Dans ce chapitre nous commen ons d abord par donner une d finition de la notion du contexte son importance ses dimensions et la pertinence de son choix Ensuite nous enchainons en pr sentant les diff rentes m thodes permettant l introduction du contexte ainsi que les diff rents travaux sur les syst mes de recommandation sensibles aux contextes Enfin nous terminons en comparant ces diff rents syst mes 2 D finition de contexte Il y a plus de 150 d finitions de diverses disciplines l une des plus fr quemment cit es a t propos e par Abowd Dey et al 1 Le contexte est n importe quelle information qui peut tre utilis e pour c
68. boratives Quant au filtrage collaboratif il exploite les votes donn s par les K voisins similaires un utilisateur actif afin de d duire les votes manquants en utilisant des fonctions d agr gation L architecture de ce syst me de recommandation sensible au contexte CARS Figure 25 est compos e de deux parties La partie en haut gauche concerne l acquisition des informations et la partie en bas droite concerne la personnalisation des recommandations Le processus d acquisition de l information Acquiert et g re les informations dont le CARS a besoin pour effectuer les recommandations Ces informations sont regroup es en trois entit s Profils utilisateur les descriptions des contenus et les contextes Les recommandations personnalis es Ce bloc calcule les recommandations contextuelles Le syst me de recommandation prend en entr e les profils contextuels g n r s du bloc d acquisition de l information et le contexte courant et donne en sortie la liste des contenus recommander Lors de l valuation des contenus recommand s le comportement de l utilisateur actif est enregistr dans ses logs sur lesquels le bloc d acquisition de l information se base pour mettre jour le profil utilisateur le contexte et les mappings r sultant de la contextualisation 48 CHAPITRE II Les syst mes de recommandation sensibles aux contextes Le processus d scqu ition de l infornmesen Aqcuis Contex
69. ch 11 Pages 95 130 1999 T Slimani B Ben Yaghlane et K Mellouli Une extension de mesure de similarit entre les concepts d une ontologie 4rth International Conference Sciences of Electronic Technologies of Information and Telecommunications Mars 2007 Sourcetone www sourcetone com L Baba Hamed R Soltani et Sabri K Construction d une ontologie pour la recommandation de films 4 un utilisateur Actes des Ateliers des 2les Journ es Francophones d Ing nierie des Connaissances IC 2010 Nimes France juin 2010 R Soltani L Baba Hamed et S Abbar Contextualisation des pr f rences pour les syst mes de recommandation 2nd International Conference on Information Systems and Technologies ICIST 12 Sousse Tunisia March 24 26 2012 www icist2012 org ISBN 978 9938 95 1 1 2 7 Z Wu et M Palmer Verb semantics and lexical selection Conference In Proceedings of the 32nd Annual Meeting of the Associations for Computational Linguistics Pages 133 138 1994 102 ANNEXE 1 ANNEXE 1 Manuel d utilisation de l application Dans cette section nous montrons comment utiliser notre application Pour commencer nous devons choisir le type de session Administrateur ou Utilisateur voir figure 52 Figure 52 Choix d une session Pour le choix de la session Administrateur la fen tre de la figure 53 s affiche pour l authentification Il faut donc entrer le nom d utilisateur
70. cier Film2 Drame Com die Les syst mes de recommandation classiques bas s sur les similarit s vectorielles seront incapables de dire lequel de ces deux films il faut recommander a Bill Or gr ce aux ontologies nous savons que les concepts Aventure et Policier caract risant Film1 sont plus proches similaires des concepts Action Guerre et Thriller du profil de Bill que ne le sont les concepts Drame et Com die du Film2 Ainsi si une recommandation est demand e c est le film Film1 qui doit tre envoy Bill On voit travers cet exemple que l aspect s mantique suffit lui seul dans certains cas pour ordonner des contenus par rapport un profil utilisateur en fonction de leurs similarit s Nous avons jug important de pr senter quelques mesures de similarit des plus connues La section suivante montre une classification de ces mesures 5 Classification des approches de mesure de similarit Dans cette classification nous distinguons quatre grandes cat gories de mesures de similarit 35 Nous avons propos une autre classification dans 6 5 1 Approches bas es sur les arcs La mesure de similarit la plus intuitive des objets dans une ontologie est leurs distances Cette similarit est valu e par la distance qui s pare les objets dans l ontologie Ces mesures se servent de la structure hi rarchique de l ontologie pour d terminer la similarit s mantique entre les concepts Le calcul des dis
71. dans le d veloppement des syst mes du futur Parmi ces derniers nous pouvons citer les syst mes de recommandation qui donnent de l importance aux pr f rences des utilisateurs dans le but de leur proposer des ressources acheter ou consulter r pondent au mieux leurs besoins Ils sont devenus des efficaces dans le commerce lectronique la recherche documentaire le tourisme etc en fournissant des suggestions pertinentes au sein d une grande masse d informations L int gration du contexte dans les syst mes de recommandation classiques permet d am liorer les performances de ces derniers Nous avons pr sent dans ce m moire une nouvelle approche de la prise en compte de l information contextuelle dans les syst mes de recommandation Elle est g n rale dans le sens o elle peut tre appliqu e pour la recommandation de contenus en g n ral livre Url article produit film chanson etc Dans cette approche le contexte est d fini du point de vue des objets et non pas des utilisateurs Il est de type intrins que c est dire d fini sur l ensemble des attributs relatifs l objet lui m me Nous avons montr en le combinant avec le profil de l utilisateur comment il peut am liorer la pr cision de la recommandation et ainsi mieux r pondre aux exigences des utilisateurs L architecture du syst me utilisant cette nouvelle m thode comporte trois composants essentiels savoir Cr ation des prof
72. dente amp x El A JO Rechercher She Favoris B eS http protege stanford edu Adr Google prot g E pro t g HOME OYERYIEW DOCUMENTATION DOWNLOADS SUPPORT COMMUNITY WIKI ABOUT US news 16th March 2009 Prot g 3 4 released read more wnload 23rd 26th June 2009 11th Prot g Conference Amsterdam Netherlands registration now open Favoris Outils gt e ORRA Bx liens Connexion J3 Rechercher o o d o 3 amp amp 2 a Search welcome to prot g Prot g is a free open source ontology editor and knowledge base framework The Prot g platform supports two main ways of modeling ontologies via the Prot g Frames and Prot g OWL editors Prot g ontologies can be exported into a variety of formats including RDF S OWL and XML Schema more SEHERE H Prot g is based on Java is extensible and provides a plug and play environment that makes it a flexible base for rapid prototyping and application development more go to prot g owl Prot g is supported by a strong community of developers and academic government and corporate users who are using Prot g for knowledge solutions in areas as diverse as biomedicine intelligence gathering and corporate modeling Figure 33 Le site officiel du logiciel Prot g 72 CHAPITRE III Conception et R alisation 8 4 Jena Jena est un Framework Java pour constr
73. e vidence le profil de l utilisateur peut comporter de nombreux concepts de l ontologie chacun figurant dans les diff rentes branches et diff rents niveaux de la hi rarchie Par exemple le profil de l utilisateur peut inclure uniquement sport ou sport et football ou football et basketball ou tous les trois en plus de nombreux autres concepts Cela signifie qu un certain concept dans un descripteur d article peut tre compar avec plus d un concept quivalent dans le profil de l utilisateur Par exemple si un descripteur d article inclut football et le profil de l utilisateur inclut la fois sport et football alors il est de type Matching parfait entre les deux profils en raison du concept commun football et aussi Matching partiel cause du concept p re Sport Comme indiqu pr c demment le profil de l utilisateur bas sur le contenu peut tre initialement g n r par l utilisateur qui s lectionne les concepts depuis l ontologie et de leur attribuer des poids d importance Le total des poids est normalis 100 Ensuite le profil de l utilisateur est mis jour au fil du le temps en fonction de la r action implicite de l utilisateur lorsque l utilisateur lit un article et le trouve int ressant les concepts dans le descripteur de cet article qui n taient pas initialement dans le profil utilisateur sont ajout s celui ci et
74. e Url article produit film chanson etc Nous illustrons l approche adopt e pour affiner la recommandation de films a un utilisateur Mots cl s Syst me de recommandation contexte profil utilisateur descriptif contenu pr f rence matching contextualisation similarit s mantique similarit num rique ontologie Abstract Traditional Recommender systems provide a solution to the problem of information overload They provide to the users the information and content those are most relevant to them These systems ignore the fact that users interact with systems in a particular context Through this thesis we present a recommendation system of intrinsic context that we can apply to the recommendation of general contents book Url article product movie song etc We illustrate the approach to refine the recommendation of movies to a user Keywords Recommendation system context user profile content descriptive preference matching contextualization semantic similarity digital similarity ontology vi Table des mati res LISTE DES FIGURES 8250 a mn nee ni ner ds x LISTE DES TABLEAUX irasra nir a AA ARA a T a TA xii INTRODUCTION GENERALE neinn R N Sus ued a waaay es 1 CHAPITRE I Les Syst mes de Recommandation Classiques 1 Dtr d cti lssnonsuo a EE en nn na A A R a aa aaa a 6 ZWD UUM an ee LE a A a N 6 ILONI MIS ESS a LL eas AN 7 De DEMU eih a n a E AE A A A E 7 32 Structure d une Ontolofi eiiie
75. e afin de g n rer des recommandations La figure 18 montre un fragment de m tadonn e d crivant un restaurant nomm Citt Vecchia lt overlay gt lt title gt bari zonel lt title gt lt detail gt lt title gt eating lt title gt lt annotation gt lt title gt eating_type lt title gt lt text gt restaurant lt text gt lt annotation gt lt annotation gt lt title gt name lt title gt lt text gt Citt Vecchia lt text gt lt annotation gt lt annotation gt lt title gt coordinates lt title gt lt text gt 41 06 14 800 N 16 45 57 013 E lt text gt lt annotation gt lt annotation gt lt title gt food type lt title gt lt text gt typical lt text gt lt annotation gt lt annotation gt lt title gt view lt title gt lt text gt historical center lt text gt lt annotation gt lt annotation gt lt title gt table lt title gt lt text gt open air lt text gt lt annotation gt lt annotation gt lt title gt timetable lt title gt lt text gt 12 00 22 00 lt text gt lt annotation gt lt annotation gt lt title gt closed lt title gt lt text gt Monday lt text gt lt annotation gt lt annotation gt lt title gt wheelchair accessibility lt title gt lt text gt yes lt text gt lt annotation gt lt detail gt lt overlay gt Figure 18 Fragment de m tadonn e d crivant un restaurant MyMap d cide laquelle des informations qu il faut fournir et comment la pr senter partir d une repr sen
76. e entre les n uds par le chemin le plus court pr sente un moyen des plus vidents pour valuer la similarit s mantique dans une ontologie hi rarchique Il pr sente ainsi une mesure utilisant une m trique distance cl c2 qui indique le nombre d arcs minimum parcourir pour aller d un concept cl un concept c2 1 Sim c1 c2 1 distance c1 c2 5 2 Approches bas es sur les n uds Ces approches adoptent une nouvelle mesure en termes de la mesure entropique Contenu Informationnel de la th orie de l information La probabilit P pour l identification de l utilisation d une classe ou de ses descendants dans un corpus d signe l information de la classe On d finit l entropie d une classe par la formule suivante Efc log P c O P est la probabilit de trouver une instance du concept c La probabilit d un concept c est calcul e en divisant le nombre des instances de c par le nombre total des instances En associant des probabilit s aux concepts d une taxonomie il est possible d viter le manque de fiabilit des distances des arcs Cette caract ristique quantitative de l information fournit 22 CHAPITRE I Les Syst mes de Recommandation Classiques une nouvelle fa on de mesurer la similarit s mantique Plus l information est partag e par deux concepts plus ils sont similaires Parmi les travaux recens s dans la litt rature sous cette cat gorie on peut citer
77. eFrameApplication app getFile File G adTextFileTask B LoadFileTask File file RO succeeded String fileContents Ta failed The amp T88 3 initComponents s s bar initialization m j eout idle ico busy animation ResourceMap resourceMap getResourceMap int messageTimeout resourceMap get Integer StatusBar messageTimeout messageTimer new Timer messageTimeout new ActionListener public void actionPerformed ActionEvent e statusMessageLabel setText gt DE messageTimer setRepeats false int busyAnimationRate resourceMap get Integer StatusBar busyAnimationRate for int i 0 i lt busylcons length i Figure 32 Capture cran de l diteur NetBeans 8 3 Prot g Est un diteur d ontologie open source disponible l adresse http protege standford edu voir figure 33 Il a t d velopp au d partement d Informatique M dicale de l Universit de Stanford L diteur d ontologie Prot g version 3 4 beta a t utilis pour diter l ontologie de ce projet dans l objectif de g n rer automatiquement le code OWL Ontology Web Language correspondant Il est noter que Prot g offre beaucoup de fonctionnalit s qui n ont pas t toutes utilis es dans le pr sent travail A The Prot g Ontology Editor and Knowledge Acquisition System Microsoft Internet Explorer Fichier Edition Affichage Q Pr c
78. ectue un achat d un cadeau sur internet pour l offrir son ami Le syst me risque de lui recommander des produits similaires alors qu il ne s agit pas de ses propres pr f rences Ce probl me peut tre surmont si le syst me connait le contexte dans lequel la transaction a eu lieu Bien qu il ne soit pas vident d obtenir ce genre d information il est possible de la d duire des donn es dont on dispose d une fa on explicite demande l utilisateur de sp cifier les variables contextuelles ou implicite comme par exemple remarquer si le lieu de r sidence d un utilisateur a chang ou bien quand est ce qu il a effectu les transactions a travers ses fichiers journaux D apr s S Lombardi et al 27 le mod le contextuel donne toujours de meilleurs r sultats par rapport au mod le non contextuel en termes de pr cision nombre de cas correctement class s parmi tous les cas et de rappel nombre de tout les cas estim s pertinent par l utilisateur et qui sont pr vus correctement 4 Dimensions du contexte M Daoud 15 a propos dans le cadre de son travail deux dimensions principales du contexte de recherche le contexte de l utilisateur et le contexte de la requ te Elle vise int grer ces deux dimensions du contexte dans un processus de recherche d information ou recommandation afin d asseoir un syst me de recherche d information contextuel La premi re permet de caract riser l utilisateu
79. edy Russell Chuck Comedy 4 0 424 367 4 Russell Chuck Crime Russell Chuck Crime 4 0 424 367 4 Russell Chuck Fantasy Russell Chuck Fantasy 4 0 424 380 4 Cameron Ja Action Cameron James Action 4 5 424 380 4 Cameron Ja Adventure E Sans contexte Cameron James Adventure 4 0 424 380 4 Cameron Ja Comedy Cameron James Comedy 1424 4 Cameron Ja Romance z Camaran lames Romance NP utilisateur Propagation des notes pr dites Figure 54 Choix de la m thode de pr diction 105 ANNEXE 1 Apr s introduction du choix du matching il faut s lectionner la m thode d valuation souhait e M thode des TOPs K M thode du SEUIL comme montr dans la figure 55 E gt lee Valider Figure 55 Choix de la m thode de pr diction Si l administrateur choisit la m thode des TOPs K alors il a la possibilit d introduire le nombre de k et les num ros de Training Set souhait s voir figure 56 Apr s avoir cliquer sur le bouton Calculer l administrateur a la possibilit de visualiser les courbes correspondantes en cliquant sur le bouton Graphe cay LI Calcul de la PRECISION et du RAPPEL par la m thode TOP K Ajouter un K Calculer Graphe Figure 56 M thode des TOPs 106 ANNEXE 1 Dans le cas o l administrateur choisit la m thode de Seuil alors il a la possibilit d introduire le seuil des notes donn es et le
80. ement PrOHPCONENUE SSSR ARRET RAR RER 2 eats 64 5 4 Mesures de similarit s utilis es dans l application 0 00 cccceceeeeeeeseeeseeeeteeeeeeeees 65 Exemple illustratif pour la recommandation des films 00 0 0 eee eeeeeeeeeseeceeeceaeenteeseeeeenees 66 Conception de l ontologie de l application ss 68 7 1 M thodologie de ConstrucLon2 in ne nn en aie 68 7 2 Respect des principes de construction 68 viii 7 3 Repr sentation hi rarchique de l ontologie conceptuelle eee eeeeeeeeseeeeeteeeees 69 8 Environnement de d veloppement ss 70 DL OA l RS Rd SU VA dd ts tas 70 8 2 Langage de programmation Ja VAE CS et nt des 70 Oe INTRO ANS tt ta nes ten Re E 71 D Ab ca 8 2 cen ni re A E a a en nec see 12 S A Fe PE EE T iia teesS ete ced vlna deieeatials 73 OS COMCLUSION Oae ESS NT A as a eae A SR aie ne En 74 hes TIONG UN sips Sa Uae RSS Sd nn ln nt a 76 MOV We tis ECIMDR SSSR RE ee gas es oe ae us nee una ste eatin sae 76 3 Evaluation du syst me de recommandation 79 3 1 Construction d s tables vc siccssssccascsedactavisiaa tosssereisvansaareebedenas tevegseaeaatnaesiaacanaseae aes 79 3 2 Calcul Ge la D COR RE Rene a nt tn en melon 84 3 2 1 Similarit Mum ri qQue ess ei ataia eE rE a raret rte hs dents 84 3 2 2 Similarit s mantique sociated sseceisbeciuaciedsdesvdeed tsar EEA EEE REA 84 3 2 3 Similarit 810 bilesin e anena cates gag custeventoddureccdercuetievustaye dent 85 3 3 Recommandatio
81. en effet deux points de d part qui d montre que ces processus ne doit pas tre lin aire Dans la branche de gauche le capteur IP r cup re l adresse IP de l utilisateur courant et la retourne comme une cha ne de caract res Le capteur des coordonn es g ographiques utilise cette adresse IP pour d terminer l emplacement actuel de l utilisateur via un service Web accessible au public 39 CHAPITRE II Les syst mes de recommandation sensibles aux contextes Les coordonn es g ographiques r sultant d clenchent le d tecteur de la ville qui cherche maintenant les villes les plus proches en comparant les coordonn es de ceux qui sont stock s dans le mod le du domaine Le r sultat est une liste de ressources pond r s Oran gt 1 0 Tlemcen gt 0 2 ce qui signifie que les v nements d Oran sont hautement recommandable par rapport aux v nements de Tlemcen Maintenant qu on a les villes les plus proches l utilisateur ce r sultat est introduit dans deux autres services Le capteur m t orologique utilise la ville la plus proche et d termine le climat cet endroit en utilisant un autre service web Par la suite la branche de droite figure 14 est en cours Les produits et les v nements sur lesquels l utilisateur a cliqu sont obtenus en utilisant le capteur Cliquer et en utilisant le service historique de clicks A chaque fois qu un utilisateur clique sur une page le syst me sauvegarde cette page
82. er Animation Comedy Fantasy Horror Sci Fi Comedy Horror Musical Sci Fi 111 ANNEXE 2 Comedy Drama Family Fantasy Romance Adventure Drama Thriller Action Adventure Horror Sci Fi Thriller Adventure Comedy Family Fantasy 2987 Who Framed Roger Rabbit Animation Comedy Crime Family Fantasy Mystery 3039 Trading Places Comed S Action Crime Drama Thriller Comedy Drama War 3471 Close Encounters of the Third Adventure Drama Sci Fi Kind 3527 Action Horror Sci Fi Thriller 3552 Caddyshack Comedy Sport 112
83. es contextes Ces deux algorithmes sont importants pour le d veloppement de notre SR sensible au contexte e Evaluation du SR sensible au contexte et comparaison avec l valuation du SR sans contexte Notre m moire est organis comme suit Le premier chapitre est d di aux syst mes de recommandation classiques SRC Nous d finissons d abord ce qu est un syst me de recommandation Ensuite nous d taillons ses diff rents types Enfin nous passons en revue les diff rentes mesures de similarit et pr sentons une classification de ces mesures Dans le deuxi me chapitre nous commen ons par d finir la notion de contexte Nous enchainons en montrant les diff rentes m thodes de son introduction dans le processus de recommandation Nous terminons en pr sentant et comparant les diff rents SR sensibles au contexte Nous exposons notre approche dans le troisi me chapitre Nous commen ons d abord par d finir le mod le de donn es utilis ainsi que la conception de notre application via les diff rents diagrammes UML Ensuite nous expliquons la m thode adopt e pour l introduction du contexte et nous d taillons l architecture g n rale du SR adoptant notre nouvelle approche 3 Introduction G n rale Nous y montrons en d tail le fonctionnement des trois modules essentiels pour la r solution contextuelle savoir Cr ation des profils utilisateurs R solution du contexte et l appariement profil conten
84. es des ressources WR Le poids des ressources inclut entre 0 pour les plus faibles et 1 pour les plus importants 123 Chiffres OXY Donn es de type texte On peut combiner ces services entre eux utiliser la sortie d un service comme entr e d un autre service durant tout le processus de recommandation Ceci posera un probl me le service destinataire doit conna tre beaucoup de chose sur l impl mentation interne du service source pour pouvoir bien interpr ter ses sorties Il existe 3 types de service dans le syst me DISCOVR e Sensor Retourne le contexte sous forme de poids de ressources ou de donn e num rique par exemple en introduisant l adresse IP de l utilisateur dans le site WWw mon ip com localiser adresse ip php on peut d duire la ville o il habite e Service de recommandation Produit les recommandations et retourne une liste ordonn e d items qui sont susceptibles de plaire l utilisateur et retourne aussi une repr sentation des donn es utilisateurs sous forme de mod le s mantique e Utilit s sont des modules suppl mentaires pour filtrer et ou convertir des donn es filtrer pour ne recommander que les donn es pertinentes et convertir les entr es de chaque service pour qu elles lui correspondent L ordre d ex cution des services est g r par un graphe orient qui est cr par le service processor La sortie de chaque service est trait e par la composante view preparer Le
85. et de les afficher l utilisateur du plus important au moins important e Afficher les courbes d valuation pour l administrateur de notre application 6 Consommation dans ce module l utilisateur parcourt la liste des recommandations et choisit les contenus qui lui sont propos s Les produits consomm s et not s par l utilisateur sont stock s dans des logs de journalisation afin d enrichir son profil ult rieurement Dans ce qui suit nous donnons les d finitions relatives aux concepts principaux de notre approche de recommandation contextuelle 61 CHAPITRE III Conception et R alisation 5 Recommandation contextuelle Dans cette section nous allons d tailler les trois modules cl s de notre syst me 38 savoir Cr ation de profil r solution du contexte et appariement profil contenu 5 1 Cr ation des profils utilisateurs Le concept de profil utilisateur est la pierre angulaire de tout syst me de recommandation Nous proposons dans ce m moire une nouvelle approche pour la cr ation automatique des profils bas e sur l analyse des logs d interaction appel s aussi fichiers de journalisation Nous rappelons qu un profil utilisateur est un ensemble de pr f rences contextuelles Nous expliquerons dans ce qui suit comment cr er des profils partir des logs d interaction en consid rant des contextes intrins ques Algorithme 1 Cr ation des profils Ent es L log de journali
86. etball tandis que le concept utilisateur est sport e 3 U2 par exemple un concept article est ligue d Euro tandis que le concept utilisateur est basketball Dans ces 2 cas le concept article est plus sp cifique que le concept utilisateur c est dire l int r t de l utilisateur est plus g n ral Matching faible Un concept appara t dans un profil alors qu un concept grand p re ou concept petit fils appara t dans l autre profil les concepts sont s par s pas 2 niveaux Un matching faible peut se produire dans 2 cas e Il U3 par exemple un concept article est sport tandis que le concept utilisateur est jeu mondial dans ce cas l article est beaucoup plus g n ral que l int r t de l utilisateur e 13 Ul par exemple un concept article est ligue d Euro tandis que le concept utilisateur est sport dans ce cas l article est beaucoup plus pr cis que l int r t de l utilisateur Pour chacun de ces 9 cas possibles nous d terminons un score de similarit Dans les 3 cas de Matching parfait marqu a voir Figure 4 le score est de 1 maximum dans tous les autres cas le score doit tre inf rieur 1 cela d pend s il s agit d un matching partiel ou faible et de la direction de la relation c est dire si le concept utilisateur est plus g n ral ou plus sp cifique que le concept article Par exemple le score pour le cas I1
87. eur Niveau 1 dans l ontologie Niveau 2 dans l ontologie Niveau 3 dans l ontologie Figure 4 Mesure de similarit hi rarchique Matching parfait Le concept apparait la fois dans le profil de l utilisateur et le profil d article I1 I2 I3 indiquent le niveau d un concept dans un profil article et U1 U2 U3 le niveau d un concept dans le profil utilisateur Un Matching parfait peut survenir dans 3 cas e Ii Ul par exemple les deux profils articles et utilisateurs incluent sport e 2 U2 par exemple les deux profils articles et utilisateurs incluent football e I3 U3 par exemple les deux profils articles et utilisateurs incluent jeu mondial Matching partiel Un concept appara t seulement dans un des profils alors que le p re ou le fils de ce concept appara t dans l autre profil Un Matching partiel peut se produire dans les 2 paires de cas e Il U2 par exemple un concept article est sport tandis que le concept utilisateur est football e I2 U3 par exemple un concept article est football tandis que le concept utilisateur est jeu mondial Dans ces 2 cas le concept article est plus g n ral que le concept utilisateur un seul niveau de diff rence c est dire l int r t de l utilisateur est plus pr cis sp cifique que l article 14 CHAPITRE I Les Syst mes de Recommandation Classiques e 2 Ul par exemple un concept article est bask
88. exte dans notre syst me de recommandation figure 29 Dans cette approche l information contextuelle est utilis e afin de filtrer les valuations qui ne correspondent pas au contexte courant de l utilisateur Le pr filtrage est ex cut avant que le module principal de la recommandation ne soit lanc 5 Recommandations SR 2 dimensions Contextualis es A Donn es Contenus items T Contextualis es Figure 29 M thode d introduction du contexte Comme le montre la figure 30 l architecture globale de notre syst me de recommandation comporte six modules principaux Cette architecture vient compl ter celle pr sent e dans 6 qui ne consid rait que la recommandation bas e sur le FBC sans la prise en compte du contexte 59 R solution du contexte Retour utilisateur Base de donn es Matching Similarit num rique Similarit s mantique D Construction Construction utilisateur de A de de contenu Utilisateur Jiang amp pet Pearson Conrath Consommation Ontologie Pr sentation Figure 30 Architecture g n rale de l application Administrateur 60 CHAPITRE III Conception et R alisation 1 Cr ation descripteur de contenu ce module a pour t che de cr er un descriptif produit partir des informations stock es dans la base de donn es et l ontologie 2 Cr ation profil utilisateur ce m
89. gissent avec des syst mes selon un contexte particulier et que la note attribu e par un utilisateur un produit peut tre diff rente en allant d un contexte un autre En effet l endroit o se trouve l individu la maison ou au travail le temps le matin ou le soir la saison l tat d esprit peuvent influer sur les votes des utilisateurs et ainsi am liorer l exactitude des recommandations Netflix organise un challenge dans lequel l entreprise offre 1 million de dollars pour celui ou celle qui r ussit impl menter un syst me de recommandations plus pertinent que le leur Cette grosse somme d argent montre le grand int r t dont b n ficient les syst mes de recommandation aupr s des industriels L objectif de la pr sente th se est de proposer une nouvelle approche permettant l introduction du contexte dans le processus de la recommandation Dans cette approche nous d finissons le contexte du point de vu des objets et non pas des utilisateurs Le contexte est toute information qui influe sur l int r t que peut exprimer un utilisateur sur un objet Nous distinguons deux types de contextes contexte intrins que et contexte extrins que Le premier type est d fini sur l ensemble des attributs relatif l objet lui m me Par exemple dans une relation Films le genre de film peut tre consid r comme un attribut contextuel Le contexte extrins que est un ensemble d attributs relatif l
90. iff rents types d Ontologie Les l ments de l ontologie sont d finis explicitement avec un langage dont la s mantique est plus ou moins formelle d pendante du degr d abstraction voulu Par cons quent les ontologies pr sentent des degr s d abstraction diff rents selon le domaine auquel elles sont d di es On identifie trois types d ontologies 19 selon un niveau d abstraction d croissant Ontologies d applications Ontologies de domaine Ontologies globales Le sch ma illustr dans la figure 2 r sume les trois types d ontologies pr sent es ci dessus CHAPITRE I Les Syst mes de Recommandation Classiques Degr d abstraction Ontologies globales Concepts g n raux Sp cialisation des concepts g n raux Ontologies de domaine Sp cialisation des r les des concepts Ontologies d application Figure 2 Classement des types d ontologie selon leurs degr s d abstraction 4 Les principales approches de filtrage Il existe trois grandes approches de filtrage bas sur le contenu collaboratif et hybride 30 Le filtrage bas sur le contenu compare les nouveaux documents au profil de l utilisateur et recommande ceux qui sont les plus proches Le filtrage collaboratif compare les utilisateurs entre eux sur la base de leurs jugements pass s pour cr er des communaut s et chaque utilisateur re oit les documents jug s pertinents par sa communaut Le f
91. iliale fran aise a ouvert en 2000 Amazon com est une entreprise de commerce lectronique am ricaine bas e a Seattle Sa sp cialit la plus connue est la vente de livres mais elle est diversifi e dans d autres produits notamment dans la vente de tout type de produits culturels disques CD musique en t l chargement DVD appareils photos num riques mat riels informatique et lectrom nager etc Ce syst me demande aux utilisateurs de se connecter via leur nom voir figure 23 A afin de cr er leur profile et fournit un bouton trouver un cadeau voir figure 23 B pour chaque utilisateur afin de faire la distinction entre les pr f rences propres l utilisateur et les pr f rences de la personne laquelle il va offrir ce cadeau amazoncom Pam See A 35 Aranno Product Categores Your Account W Cat Your Lits E Heb jf You Broneng History Recommendec For You Rate These Meng improve You Rocommendstens Yo commended for you ED Figure 23 Barre d outils du site www amazon com 46 CHAPITRE II Les syst mes de recommandation sensibles aux contextes 8 1 8 Approche bas e sur le Mod le d Acc s Personnalis PAM Cette approche consiste tudier les possibilit s d int gration des informations contextuelles dans les syst mes de recommandation classiques en suivant les travaux initi s par G Adomavicius et al 2 Anand et al 5 et L Baltrunas 7 Le mod le d acc s personnal
92. ilisateur en fonction des contextes nous avons introduit le concept de pr f rence contextuelle La pr f rence contextuelle est une pr f rence valide dans un contexte particulier Elle ne doit tre prise en compte que lorsque l utilisateur se trouve dans ce contexte Nous utilisons le formalisme suivant pour mod liser la pr f rence contextuelle pc lt pi contexte cj gt O pi est une pr f rence quantitative normale valide dans le contexte cj Exemple toujours sur la relation des voitures R un utilisateur peut d finir les deux pr f rences contextuelles suivantes cp1 lt Prix gt 1 4M DA gt 0 2 type Renault cp2 lt Prix lt 1 7M DA gt 0 8 type BMW Dans cpl l utilisateur exprime le fait qu il accorde un score de 0 2 aux tuples pour lesquels l attribut prix prend une valeur sup rieur 1 4 million de Dinars Alg riens dans le contexte des voiture de type Renault contexte intrins que En m me temps l utilisateur accorde un score de 0 8 aux voitures ayant un prix pouvant atteindre 1 7 million DA dans le contexte des voitures de type BMW Profil utilisateur Dans notre approche le profil utilisateur est d fini par l ensemble des pr f rences contextuelles implicites d duits automatiquement par le syst me en analysant les logs d interactions de l utilisateur Pu cp1 cpn Cette mod lisation permet de capturer le fait qu un utilisateur puisse avoir
93. ils utilisateurs R solution du contexte et l appariement profil contenu Un premier algorithme a t r alis dans le but de cr er de fa on automatique des profils utilisateurs sur la base de l analyse des logs d interaction Un deuxi me algorithme a t labor pour permettre l extraction du contexte intrins que directement partir des contenus identifi s comme candidats potentiels la recommandation Ce deuxi me algorithme r sout m me le probl me des contextes qui ne sont pas compatibles avec le profil de l utilisateur en se basant sur la similarit entre les instances du contexte En ce qui concerne l appariement profil contenu nous avons con u et utilis une nouvelle mesure de similarit qui combine lin airement une mesure s mantique et une mesure vectorielle Pour mieux comprendre les diff rents aspects pris en compte par notre approche nous l avons appliqu e pour la recommandation de films un utilisateur en choisissant comme contexte le r alisateur d un film Nous avons galement pr sent et compar les principaux m thodes et syst mes sensibles au contexte sur la base d un certain nombre de propri t s que nous avons d finies Finalement en vue de confirmer l efficacit de notre application des tests ont t effectu s sur les donn es r colt es de deux grandes bases de donn es des films savoir MovieLens et IMDB en utilisant l approche de recommandation propos e Ces test
94. iltrage collaboratif On suppose que l on a des communaut s form es par la proximit des valuations des utilisateurs Le document d sera recommand l utilisateur u car ce document est appr ci par la communaut G o se trouve l utilisateur 11 CHAPITRE I Les Syst mes de Recommandation Classiques Documents TT wW Communaut s Profil des i dE valuations recommandation Figure 3 Principe g n ral du filtrage collaboratif 4 2 Filtrage bas sur le contenu Dans cette section nous d finissons dans un premier temps ce qu est le filtrage bas sur le contenu Ensuite nous pr sentons les diff rents types de matching qui existent Enfin nous donnons un exemple pour illustrer le fonctionnement d un syst me utilisant le filtrage bas sur le contenu 4 2 1 D finition Le filtrage bas sur le contenu Content based Filtering 30 qui est une volution g n rale des tudes sur le filtrage d information s appuie sur le contenu des documents th mes abord s pour les comparer un profil lui m me constitu de th mes Chaque utilisateur du syst me poss de alors un profil qui d crit ses propres centres d int r t Par exemple le profil peut contenir une liste des th mes ou pr f rences que l utilisateur aime bien ou qu il n aime pas Lors de l arriv e d un nouveau document le syst me compare le descriptif du document avec le profil de l utilisateur pour pr dire l utili
95. iltrage hybride combine le filtrage bas sur le contenu et le filtrage collaboratif pour exploiter au mieux les avantages de chacun 4 1 Filtrage collaboratif Dance cette section nous donnons dans un premier temps une d finition du syst me de filtrage collaboratif Ensuite nous voquons les diff rentes tapes par lesquelles passe le processus du filtrage collaboratif Enfin nous terminons par un exemple illustratif 4 1 1 D finition Le filtrage collaboratif Collaborative Filtering CF a pour principe d exploiter les valuations faites par des utilisateurs sur certains documents contenus afin de recommander ces m mes documents d autres utilisateurs et sans qu il soit n cessaire d analyser le contenu des documents Tous les utilisateurs du syst me de filtrage collaboratif peuvent tirer profit des valuations des autres en recevant des recommandations pour lesquelles les utilisateurs les plus proches ont mis un jugement de valeur favorable et cela sans que le syst me dispose d un processus d extraction du contenu des documents Gr ce son ind pendance vis a vis de la repr sentation des donn es cette technique peut s appliquer dans les contextes o le contenu est soit indisponible soit difficile analyser et en particulier elle peut s utiliser pour tout type de donn es texte image audio et vid o CHAPITRE I Les Syst mes de Recommandation Classiques De plus l utilisateur est capable de
96. ine est pr sent e par le concept Film voir Figure 31 Brim Guerre Or hnileur Drame in Drcurent taire AN 0 n D APIAN A j Ouest PAPAS er Orinsloi nyse need ibis ELITE Figure 31 Repr sentation hi rarchique de l Ontologie 69 CHAPITRE III Conception et R alisation 8 Environnement de d veloppement Nous avons d velopp notre application sur une machine AMD Atlon 64 bits avec une vitesse de 1 60Ghz dot e d une capacit m moire de 3GB DDR2 sous Windows 7 L application a t r alis e avec le langage de programmation Java Pour la base de donn es nous avons utilis Oracle 10g Express Edition 8 1 Oracle Oracle 31 est un SGBD Syst me de Gestion de Base de Donn s dit par la soci t du m me nom Oracle Corporation leader mondial de bases de donn es Sa force principale est la portabilit de sa base de donn es Aujourd hui il y a un groupe de quelques machines auxquelles Oracle accorde une priorit Windows en fait partie au m me titre que Linux HP UX Hewlett Packard Solaris Sun et Aix IBM C est dire que toute sortie d une nouvelle version d Oracle sera synchronis e de mani re prioritaire pour l ensemble de ces plates formes Les fonctionnalit s d oracle Oracle est un SGBD permettant d assurer e La d finition et la manipulation des donn es La coh rence des donn es La confidentialit des donn es L int grit des donn es La sa
97. is PAM 10 offre un ensemble de services de concepts et de techniques de personnalisation qui sont adaptables diff rents types d application Cette plateforme satisfait les exigences suivantes e Dispose des m tas mod les de profil et de contexte qui lui permettent d tre adaptable toute sorte d applications e Etre ind pendante e Fournir un ensemble de services qui peuvent personnaliser des applications existantes utilisation partielle ou m me construire de nouvelles applications de personnalisation utilisation compl te e Rendre les informations r utilisables en assurant leur p rennit La figure 24 repr sente l architecture de cette plateforme Elle se d cline en 3 couches 1 une couche de persistance 11 une couche fonctionnelle et 111 une couche de communication La couche de persistance Concerne le stockage des informations contenues dans les m tas mod les du profil et du contexte dans une base de donn es assure leurs p rennit et propose une API qui permet l acc s ces informations La couche fonctionnelle Regroupe l ensemble des services offerts par la plateforme Ces services sont l instanciation la mise jour la contextualisation du profil l appariement des profils le filtrage des profils par rapport au contexte et enfin la reformulation des requ tes La couche de communication N est autre que l interface graphique Elle effectue la liaison entre le mod le d acc
98. iser le comportement malveillant Par cons quent il est indispensable d avoir des moyens permettant chaque utilisateur de d cider en quels utilisateurs et en quels contenus avoir confiance e Protection de la vie priv e Un autre probl me qui touche les syst mes de recommandation est la protection des informations sensibles constituant le profil de l utilisateur informations personnelles int r ts go ts habitudes etc Vu la nature de l information ces syst mes doivent assurer une telle protection A nsi des moyens pour pr server l anonymat des utilisateurs et chiffrer les donn es transmises sont n cessaires 7 Les principaux travaux dans les syst mes de recommandation Dans le domaine de la recommandation plusieurs techniques ont t utilis es par les chercheurs notamment les techniques bas es sur les heuristiques et celles bas es sur un mod le Nous pouvons citer parmi ces techniques les r seaux ba siens le clustering les arbres de d cision etc voir r f 13 Le tableau 4 r sume les diff rentes techniques de recommandation utilis es par la communaut des chercheurs dans les trois approches de recommandation FBC FC et hybride 26 CHAPITRE I Les Syst mes de Recommandation Classiques Tableau 4 Classification des recherches dans les syst mes de recommandation Content based Commonly used techniques Representative research examples Hybrid Combining content
99. jourd hui avec l av nement d internet en leur fournissant des recommandations personnalis es Ce sont des syst mes de personnalisation qui pr sentent aux utilisateurs les contenus les plus pertinents en utilisant certaines informations concernant leurs pr f rences pass es Les SRs utilisent des profils repr sentant des pr f rences relativement stables des utilisateurs pour calculer des recommandations Ce calcul se fait par la pr diction des scores qu un utilisateur est susceptible d attribuer aux contenus Les strat gies de recommandation se basent g n ralement sur le filtrage collaboratif FC le filtrage bas sur le contenu FBC ou sur une combinaison de ces deux approches Le FC recommande des produits en se basant sur la similarit des pr f rences d un groupe de clients connus comme tant des voisins Cela suppose que les utilisateurs ayant des int r ts communs dans le pass continueront probablement partager les m mes go ts dans le futur Les syst mes FBC utilisent l appariement entre le profil d un utilisateur et les descripteurs des contenus pour lui recommander les produits appropri s Les SRs traditionnels op rent sur une matrice Utilisateur Produit Quand un utilisateur entre de nouveaux votes ou fait de nouveaux achats son profile est mis jour en ajoutant les nouvelles informations au vecteur de votes courant de cet utilisateur Ces syst mes ignorent le fait que des utilisateurs intera
100. le 6 Pertinence de l information contextuelle Les informations contextuelles ne sont pas toutes pertinentes pour la formulation des recommandations 3 par exemple quelle est l information contextuelle pertinente au moment de recommander un livre e Dans quel but le livre est achet travail loisirs e Quand le livre sera lu semaine week end e Ot le livre sera lu A la maison l cole dans un avion La d termination de la pertinence des informations contextuelles se fait e manuellement par exemple l aide de la connaissance du domaine d un concepteur du syst me de recommandation e automatiquement par exemple en utilisant des proc dures de s lection de l apprentissage automatique 23 de l exploration de donn es 26 et des statistiques 14 7 Diff rentes m thodes d introduction du contexte Selon U Panniello et al 32 trois diff rents paradigmes algorithmiques pour l int gration des informations contextuelles dans le processus de recommandation sont pr sent s 7 1 L approche de Pr filtrage Contextuel Pref Dans l approche de pr filtrage l information contextuelle est utilis e comme une tiquette permettant de filtrer les valuations qui ne correspondent pas l information contextuelle sp cifi e Cela se fait avant que la m thode principale de recommandation soit lanc e sur le reste des donn es s lectionn es Autrement dit si un contexte d int r t partic
101. les poids de tous les concepts dans ce profil sont recalcul s en fonction du nombre de clicks 4 2 2 3 Similarit s entre un descripteur d article et un profil utilisateur Un descripteur d article et un profil utilisateur sont semblables un certain degr si leurs profils comprennent des concepts communs le m me ou des concepts relatifs c est dire des concepts ayant une sorte de relation p re fils Un descripteur d article et un profil utilisateur peuvent avoir de nombreux concepts communs ou relatifs de toute vidence plus les concepts sont communs ou relatifs plus forte est leur similitude Par exemple si le profil de l utilisateur inclut football et sport ce profil est similaire un certain degr un article qui comprend ces deux concepts mais il est moins semblable un article incluant juste 13 CHAPITRE I Les Syst mes de Recommandation Classiques sport et il est plus semblable un article comprenant sport et football et basketball 4 2 3Les diff rents types de matching Dans une ontologie hi rarchique 3 niveaux nous pouvons distinguer entre 9 diff rents cas de similitude entre les concepts dans un profil utilisateur et un descripteur d article 28 comme repr sent sur la figure 4 Dans les paragraphes qui suivent nous pr sentons les diff rents types du matching qui existent Concepts dans Concepts dans le le profil article profil utilisat
102. leur de la pr f rence du genre Action pour l utilisateur 424 en prenant en compte le contexte intrins que d fini par le r alisateur Cameron James voir tableau 17 82 CHAPITRE IV Exp rimentation et Evaluation Un changement d chelle s av re n cessaire ce stade du calcul car les scores pr f rences doivent tre compris entre 0 et 1 Nous utilisons pour cela la formule X X0 X1 X0 avec XO 1 et X1 5 Par exemple la pr f rence pour l utilisateur 424 pour le genre Musical qui est gale 4 2 sera transform e en 4 2 1 5 1 3 2 4 0 8 Afin de calculer la similarit entre les r alisateurs que nous allons expliquer son utilit plus loin nous avons besoin des profils r alisateurs Nous repr sentons chaque r alisateur contexte intrins que par un vecteur de genres pond r s R alisateur lt Action 0 7 gt lt Drame 0 2 gt La pond ration score compris entre 0 et 1 associ e chaque genre renseigne sur le pourcentage de films de ce genre r alis s par le r alisateur en question nombre de film d un certain genre nombre total de films r alis s Par exemple lt Action 0 7 gt renseigne sur le fait que 70 des films r alis s par le r alisateur sont des films d Action Le tableau 18 montre une partie des vecteurs repr sentant les r alisateurs avec les attributs r alisateur genre et moyenne Tableau 18 Un extrait de la table profil r alisateur Eastwood Clin
103. lui des utilisateurs Le contexte est toute information qui influe sur l int r t que peut exprimer un utilisateur sur un objet Nous mod lisons le contexte comme une conjonction de pr dicats d finis sur des attributs contextuels Nous distinguons deux types de contextes contexte intrins que et contexte extrins que Le contexte intrins que est d fini par un sous ensemble des attributs d crivant l objet lui m me 54 CHAPITRE III Conception et R alisation Exemple Dans la relation R les attributs kilom trage et type peuvent tre consid r s comme des attributs contextuels intrins ques Le contexte extrins que est un ensemble d attributs relatifs l environnement d interaction de l utilisateur Il peut renseigner sur l emplacement g ographique de l utilisateur adresse IP sur la p riode temporelle de son interaction date et heure sur le media utilis pour l interaction etc Exemple A partir de la date et de la localisation par exemple on peut d tecter un v nement qui peut changer les pr f rences de l utilisateur de fa on momentan e Ainsi un utilisateur Alg rien peut se voir recommander des objets historiques et r volutionnaires Livres chansons films documentaires etc dans les p riodes pr c dant et succ dant un v nement historique comme le 1er Novembre ou le 5 juillet Pr f rence contextuelle Afin de capturer la variabilit incontestable des pr f rences d un ut
104. mettre de faire les recommandations ils fourniront les donn es pour e Le module de calcul Il s agit de l algorithme en lui m me En entr e il y a toutes les donn es et la demande et en sortie les diff rentes recommandations e Le consommateur C est celui qui demande la recommandation Comme nous l avons d j mentionn plus haut le calcul des recommandations se fait par la pr diction des scores qu un utilisateur est susceptible d attribuer aux contenus Ce calcul n cessite souvent la pr sence d une ontologie Nous introduisons bri vement des notions relatives aux ontologies dans ce qui suit avant d aborder les principales approches de filtrage 3 Ontologies Dans cette section nous donnons la d finition d une ontologie sa structure ainsi que ses diff rents types 3 1 D finition Le terme ontologie est construit partir des racines grecques ontos ce que existe l existant et Jogos le discours l tude Le terme a t repris en informatique et en science de l information au d but des ann es 90 o une ontologie repr sente l ensemble structur des termes et concepts repr sentant le sens d un champ d informations en effet Gruber a d fini l ontologie comme La sp cification d une conceptualisation d un domaine de connaissance Plus simplement elle permet de cr er une base de donn es structur e dans laquelle il est possible de classifier des l ments par cat gories et sous cat gories
105. n contextuelle 2g ci52cecxcceusiees nn Rs 85 SALA PVE CISIOM COIS TAD Pel sirenen i a rt Re mnt etre 86 JAI Ea prec SiOm ss een M re donee seth ren ten en ten A ce 86 3 4 1 1La m thode des TOP K is 86 3 4 1 2La m thode du seuil ss 87 3 4 2 Le rappels sent int mesh entrer tre cats tentes 88 3 5Interpr tation de P valuation Ernest tas ddr nie 89 3 5 1 R sultats de la m thode TOP K ss 89 3 5 2 R sultats de la m thode du seuil cceeccssscececcesessneeeeeeesennneeeeeceeeqneeeeeeeeeaaas 95 4 CONCUSSION onea a ee na mn na DO T 96 CONCLUSION GENERALE ijsssisssnccistscassdtavsuacvasstvedanavasaaaisseveliannsetandsevaanasdenadeeapaseersseeeuauetes 97 BIBRIOGRAPHIE iie es adel E E E E en tem 99 1X LISTE DES FIGURES Figure 1 Sch ma g n ral du filtrage d information 7 Figure 2 Classement des types d ontologie selon leurs degr s d abstraction 0 0 0 ceeeeeeeeeee 9 Figure 3 Principe g n ral du filtrage collaboratif 0 0 esc eeeeeeseeceeecneecneeeseeeeseesnaeenseeees 12 Figure 4 Mesure de similarit bierarc nique s2 2 0 2 sce ne ant nent de mer ee 14 Figure 5 Exemple de recommandation faite par notebookreview com 16 Figure 6 Hybridation classique de filtrage S20 fected nent ann 20 Figure 7 Exemple d un extrait d onfologie ic v ssivssceseusecasestivshcanesvbansetvcncestevyeevaewesvessactaous daseeys 22 Figure 8 Exemple de contexte p riode de l ann e
106. n et Evaluation Le poids de chaque matrice est calcul par la formule suivante Similarity V1 V2 M xN24 3 2 3 Similarit globale Dans ce type de similarit nous avons effectu une combinaison lin aire entre la mesure s mantique de Jiang et Conrath et la mesure num rique de Pearson En utilisant la formule suivante Sim glob Coef 1 Sim s m de Jiang Coef 2 Sim num de Pearson Avec Coef 1 et Coef 2 1 3 3 Recommandation contextuelle Nous distinguons trois cas pour le calcul de la recommandation contexttuelle 1 Lorsque les deux vecteurs ont le m me r alisateur nous appliquons la m thode de similarit globale Sim glob Coef 1 Sim s m Coef 2 Sim num Avec Coef 1 Coef 2 1 D apr s nos exp rimentations Coef 1 0 75 et Coef 2 0 25 conduisent a de bonnes recommandations aux utilisateurs 2 Lorsqu un nouveau contexte r alisateur se pr sente l utilisateur typiquement un r alisateur pour lequel l utilisateur n a vu aucun film auparavant Dans ce cas nous devons pr dire les pr f rences qu aurait eues l utilisateur par rapport aux genres de films produit par ce r alisateur inconnu Pour cela nous devons trouver parmi les r alisateurs connus par l utilisateur ceux pr sents dans son profil celui qui est le plus similaire au r alisateur inconnu Pour trouver ce r alisateur inconnu nous devons calculer tous les profils r alisateurs qui vont nous servir par la
107. n lui permettant de cliquer par exemple sur un triangle jaune pour obtenir les raisons pour lesquelles cet l ment n est pas recommandable ou non disponible La figure 21 montre le triangle jaune sur lequel l utilisateur peut cliquer pour avoir les explications gt Mozilla Firefox Le Travi Vini e Cucina Al Gambero Comunque Yoverest quesio ristorante interessante visto che proensa Storko che i prezzo medio di un pranzo Figure 21 Exemple de recommandation utilisant MyMap 45 CHAPITRE II Les syst mes de recommandation sensibles aux contextes 8 1 6 Sourcetone Interactive Radio Musiques selon l humeur En 2004 Malcolm Goodman et le Dr Jeff Berger ont fond un syst me de recommandation qu ils ont nomm Sourcetone radio interactive www sourcetone com 36 ce syst me demande l auditeur de pr ciser son tat d esprit ou motionnel le contexte avant de lui recommander une chanson La figure 22 montre une recommandation de la chanteuse Lady Gaga pour un utilisateur qui a un tat d esprit agit click for full player meo Ca Cr a i Lady Gaga VS Money Honey 4154 The Fame Japan Deluxe 47 2008 Pop Rock Sub Genre Dance Pop LADY GAGA THE FAME MONSTER Figure 22 Imprime cran du site www sourcetone com 8 1 7 Amazon Un autre syst me de recommandation sensible au contexte est celui d Amazon 4 qui a t cr par Jeff Bezos en juillet 1995 et dont la f
108. nceceseececeeeeeceeeeeeeeeeeesteeeenaeees 18 Tableau 2 Filtrage collaboratif bas sur le contenu 18 Tableau 3 Filtrage collaboratif d mographique ceeeceeesceceenceeeeeeeeceeeeeceeeeeceeeecsteeeenaeees 18 Tableau 4 Classification des recherches dans les syst mes de recommandation 27 Tableau 5 Matrice de similarit article article ceccceessecessceceseceeceeececeeceeceeceecseceeceteeeenaeees 36 Tableau 6 Matrice de similarit avec l attribut contextuel jour ee eeeeeceeseeeeteeeeeeeeeeetaees 37 Tableau 7 Tableau r capitulatif des diff rents Syst mes de recommandation sensibles aux COME KOS Lu pedis shit tn ete at EAAS E ne EE LA SN Eng ed Lame tale nude 51 Tableau 8 Profil de l utilisaten N 424 55 ccscss sacaSscovstcpanvssteeaaiiesueadunvthnds una sets 66 Tableau 9 Matrice de similarit s entre r alisateurs 67 Tableau 10 Enrichissement du profil utilisateur 67 Tableau 11 Dictionnaire de Base de Donn es 79 Tableau 12 Un extrait de la table T_Asernotes j3 cissccicciseaseaatasassateas sie ts sesccatasegnactvanndcncsseceen andes 79 Tableau 13 Un extrait de la table raining Sets sise adapte 80 Tableau 14 Un extrait de la table Resin set ns ne ne er en te 81 Tableau 15 Un extrait de la table Classic_Profil_user 0 ceeccceesceceenceceeeceeceeceeceeeeeesteeeenseees 81 Tableau 16 Un extrait de la table Contextual_Profil_User cece eeeeeceeseeceeneceeeteeeeeteeeeneeees 82 Tableau 17
109. ne virtuelle JRE la machine virtuelle qui effectue la traduction et l ex cution du bytecode en code natif supporte plusieurs processus de compilation a la vol e bytecode natif La portabilit est d pendante de la qualit de portage des JVM sur chaque OS Aujourd hui Java sous la forme de JavaFx trouve une nouvelle niche dans la cr ation d applications RIA Rich Internet Applications des applications qui proposent des fonctionnalit s notamment des interfaces plus volu es a la fois sur Internet et sur les t l phones portables Le langage JavaFx est un langage agile d riv de Java sous le contr le d Oracle qui met a profit la portabilit de Java ainsi que les vastes biblioth ques d j disponibles dans le langage Java 8 2 1 NetBeans NetBeans 29 est un environnement de d veloppement int gr EDI plac en open source par Sun en juin 2000 sous licence CDDL Common Development and Distribution License En plus de Java NetBeans permet galement de supporter diff rents autres langages comme Python C C JavaScript XML Ruby PHP et HTML Il comprend toutes les caract ristiques d un IDE moderne diteur en couleur projets multi langage refactoring diteur graphique d interfaces et de pages Web Con u en Java NetBeans est disponible sous Windows Linux Solaris sur x86 et SPARC Mac OS X ou sous une version ind pendante des syst mes d exploitation requ rant une machine virtuelle Java Un e
110. ngSetSO AC TrainingSet30 AC Figure 46 M thode des TOPs k Mesure globale Avec Contexte 92 CHAPITRE IV Exp rimentation et Evaluation Afin de comparer la m thode contextuelle et la m thode non contextuelle nous avons pris la r partition 70 30 70 films pour la construction des profils Training_set et 30 films pour le test Result_set Les figures 47 48 et 49 montrent les courbes de Training_set70 en utilisant les trois types de similarit cit es dans la section 3 2 M thode des TOPs K Mesure de Jiang amp Conrath Avec et Sans Contexte 1 00 0 95 0 90 0 85 0 80 0 75 0 70 0 65 0 60 6 055 3 0 50 0 45 0 40 0 35 0 30 0 25 0 20 0 15 0 10 0 05 0 00 TrainingSet70 Avec Contexte TrainingSet70 Sans Contexte Figure 47 M thode des TOPs k Mesure de Jiang amp Conrath Avec et Sans Contexte pour TrainingeSet 70 93 CHAPITRE IV Exp rimentation et Evaluation M thode des TOPs K Mesure Pearson Avec et Sans Contexte 1 00 0 95 0 90 0 85 0 80 0 75 0 70 0 55 0 45 c Q 2 Q O b a 15 20 K TrainingSet70 Avec Contexte TrainingSet70 Sans Contexte Figure 48 M thode des TOPs k Mesure de Pearson Avec et Sans Contexte pour TrainingSet 70 M thode des TOPs K Mesure Globale Avec et Sans Contexte 1 00 0 95 0 90 0 85 0 80 0 75 0 70 0 65 0 60 6 055 3 0 50 0 45 0 40 0 35 0 30 0 25 0 20 0 15 0 10 0 05 0 00 5 K TrainingSet70 Avec
111. nnalis PAM cscceeceeeseeeteeeeteeeeeeeees 47 Figure 25 Architecture globale du syst me de recommandation sensible au contexte 49 Figure 26 Mod le Entit Association es uen nn nent usages 56 Fisure 27 Diapramme d S Qu nte us tee A ee ee RE eh Meee Gide 57 Figure 28 Diagramme decolliboration 2 554r nus te stored ceasing die Ain 58 Figure 29 M thode d introduction du contexte 59 Figure 30 Architecture g n rale de l application ss 60 Figure 31 Repr sentation hi rarchique de l Ontologie eee eeeeeeeceseceseceeeeeeceaeceeeeeeneerees 69 Figure 32 Capture cran de l diteur NetBeans seine 12 Figure 33 Le site officiel du logiciel Prot g sens haoatseninslsfasaseatanenetss 12 Figure 34 La paged accuerl du Site iieiea iae e eee Ronee ee 73 Bigure 35 Ajout de haine Jenaan nent ntm ts in tunes 74 Figure 36 Les r partitions des valuations ses te ne nt tn ne Rene 76 Fieure 37 Table T us mnote sss seine der lsh ner ec eee 78 Fisure 38 Cable raining Ste Se RS nn An Aaa oria 78 Freure 39 Table Profil US ES nn ea ea ese a al ad eet 78 Figure 40 Table Result Sets hunter dani d heat ire 78 Figure 41 M thode des TOPs k Mesure de Jiang amp Conrath Sans Contexte 90 Figure 42 M thode des TOPs k Mesure de Pearson Sans Contexte 90 Figure 43 M thode des TOPs k Mesure Globale Sans Contexte oe ceeeeeseeesneeeeeeeees 91 Figure 44 M thode des TOPs k Mesure de Jiang amp
112. nnelles pouvant influencer fortement l interaction ge sexe etc e Les int r ts et les pr f rences g n rales de l utilisateur relatives la t che accomplir qui permettent une adaptation ses attentes e Qualit Cette dimension contient tous les facteurs refl tant les pr f rences relatives la qualit de l information comme la disponibilit de donn es la concision le style et la structure du document etc Dans cette dimension nous nous int ressons en particulier la diversit de l information e S curit La dimension de s curit dans le contexte du filtrage collaboratif est le niveau de confidentialit concernant tous les autres crit res e Livraison On peut citer titre d exemple la modalit de livraison des informations comme le format le standard le volume et le mode de visualisation le d lai et le prix etc e Un historique des interactions avec le service qui peuvent permettre de mod liser les habitudes comportementales 4 1 3 2 Communaut s La notion de communaut dans un syst me de filtrage collaboratif est d finie comme le regroupement des utilisateurs en fonction de l historique de leurs valuations afin que le syst me calcule des recommandations Selon cette optique les profils sont un facteur interactif alors que les communaut s sont consid r es comme un facteur interne du syst me 4 1 4 Exemple Dans la figure 3 nous sch matisons le principe du f
113. notre ontologie nous avons eu besoin de l exploiter par notre logiciel cod en JAVA La connexion entre un code OWL et un programme JAVA n cessite l utilisation d une biblioth que ou API appel e Jena Cette biblioth que ne peut fonctionner correctement qu avec la version 1 7 de JDK Java D veloppement Kit Pour ajouter la librairie Jena dans NetBeans il faut aller au menu Outils configurer librairies et cliqu sur le bouton Ajouter voir figure 35 73 CHAPITRE III Conception et R alisation Configuration des biblioth ques ia Projet a Param tres de biblioth ques a utilisateur Nom Ho EE NM res F F7 Bulder amp Ant Classe Source Documentation Framework Biblioth ques requises amp Axis C Documents and Settings soltaniMes documents a Ajouter fh Borland Mak Lt amp AR C Documents and Settings soltaniMes documentsA us C Documents and Settings sottaniMes documents MO amp is tie C Documents and Settings soltaniMes documents amp oun C Documents and Settings sottaniMes documents a Cocoon C Documents and Settings sottaniMes documents amp CORBA Express C Documents and Settings sottaniMes documents amp Data Express C Documents and Settings soltaniMes documents amp Data Express for EJB C Documents and Settings sottaniMes documents amp dbSwing y C Documents and Settings sottaniMes documents lt gt Nouveau
114. notre syst me nous consacrons ce chapitre son valuation une partie de cette valuation a t pr sent e dans 6 Nous commen ons d abord par d crire la base de donn es utilis e pour l valuation ainsi que la m thodologie suivie pour la construction des tables et le calcul de pr diction Nous enchainons en pr sentant l valuation en adoptant les deux m triques les plus utilis es dans le domaine de la recherche d information savoir la pr cision et le rappel Enfin nous terminons avec une interpr tation des r sultats de l valuation du syst me avec contexte en les comparant ceux de l valuation du SR traditionnel sans contexte 2 MovieLens et IMDB Pour l valuation nous nous sommes bas sur la plateforme de test r alis e au cours du projet APMD Acc s Personnalis des Masses de Donn es URL http apmd prism uvsq fr et qui regroupe deux bases de donn es sur les films savoir IMDB Internet Movie Database URL http www imdb com qui fournit les caract ristiques des films titre genre acteurs r alisateur etc et MovieLens URL http www movielens umn edu qui fournit les notes donn es par des utilisateurs certains films Ces notes sont comprises entre 1 et 5 La r partition des notes donn es par les utilisateurs est la suivante e D favorables 5 pour la note 1 10 pour la note 2 e 35 des valuations effectu es sont repr sent es par des notes de
115. nrath Enfin nous combinons les deux mesure afin d avoir de meilleurs r sultats 3 2 1 Similarit num rique Pour calculer la pr diction dans cette mesure nous avons besoin de deux vecteurs le premier correspond aux genres de films pr dire pr diction contextuelle et non contextuelle le deuxi me vecteur contient les pr f rences extraites de la table Classic_ Profil_User pour la pr diction non contextuelle Tandis que les pr f rences extraites de la table Contextual_Profil_User sont utilis es pour la pr diction contextuelle Le tableau 20 est une illustration du premier vecteur pour l utilisateur d identificateur 424 Le deuxi me vecteur correspond la pond ration des genres associ s un film ayant l identificateur 1387 voir tableau 21 Tableau 20 Illustrations du vecteur User pour le calcul de la similarit num rique ee EEA Tableau 21 Illustration du vecteur Film pour le calcul de la similarit num rique PS oere Heron Anaon Sins Aene S r RS E 3 2 2 Similarit s mantique Le tableau 22 montre comment nous calculons la similarit s mantique entre un film dont les genres sont Drame Musical et Com die et un utilisateur qui pr f re les genres Drame et Romance La mesure s mantique utilis e dans cet exemple est la mesure de Jiang et Conrath Tableau 22 Illustrations d une matrice pour le calcul de la similarit s mantique ae I 84 CHAPITRE IV Exp rimentatio
116. ntologies au lieu d utiliser l extraction recherche par mots cl s sont e L ontologie est plus pr cise et moins ambigiie e L ontologie est hi rarchis e Facilite les recherches et donc gagner plus de temps e L inf rence aide trouver les relations entre les pr f rences de l utilisateur L introduction du contexte conduit tr s souvent au probl me de data sparsity Afin d viter ce probl me dans le profil utilisateur il faut trouver un rapprochement ou un lien entre les classes concepts des ontologies qui sont pertinentes pour l utilisateur Mais aussi trouver des liens entre les concepts qui ne sont pas pertinents pour l utilisateur L extraction personnalis e du contenu trouver les items pertinents se fait en appliquant la fonction de cosin suivante Pref in um inX um Il inll x Hunll 41 CHAPITRE II Les syst mes de recommandation sensibles aux contextes Le r sultat de la formule 0 1 Si le r sultat est proche de 0 donc les deux vecteurs sont diff rents S ils sont proches de 1 donc les deux vecteurs sont semblables et il est possible de les repr senter par un seul vecteur La personnalisation doit combiner les pr f rences long terme bas es sur l historique des pr f rences de l utilisateur avec des pr dictions contextualis es bas es sur les activit s courantes de l utilisateur feedback de l utilisateur Cette personnalisation aide les utili
117. nts Pour cela chaque utilisateur nous associons un vecteur de notes sur les pages qu il a parcourues C est cette repr sentation de profil qui est utilis e pour le filtrage collaboratif Par contre la m thode d analyse de contenu ne s arr te pas l Pour chaque page identifi e une analyse en profondeur du texte va permettre d en extraire les caract ristiques essentielles pour tenter de mieux comprendre ce qui plait ou d plait dans la page au client et former un autre profil en associant en plus chaque utilisateur un vecteur des th mes et ventuellement des mots les plus fr quemment rencontr s dans ses lectures et constituer ainsi une m moire des centres d int r ts du client Chacune des approches poss de ses limitations Celles de l analyse bas e sur le contenu sont les suivantes 16 CHAPITRE I Les Syst mes de Recommandation Classiques e Avant d analyser le contenu les articles doivent dans un premier temps tre mis sous une forme convenable pour l algorithme Cependant des nouvelles technologies telles le son les photos ou la vid o etc ne peuvent tre analys es automatiquement pour obtenir des informations suffisamment pertinentes e Etant donn que relativement peu de textes ont des vecteurs vraiment similaires le syst me recommande souvent ce que l utilisateur a d j vu auparavant e A part si le syst me utilise un niveau d analyse linguistique tr s pouss il ne peut filtrer des articles
118. nvironnement Java Development Kit JDK est requis pour les d veloppements en Java NetBeans constitue par ailleurs une plate forme qui permet le d veloppement d applications sp cifiques biblioth que Swing Java L IDE NetBeans s appuie sur cette plate forme voir figure 32 71 CHAPITRE III NetBeans IDE 6 0 File Edit View Navigate Source Refactor CSS x 09 C Conception et R alisation Build Run Profile Versioning Tools Window Help TB Dw O default config gt v Projects 40 x Files __ liServices S DocumentEditor1 5 0 Source Packages ff META INF services fi documenteditor B DocumentEditorAboutBox java amp bocumentEditorapp java E PDocumentEditorview java EE documenteditor resources w documenteditor resources busyicons W Libraries DocumentEditor iew java Navigator E DocumentEditorAboutBox java x 8 DocumentEditorapp java x Ej DocumentEdtorView java x EB B 858 PLL a2 00 Source Design CARE 7 package documenteditor import ary public class DocumentEditorView extends FrameVieu private File file new File untitled txt private boolean modified false pr p protected IngleFrameapplication app Process D ProcessBuilder Members view Imported Items Press Cw SPACE Again for All tems code iQ DocumentEditarview FrameViev 8 file File amp modified boolean DocumentEditorview Singl
119. odule a pour t che la cr ation des profils utilisateurs Cela correspond dans notre application au calcul de pr f rence pour chaque utilisateur en se basant sur le contexte intrins que 3 Matching ce module sert calculer les recommandations pertinentes Nous avons utilis trois types de similarit Similarit s mantique nous avons impl ment la mesure de Jiang amp Conrath dont l quation a t pr sent e dans la section 5 3 du chapitre 1 Similarit num rique la mesure de Pearson a t utilis e pour calculer le taux de corr lation entre le profil utilisateur et le produit Similarit globale not e Simsobar elle combine les deux similarit s num rique SiMpr f et s mantique siMs m Selon la formule suivante SiMgiobale Pu C a X SiMs m Pu C P X SiMpr f PU C Avec a p 1 Nos exp rimentations r p t es nous ont conduits choisir les valeurs 0 75 pour a et 0 25 pour Cette mesure a t pr sent e et d taill e dans 6 4 R solution du contexte ce module pour t che la contextualisation du profil utilisateur afin de lui recommander des produits plus pertinent en utilisant les deux algorithmes cit s pr sent en d tail dans la section 5 de ce chapitre 5 Pr sentation apr s l obtention des calculs effectu s par le module Matching ce module se charge de e Classer les produits par ordre d croissant du score de similarit qu ils ont obtenu
120. ofil partir de son historique et l envoi au module R solution Contexte ce dernier fourni des profils contextualis s au module Matching Le module Matching re oit ainsi les descripteurs de contenus cr s par le module Cr ation Descripteur Contenu est calcule la similarit entre le profil utilisateur contextualis et les diff rents descripteurs de contenus pour ainsi renvoyer les contenus pertinents au module Pr sentation Le module Pr sentation classe les contenus par ordre d croissant selon leurs degr s de similarit et les affiche pour l utilisateur La figure 28 illustre l change d information entre les diff rents modules Cr ation Profil 1 Historique Utilisateur 3 Profil Cr R solution Contexte Utili tilisateur 4 R solution 2 Cr ation Contextuelle Profil 5 Profil Contextualis 7 Descripteur Cr gt 6 Cr ation 8 Calcul de Descripteur 9 Produits Similarit Pertinents 10 Produits Class s E Figure 28 Diagramme de collaboration Nous pr sentons dans la section suivante l architecture g n rale de notre syst me de recommandation Nous d taillerons par la suite les diff rents modules le composant 58 CHAPITRE III Conception et R alisation 4 Architecture g n rale de l application Nous avons opt pour l utilisation de la m thode de pr filtrage d finie au chapitre 2 pour l introduction du cont
121. omique des syst mes de recommandation n est plus d montrer L entreprise Am ricaine de recommandation de film Netflix par exemple organise un challenge dans lequel elle offre 1 million de dollar pour celui qui con oit un SR plus performant que leur syst me Pour r aliser le filtrage le syst me de recommandation SR utilise les profils repr sentant des pr f rences relativement stables des utilisateurs pour calculer des recommandations Ce calcul se fait par la pr diction des scores qu un utilisateur est susceptible d attribuer aux contenus Le SR adapte ce profil au cours du temps en exploitant au mieux le retour de pertinence que les utilisateurs fournissent sur les informations documents re ues Par exemple dans la figure 1 la fonction de d cision du syst me traite le flux entrant de documents pour sugg rer l utilisateur en consultant son profil les documents qu il pr f re A son tour l utilisateur doit fournir ses valuations c est dire valuer fr quemment les recommandations pour que le syst me comprenne mieux ses besoins en information et lui fournisse par cons quent de meilleures nouvelles recommandations CHAPITRE I Les Syst mes de Recommandation Classiques 1 Fonction de d cision utilisateur Figure 1 Sch ma g n ral du filtrage d information Les trois parties suivantes constituent un syst me de recommandation e Les producteurs Ce sont ceux qui vont per
122. portant de notre Syst me de Recommandation SR est celui de r solution des contextes Dans le cas g n ral ce composant prend en entr e les descripteurs des contenus candidats la recommandation le profil utilisateur ainsi que des informations relatives la situation de l utilisateur ex adresse IP date et heure de connexion m dia utilis etc et retourne les contextes intrins que et extrins que consid rer dans le calcul des recommandations faites l utilisateur Nous d crivons dans ce qui suit le processus de r solution des contextes intrins ques Dans son sch ma classique le processus de r solution de contexte proc de l extraction du contexte intrins que directement partir des contenus identifi s comme candidats potentiels la recommandation Ceci revient retourner tous les pr dicats contextuels d crivant les contenus candidats Mais dans certains cas les contextes extraits par ce processus ne sont pas compatibles avec le profil de l utilisateur Exemple Dans le cas du profil de Samira par exemple nous pouvons distinguer deux contextes chanteur C line Dion et chanteur Lady Gaga Si l on suppose qu une chanson sentimentale de Shakira est identifi e comme candidate la recommandation alors le processus de r solution de contexte va retourner le contexte chanteur Shakira Cependant le syst me de recommandation ne saura pas quelle pr f rence de Samira prendre en compte pour
123. ppr ci par un ensemble d utilisateurs qui pr sentent des profils similaires ou par l utilisateur lui m me L id e principale de l approche par hybridation est de proposer au nouvel utilisateur d adopter un profil pr d fini selon le cas afin de recevoir des recommandations exploratoires 11 En g n ral l hybridation dans un syst me de filtrage se r alise en deux phases pr liminaire et couplage 4 4 1 Filtrage collaboratif via le contenu Le filtrage collaboratif tel que nous l avons pr sent pr c demment utilise l ensemble des votes des utilisateurs sur les articles pour leur attribuer un degr de similarit La matrice de donn es utilis e ressemble alors au tableau 1 suivant 17 CHAPITRE I Les Syst mes de Recommandation Classiques Tableau 1 Filtrage collaboratif bas sur les notes i Article 1 Article 2 Article 3 Article 4 Article 5 consid r Utilisateur 1 7 6 7 Utilisateur2 0 J 5 6 1 _ Utilisateur 3 6 l 6 3 Utilisateur4 7 5 J Utilisateur 5 7 6 1 1 TA Ici on cherche la note que l utilisateur 1 va attribuer l article 5 en fonction des notes que les autres utilisateurs ont attribu l article et de la similarit entre leurs vecteurs de notes sur les autres articles L id e du filtrage collaboratif via le contenu est d utiliser les profils th matiques des clients form s partir de l analyse du contenu des articles
124. pr diction 0 5 Les figures 50 et 51 pr sentent les courbes correspondant la similarit globale avec coef1 0 75 et coef2 0 25 Methode du seuil Mesure Globale Sans Contexte 1 000 5 0 975 1 x M 0 950 4 0 925 A a EE S 0 900 LE 0 875 4 0 850 0 825 4 0 800 Se T 0 775 0 750 ate S 0 725 mq W 29 0 700 N _ 0 675 FA 0 650 4 A 0 625 4 See ps 7 0 600 4 nn 0 575 A 0 550 0 5254 0 500 i 30 40 50 60 70 80 90 La taille de la table traning_set Pr cision rappel Figure 50 M thode du seuil Mesure Globale Sans Contexte 95 CHAPITRE IV Exp rimentation et Evaluation M thode du seuil Mesure Globale Avec Contexte 30 40 50 60 70 80 90 La taille de la table traning_set Pr cision rappel Figure 51 Mesure du seuil Mesure Globale Avec Contexte D apr s les figures 50 et 51 nous constatons que la pr cision et le rappel fourni par la mesure globale avec contexte sont meilleurs par rapport 4 ceux donn s par la mesure globale sans contexte 4 Conclusion Dans ce chapitre nous avons abord l valuation du syst me de recommandation suivant deux m thodes seuil top k L exp rimentation nous a montr que la contextualisation a un impact positif sur le processus de recommandation 96 CONCLUSION GENERALE CONCLUSION GENERALE La personnalisation de l information merge comme une approche capitale
125. r 4 1 3 Profils et communaut s Ici nous discutons les profils bas s sur l historique des valuations des utilisateurs ainsi que les communaut s qui sont les deux facteurs cl s d un syst me de filtrage collaboratif Le probl me de la surcharge d information peut tre palli par la personnalisation de l acc s aux informations en utilisant des profils repr sentant des int r ts relativement stables des utilisateurs En d autres termes les profils des utilisateurs sont utilis s comme des crit res 10 CHAPITRE I Les Syst mes de Recommandation Classiques persistants dans la recherche d information Le filtrage d information Information Filtering s appuie galement sur de tels profils pour filtrer un flux de documents en vue de ne conserver que les documents pertinents pour l utilisateur 4 1 3 1 Profil de l utilisateur Le profil de l utilisateur est compos d un ensemble de pr dicats pond r s Le poids d un pr dicat exprime son int r t relatif pour l utilisateur Il est sp cifi par un nombre r el compris entre 0 et 1 Le profil s enrichit progressivement au fur et mesure que l utilisateur value des documents re us Outre les informations d identification de base par exemple l identifiant ou des l ments d tat civil le profil de l utilisateur peut regrouper des informations tr s diverses selon les besoins Parmi celles ci nous pouvons citer e Des caract ristiques perso
126. r travers ses centres d int r ts court et long terme et ses pr f rences La seconde dimension est li e la requ te et permet de cibler la nature des r sultats attendus par l utilisateur 4 1 Contexte li l utilisateur On d finit le contexte li l utilisateur par des l ments qui peuvent tre donn s explicitement par l utilisateur ou d duits implicitement par le syst me On cite les centres d int r ts qui peuvent appartenir aux domaines de la science sport humanit etc et les pr f rences li es la qualit des informations attendues Ces pr f rences sont donn es explicitement et comportent les deux aspects suivants e La fra cheur l utilisateur peut s int resser l information la plus r cente ou bien des documents li s des dates bien pr cises e La granularit l utilisateur peut s int resser un certain niveau de d tail de la r ponse attendue cela peut d terminer la structure de la r ponse retourn e un document int gral ou une partie de document passage une page d accueil ou une page cible 4 2 Contexte li la requ te On d finit ce contexte par diff rents param tres descriptifs et ventuellement mesurables partir de la requ te ou partir du profil des n top documents retourn s par la requ te Soient les param tres suivants e Clart de la requ te ce param tre quantifie le degr d ambiguit de la requ te et permet de
127. r 2 _Utilisateur 4 87 F 3 95 2 6 18 CHAPITRE I Les Syst mes de Recommandation Classiques 4 4 2 Filtrage collaboratif automatis ACF Automated Collaborative Filtering L id e qui a t d velopp e ici est de combiner l utilisation des caract ristiques essentielles des documents avec les valuations des documents par les clients c est dire de combiner les deux m thodes qui paraissent compl mentaires de filtrage collaboratif et d analyse de contenu Ceci permettrait de r duire le nombre d articles consid rer pour l algorithme de pr diction et permettrait galement d obtenir de meilleures pr dictions puisque seuls les articles ayant des caract ristiques proches de celles du client consid r seront pris en compte pour calculer les pr dictions Le syst me consiste donc en deux composantes principales un agent personnel d information pour chaque utilisateur contr le continuellement les int r ts de l utilisateur recommande des documents potentiellement int ressants et collecte et propage l valuation des documents par l utilisateur et un serveur de filtrage collaboratif automatique bas sur les caract ristiques FGACF Feature Guided Automated Collaborative Filtering collecte les valuations de plusieurs agents utilisateurs pour recommander ensuite de nouveaux documents ces utilisateurs En fait les agents utilisateurs aident structurer l ensemble des documents favoris d un utilisateur
128. r d finir ce qu est un syst me de recommandation ainsi que les notions qui s y rapportent Ensuite nous pr sentons les trois approches principales de filtrage qui permettent la recommandation Nous enchainons en exposant les diff rentes mesures de similarit qui permettent aux syst mes de recommandation de faire l appariement entre les concepts Enfin nous terminons en citant les limites et inconv nients des syst mes de recommandation ainsi que quelques principaux travaux dans le domaine 2 D finition Un syst me de filtrage d information ou syst me de recommandation Recommender System 30 est un filtre de flux entrant d informations de fa on personnalis e pour chaque utilisateur Autrement dit dans le but de personnaliser la recherche d information dans un domaine d application particulier un syst me de filtrage collecte s lectionne classifie et sugg re l utilisateur les informations qui r pondent vraisemblablement ses int r ts long terme Il existe pr sent de nombreux syst mes de recommandation utilis s dans divers domaines comme la recherche documentaire le commerce lectronique les loisirs etc On peut citer titre d exemple quelques sites Web populaires comme CiteSeer pour la recommandation d articles de recherche Amazon pour la recommandation des livres MovieLens pour la recommandation de films LAST FM pour la recommandation de la musique etc L importance con
129. rce la volont et le courage pour accomplir ce travail Mes sinc res remerciements vont mon encadreur madame Latifa BABA HAMED pour m avoir dirig et soutenu tout au long de ce projet Votre esprit scientifique et votre souci pour de hautes performances sont une grande inspiration et m ont pouss me surpasser Merci pour vos efforts vos conseils et Vos critiques constructives Je serai toujours reconnaissant envers mon co encadreur Mr Sofiane ABBAR qui durant cette ann e n a pas h sit donner de son temps et proposer son aide qui m a t tr s pr cieuse Mes remerciements aux membres du jury qui ont accept de juger mon travail Enfin j exprime ma profonde reconnaissance toutes les personnes qui ont contribu de pr s ou de loin au bon d roulement de ce travail iii We are leaving the age of information and entering the age of recommendation Chris Anderson in The Long Tail iv R sum Les syst mes de recommandation traditionnels apportent une solution au probl me de surcharge d informations Ils fournissent aux utilisateurs les informations et contenus qui sont les plus pertinents pour eux Ces syst mes ignorent le fait que des utilisateurs interagissent avec des syst mes selon un contexte particulier A travers cette th se nous allons pr senter un syst me de recommandation contextuel intrins que que nous pouvons appliquer pour la recommandation de contenus en g n ral livr
130. rr lation entre le profil utilisateur et le descripteur de contenu On parle alors de SR bas sur le filtrage 64 CHAPITRE III Conception et R alisation base de contenu CBF Dans ce qui suit nous donnons une description de notre processus d appariement entre profils et contenu dans le cas des syst mes de recommandation CBF Comme montr dans la figure 30 le processus d appariement prend en entr e le profil utilisateur un ensemble de contenus candidats ainsi que l ensemble des contextes courants Il renvoie une liste ordonn e de recommandations Pour produire cette liste le processus d appariement calcule la similarit entre le profil utilisateur et chaque descripteur de contenu candidat Ces derniers sont alors ordonn s dans l ordre d croissant de leur pertinence l utilisateur similarit avec le profil Les K premiers contenus sont recommand s l utilisateur L appariement entre un descripteur de contenu DescCt et un profil utilisateur Pu dans un contexte donn Cxt Sim Pu DescCt Cxt se fait en deux tapes 1 Filtrage et correction des pr f rences pertinentes Cette tape consiste choisir parmi toutes les pr f rences de l utilisateur celles qui sont pertinentes au contenu DescCt dans le contexte Ctx Ces pr f rences sont ensuite corrig es en les multipliant par le facteur de correction correspondant au contexte Ctx Le r sultat de cette tape est un vecteur de pr dicat
131. s ont montr l importance du contexte dans un syst me de recommandation L valuation du syst me avec contexte a r v l de meilleurs r sultats en les comparant ceux de l valuation d un SR classique sans contexte Ce travail est loin d tre termin Des perspectives sont envisager comme e Introduire le contexte dans les SR utilisant le filtrage collaboratif et le filtrage hybride e Int grer le contexte extrins que qui est un ensemble d attributs relatifs a l environnement d interaction de l utilisateur dans le processus de recommandation e Combiner les deux types de contextes savoir le contexte extrins que et le contexte intrins que afin d affiner la liste des produits recommander 98 BIBLIOGRAPHIE BIBLIOGRAPHIE 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 G D Abowd A K Dey P J Brown N Davies M Smith and P Steggles Towards a better understanding of context and context awareness In HUC 99 Proceedings of the 1st international symposium on Handheld and Ubiquitous Computing pages 304 307 London UK 1999 Springer G Adomavicius R Sankaranarayanan S Sen and A Tuzhilin Incorporating contextual information in recommender systems using a multidimensional approach ACM Trans Information System 23 1 103 145 2005 G Adomavicius A Tuzhilin Context Aware Recommender Systems 2nd ACM International
132. s pond r s tir de DescCt N Pu 2 Evaluation de la pertinence du contenu Cette tape consiste mesurer la similarit entre le profil issu de la premi re tape avec le descripteur de contenu Nous avons utilis la similarit qui combine la similarit s mantique et la similarit num rique comme illustr dans la section suivante 5 4 Mesures de similarit s utilis es dans l application Dans notre application nous avons opt pour la mesure de Pearson pour la similarit num rique et la mesure de Jiang amp Conrath pour la similarit s mantique Similarit de Pearson Nous avons utilis la corr lation de Pearson entre les deux vecteurs utilisateur repr sent par X X1 X2 Xn gt et produit repr sent par Y yj Y2 Yn gt La formule de Pearson est donn e par Sim x y Tp Mesure de Jiang et Conrath La similarit de Jiang et Conrath est une mesure hybride qui combine une mesure structurelle longueur du plus court chemin entre deux n uds et une mesure s mantique bas e sur le contenu informationnel des n uds compar s La similarit de Jiang et Conrath s utilise dans le cas des ontologies et est d finie par 1 Sim c1 c2 distance c1 c2 65 CHAPITRE III Conception et R alisation O la distance entre C7 et C2 est calcul e par la formule suivante Distance c1 c2 CI c1 CI c2 2 CI PPG c1 c2 Avec CI Log Nombre d
133. s trouvons un op rateur de matching qui mesure la similarit de deux profils utilisateurs de deux descripteurs de contenu ou bien la similarit entre un profil utilisateur et un descripteur de contenu Nous avons donc t amen s tudier les diff rentes mesures de similarit s existantes et les classer e L laboration et l valuation d un syst me de recommandation s mantique sans contexte Il s agit ici d un SR bas sur le FBC dont l op rateur de matching utilise une combinaison lin aire d une mesure de similarit num rique et d une mesure de similarit s mantique L valuation de ce syst me a donn des r sultats satisfaisants en termes de pr cision mesure bien connue dans le domaine de la recherche d information e Une classification des travaux sur la contextualisation Un tat de l art sur les diff rents SR sensibles au contexte a permis de d gager un certain nombre de crit res sur lesquels nous nous sommes bas s pour classifier ces syst mes e L laboration de deux algorithmes aidant l introduction du contexte Le premier algorithme d crit le processus de cr ation des profils partir des logs transform s L id e principale de cet algorithme est de calculer le score contextuel de chaque pr dicat dans chaque instance de contexte Ceci permettra notre syst me de capturer la variabilit des pr f rences en fonction des contextes Le second d crit le processus de r solution d
134. sateur et d termine le degr de pertinence de chaque article ou contenu pour les utilisateurs potentiels Si de nombreux articles s accumulent dans un certain laps de temps l algorithme de filtrage de contenu peut ordonner les articles en fonction de leur pertinence pour chacun des utilisateurs potentiels 28 4 2 2 1 Repr sentation des contenus le descripteur d article Un descripteur d article se compose d un ensemble de concepts qui peuvent tre repr sent s par une ontologie de domaine Les concepts qui repr sentent un l ment sont les plus sp cialis s dans une branche de la hi rarchie Par exemple si un article traite le sport et en particulier le football il est repr sent par football seulement De toute vidence un article peut tre repr sent avec de nombreux concepts de l ontologie chaque concept peut appara tre dans n importe quelle branche de la hi rarchie de l ontologie et tout niveau cela d pend du contenu r el de cet article Il est noter que le profil peut inclure des concepts fr res c est dire les fils d un m me concept Par exemple un profil d article peut inclure la fois football et basketball les fils de sport 4 2 2 2 Repr sentation des utilisateurs le profil d utilisateur Un profil d utilisateur bas sur le contenu se compose d une liste pond r e de concepts de l ontologie repr sentant ses pr f rences ses int r ts De tout
135. sateurs trouver les articles qui leurs sont pertinents L expansion s mantique des pr f rences de l utilisateur assouplit l appariement entre le profil utilisateur et l item en vitant les probl mes de data sparsity et le d marrage froid La figure 16 montre l expansion des pr f rences utilisateur l expansion du contexte et l intersection des ces deux expansion qui donne les pr f rences contextualis es de l utilisateur Initial User Preferences Extended User Preferences Initial Runtime Context Extended Runtime Context Contextualised User Preferences Figure 16 Expansion et contextualisation des pr f rences de l utilisateur 8 1 5 Extention de My Map MyMap 16 est un syst me de recommandation mobile c est dire un syst me de recommandation qui peut tre install sur un appareil mobile comme un PDA IPhone ect qui est bas sur l id e d utiliser une carte afin de fournir des recommandations personnalis es de lieux d int r ts pour les touristes Inote 6 0 thel F P8 100 jpg ox Figure 17 Imprime cran du logiciel Inote 42 CHAPITRE II Les syst mes de recommandation sensibles aux contextes La carte dans MyMap a t annot e avec l outil graphique Inote 21 voir figure 17 qui fournit un moyen d annoter des images d une mani re conviviale pour d finir une correspondance entre ses objets graphiques et les m tadonn es qui vont tre utilis s par le syst m
136. sation C ensemble de contextes T ensemble de tuples Sortie P Profil utilisateur D but C Instances_Contextes L T Pr dicats L Pu Pour chaque c dans C faire 10 Pour chaque tj dans T faire 11 si Score t ci L 12 P P U t Sijl ci 13 Fin Pour 14 Fin Pour 15 retourner P 16 Instance_Contextes L retourne l ensemble de toutes les instances du contexte 17 intrins que pr sent s dans les fichiers de journalisations L 18 Predicats L retourne l ensemble de tous les pr dicats non contextuels dans L 19 pertinent pour le profil utilisateur 20 Score t c L retourne la moyenne des scores assign s au pr dicat t dans le contexte c 21 Fin CHNAAKRWNS Les logs d interaction que nous utilisons ont une structure commune plusieurs syst mes de recommandation commerciaux ex MovieLens LastFm Pandora etc Nous nous int ressons dans ces logs aux votes laiss s donn s par les utilisateurs sous la forme Vote lt content utilisateur scorex gt o l utilisateur k accorde un score de pr f rence score au contenu 1 La cr ation des profils se fait en deux tapes 1 Pr paration des donn es afin de pouvoir extraire des pr f rences contextuelles partir des logs nous transformons ces derniers par expansion des votes et propagation des scores en se basant sur les descriptifs des contenus Nous obtenons apr s transformation des tuples avec la forme suivante
137. sent e sous forme de plusieurs domaines Sport sant science business etc Si l utilisateur s est identifi les recommandations personnalis es sont activ es sinon des items lui sont recommand s au hasard 40 CHAPITRE II Les syst mes de recommandation sensibles aux contextes News hand wee sai ar rasta nsere u m 5 ERED ION SFT PELE HO SO De NOS DEE Dost pepo ten overs amp Cotgrwen Mirrors esters were by ty mode we any wean sers nan gt LT tee RE nd eh Sat ren Es tochey kas terras Ratan Matai Figure 15 L interface graphique du syst me News Hand Les pr f rences de l utilisateur sont repr sent es sous forme de vecteur um Um 1 Umk OU umk 1 1 est le poids qui mesure l intensit de l int r t que porte l utilisateur um pour le concept Ck Ce dernier appartient une classe dans un domaine de l ontologie et le k le nombre total de concepts dans cette ontologie Si le poids est proche de 1 alors l utilisateur aime le concept et s il est proche de 1 l utilisateur ne l aime pas Les items sont repr sent s sous forme de vecteurs in in 1 ink avec ink le poids du concept 0 1 qui mesure l importance d un concept dans le contenu d un item L int r t pour les items peut tre calcul en comparant les pr f rences de l utilisateur avec les vecteurs des items Les avantages d utiliser des o
138. seuil des notes pr dites comme montr dans la figure 57 Figure 57 M thode de Seuil Pour le choix de la session Utilisateur la fen tre de la figure 58 s affiche pour l authentification Il faut donc entrer l identifiant de l utilisateur ainsi que le mot de passe correspondant 107 ANNEXE 1 Le Basic Application Exam Identifiant 424 Mot de passe esoe Figure 58 Authentification de Putilisateur Apr s l authentification de l utilisateur une liste de films pertinents est affich e avec leurs d tails figure 59 Figure 59 Liste des films pertinents 108 ANNEXE 2 ANNEXE 2 Nous pr sentons dans ce qui suit un tableau qui contient les 100 films constituant notre ontologie avec leurs identifiants ainsi que leurs genres Tableau 26 Repr sentation des films avec leurs genres respectifs ID Film Titre Genre CC Action Biography Drama History War Interview with the Vampire Drama Fantasy Horror FM Star Wars Episode IV A New Action Adventure Fantasy Sci Fi Hope Action Drama Thriller Comedy Drama Romance Action Comedy Crime Fantasy Action Thriller 380 Truelies Action Adventure Comedy Romance Thriller Action Crime Drama Thriller Action Adventure
139. sistent compter les arcs afin d am liorer les r sultats par des calculs bas s sur les n uds Notons que cette formule est d finie par l inverse de la distance s mantique 1 Si 1 c2 gt Heh e2 distance c1 c2 Sachant que la distance entre c1 et c2 est calcul e par la formule suivante Distance c1 c2 CI c1 CI c2 2 CI PPG c1 c2 5 3 2 Mesure de Leacock et Chodorow 1998 Une autre m thode pr sent e combine la m thode de comptage des arcs et la m thode du contenu informationnel 35 La mesure propos e par Leacock et Chodorow est bas e sur la longueur du plus court chemin entre deux synsets de Wordnet Les auteurs ont limit leur 23 CHAPITRE I Les Syst mes de Recommandation Classiques attention des liens hi rarchiques is a ainsi que la longueur de chemin par la profondeur globale de la taxonomie La formule est d finie par CD X 2 2 xM Sim X Y tog O M est la longueur du chemin le plus long qui s pare le concept racine de l ontologie du concept le plus en bas la profondeur globale On d note par CD X Y la longueur du chemin le plus court qui s pare X de Y 5 4 Approches bas es sur l espace vectoriel Dans le domaine de la recherche de l information les mod les de l espace vectoriel sont largement adopt s on parlera alors de similarit num rique Ces approches 35 utilisent un vecteur caract ristique dans un espace dimensionnel po
140. stimera qu une recommandation supprim e correspond une valuation tr s mauvaise alors qu une recommandation imprim e ou sauvegard e peut tre interpr t e comme une bonne valuation Il faut par ailleurs noter que les recommandations qu value un utilisateur peuvent tre g n r es par le syst me et ou choisies par l utilisateur lui m me 4 1 2 2 Formation des communaut s Le processus de formation des communaut s est le noyau d un syst me de filtrage collaboratif Pour chaque utilisateur le syst me doit calculer sa communaut g n ralement cela se fait par la proximit des valuations des utilisateurs Pour ce faire on peut calculer dans un premier temps la proximit entre un utilisateur donn et tous les autres Ensuite et afin de cr er concr tement la communaut de l utilisateur on applique souvent la m thode des voisins les plus proches en utilisant un seuil pour le niveau de proximit ou un seuil pour la taille maximale de la communaut en raison de sa performance et sa pr cision 4 1 2 3 Production des recommandations Dans ce dernier processus une fois la communaut de l utilisateur cr e le syst me pr dit l int r t qu un document particulier peut pr senter pour l utilisateur en s appuyant sur les valuations que les membres de la communaut ont faites sur ce m me document Lorsque l int r t pr dit d passe un certain seuil le syst me recommande le document l utilisateu
141. suite trouver la similarit entre tous les r alisateurs de notre base de donn es Une fois la similarit entre tous les r alisateurs est calcul e nous pouvons chercher parmi les r alisateurs figurant sur le profil utilisateur contextuel celui qui ressemble le plus au r alisateur inconnu Par cons quent le profil de cet utilisateur sera enrichi par des pr f rences contextuelles pr dites et corrig es partir de celles relatives au r alisateur le plus similaire 3 Lorsque nous avons un film avec deux r alisateurs un connu et l autre inconnu dans ce cas nous calculons la similarit globale entre le profil utilisateur et le profil film qui ont le m me r alisateur ensuite nous appliquons la m thode pr c dente pour le r alisateur inconnu Enfin nous calculons la moyenne entre les deux similarit s pr c dentes Nous r p tons ce proc d pour tous les utilisateurs et tous les films qui existent dans la table Result_set Ensuite nous sauvegardons tous ces r sultats dans une table Le tableau 23 montre un extrait de cette sauvegarde 85 CHAPITRE IV Exp rimentation et Evaluation Tableau 23 R sultat exp rimental selon la similarit globale 3 4 La pr cision et le rappel Nous d taillons travers cette section le calcul de pr cision pour chacune des m thodes m thode du seuil m thode des Top k ainsi que le calcul du rappel en utilisant la m thode du seuil 3 4 1 La pr cision Pour calculer
142. t Dans la figure 20 des exemples de r gles utilis es dans MyMap sont pr sent s La premi re colonne d crit quel attribut est valu pour l application de la r gle il peut s agir d un attribut ou sa valeur la deuxi me colonne indique la cat gorie laquelle les l ments de la r gle peuvent tre appliqu es par exemple monument v nement ou tous ce qui est disponible la troisi me d signe le contexte de services de prestation qui doit tre utilis pour v rifier les fonctionnalit s du contexte par exemple service m t o d crites dans la quatri me colonne par exemple s il pleut La cinqui me colonne indique la strat gie de r vision qui doit tre utilis e par exemple utiliser d autre pr f rences ou ne pas recommander cet article la derni re colonne indique quelle strat gie communicative appliquer pour interagir avec l utilisateur par exemple indiquer les recommandations diff remment sur la carte et expliquer pourquoi elles n ont pas t faites 44 CHAPITRE II Les syst mes de recommandation sensibles aux contextes e De Stratec Open Air Monument oe op z ndicate on the Event n local Exclude that item ap differently plain why Figure 20 Exemple de r gles tendant MyMap B De Carolis I Mazzotta N Novielli and V Silvestri 16 envisagent en plus des r gles d expliquer a l utilisateur pourquoi certaines recommandations n ont pas t sugg r es e
143. t SiMplobale ID_utilisateur 424 ID_Film 1610 0 82 En comparant ce score d int r t un score pr d fini le syst me peut d cider si le film Hunt for Red est recommander ou non l utilisateur N 424 Nous pr sentons dans la section suivante notre ontologie ainsi que la m thode suivie pour son laboration 7 Conception de l ontologie de l application Dans cette th se nous proposons un systeme de recommandation ontologique bas sur le filtrage base de contenu Les concepts servant mod liser les profils utilisateurs et les descripteurs de contenus de notre syst me sont organis s dans une ontologie que nous avons cr e dans 37 Il est noter qu un certain nombre de principes avaient t d gag s pour l obtention d une ontologie coh rente 22 et que cette derni re a t cr e pour le seul cas de recommandation des films 7 1 M thodologie de construction Pour construire l ontologie nous avons adopt les trois tapes ci dessous e Sp cifier les termes collecter et les t ches effectuer en utilisant cette ontologie L ontologie est construite dans l esprit de fournir les recommandations les plus pertinentes l utilisateur e Organiser les termes en utilisant les m tas cat gories concepts relations attributs etc e Affiner l ontologie et la structurer selon des principes de modularit et d organisation hi rarchiques 7 2 Respect des principes de construction En ce
144. t de ce document pour cet utilisateur Le premier avantage du filtrage bas sur le contenu est qu il peut r pondre aux pr f rences de l utilisateur long terme en employant des techniques efficaces dans le domaine de l intelligence artificielle pour la mise jour des profils et le recoupement entre profils et documents En outre l utilisateur dans un tel syst me ne d pend absolument pas des autres Ainsi il recevra des recommandations du syst me m me s il est le seul inscrit pour peu qu il ait d crit son profil en donnant un ensemble de th mes qui l int ressent En revanche cette technique de filtrage est soumise l effet entonnoir car le profil de l utilisateur volue naturellement par restriction progressive sur les th mes recherch s Ainsi l utilisateur ne re oit que les recommandations relatives aux th mes pr sent s dans son profil une fois devenu stable Par cons quent il ne peut pas d couvrir de nouveaux domaines potentiellement int ressants pour lui Le filtrage bas sur le contenu est galement victime d un effet de masse puisqu il ne b n ficie pas des jugements de qualit des autres utilisateurs 12 CHAPITRE I Les Syst mes de Recommandation Classiques 4 2 2 Descripteur d article et profil utilisateur L algorithme de filtrage bas sur le contenu peut r aliser le matching entre un descripteur de contenu comme par exemple documents News Url livre etc et un profile utili
145. t mes de recommandation http ziedzaier com category systeme de recommandation D Lin An Information Theoretic Definition of similarity In Proceedings of the Fifteenth International Conference on Machine Learning Pages 296 304 1998 H Liu and H Motoda Feature selection for knowledge discovery and data mining Springer 1998 S Lombardi S S Anand M Gorgoglione Context and Customer Behavior in Recommendation Septembre 2009 Kr Markov et Kr Ivanova An ontology content based filtering method Proceedings of the Fifth International Conference Information Research and Applications Varna Bulgaria Juin 2007 NetBeans www netbeans org A T NGUYEN COCoFil2 Un nouveau syst me de filtrage collaboratif bas sur le mod le des espaces de communaut s Th se Universit joseph Fourier Grenoble I Novembre 2006 Oracle www oracle com 101 BIBLIOGRAPHIE 32 33 54 35 36 37 38 39 U Panniello A Tuzhilin M Gorgoglione Experimental Comparison of Pre vs Post filtering Approaches in Context Aware Recommender Systems 2009 V Peralta Extraction and Integration of MovieLens and IMDb Data technical report APMD project Laboratoire PRISM Universit de Versailles July 2007 P Resnik Semantic Similarity in a Taxonomy An Information Based Measure and its Application to Problems of Ambiguity in Natural Language Journal of Articial Intelligence Resear
146. t Action 0 25 Eastwood Clint Adventure 0 16 Eastwood Clint Comedy 0 25 Eastwood Clint Crime 0 33 Zemeckis Robert Action 0 44 Zemeckis Robert Animation 0 11 Zemeckis Robert Comedy 0 77 Apres avoir calcul les vecteurs de tous les r alisateurs nous pouvons proc der au remplissage de la matrice de similarit r alisateurs r alisateurs Cette derni re est une matrice carr e sym trique contenant en ligne et en colonne tous les r alisateurs de la base de donn es voir tableau 19 Nous utilisons la corr lation de Pearson pour calculer la similarit entre ses r alisateurs Tableau 19 Un extrait de la matrice r alisateur r alisateur Abraham Adam 1 0 24 0 9 _ Bay Michael 0 24 1 0 52 Landis John 0 9 0 52 1 Dans le tableau 19 nous remarquons que la similarit Sim Abraham Adam Abraham Adam 1 car le r alisateur est similaire lui m me Sim Bay Michael Landis John 0 52 indique que le r alisateur Bay Michael est similaire au r alisateur Landis John avec une valeur de 0 52 83 CHAPITRE IV Exp rimentation et Evaluation 3 2 Calcul de la pr diction Pour pouvoir faire l valuation du prototype il faut comparer entre les notes r elles donn es par l utilisateur sur le film et la pr diction calcul e par le prototype Pour le calcul de la similarit num rique nous utilisons la mesure de Pearson et pour le calcule de la similarit s mantique nous utilisons la mesure Jiang amp Co
147. table Result_set Ces trois tapes nous d livrent le calcul de la pr cision en fonction de la taille de la table Training_set correspondant la taille de la table Result_set en question On refait les tapes 2 et 3 pour les autres tables Result_set 87 CHAPITRE IV Exp rimentation et Evaluation 3 4 2 Le rappel Pour le calcul de cette m trique nous proc dons de la m me fa on avec laquelle nous avons calcul la pr cision par la m thode du seuil Le seul changement r side dans le d nominateur la formule du rappel est donn e par Nombre de films tel que note gt seuil not N pr diction gt seuil pr diction EE ee Nombre de films tel que note gt seuil note Exemple A partir du tableau 25 nous montrons comment calculer la pr cision et le rappel des deux utilisateurs 424 et 549 en consid rant seuil note 4 et seuil pr diction 0 75 Tableau 25 Exemple de la m thode du seuil 549 2088 0 7576315 WMA HOH A Mw mw Bio Bo amp w uw Les films qui ont un seuil note gt 4 pour l utilisateur 424 sont 1193 1208 1036 3421 Les films qui ont un seuil pr diction gt 0 75 pour l utilisateur 424 sont 1080 2193 1193 2918 1208 367 2405 1527 1036 3421 alors la pr cision donn e par la m thode du seuil de l utilisateur 424 est donn e par 1193 1208 1036 3421 N 1080 2193 1193 2918 1208 367 2405 1527 1036 3421 1080 2193 1193 2918 1208 367 2405 1527 1036 342
148. tances dans l ontologie est bas sur un graphe de sp cialisation des objets Dans chaque graphe la distance de l ontologie doit tre caract ris e par le plus court chemin qui fait intervenir un anc tre commun ou le plus petit g n ralisant connectant potentiellement deux objets travers des descendants communs Parmi les travaux classifi s sous cette cat gorie on peut citer 5 1 1 Mesure de Wu amp Palmer 1994 La mesure de similarit de Wu et Palmer 39 est bas e sur le principe suivant Etant donn e une ontologie form e par un ensemble de n uds et un n ud racine R Figure 7 Soit X et Y deux l ments de l ontologie dont nous allons calculer la similarit Le principe de calcul de similarit est bas sur les distances N1 et N2 qui s parent les n uds X et Y du n ud racine et la distance qui s pare le concept subsumant CS de X et de Y du n ud R 21 CHAPITRE I Les Syst mes de Recommandation Classiques Figure 7 Exemple d un extrait d ontologie La mesure de Wu et Palmer est d finie par la formule suivante 5 1 2 Mesure de Rada et al 1989 Cette mesure est adopt e dans un r seau s mantique et elle est fond e sur le fait qu on peut calculer la similarit en se basant sur les liens hi rarchiques is a Pour calculer la similarit de concepts dans une ontologie on doit calculer le nombre des arcs minimums qui les s parent Cette mesure 35 est bas e sur le calcul de la distanc
149. tation XML des connaissances du domaine Pour cet objectif le systeme utilise deux composants e le gestionnaire Mobile User Profile MUP utilise des profils formalis s voir figure 19 selon le langage UbisWorld qui est une approche int ressante pour mod liser une partie du monde r el comme une ville et s adapter dynamiquement a l acc s aux sources d information voir http www w2m org e le module de s lection et de pr sentation de l information qui a comme t che la g n ration des descriptions d articles choisis suite une demande explicite de l utilisateur ou de fa on proactive en pr sence d objets int ressants 43 CHAPITRE II Les syst mes de recommandation sensibles aux contextes lt Statement id 16 gt lt content gt lt subject gt lt UbisWorld Dora gt lt subject gt lt predicate gt lt User0L eating lt predicate gt lt predicate range gt lt UserOL restaurant fast food pizzeria gt lt predicate range gt lt object gt restaurant lt object gt lt predicate gt lt User0L table gt lt predicate gt lt predicate range gt lt UserOL open air inside gt lt predicate range gt lt object gt open air lt object gt lt content gt lt restriction gt lt season gt summer lt season gt lt restriction gt lt meta gt lt owner gt lt UbisWorld Dora gt lt owner gt lt privacy gt lt UbisWorld friends gt lt privacy gt lt purpose gt lt UbisWorld commercial gt lt purpose gt
150. tering car les donn es sont filtr es selon le contexte le temps moment de la journ e jour mois ou ann e dans cette approche avant d effectuer les recommandations Dans cette approche on suppose que les go ts des utilisateurs changent selon une p riode et peuvent tre similaires dans une m me p riode Par exemple un utilisateur pr f re couter un certain genre de chanson quand il travaille et un autre genre de chanson avant de dormir On dispose d un profil utilisateur dans lequel on affectera les chansons artistes cout s par cet utilisateur Ce profil sera d compos de fa on ce qu il s adapte chaque contexte dans cette approche le temps repr sente le moment de la journ e il sera divis en plusieurs segments en fonction des chansons que l utilisateur coute le plus durant chaque moment segment de temps de la journ e Le probl me qui se pose par cette approche est comment r partir les heures de la journ e C est dire comment bien diviser le temps en segments car la d finition de la matin e peut changer d un utilisateur un autre Donc l erreur du partitionnement du temps doit tre minimale Les contextes sont extraits implicitement ce qui rend la t che assez difficile car on ne conna t pas ce que l utilisateur n aime pas On ne peut d duire que ce qu il aime partir de ce qu il a cout comme albums d artistes ou chansons et quel moment de la journ e il les a
151. tions S Bouakaz et S Abbar ont propos un prototype de syst me de recommandation sensible aux contextes et ils ont sp cifi les structures de profil et contexte utilis es ainsi que les algorithmes de matching en plus des algorithmes des autres services contextualisation binding Le prototype de syst me de recommandation sensible au contexte est bas sur des informations additionnelles afin de pr dire le comportement de l utilisateur Le mod le d acc s personnalis est instanci dans cette application r elle o ils font appel ses services en les adaptant leurs besoins Le service de contextualisation permet de d tecter le changement de comportement de l utilisateur en fonction de son contexte et cr e des mappings entre les pr f rences de l utilisateur et les contextes dans lesquels la personnalisation doit tre prise en consid ration A d faut de prendre tout le profil utilisateur en compte lors de la personnalisation le service de binding filtre les informations inutiles qui n appartiennent pas au contexte dans lequel l utilisateur interagit Le syst me de recommandation PAM combine la m thode bas e sur le contenu et le filtrage collaboratif La m thode bas e sur le contenu nous fournit les informations sur le profil utilisateur en analysant le contenu de ses pr f rences ces profils sont par la suite compar s afin de d terminer les utilisateurs qui sont similaires et effectuer des recommandations colla
152. tions calcul es par l application GENRE Les genres de film DIRECTOR Le r alisateur de film Remarque Les tables repr sent es ci dessus sont utilis es pour l valuation du syst me de recommandation sans contexte Pour l valuation du syst me de recommandation avec contexte nous devons effectuer des jointures entre quelques unes de ces tables Nous verrons cela dans la section suivante 3 Evaluation du syst me de recommandation L valuation des algorithmes de recommandation est une t che complexe En effet les syst mes ont souvent t valu s selon des crit res diff rents Parmi ces m triques nous pouvons citer la pr cision et le rappel Nous pr sentons dans ce qui suit les diff rentes tapes par lesquelles nous sommes pass s pour valuer notre syst me 3 1 Construction des tables Comme nous l avons d j mentionn ci dessus de notre benchmark sont extraits une partie Training_set pour l apprentissage des profils utilisateurs et une autre partie Result_set qui sert tester le processus de recommandation Ce benchmark est constitu de 21 utilisateurs qui ont regard s les m me 100 films Il a t utilis pour remplir la table T_usernote pr sent e la figure 37 Une partie de cette derni re est montr e dans le tableau 12 Tableau 12 Un extrait de la table T_usernote CHAPITRE IV Exp rimentation et Evaluation A partir de la table T_usernote nous avons rempli les tables
153. tualisation a contexte _ Profils contextuels Syst me de E recommandation Recommandations personnalis es Figure 25 Architecture globale du syst me de recommandation sensible au contexte Ce syst me de recommandation sensible au contexte r pond aux exigences suivantes e Faire une distinction entre le profil utilisateur et le contexte pour bien comprendre chaque entit e Permet la d couverte du contexte des fichiers journaux e Prend en consid ration le contexte en plus du profil utilisateur lors des recommandations et part du fait que les pr f rences de l utilisateur changent selon son contexte 8 2 Comparaison Le tableau 7 montre une comparaison entre les diff rentes approches tudi es dans cette th se selon le type d approche de recommandation utilis le type de la collecte des donn es le type du contexte et sa d finition ainsi que le domaine d valuation et la flexibilit de l approche 8 2 1 Approche de recommandation Il existe trois types de syst mes de recommandation Les syst mes bas s sur le filtrage base de contenu FBC les syst mes bas s sur le filtrage collaboratif FC et les syst mes hybrides Dans les syst mes FBC les descripteurs de contenus sont directement appari s avec les profils utilisateurs pour estimer leurs utilit s Seuls les contenus ayant un score d utilit important seront recommand s aux utilisateurs Les syst mes FC sont bas s sur l
154. u Enfin nous pr sentons les tapes suivies pour la construction de notre ontologie Le quatri me chapitre est consacr l valuation du syst me et se compose de deux parties La premi re consiste l valuation du syst me sans tenir compte du contexte La seconde partie concerne l valuation en tenant compte du contexte L illustration est faite dans le domaine cin matographique le contexte intrins que choisi est R alisateurs Nous avons utilis la mesure de similarit globale pour le calcul de la pr diction dans les deux parties ainsi que les m triques d valuation repr sent es par la Pr cision et le Rappel Nous cl turons ce m moire par une conclusion et des perspectives Enfin nous pr sentons en annexe 1 un manuel d utilisation de notre application et en annexe 2 un affichage des diff rents titres des films tir s des deux bases de donn es Movielens et IMDB CHAPITRE I Les Syst mes de Recommandation Classiques CHAPITRE I Les Syst mes de Recommandation Classiques 1 Introduction Avec l av nement d internet nous assistons aujourd hui une surcharge d informations Par exemple une personne qui d sire regarder un film se retrouve devant un volume tr s grand de propositions de films Ce qui lui rend la t che de choix d un film tr s difficile Les syst mes de recommandation sont apparus pour rem dier ce probl me Dans ce chapitre nous commen ons d abord pa
155. uire des applications de Web s mantique Il fourni un ensemble d outils une APT open source d velopp par HP Labs semantic Web programme Jena est disponible l adresse http jena sourceforge net La figure 34 montre la page d accueil du site Jena Pour notre projet nous avons utilis la version 2 7 qui est la version la plus r cente de Jena Jena Semantic Web Framework Microsoft Internet Explorer DE x Fichier Edition Affichage Favoris Outils ay Q Pr c dente Q a JO Rechercher Se Favoris Ps A Adresse http jena sourceforge net index html Ed OK Liens v 9 Rechercher 7 gt gt amp O Connexion Google Jena A Semantic Web Framework for Java home e ee kA framework Jena is a Java framework for building Semantic Web Jena applications It provides a programmatic environment for RDF RDFS and OWL SPAROL and includes a rule based inference engine on this site Jena is open source and grown out of work with the home 3 HP Labs Semantic Web Programme downloads license documentation support resources The Jena Framework includes RDF API Reading and writing RDF in RDF XML N3 and N Triples An OWL API In memory and persistent storage SPAROL query engine contributions Support is provided by the jena dev mailing list Internet Figure 34 La page d accueil du site Apr s la g n ration du code OWL correspondant
156. ulier est k alors cette m thode s lectionne partir de la s rie initiale toutes les valuations relatives au 32 CHAPITRE II Les syst mes de recommandation sensibles aux contextes contexte sp cifi k et elle g n re la matrice articles x utilisateur ne contenant que les donn es relatives au contexte k Apr s cela la m thode des syst mes de recommandation SR comme le filtrage collaboratif est lanc e sur la base de donn es r duite afin d obtenir les recommandations li es au contexte k La figure 9 montre l int gration du contexte dans un syst me de recommandation deux dimensions utilisateur x produit Recommandations Donn es SR 2 dimensions Contextualis es Figure 9 Pr filtrage Contextuel Il existe diff rents types de pr filtrage tels que le pr filtrage exact Exact Pre Filtering et le pr filtrage g n ralis Generalized Pre Filtering Exact Pre Filtering EPF s lectionne toutes les op rations relatives exactement au contexte sp cifique par exemple les achats effectu s en hiver 2008 tandis que Generalized Pre Filtering s lectionne toutes les op rations vis es un contexte sp cifique bas e sur la g n ralisation de l information contextuelle par exemple les achats effectu s en hiver 2008 pas en vacances peut tre g n ralis e aux achats effectu s en 2008 pas en vacances ou un Cadeau pour ses parents peut tre g n ralis e
157. ur d crire les diff rentes tapes de conception de notre application nous avons opt pour le langage UML 3 1 Diagramme de classe Le diagramme de classe peut tre facilement d duit de notre sch ma entit association pr sent dans la figure 26 Cette d duction se fait par l application des r gles de transformation suivantes e entit gt classe e association avec attributs gt classe associative e inversement des cardinalit s 3 2 Diagramme de S quences Le diagramme de s quences repr sente l une des vues dynamiques les plus importantes d UML La figure 27 montre les interactions entre les diff rents objets de notre application Historique i Cr ation deprofil Profil cr R solution contextuelle Cr ation i Profil contextualis descripteur L o contenu i Descripteur cr Calcul de i pr diction i i i Produits pertinents i i i 4 Produits class s i eee eee eee a aaa js I I I sk Figure 27 Diagramme de s quences 57 CHAPITRE III Conception et R alisation 3 3 Diagramme de collaboration Un diagramme de collaboration montre les relations entre les objets jouant les diff rents r les Toutefois ce diagramme ne contient aucune notion de temps Apr s que l utilisateur ait valu un certain nombre de produits le module Cr ation Profil Utilisateur construit son pr
158. ur repr senter chaque objet et calculent la similarit num rique en se basant sur la mesure de cosine ou la corr lation de Pearson Le mod le de l espace vectoriel est employ pour un arrangement des objets complexes en les repr sentants comme des vecteurs de k dimensions La d finition de la similarit num rique entre deux vecteurs d objets est obtenue par leurs contenus internes Parmi les approches cit es dans la litt rature on peut citer 5 4 1 Similarit de Cosine Cette mesure utilise la repr sentation vectorielle compl te c est dire la fr quence des objets mots Deux objets documents sont similaires si leurs vecteurs sont confondus Si deux objets ne sont pas similaires leurs vecteurs forment un angle X Y dont le cosinus repr sente la valeur de la similarit La formule est d finie par le rapport du produit scalaire des vecteurs x et y et le produit de la norme de x et de y EE d Xll2 I ll2 Sim X Y cos X Y La mesure de Cosine 35 quantifie donc la similarit num rique entre les deux vecteurs comme le cosinus de l angle entre les deux vecteurs 5 4 2 Similarit de Pearson La mesure de similarit de Pearson est bas e sur le calcul de la corr lation Pour connaitre le coefficient de corr lation liant deux s ries X x1 X2 Xn et Y Y1 Y2 Yn On applique la formule suivante Sim x y Tp 24 CHAPITRE I Les Syst mes de Recommandation Classiques Si r vaut
159. uvegarde et la restauration des donn es La gestion des acc s concurrents Les composants d oracle Outre la base de donn es la solution oracle est un v ritable environnement de travail constitue de nombreux logiciels On peut classer les outils d oracle selon diverses cat gories e Les outils d administration e Les outils de d veloppement e Les outils de communication e Les outils de g nie logiciel e Les outils d aide a la d cision Communication Java Oracle JDBC JDBC Java DataBase Connectivity est une interface de programmation cr e par Sun Microsystems depuis rachet par Oracle Corporation pour les programmes utilisant la plateforme Java Elle permet aux applications Java d acc der par le biais d une interface commune a des sources de donn es pour lesquelles il existe des pilotes JDBC 8 2 Langage de programmation java Le langage Java est un langage de programmation informatique orient objet cr par James Gosling et Patrick Naughton employ s de Sun Microsystems avec le soutien de Bill Joy cofondateur de Sun Microsystems en 1982 pr sent officiellement le 23 mai 1995 au SunWorld La particularit principale de Java est que les logiciels crits dans ce langage sont tr s facilement portables sur plusieurs syst mes d exploitation tels que UNIX Windows Mac OS 70 CHAPITRE III Conception et R alisation ou GNU Linux avec peu ou pas de modifications C est la plate forme qui garantit la
Download Pdf Manuals
Related Search
Related Contents
師 嘉喜篁童養 ステンレス基台 FCX-SZZA 取扱説明書 KOHLER K-7506-CP Installation Guide Manuel test de grossesse maybebaby Emacspeak User`s Guide - The Linux Documentation Project Panaracer 軽量チューブシリーズの取扱上の注意点 User & Programming Guide Cisco Systems 15530 Network Router User Manual Fiche LPA-1.qxd - La Centrale du Diagnostiqueur Sony XS-602E User's Manual Copyright © All rights reserved.