Home
Faire parler les données des bibliothèques : du Big Data à
Contents
1. 10 DELCARMINE Nadine Tableaux de bord en biblioth que dans ALONZO et RENARD 2012 p 101 Ibid p 100 101 18 Jbid p 102 14 Jbid 105 Jbid p 104 1 DENNI Ga lle 2010 Quatre cat gories d outils pour l auto valuation au SICD2 de Grenoble en ligne 1 janvier 2010 Consult le 26 juillet 2014 Disponible l adresse http bbf enssib fr consulter bbf 2010 04 0023 005 19 DELCARMINE dans ALONZO et RENARD 2012 p 104 108 Thid LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 42 Les donn es un atout pour la gestion d une biblioth que rets de la bible Sou cenwe de Cocumentabon C EVOLUTION DANS L ANNEE succursale du_pret localsaton_exemplare annee crvee 2 SCER 2008 Janvier 133 2008 F vrier 140 PP SE 2008 Mars 109 2008 Avril 95 2008 Ma 2 2008 Juin 78 2008 Juillet 46 2008 Septembre 75 2008 Octobre 139 2008 Novembre 132 2008 D cembre 85 8CER 1114 8 SsDPS 2008 Janvier 2008 F vrier 1 Tikt Omie D centre 2003 rpe 1 Fore wel a Sese Mowmbee 2008 Ma 3 8DPS 9 Total 1123 REPARTITION PAR POLITIQUE DE PR TS succursale du pre Ocalisavuon exempiare more pourcentage de code_type_levtewr pr ts A f SCER 80 180 18 03 po 8LP 7 0 82 ae EM 20 32 06 ao 8M2 377 33 57 8P 136 12 11 8S 22 1 26 LP 32 285 8CER 1114 DPS 80 1 0 00 nm oas 8M1 3 0 27 8M2 5 045 EE Figure 3 Rapports statistiques de l outil Cognos au SC2 de Grenoble Mais ces
2. Hamlet Legendary character Drama R sultats 1 10 sur environ 684 18 secondes Premi re lt Pr c dente 1 2 3 Suivante gt Tout s lectionner Tout effacer Enregistrer dans Nouvelle liste v Enregistrer Trier par Pertinence v Enregistrer la recherche de Ambroise Thomas Michel Carr Jules Barbier Joan Sutherland Sherrill Milnes Richard Bonynge William Shakespeare Welsh National Opera de 33 tours de musique Op ras View all formats and lan Le London Records 1984 ditions et formats Hamlet de Kenneth Branagh David Barron Film producer Julie Christie Billy Crystal G rard Depardieu Chariton Heston Derek Jacobi Jack Lemmon Rufus Sewell Robin Williams Kate Winslet Alex Thomson Patrick Doyle Wiliam Shakespeare Castle Rock Entertainment Firm Warner Home Video Firm o View all formats and languages Distributed by Warner Home Video Base de donn es Editions et formats 3 Hamlet de William Shakespeare Harold Jenkins Livre View all formats and languages New York Methuen 1982 ditions et formats de Franco Zeffirelli Dyson Lovell Christopher De Vore Mel Gibson Glenn Close Alan Bates Paul Scofield lan Holm Helena Bonham Carter Ennio Morricone David Watkin Richard Marden Maurizio Millenotti Dante Ferretti William Shakespeare Warner Bros Nelson Entertainment Firm Icon Productions Warner Home Video Firm Vid o DVD NTS
3. visant faire des biblioth ques des acteurs du web de donn es en exposant leurs donn es sur le web et en les reliant entre elles participent ce mouvement d ouverture en favorisant la r utilisation grande chelle de ces donn es A cette ouverture de certaines des donn es des biblioth ques s ajoute la participation des biblioth ques universitaires au mouvement d ouverture des donn es de la recherche afin de rendre possible une transparence et une communication plus grande des m thodes scientifiques et des donn es produites dans le contexte de la recherche ces derni res sont de plus en plus incit es mettre disposition de leurs usagers des dispositifs de stockage et de r utilisation de ces donn es Nous aimerions souligner ici que ce mouvement ne concerne pas seulement les biblioth ques de recherche mais peut galement toucher les biblioth ques publiques Par ailleurs il ne concerne pas seulement les sciences dures mais aussi les lettres et sciences sociales le mouvement des humanit s num riques dont les techniques ont inspir une partie de cette tude s appuie en effet massivement sur les nouvelles possibilit s de stockage et de traitement des donn es offertes par les technologies en 2014 Comment faire parler les donn es En premier lieu qu entend t on par faire parler les donn es Une premi re r ponse a cette question peut se trouver dans la d finition que donnent Cathy O Neil et Rach
4. Even if we have access to all of Facebook s or Google s or Twitter s data corpus any inferences we make from that data should not be extended to draw conclusions about humans beyond those sets of users or even those users for any particular day Non pagin dans sa version lectronique LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 20 Les donn es une r volution pist mologique pour les biblioth ques les op rateurs bool ens et ou sauf Cependant proc der ainsi comporte le risque d augmenter les marges d erreur inh rentes aux calculs qui pourraient tre effectu s sur les sous populations tant donn que l chantillon aura t divis Lorsque les donn es sont massives la division en sous cat gories d tudes ne poserait pas ce probl me puisque les divisions s effectueraient sur la totalit des donn es Le fait que l on ait pris la pr caution de publier des guides propos des tudes des publics en biblioth que t moigne de la longue pr paration n cessaire en amont de sa r alisation la m thode de l chantillonnage D s lors un chantillon peut difficilement r pondre des questions qui n avaient pas t envisag es avant sa r alisation Par contraste les techniques d analyses propres au Big Data offriraient une plus grande libert dans les objectifs que se fixent une enqu te Leur dimension al atoire rendrait possible la production de connaissances sans
5. 17 Cf annexe p 107 figure 26 180 Cf annexe p 107 figure 27 181 tablissement qui se d finit lui m me comme un gestionnaire de contenus lectroniques en direction des biblioth ques et de leurs lecteurs Content Management Services for Libraries and Publishers sans date en ligne Consult le 8 d cembre 2014 Disponible l adresse http www swets fr 182 GULLIGAN Finbar Sans date Patron driven library Patron driven acquisition Research Information en ligne Consult le 3 d cembre 2014 Disponible a l adresse http www researchinformation info features feature php feature id 485 Where content isn t provided in advance search and discovery becomes the most important part of the workflow If the end users can t find particular content unless they already know it exists then the system will automatically fail 183 Outre les th ories de Neal Thomas que nous avons d j cit es en premi re partie p 24 26 les explications de Rachel Schutt et Cathy O Neil viennent illustrer de mani re pertinente ce propos Another way in which the assumption that N ALL can matter is that it often gets translated into the idea that data is objective It is wrong to believe either that data is objective or that data speaks and beware of people who say otherwise We were recently reminded of it in a terrifying way by this New York Times article on Big Data and recruiter hiring practices At one point a data sc
6. 213 Nous avons d j vu que c est plut t la pens e qui a pr c d ces derni res 24 Jbid p 72 25 Sur cette question lire WRIGHT Alex 2008 Glut Mastering Information Through the Ages Cornell University Press 216 D o peut tre cette r flexion que l on peut lire dans son essai Comme l crit Wayne A Wiegand le biographe de Dewey l organisation de la connaissance qu a produite Dewey a mat rialis e une vision du monde et une structure de la connaissance enseign e sur le campus de l universit d Amherst entre 1870 et 1875 une vision du monde et une structure qui pr supposait que l Occident tait la culture la plus avanc e et que le Christianisme tait au fondement de la v rit Ibid p 116 Il s agit donc l d une tradition lib rale qui pr ne le fait que la puissance publique doive s abstenir de se prononcer sur ce que peuvent tre les valeurs d une vie bonne L humanisme d mocratique au contraire exige de l tat qu il se penche d mocratiquement sur cette question en l affirmant et en la soumettant discussion un peu la mani re des articles de Wikip dia aujourd hui Dans une telle perspective il s agirait donc de conserver une classification unique mais de la soumettre perp tuellement discussion Cf BRIEY Laurent de 2009 Le sens du politique essai sur l humanisme d mocratique Editions Mardaga LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 68 Les Donn es
7. Mais la mutualisation du catalogage n est pas la seule r utilisation envisag e par l OCLC L organisme de recherche s est en effet dot d une section enti rement consacr e l extraction et l analyse de donn es Data Mining Research Area les objectifs assign s cette section tant les suivants En savoir plus sur les caract ristiques propres aux collections des biblioth ques G n rer des pr sentations int ressantes et innovantes des donn es Fournir des informations pour r pondre un certain nombre de besoins en mati re de prises de d cision dans les biblioth que tels que e le d veloppement des collections e la num risation e la conservation Ces objectifs ont t d clin s l chelle de la section de recherche de l OCLC en plusieurs projets notamment l analyse de la taille et des caract ristiques des collections des fonds agr g s d imprim s avec une emphase sur leurs implications pour les d cisions prendre en mati re de num risation et de conservation la d duction par inf rence des publics cibles ou des niveaux d audience des ouvrages partir des informations provenant des fonds ou encore l valuation comparative de collections l tude du d veloppement de l valuation et du partage des ressources pour les collections imprim es et lectroniques entre autres choses On le voit ces projets ont pour beaucoup voir avec ce que nous consid rons comm
8. cette derni re une identit en tant que b timent qui sans cela resterait difficile d finir C est bien l une confirmation du lien intrins que qui unit le probl me de l identification du lieu biblioth que et le probl me de sa visibilit Mais pour poursuivre l analogie avec la visibilit de la biblioth que dans l espace global d information du web quel l ment num rique pourrait correspondre la port e du geste architectural si ce n est la visualisation de donn es Il nous semble en effet significatif que Johanna Drucker dans sa tentative pour d finir ce qu elle appelle graphesis se r f re aux artistes du Bahaus et plus particuli rement Kandinsky dont la conviction tait que le design convenait tout m dia et toute discipline y compris ce qui deviendrait plus tard l infographie De fait Johanna Drucker fait du design un l ment central de la visualisation et par extension de tout m dia num rique Or ce caract re central du design dans la visualisation nous para t tout fait fondamental lorsque l on consid re quelle place les conomistes de l attention lui accordent eux m mes dans leur cit Le design d un produit crit Richard Lanham nous invite lui pr ter attention de mani re particuli re porter un certain type d attention sur lui 251 Thid 252 BLOT JULIENNE Gr gor 2012 Du choix de l implantation aux strat gies de localisation biblioth ques dans la ville Bi
9. l incroyable We are Data mod lisation interactive de toutes les donn es qui nous entourent quand on vit dans une grande ville comme Paris Cette application web a t d velopp e par Ubisoft sur le mod le d un jeu vid o qu elle est cens e promouvoir a partir des donn es r elles de trois grandes villes On voit par l que la production d un jeu vid o interactif permettant d explorer les collections d une biblioth que n est donc clairement pas hors de port e NOUVEAU MOD LE DE BIBLIOTH QUE OU RENOUVELLEMENT D UN MOD LE DE BIBLIOTH QUE En interrogeant l apport r el du num rique et du Big Data l acc s la connaissance nous avons cherch proposer le raisonnement suivant en premier lieu nous postulons que l volution d un acc s arborescent et hi rarchique la connaissance un acc s fragmentaire et multidimensionnel ne serait pas li l apport des nouvelles technologies mais cette volution qui a fait que nous sommes pass de l univers clos de l antiquit aux perspectives infinies ouvertes par la r volution copernicienne En somme la m taphore des feuilles de l arbre utilis e par Weinberger n est pas bonne pour d signer l organisation des connaissances notre poque Il faudrait au contraire 61 Introducing the Knowledge Graph 2012 en ligne Consult le 2 septembre 2014 Disponible l adresse http www youtube com watch v mmQIl6VGvX c amp feature youtube gdata play
10. qui concerne par exemple les sciences de la terre pour lesquelles le dessin parfait 20 WEINGART Scott B From trees to webs uprooting knowledge through visualization dans NTERNATIONAL UDC SEMINAR SLAVIC 2013 p 43 Still we have found the division of knowledge into subjects disciplines or fields a useful practice since before Artistotle These divisions are often organized into metaphors which in turn influence our understanding of knowledge itself Structured or diffuse overlapping or separate rooted or free fractals or divisions these metaphors inform how we think about thinking and they lend themselves to visual representations which construct aznd reinforce our notions of the order of knowledge 21 ECO 2010 p 88 2 Les images visuelles servent les sciences en usant de propri t s graphiques sp cifiques Les images incarnent l information travers trois modes diff rents chacun d entre eux ayant une relation structurelle diff rente avec leur r f rent Elles peuvent fonctionner 1 en offrant une analogie visuelle ou une ressemblance morphologique 2 en fournissant une image visuelle d un ph nom ne invisible ou 3 en fournissant des conventions visuelles pour structurer des op rations ou des proc dures DRUCKER 2010 p 4 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 70 Les Donn es un outil de navigation dans les collections d un objet devait permettre de cr er un
11. LA NAVIGATION DANS LES COLLECTIONS Processus de s lection inform par les donn es d usages la Patron Driven Acquisition PDA est peut tre l exemple type du pilotage d un tablissement documentaire par les donn es et incarne d une certaine mani re un transfert de responsabilit des acquisitions du biblioth caire vers les utilisateurs de la biblioth que Or comme le souligne Finbar Galligan chef d quipe marketing et communications chez Swets l o le contenu n est plus fournit l avance la recherche et la d couverte deviennent les parties les plus importantes du flux de travail la PDA suppose donc l existence pr alable d un moteur de recherche permettant de moissonner des corpus complets de documents D une certaine mani re on peut dire qu il y a bien un transfert de la politique documentaire mais ce transfert ne se fait pas tant vers les usagers de la biblioth que que vers les algorithmes qui fournissent les contenus en fonction de classements qui transposent les choix et pr suppos s de d part de leurs concepteurs Ce caract re m diatique des algorithmes fournisseurs de contenus est amplifi par l ajout de fonction de recommandations bas es sur les recherches pass es et les recherches similaires faites par d autres utilisateurs Comme le sugg re Finbar Galligan ces volutions sont en effet envisager dans le cadre de biblioth ques de plus en plus pilot es par ses usagers patron driven
12. chelle permet de mettre en place ce type de comparaison entre tablissement Nous pourrions reprendre ainsi l exemple de la visualisation d velopp e au sein de la DST4L notamment la premi re 4 destin e a r pondre a la question de savoir quel ouvrage ancien d astronomie avait t le plus t l charg partir de la biblioth que num rique de l Internet Archive Cette visualisation est interactive en cliquant dans le menu gauche de l image sur l une des institutions ayant fourni des ouvrages la biblioth que le fond de 168 MALPAS Constance sans date Sliding scale mapping local group and system wide library infrastructure hangingtogether org en ligne Consult le 21 juillet 2014 Disponible l adresse http hangingtogether org p 3149 1 Ibid My current objective is a lot more prosaic modeling supply and demand within and outside of a given library consortium to inform decisions about local and shared stewardship of print collections 0 Top 250 CIC borrowers by location jpg Image JPEG 658 x 435 pixels sans date en ligne Consult le 21 ao t 2014 Disponible l adresse http hangingtogether org wp content uploads 2013 07 Top 250 CIC borrowers by location jpg Cf annexe p 105 figure 22 17 Choropleth US libs by county jpg Image JPEG 1017 x 653 pixels Redimensionn e 96 sans date en ligne Consult le 21 ao t 2014 Disponible l adresse http hangingtog
13. savoir la facult de filtrer l information et ventuellement d effectuer des recommandations ce qui d ailleurs a de plus en plus tendance se d velopper dans les catalogues nouvelle g n ration Nous aurions l un dispositif num rique tout fait efficace dans l environnement virtuel Reste savoir sous quelle forme nous pourrions d cliner ce dispositif c est ce que nous allons tenter de d finir maintenant Un data game stellaire Un data game ou jeu avec des donn es est un jeu vid o dont l environnement et le sc nario sont uniquement fond s sur des donn es r elles Le principe du data game est simplement d tre un jeu vid o une simulation dont le contenu est apport par des donn es se r f rant des objets r els Ainsi dans le cas d un jeu s rieux serious game dont le but serait de simuler des explosions de bombes nucl aires et d en mesurer les cons quences celui ci se d clinerait ainsi Le lieu d abord pourra ainsi tre une grande ville contemporaine ou un des en droits de la plan te qui a d j connu une explosion atomique Et la puissance de la bombe elle pourra correspondre l arme largu e sur Hiroshima la plus grosse ogive fran aise ou encore la Tsar bomba mastodonte de l arm e sovi tique Quant l objectif il est sugg r par le dispositif recr er toutes les conditions de l attaque sur Nagasaki et voir combien de victimes elle ferait si el
14. sp culation commerciale fond e sur la valeur de la base de donn es des livres Darnton oppose en effet le principe de bien commun de la connaissance incarn par l id al Jeffersonien Qui re oit une id e de moi re oit lui m me une instruction sans amoindrir la mienne de m me que celui qui claire sa chandelle la mienne re oit de la lumi re sans me plonger dans l obscurit Il s agirait donc bien d un conflit entre deux visions diff rentes de l conomie de l information d une part celle lib rale de Google et d autre par celle des biens communs de la connaissance port e en France par le collectif SavoirComl pour ne citer que cet exemple Ces deux conceptions donnent naissance des donn es et des technologies de traitement diff rentes savoir Google Book et la DPLA mais la derni re rel ve bien de cette inspiration vers l ouverture la participation et la d mocratie d crite plus haut par M taLAB qui peut pr cis ment amener des conflits avec d autres valeurs ayant pr sid la cr ation des donn es de la DPLA En effet contrairement Google Book explique Robert Darton la DPLA ne puisera pas dans une seule et gigantesque base de donn es Il s agira d un syst me dit distribu qui agr gera les collections de multiples biblioth ques de recherche mus es et autres institutions Les diverses institutions qui ont fourni leur donn es de num risation la DPLA sont elles m
15. ABC CLIO The traditional ways in which librarians gather and process data often stop short of the analysis processing or mining techniques that could be considered a necessity in any other profession as data rich as ours Such techniques are not easy to employ but they produce remarkably informative if at times uncomfortable results Instead we prefer to deal with the surface safe meaning of our data relying on a predominance of quantitative variables and the simple arithmetic conclusions we can draw from them Those conclusions are safe because they seldom yield to unexpected results p 3 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 43 ae ey Droits d auteur r serv s OU cc ETATS Jamene Brooks Kieffer fait donc un constat assez dur celui que les biblioth caires et professionnels de la documentations pourtant si d sireux de piloter leur action par l usage des donn es ne savent cependant pas les analyser de mani re approfondie et se contentent souvent de chiffres et de simples op rations arithm tiques pourcentages minimum maximum moyennes etc pour informer leur d cision Mais comment pourrait on s attendre ce qu il en soit autrement continue t elle alors que les agences nationales am ricaines elles m mes d signent sous le terme de statistiques une collection de donn es quantitatives portant sur un sujet particulier Lorsque les agences nationales elles m mes envoie
16. O NEIL SCHUTT 2013 Non pagin dans sa version lectronique 2 MAYER SCHOENBERGER CUKIER 2013 One of the areas that is being most dramatically shaken up by N all is the social sciences They have lost their monopoly on making sense of empirial social data as big data analysis replaces the highly skilled survey specialists of the past The social science disciplines largely relied on sampling studies and questionnaires But when the data is collected passively while people do what they normally do anyway the old biases associated with sampling and questionnaires disappear p 30 3 O NEIL SCHUTT 2013 even if we poll absolutely everyone who leaves the polling stations we still don t count people who decided not to vote in the first place And those might be the very people we d need to talk to to understand our country s voting problems Non pagin dans sa version lectronique LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 21 Droits d auteur r serv s OU se r v lent toujours aussi pr cieuses D s lors il nous para t pr somptueux de la part des auteurs d affirmer que les m thodes propres a la science des donn es pourraient remplacer de mani re avantageuse les statistiques traditionnelles Mais au del de cela que penser de l affirmation selon laquelle les m gadonn es ferait dispara tre les pr suppos s qu impliquaient tout chantillon et questionnaire Avant toute chose nous
17. VISUALISATION DES OUVRAGES LES PLUS DETENUS A L ECHELLE GLOBALE ORDONNEES ET A L CHELLE LOCALE ABSCISSES EE ae harvard TANNNN Visual Query Expansion Q Please enter your query semantics Search Q Expanded search terms View in PubMed Neurons Visual Perception Evoked Potentials Visual Visual Cortex 9 Visual Pathways Brain Mapping e s s 8000 5 6000 4000 a 2000 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 H Figure 27 La collection du Lafayette College se voulant universelle et grand public 1 COHEN Dan 2012 Visualizing the Uniqueness and Conformity of Libraries Dan Cohen en ligne 13 d cembre 2012 Consult le 11 juin 2014 Disponible l adresse http www dancohen org 2012 12 13 visualizing the uniqueness and conformity of libraries LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 107 ae er Droits d auteur r serv s OU cc ETATS Limited facets after Rich facets upon 4 e P initial search selecting a category S Any Department Any Format Any Award Sports amp Outdoors 99 920 Printed Books 189 555 Caldecott Medal Books 195 488 Sports 16 742 HTML 1 205 Man Booker Prize 24 Apparel amp Accessories 41 801 Nonfiction 49 921 Audiobooks 985 Nationa Book Award 26 OVD 608 Religion amp Calendars 423 Newbery Medal 12 Toys amp Games 8 776 Spey 23 708 Kindle Books 199 The Puli
18. VuFind FAQ Frequently Asked Questions sans date en ligne Consult le 29 ao t 2014 Disponible l adresse http www library illinois edu learn find vufind vufind_faq html Watch Dogs WeAreData sans date Watch Dogs WeAreData en ligne Consult le 31 ao t 2014 Disponible l adresse http wearedata watchdogs com What is Summon University Libraries Virginia Tech sans date en ligne Consult le 2 aout 2014 Disponible a l adresse http www lib vt edu help summon what is summon html xlin udcseminar2013 pdf sans date en ligne Consult le 8 septembre 2014 Disponible a l adresse http www udcds com seminar 2013 media slides xlin udcseminar2013 pdf LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 95 ie EI EEE Droits d auteur r serv s OU 10 principes fondamentaux Soci t Google sans date en ligne Consult le 11 d cembre 2014 Disponible a l adresse http www google fr intl fr about company philosophy VIDEOGRAPHIES Introducing the Knowledge Graph 2012 en ligne Consult le 2 septembre 2014 Disponible a l adresse http www youtube com watch v mmQI6VGvX c amp feature youtube gdata player Leveraging WorldCat Data Mining the largest library database in the World 2013 en ligne Consult le 14 juillet 2014 Disponible l adresse http www youtube com watch v atA2QadzTdY amp feature youtube gdata pl
19. What is Visualization Data Visualisation sans date en ligne Consult le 30 juin 2014 Disponible l adresse http www datavisualisation org 2010 11 lev manovich what is visualization 187 Jbid p 4 Ce caract re de sch matisation extr me et de r duction est bien videmment rapprocher de la r duction op r e par les algorithmes la visualisation au m me titre que ces derniers est un m dia et en tant que tel est dot e des m mes limites pist mologiques N anmoins le caract re sch matique est peut tre plus vident dans la visualisation que dans les algorithmes la proc dure de ces derniers n tant souvent pas connue pour des utilisateurs lambda LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 57 Droits d auteur r serv s OU Together elle d crit en effet les tapes de sa recherche d une repr sentation visuelle adapt e pour mod liser l offre et la demande l int rieur et l ext rieur d un consortium de biblioth que afin d informer des d cisions concernant la conservation locale et partag e de collections imprim es L information recherch e n est donc pas des plus simples Pour autant la visualisation cartographique permet de s en faire une id e claire assez rapidement apr s avoir renonc repr senter les biblioth ques am ricaines sous forme de points du fait de l illisibilit que cela induisait l auteur s est finalement rabattue su
20. http bibliotheques wordpress com 2014 07 03 mais que fait gephi 153 grapheprc3aats png Image PNG 1024 x 1024 pixels sans date en ligne Consult le 20 ao t 2014 Disponible l adresse https bibliotheques files wordpress com 2014 07 grapheprc3aats png 154 BAUDIERE 2014 p 53 54 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 54 Les donn es un atout pour la gestion d une biblioth que On voit ici que la communication du biblioth caire en direction de son lu n cessite une certaine cr ativit de sa part afin d en appeler aux sentiments de son interlocuteur Or selon Nathan Yau la visualisation r pond tout fait ces crit res en effet bien loin de pr senter un simple r sum de donn es quantitatives la visualisation fait appel au design Les qualit s esth tiques qu elle met en ceuvre doivent permettre de susciter une r action positive ou n gative de la part de l observateur Pour illustrer cette id e Nathan Yau prend l exemple de la visualisation intitul e We Feel Fine de Jonathan Harris qui doit permettre d explorer les motions humaines l chelle mondiale Plus proche des biblioth que l exemple du navigateur de th se de Stanford qui permet d embrasser du regard l volution temporelle de sujets des th ses soutenues dans cette universit figure ci dessous Depts Year 1993 lt Backward Forward gt Figure 5 Dissertation brow
21. le nouveau pour la biblioth que un r le qui soutient l information sous toutes ses formes depuis le mot crit jusqu l image num rique en passant par l chantillon circulant en streaming et le fi chier de donn es quantitatives Il se peut que les usagers n associent pas imm diatement les ressources quantitatives la biblioth que mais de plus en plus de biblioth ques et de biblioth caires sont appel s acheter communi quer et archiver ces ressources La donn e est donc susceptible d int resser tout type de public et c est bien ce titre que Kellam et Peter en appellent la formation de donn eth caires data librarians dont le r le serait de s lectionner rendre disponible et promouvoir des jeux de donn es D s lors la difficult r side dans le fait qu quelques expressions pr s les biblioth caires sont traditionnellement peu form s dans le domaine des statistiques et de la gestion informatis e des donn es L objectif de la DST4L n anmoins consiste essentiellement permettre aux biblioth caires de nettoyer et rendre visible les jeux de donn es afin d en faciliter la d couverte et non sp cifiquement de former l analyse des donn es en r alit 133 ERDMANN 2014 p 21 134 GAILLARD 2013 p 72 135 KELLAM PETER 2011 With these changes in the access to numeric data librarians have become central participants in assisting users Our traditional focus may
22. mes en possession de ces h ritages de normes et de valeur pass es qui pourraient entrer en conflit avec les valeurs mergentes propres Internet de la biblioth que num rique am ricaine Or ces conflits permettent de nous apporter des connaissances sur le contexte institutionnel des biblioth ques qui ont particip au projet port par la DPLA Or tout l enjeu est de pouvoir les mettre au jour Comment fonctionne l Observatoire En langage technique un artefact de donn e est un objet produit par inadvertance au cours de processus humains d organisation et de gestion D un point de vue culturel un artefact est une fabrication situ e dans un contexte culturel Enfin d un point de vue historique un artefact est une trace vidente d une rencontre carac t re m dico l gale avec le pass Jamais brute toute donn e transporte les traces du travail humain de ses interpr tation et de ses valeurs Matthew Battles et l quipe de chercheurs l origine de l Observatoire Biblioth que ont la conviction que l analyse et la visualisation de donn es rendent possible le rep rage d artefacts ces erreurs de catalogage qui t moignent d un conflit de classification entre deux institutions diff rentes l origine des donn es de la DPLA Plus concr tement l Observatoire est une application con ue partir de l API pour Application Programming Interface fournie par la biblioth que num rique am ricaine 5
23. peut tre serait il n cessaire que toute personne amen e travailler avec les donn es des biblioth ques prenne conscience de ce que sont par nature les donn es non des reflets du r el mais davantage des fragments de ce dernier dont le sens jamais fixe n1 certain est sans cesse construire Peut tre serait il opportun pour saisir ce caract re instable et faussement miroitant des donn es de rapprocher ces derni res du statut des archives aux yeux de l historien notamment tel que l expose Arlette Farge Celle ci d crit en effet la surveillance polici re du Paris du XVIII si cle par un dispositif pyramidal de mouches le pouvoir monarchique a cherch se tenir inform au plus pr s de l opinion parisienne notamment dans le but de pr venir d ventuels soul vements Mais lire ces paroles capt es comme la NSA capte aujourd hui les donn es des t l communications on ne peut s emp cher de sentir toute la vanit de cet effort de surveillance Jamais en effet la rue n a pu tre enti rement saisie par le pouvoir royal pour la simple raison que le syst me de surveillance masquait par son dispositif m me la r alit des comportements quotidiens des administr s les formes m mes de l organisation polici re sont construites autour de cette n cessit quotidienne de tout savoir et tout entendre et le classement des archives du lieutenant g n ral traduit cette pr occupation forcen e pour le d tail et
24. que en ligne De la monumentalit au geste visuel Deux solutions s offrent au probl me de la visibilit de la biblioth que dans la ville La premi re concerne sa situation dans le tissu urbain et la seconde sa monumentalit est celle qui la rendrait rep rable dans la ville Emmanuelle Berm s semble pencher pour la premi re solution Dans la ville pour tre fr quent e la biblioth que a besoin d tre incarn e par un b timent visible imm diatement identifiable pour la fonction qu il remplit La bi blioth que met galement en place des moyens qui permettent aux lecteurs poten tiels de la trouver des panneaux indicateurs ou tout simplement un symbole qui positionne son emplacement sur une carte 7 Thid p 165 248 Thid p 163 29 Jbid p 155 oe BERMES ISAAC POUPEAU 2013 p 24 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 77 Droits d auteur r serv s OU cc EE Cependant cette d marche purement g ographique si elle est indispensable ne peut suffire comme unique moteur pour inciter les gens venir la biblio th que Les diff rentes strat gies mises en place par les biblioth ques pour gagner une audience plus large dans la cit du bibliobus la biblioth que hors les murs en passant par toutes les animations qu elles organisent expo sitions lectures accueil des scolaires et les diff rents moyens qu elles peuvent utiliser pour faire conna tre ces ac
25. sans date en ligne Consult le 9 mai 2014 Disponible l adresse http www serialssolutions com en words detail data mining big data a strategy for improving library discovery For the past decade or longer usability testing has been the traditional process for evaluating a software application s user experience In usability testing users existing users of the application or participants recruited off the street are observed while completing a series of scenarios that mimic real life examples For many years this approach has provided valuable information However non matter how unobtrusive the observation mechanism users act differently when they know they are being observed All users searching across the same unified index no matter how customized their local Summon site might be is the key to capturing meaningful and interpretable data This data can expose behaviors that illustrate true usage of library services as opposed to the usage of a small number of participants being observed in an unfamiliar situation such a usability study defined tasks LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 22 Les donn es une r volution pist mologique pour les biblioth ques recherche scientifique C est l la teneur du propos de Chris Anderson r dacteur en chef du magazine Wired proph tisant en 2008 la fin de la th orie Selon lui le d luge de donn es rendrait la
26. serv s OU remplacent ensuite cet arbre unique par autant d arbres classificatoires diff rents qu il y a d utilisateurs d Amazon Mais David Weinberger va plus loin encore dans l explosion de l arbre en feuilles puisqu il explique que la num risation massive effectu e par Google a permis de faire d une phrase d une expression ou m me d un mot une feuille qu il est possible de brasser l infini avec d autres l ments similaires afin de d couvrir d autres livres Amazon produit ainsi par le biais d une fouille de texte une analyse statistique du contenu d un ouvrage dont il rapproche les expressions les plus statistiquement significatives d autres ouvrages employant des expressions similaires Le bouleversement num rique a donc fait explos jusqu au livre et sa mise en page la biblioth que num rique va au del du livre Jusqu pr sent il y aurait peu de chose redire aux th ories d velopp es par Weinberger sa vision de la strat gie des Amazon et autres g ants du net semble juste En revanche il nous semble que la seconde partie de sa r flexion portant sur les limites pr suppos es de la g ographie sous jacente a la connaissance appelle une discussion L auteur explique en effet que la limite des syst mes classificatoires tel que celui de Dewey ne r side pas tant dans la vision du monde ce a quoi l auteur fait r f rence lorsqu il parle de son excentricit ou de sa premi re ducation que Dew
27. Cassidy R 2014 Beyond Bibliometrics Harnessing Multidimensional Indicators of Scholarly Impact Cambridge Massachusetts MIT Press p 70 71 What we find is that social computing algorithms such as PageRank link analysis algorithms and recommender systems strengthen the truthfulness of bibliometric laws such as Lotka s law simply because they automate the group behavioral assumptions inherent in such laws and then feed this back into user behavior Empirical findings never simply show themselves Citation analytics either explicitly or implicitly as a social science must indicate social explanations of various types of regular behaviors Once again the epistemic problem of social science operationalization which becomes political and psychological when citation analyses are highly valued in restricted e g Academic or general e g Social economies is what happens when these explanations are the very basis for the metrics to begin with Then the objects of study and their empirical measurements and the tools and algorithms that aid this may be nothing other than devices in the restaing of social cultural and political norms What they would assert is the certainty of ideology 4 GILLESPIE Tarleton The relevance of algorithms para tre dans Gillespie Tarleton BOCZCOWSKI Pablo et KIRSTEN Foot Media Technologies Cambridge MA MIT Press Consult le 3 ao t 2014 l adresse We
28. Dans le monde num rique c est la multiplication des donn es la datafication de notre environnement y compris livresque qui permet un tel tour de force les algorithmes classent la fois les donn es personnelles d un utilisateur et les donn es produites sur un objet pour proposer ce dernier un ensemble de produits dont on suppose qu il y portera int r t cela s ajoute les performances de la fouille de texte ou text mining il s agit d un ensemble de techniques de linguistique de statistique et d apprentissage automatique visant mod liser et structurer l information contenue dans des ressources textuelles ce par exemple pour indexer un ensemble de documents et les classer selon leurs th mes La datafication va donc jusqu aux mots d un texte pris comme unit et dans une certaine mesure transform en m tadonn es par le biais de l analyse de contenu N anmoins que signifie dans ce contexte la notion d exploration des collections quand la d couverte accidentelle d un objet reste difficile avec le syst me de type requ te r ponse utilis pour les moteurs de recherche Les concepteurs des services grand public comme Google Books et Amazon en sont conscients et ont mis en place plusieurs techniques alternatives essentielle ment bas es sur la visualisation des lectures en cours d autres usagers ou de re commandations inspir es de la navigation pass e voir de notic
29. Disponible l adresse http crl acrl org content early 2014 10 20 cr114 632 full pdf M6 Ibid By conducting similar evidence based evaluation of library use patterns we believe that academic libraries should be able to create effective feedback mechanisms to monitor and inform their collection development practices to better meet the changing needs of their user populations 17 Ibid relationships among recent acquisitions circulation and ILL borrowings data need to be examined more carefully to determine subject strengths and weaknesses in relation to the total user demand for library materials Moreover because academic libraries serve different user populations e g undergraduate graduate students faculty it is also essential that effort be made to disaggregate allt hese data sets and analyse them on a smaller scale to examine the effectiveness of collection development activities for different user categories LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 45 Droits d auteur r serv s OU En contribuant fournir des aper us nouveaux sur ces questions l objectif fi nal de cette tude tait de renouveler le dialogue entre les acqu reurs et les usagers et redonner de l nergie la conception du d veloppement des collec tions de la biblioth ques D une certaine mani re les auteurs de l tude semblent admettre que les variables qu ils ont choisies savoir le trio u
30. Emmanuel 2012 L attention au monde Sociologie des donn es personnelles a l re num rique Armand Colin ISBN 9782200286729 LA BARRE Kathryn Sempre avanti Some reflections on faceted interfaces dans INTERNATIONAL UDC SEMINAR SLAVIC 2013 LAVOIE Brian F SCHONFELD Roger C Books without Boundaries A Brief Tour of the System wide Print Book Collection dans DEMPSEY Lorcan LAVOIE Brian F MALPAS Constance CONNAWAY Lynn S SCHONFELD Roger C SHIPENGROVER J D et WAIBEL G nter 2013 Understanding the Collective Collection Towards a System wide Perspective on Library Print Collections Dublin Ohio OCLC Research Consult le 5 ao t 2014 Disponible l adresse Web http oclc org research publications library 2013 2013 09 pdf LIN Xia AHN Jae WOOK Challenges of knowledge structure visualization dans INTENRATIONAL UDC SEMINAR SLAVIC 2013 O NEIL Cathy SCHUTT Rachel Doing Data Science sans date en ligne Consult le 1 novembre 2014 Disponible a l adresse http shop oreilly com product 0636920028529 do POISSENOT Claude La connaissance des publics via les donn es internes de la biblioth que dans EVANS 2011 RAZPOTNIK Spela SAUPERL Alenka Enhancing browsing experience through visual presentation of subject terms dans INTERNATIONAL UDC SEMINAR SLAVIC 2013 TESNIERE Val rie dans BERTRAND Anne Marie BETTEGA Emilie CLEMENT Catherine ERMAKO
31. Rapha lle DCB M moire d cembre 2014 83 Droits d auteur r serv s OU cc EE semble que la diff rence fondamentale entre algorithmes et visualisation de donn es demeure dans le fait que la subjectivit est latente dans les premiers tandis que dans la seconde elle est davantage affirm e ce qu il nous semble il y a en effet une diff rence notoire entre se contenter de transposer une vision du monde dans un m dia et vouloir exprimer certes m diatiquement mais galement m taphoriquement cette m me vision du monde Dans un second temps si l on observe la biblioth que et ses collections du point de vue de leur pilotage de nouveau les donn es posent la question fondamentale du politique notamment en raison de la particularit des acteurs qu elles impliquent Ces acteurs sont d crits par Benoit Tuleu Dans un contexte nouveau o les missions p dagogiques de la biblioth que seraient enfin garanties on aurait tout gagner inventer un nouveau tri angle lu biblioth caire usager et placer en son centre la biblioth que comme objet politique fondamentale 7 Si donc la biblioth que doit tre con ue comme tant au c ur d une n gociation permanente entre un biblioth caire son lu et les usagers de son service il appara t n cessaire de r fl chir un outil de pilotage qui permette d int grer ce caract re de dialogue continu cet gard la visualisation nous para t de
32. WorldCat il ne nous a gu re t possible de trouver des informations sur les algorithmes qui ont t utilis s pour les effectuer En revanche nous avons pu trouver sur le site de l OCLC de la documentation concernant un algorithme Work set FRBR traduisons par groupe uvre FRBR FRBR d signant les Functional Requirement for Bibliographic Records qui consiste pour sa part a rassembler toutes les informations concernant non pas un auteur ou un cr ateur mais une uvre Il s agit donc du m me principe que les identit s WorldCat mais appliqu aux ceuvres telles qu elles sont d finies par les FRBR Pour comprendre le fonctionnement de l algorithme peut tre est il bon de rappeler comment fonctionne les FRBR les Sp cifications Fonctionnelles des Notices Bibliographiques sont un mod le conceptuel de notices bibliographiques dont l objectif est de fournir un cadre commun la r daction de ces notices D apr s Wikip dia elles sont con ues comme un outil pour l tablissement de futures normes bibliographiques Plus concr tement les FRBR distinguent quatre mentions essentielles devant tre identifiables dans toutes les notices tout d abord l uvre produit intellectuel d un auteur ou d un cr ateur puis son expression qui peut tre toute r alisation cr e partir de cette uvre telle qu une traduction La manifestation doit ensuite repr senter la mat rialisation de cette expr
33. a category Department Department Format Award Winners Any Department Any Department Any Format Any Award Printed Books ca TM ne amp Garden See All 30 Departments Hugo amp Nebula Binding Any Binding Promotion Paperback Any Feature or Promotion 4 for 3 Books Bargain Books Avg Customer Review Any Avg Customer Review teteicte amp Up Li amp Up tir Up u amazon com Figure 9 Amazon exemple par excellence d interface facettes Mais ce type de visualisation s il est fort utile comme l illustre le succ s des sites de ventes en ligne poss de toutefois ses limites lorsqu il s agit de visualiser les r seaux complexes de l information Les exp rimentations conduites l Universit de l Illinois ont montr qu il n tait pas possible d afficher toutes les sous cat gories attenantes une recherche et qu il tait d s lors n cessaire de supprimer des l ments pourtant importants Par ailleurs comme le soulignent Xia Lin et Jae Wook Ahn ces structures de connaissances taient labor es la plupart du temps par des hommes experts dans chaque domaine et existaient sous la forme de vocabulaires contr l s et d ontologies On ne voit pas tr s bien l utilit dans ce contexte d une visualisation qui se contente de reproduire une repr sentation d ja d termin e au pr alable elle ne permet pas r ellement de d couvrir de nouvelles relations entre plusieurs concepts K
34. adeno 42 Quelques exemples innovants d analyse des donn es en biblioth que 45 Penser les donn es des biblioth ques non comme des indicateurs mais comme des symboles de son GCHVEG nine 47 DST4L un exemple de formation sp cialement con ue pour des DMO TGC AU CS PRE een nn 49 Contexte et objectifs de la formation vais covessasssvanaziesseinncnsderaascovasasosavnainedessncaveraes 49 Comment dompter les donn es bibliographiques 2 51 L apport de la visualisation pour la communication 53 Sl LIE ca ct eaatoasvcstasesauiedecenite csi aisa be cutiaisel un eon seseapviivcnie tise asta ce mine reahnesle 54 US RER ni dit don Ce 55 OR D ea tn ete ee 56 COM DO ER RS e td D E E D ON dd 58 De la politique documentaire la navigation dans les collections 60 LES DONN ES UN OUTIL DE NAVIGATION DANS LES COLLECTIONS Tonnerre 63 De la classification la navigation seeesssescsesssesssesesooesoossoosssoesssesssoossosssossseso 64 DE l Arbre u Labyrinthe ren latopeataie 65 De l universalit de la classification l individualit de la navigation 67 Lap tre Rapha lle DCB M moire d cembre 2014 115 Droits d auteur r serv s OU cc EE La Classification D cimale Universelle CDU la recherche d une m taphore VISE de rente ne sen lente Ris ete 69 La n cessit d une TNCLAPNOFC So cnnsseonntisecnsialssacesenta arr needa tA anne 70 D NAIDU ed VO IONE atte rm AR Re eeGien O 71 Re
35. arborescente qui caract risait les classifications pr c dentes pour pouvoir rendre au mieux la multi dimensionnalit qui caract rise la CDU et plus g n ralement l organisation labyrinthique des connaissances De l arbre la galaxie Au sein du recueil des communications faites l occasion du s minaire de la CDU de 2013 nous avons choisi les exemples qui nous paraissaient la fois les plus li s au monde des biblioth ques et les plus embl matiques des quelques techniques de visualisation dont nous allons exposer ici les caract ristiques s0p0nrQ and resstng siemens tectural elements ei spannng and propctng structure comors lt structural elements gt se 2 FRF RTE cont orctsing syuctral ciomonts lt structural systems gt s3uctua ciormenta O srucaral ssombtes O sruceral syswms FERCRE ER srcurai cements by specific coment i ne es sructves by location c structures sructres by property ting and re Figure 8 un exemple de structures hi rarchiques pr sent es sous forme textuelle et visuelle Pour commencer nous pouvons consid rer au niveau le plus l mentaire de la visualisation des connaissances la m taphore de l arbre figure ci dessus Il s agit simplement de visualiser la fois des relations entre des concepts mais aussi les 2 Ibid The long invetory of distortions drawings of specimens for which no conceptual classifications is yet established argue
36. cela l Encyclop die est devenue elle m me une m thode d enqu te travers la biblioth que g n rale et omnivore de la culture toute enti re Cette mani re multidimensionnelle et labyrinthique de rechercher la connaissance et d y acc der qui serait la n tre aujourd hui ne daterait donc pas des changements introduits r cemment par les technologies num riques Nous pourrions plut t envisager ces derni res comme le produit d une volution philosophique d j vieille de quelques si cles De fait en soutenant la th se d un bouleversement de nos modes d acc s la connaissance introduit par le num rique et non r sultat d une volution ant rieure de la pens e il semble que David Weinberger c de aux sir nes de la neutralit et de l objectivit dont nous avons d j soulign dans notre premier chapitre l impossibilit selon son point de vue un tablissement public tel que la biblioth que se devrait d tre la c jusque dans sa classification en ne privil giant pas outre mesure une philosophie ou une religion par rapport une autre f 21 WEINBERGER 2008 Let s say you want a copy of the Little House Cookbook Frontier Food from Laura Ingalls Wilder s Classic Stories by Barbara M Walker If you look up the title at the New York Public Library you ll find fifty two copies across the many branches Most put it in the children s room but the Donnell Library puts it in the reading room Everyo
37. ces institutions tendances influenc es non seule ment par des pr dilections de conservation ou d universit mais aussi par les sources de financement les pr occupation de pr servation et la susceptibilit la num risation pr sent e par de nombreux types d objets BATTLES 2013 The dead end at type register may reflect an error in the ingestion of data or disagreemnets between th data models of the Smithsonian and the DPLA The varied sizes of collections might reflect the relative significance of certain materials in the collections development program but we do well to remember that the DPLA is a mega meta collection of digital objects it reflects not only the collecting habits of its partner institutions but the focus and relative pace of digitization efforts across those institutions patterns influenced not only by curatorial or scholarly predilections but funding LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 37 Droits d auteur r serv s L Observatoire s int resse donc au m me titre que l OCLC des questions relatives la politique documentaire des tablissements et ce dans le cadre des bouleversements amen s par la num risation massive Si les m thodes sont radicalement diff rentes elles sont nos yeux compl mentaires les rapports de l OCLC d une part produisent des connaissances une chelle globale Ses observations sont de port es tr s g n rale
38. dans College amp Research Libraries 2015 Microsoft Word Link Tosaka Weng docx crl14 632 full pdf sans date en ligne Consult le 8 d cembre 2014 Disponible a l adresse http crl acrl org content early 2014 10 20 crl14 632 full pdf ERDMANN Christopher 2014 Teaching librarians to be data scientists Information outlook en ligne mai juin 2014 Vol 18 n 3 Consult le 17 ao t 2014 DOI 10 5281 zenodo 11217 Disponible l adresse https zenodo org record 11217 files DataScientistTraining pdf LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 91 ns EEE Droits d auteur r serv s OU GILLESPIE Tarleton The relevance of algorithms para tre dans GILLEPSIE Tarleton BOCZCOWSKI Pablo et KIRSTEN Foot Media Technologies Cambridge MA MIT Press Consult le 3 ao t 2014 l adresse Web http www tarletongillespie org essays Gillespie 20 20The 20Relevance 200f 20Algorithms pdf POULAIN Martine 2002 Retourner a Tocqueville en ligne 1 janvier 2002 Consult le 11 d cembre 2014 Disponible a l adresse http bbf enssib fr consulter bbf 2002 05 0066 001 2002 5 fam apropos varia ROUVROY Antoinette et BERNS Thomas 2013 Gouvernementalit algorithmique et perspectives d mancipation R seaux 1 avril 2013 Vol 177 n 1 pp 163 196 DOI 10 3917 res 177 0163 p 180 The End of Theory The Data Deluge Makes the Scientific Method Obsolete WI
39. de l ADS et de l IA De simples tris crois s permettent ensuite de rep rer les doublons et les manques d une collection l autre Les participants au projet ont ensuite cherch visualiser la totalit des donn es r cup r es de l Internet Archive dans le domaine de l astronomie et ont g n r ces visualisations en fonction des questions qu ils avaient poser leurs donn es Une premi re visualisation sous forme de pastilles color es devait nous renseigner par exemple sur les ouvrages anciens les plus t l charg s en astronomie un diagramme en barre nous indiquant ensuite quelle biblioth que d astronomie ayant particip la collection num rique de l Internet Archive poss de la collection la plus pr cieuse Au moyen d une carte les participants ont galement choisi de repr senter les lieux de publications les plus actifs dans le monde toujours dans le domaine de l astronomie De m me une carte arborescente est charg e de repr senter les ouvrages dont la num risation a t la plus co teuse Enfin un nuage de tags permet de visualiser les langues les plus courantes dans lesquelles sont publi s ces ouvrages d astronomie l anglais et le fran ais tant les deux langues les plus courantes Contrairement ce que l on pourrait penser au vu de ces r alisations les techniques utilis es sont accessibles des personnes qui n ont pas n cessairement de bagage en informatique ou en design En effet si l on obse
40. de la visualisation Les r ponses que nous tenterons de donner ces questions pourront s appliquer indiff remment nous semble t il aux biblioth ques universitaires et aux biblioth ques publiques nous consid rons en effet que la t che d valuer un service si elle sera dans un premier temps d crite en prenant le cadre universitaire peut tr s bien se transposer l chelle d une biblioth que municipale De m me le second chapitre de cette partie qui se penchera sur un exemple de formation mis en place dans une biblioth que de recherche aux tats Unis peut s envisager galement dans le contexte publique si la n cessit de mettre disposition des usagers de la biblioth que des personnes comp tentes pour g rer les donn es issues de la recherche a motiv la cr ation de la formation que nous allons d crire il n est pas vident que seul un public d tudiants et de chercheurs aujourd hui prouve le besoin d obtenir des donn es ainsi que les renseignements pouvant les accompagner Enfin si le dernier temps de ce chapitre porte sp cifiquement sur la communication du biblioth caire avec son lu il nous semble que l lu peut tout aussi bien tre inter chang dans notre propos avec le pr sident d universit dont le pouvoir de d cision sur ses services de documentation a t renforc par la loi sur l autonomie des universit s S APPUYER SUR L ANALYSE DE DONN ES POUR VALUER LA BIBLIOTH QUE Les bib
41. de publier ce dernier sur un site web ou un blog comme l ont fait les apprentis donn eth caires de la DST4L Le fait que ce logiciel ne requi re pas de connaissances en programmation est mentionn parmi les raisons invoqu es pour justifier son emploi On peut donc constater que ce travail effectu partir des donn es s il n est pas sans difficult reste la port e des comp tences d un biblioth caire Par ailleurs l emploi de ces outils permet galement l apprentissage de langages de programmation qui peuvent permettre de ne pas se contenter d une simple comparaison entre deux collections on aura not en effet que le travail pr sent sur ce blog ne t moigne pas d analyses statistiques tr s pouss es mais constitue une premi re tape vers ces derni res Les visualisations pr sent es sont n anmoins d j fort utiles pour leur qualit s communicationnelles L APPORT DE LA VISUALISATION POUR LA COMMUNICATION Dans son m moire sur les relations entre le directeur de la biblioth que et ses tutelles administratives et politiques Marie Baudi re explique notamment que les donn es des biblioth ques sont au c ur de la communication du biblioth caire en direction de son lu Les directeurs de biblioth que cherchent donc comment pr senter leurs lus l activit de la biblioth que Tous attribuent au bilan annuel cette fonction les donn es statistiques qui y figurent les analyses sur la politiq
42. des formats de donn es entre l ADS qui d crit les documents l chelle d un article et l IA qui les d crit l chelle d un titre de revue Les responsables du projet ont donc d cid de se contenter dans un premier temps de retrouver des correspondances entre les donn es bibliographiques de l IA et celle de l ADS seulement pour les monographies o les formats de donn es taient peu pr s similaires Les membres du projet ont ensuite commenc par extraire de l ADS les donn es correspondant aux monographies d astronomie dont les notices se trouvent dans la base bibliographique de la NASA en se contentant des donn es de titre auteur et date de publication De l ces donn es n tant pas propres du fait du caract re composite de l ADS qui regroupe plusieurs institutions diff rentes un outil gratuit en ligne OpenRefine a t utilis pour rep rer et corriger automatiquement les erreurs de frappe ou de catalogage dans les donn es fra chement r cup r e OpenRefine a ensuite t de nouveau utilis pour construire des requ tes sur mesure afin de fouiller les donn es de l Internet Archive et de retrouver celles qui correspondaient aux donn es de l ADS ainsi 7 DST4L Class Notes Google Docs sans date en ligne Consult le 26 juillet 2014 Disponible l adresse https docs google com document d 1 WUZ4UwwRvSszcsODIwcEV7qAGNcOgjL 0DErFQ2MoBY edit pli 1 88 ERDMANN 2014 p 24 Another goal
43. donc transposer les pr suppos s id ologiques de leur concepteurs et les r infuser dans nos comportements lorsque ces algorithmes sont utilis s non plus seulement pour analyser des donn es sociales mais pour les g n rer Ces pr suppos s quels sont ils et comment les mettre jour Les algorithmes au regard critique de la sociologie L exemple de Google d sign comme la parangon des compagnies s appuyant sur les m thodes du Big Data nous para t embl matique de ce ph nom ne politique qui consiste revendiquer une objectivit dans le traitement des donn es en arguant du fait que les proc d s utilis s sont technologiques et non humains En r action cela Tarleton Gillespie crit dans son essai sur la pertinence des algorithmes Ce dont nous avons besoin c est d une interrogation des algorithmes en tant que caract ristique cl de notre cosyst me informationnel et des formes culturelles mergeant dans leurs ombres avec une attention particuli re por t e l endroit et la mani re avec laquelle l introduction d algorithmes dans nos pratiques de connaissance humaine peuvent avoir des ramifications poli tiques Dans un article intitul La subjectivit algorithmique et le besoin d tre in form Neal Thomas semble avoir r pondu Tarleton Gillespie Son analyse DAY Ronald E The Data It is Me Les donn es c est Moi dans CRONIN Blaise et SUGIMOTO
44. es au jeu avec les donn es The Pixel Hunt sans date en ligne Consult le 30 juillet 2014 Disponible l adresse http florentmaurin com p 471 DST4L Class Notes Google Docs sans date en ligne Consult le 26 juillet 2014 Disponible a l adresse https docs google com document d 1 WUz4UwwRvS5szcsODIwcEV7qAGNc0gjL oDErFQ2MoBY edit pli 1 FRANCE Biblioth que nationale de sans date BnF Les enjeux du web de donn es en biblioth que en ligne Consult le 2 novembre 2014 Disponible a l adresse http www bnf fr fr professionnels innov num web donnees a web donnees enjeux bi bliotheques html grapheprc3aats png Image PNG 1024 x 1024 pixels sans date en ligne Consult le 20 aout 2014 Disponible a l adresse https bibliotheques files wordpress com 2014 07 graphepre3aats png GULLIGAN Finbar Sans date Patron driven library Patron driven acquisition Research Information en ligne Consult le 3 d cembre 2014 HARRIS Jonathan KAMVAR Sep sans date We Feel Fine en ligne Consult le 20 ao t 2014 Disponible l adresse http wefeelfine org HICKEY Thomas B TOVES Jenny 2009 FRBR Work Set Algorithm v 2 0 OH OCLC Online Computer Library Center Inc Research division Consult le 4 aout 2014 a l adresse Web http www oclc org research activities past orprojects frbralgorithm 2009 08 pdf LAPOTRE Rapha lle DCB M moire d tu
45. es des biblioth ques C est ainsi que pour tenter d y r pondre il me faudra passer du je de l exp rience personnelle au nous du m moire d tude Lap tre Rapha lle DCB M moire d cembre 2014 11 A er JE Droits d auteur r serv s OU Qu est ce que les donn es des biblioth ques Pour parler des donn es des biblioth ques nous pourrions peut tre dans un premier temps nous pencher sur la question d une d finition plus g n rale de la donn e Si l on reprend en effet les mots de Lynda Kellam et Katharin Peter les donn es seraient toute information structur e d une mani re reconnaissable incluant donc la fois des informations qualitatives et quantitatives dont le point commun est d avoir t collect es trait es et organis es de fa on les rendre compr hensibles Lorsque l on parle de donn es cependant notamment dans le domaine de l administration et des biblioth ques il arrive souvent que l on ne d signe sous ce terme que des chiffres qu ils d signent des quantit s de quelque chose ou des agr gats de ces quantit s produits par synth se statistique comme le sont les totaux pourcentages moyennes et autres m dianes La plupart du temps ces chiffres se laissent entrevoir sous forme de tableaux et de graphiques le tableau pouvant tre consid r comme une forme de visualisation des donn es au m me titre qu un graphique D une certaine mani re il est donc diffic
46. exemple ou encore celui enti rement consacr la visualisation des donn es des biblioth ques publiques intitul Visualisation des donn es des biblioth ques utiliser donn es mais qui se r v lent n anmoins utiles Le pr sent chapitre traite de ces diff rentes options YAU Nathan 2013 Data visualisation De l extraction des donn es leur repr sentation graphique Editions Eyrolles p 65 47 How to Beat Bibliographic Data into Submission pt 2 Our group chose to work with Tableau for four main reasons 1 Stellar visualizations So pretty 2 You can work with multiple data sources simultaneously 3 It has a large visualization toolset and suit of graphics to choose from 4 Doesn t require a background in coding 148 BAUDIERE Marie 2013 Le biblioth caire son lu son directeur Marie Baudi re Biblioth que num rique de l Enssib Consult le 20 ao t 2014 Disponible l adresse Web http www enssib fr bibliotheque numerique documents 64142 le bibliothecaire son elu son directeur pdf 1 Ibid p 61 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 53 Droits d auteur r serv s OU les statistiques des biblioth ques publiques am ricaines Plus proche de nous le blog fran ais Biblioth que reloaded a consacr quelques pages sous la plume d Etienne Cavali 4 une exp rience de visualisation de donn es grace a l outil Gephi l auteur
47. http wefeelfine org Cf annexe p 103 figure 19 57 Dissertation Browser Information sans date en ligne Consult le 23 mai 2014 Disponible l adresse http www nlp stanford edu projects dissertations 158 Cf annexe p 104 figure 20 et 21 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 55 Nue ED EEE Droits d auteur r serv s OU pr sentation pour illustrer ce propos En effet des trois cas mentionn s de biblioth ques universitaires am ricaines c est le premier qui nous int resse le plus car la visualisation y est v ritablement consid r e selon sa dimension de repr sentation d un objet En l occurrence il s agissait d illustrer un probl me d espace dans la biblioth que probl me qui d ailleurs est plut t partag par un grand nombre de biblioth ques universitaires Afin de pouvoir offrir davantage d espaces de travail aux tudiants la direction de cette biblioth que a pris la d cision de d m nager les revues imprim es dans un magasin distant Il restait cependant faire accepter cette d cision la tutelle de la biblioth que en question ce qui passait n cessairement par une prise de conscience de sa part de la situation de contrainte spatiale tant donn que la d cision de d m nager les journaux imprim s taient venue de l analyse de quelques sources de donn es tr s divergentes crivent Elguindi et Mayer il a paru pr f rable d utilis
48. l quipe du SCD autour de la mission d crite dans une lettre de cadrage consistant a doter la biblioth que d un outil d aide la d cision centr sur la mesure de l activit et des performances du service comme l crit Nadine Delcarmine Tr s rapidement la r flexion sur le panel des indicateurs suivre et sur la n cessit d une large mobilisation des personnels dans des circuits de collecte et d analyse efficaces a conduit le SICD s engager dans une d marche pro fessionnelle hardie qui s est traduite par la mise en place de plusieurs outils techniques produits en interne ou issus du monde de l informatique d cision nelle business intelligence et aussi souvent que possible de la simplifica tion et de l automatisation des circuits 2 L utilisation d outils informatiques adapt s caract rise donc galement le syst me d valuation mise en place Grenoble En premier lieu il s agit du r f rentiel des indicateurs permettant de standardiser la collecte des donn es afin de permettre une utilisation long terme de ces derni res ainsi que des comparaisons avec d autres jeux de donn es cela s ajoutent deux bases de donn es une premi re destin e la collecte des donn es qui ne sont pas issues du SIGB mais relev es manuellement par les agents du SCD et une seconde r plique du SIGB mise jour continuellement et qui fournit les l ments statistiques sur les lecteurs le
49. l information la multi dimensionnalit des classifications et l individualisation de l exploration des connaissances la visualisation pourrait tre la r elle innovation apport e par le num rique et l re du Big Data la condition que l on admette que les m taphores de l arbre et du labyrinthe ont exist depuis Aristote mais que la visualisation des connaissances produite en temps r elle partir des donn es bibliographiques et sur le mod le de ces m taphores est quant elle nouvelle Au vu des nombreuses communications qui ont t faites dans ce s minaire de la CDU il nous semble que c est l l occasion parfaite pour pr senter quelques exemples de visualisations de l organisation des connaissances extraites de ce recueil Mais auparavant nous aimerions nous attarder sur les raisons pour lesquelles la visualisation nous para t tre fondamentale pour la navigation dans les collections La n cessit d une m taphore Dans un des articles introduisant le s minaire de la CDU portant sur la visualisation on peut lire Nous avons consid r la division des connaissances en sujets disciplines ou champs comme une pratique utile d j bien avant Aristote Ces divisions sont souvent organis es en m taphores qui en retour influencent notre com pr hension de la connaissance elle m me Structur es ou diffuses se chevau chant ou se s parant enracin es ou ouvertes en fractales ou en divisions ces m taphores
50. lesquels seules les multiples connexions entre les m tadonn es permettent de se d placer d une information une autre c est pr cis ment pour pouvoir se d placer plus facilement dans ce r seau que la tendance est en ce moment l ouverture des catalogues au web s mantique Enfin l o David Weinberger tente d expliquer que les nouvelles technologies utilis es par Amazon n imposent d sormais plus une vision unique de l ordre des connaissances mais permettent au contraire chacun de se constituer librement sa propre classification nous pourrions objecter que ce type de proposition ignore d lib r ment les pr suppos s inh rents aux algorithmes utilis s par Google et Amazon auxquels nous avons d j fait allusion dans la premi re partie de cette tude En somme nous pourrions dire que les g ants du net dans leur volont de faire parler les m tadonn es gr ces aux nouvelles technologies offertes par l re du num rique n ont fait que d placer la subjectivit et le caract re monopolistique propre la classification traditionnelle au champ de la navigation quotidienne que nous effectuons dans leur corpus de donn es De l universalit de la classification l individualit de la navigation Une autre des th ories d velopp es par David Weinberger consiste dire que le num rique nous ferait passer d une classification unidimensionnelle par n cessit physique une classification multidimensionnelle car
51. nous renseignent sur la mani re dont nous pensons la pens e et elles se pr tent elles m mes aux repr sentations visuelles qui construisent et renforcent nos notions de l ordre des connaissances 7 Scott B Weingart insiste sur les vertus cognitives des m taphores qui accompagnent depuis toujours l organisation des connaissances produites sur l univers Aristote consid rait d j la m taphore comme une figure de rh torique ayant la fois des vertus esth tiques et cognitives la m taphore doit permettre de rapprocher des objets qui n ont apparemment rien voir entre eux afin d apercevoir des ressemblances ou des affinit s entre deux concepts Umberto Eco prend l exemple de pirates m diterran ens que l on qualifierait de pourvoyeurs ou de fournisseurs le rapprochement nous incite en effet consid rer les pirates non plus sous l angle moral mais sous un angle conomique que l on n aurait pas envisag auparavant Quand Aristote crit il disait que l invention d une belle m taphore met sous les yeux pour la premi re fois un rapport in dit entre deux choses il voulait dire que la m taphore impose une r organisation de notre savoir et de nos opinions En r alit l arbre de Porphyre fait voluer le statut de la m taphore de repr sentation mentale et cognitive celui de repr sentation visuelle dont Johanna Drucker a d montr l utilit dans la diffusion et l avancement des sciences en ce
52. objets de nature similaire est ce qu on appelle un jeu de donn e Pourquoi parler des donn es des biblioth ques en 2014 La r volution du Big Data ou m gadonn es est toujours au c ur de l actualit en 2014 en t moigne la sortie le 20 f vrier dernier de la traduction fran aise du best seller de Kenneth Cukier et Victor Mayer Schoenberger sur le sujet Force est de constater que la notion de Big Data recouvre malgr cela une r alit bien difficile d finir Selon le Wikip dia anglais celle ci d signe un ensemble de processus de traitement de jeux de donn es dont le volume est tel qu il n est plus possible d employer les m thodes traditionnelles pour les traiter Cependant la taille des donn es du Big Data est toute relative comme l expliquent Cathy O Neil et Rachel Schutt dans leur ouvrage de r f rence Doing Data Science en r alit le big de Big Data peut d signer un petabyte au m me titre qu un terabyte ou un gigabyte seul importerait v ritablement le fait que la masse de donn e d passe la capacit de stockage et de vitesse de traitement des machines actuelles cette capacit voluant quant a elle avec son poque Plus concr tement si nous devions rester dans la perspective choisie pour cette tude a savoir la r utilisation des donn es notamment dans le but de conna tre et de piloter un ou plusieurs tablissements il conviendrait peut tre de retenir la d finition fournie par Ste
53. only Peer reviewed Journals Full Text Online 7 982 items not checked out 22 5 522 Refine My Results Resource Type Articles Conference Proceedings Reviews Books Newspaper Articles Text Resources Reference Entnes Other More options v Figure 30 Affichage Primo de restriction possible en r ponse une requ te LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 108 Table des annexes Document 2 NAVIGATION A FACETTES DDC Search Clear 3 klabarre_udcseminar2013 pdf sans date en ligne Consult le 8 septembre 2014 Disponible l adresse http www udcds com seminar 2013 media slides klabarre udcseminar2013 pdf LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 109 Droits d auteur r serv s Limited facets after Rich facets upon fate af aia ek aot eR Se ee Avenue Parmentier METRO VELOS LIBRE SERVICE CHAMPS ELECTROMAGNETIQUES RELAIS INTERNET HOTSPOTS WIFI MOBILE Boulevard Voltaire DISTRIBUTEURS PANNEAUX PUBLICITAIRES FEUX DE CIRCULATION TOILETTES PUBLIQUES CAMERAS DE VIDEOSURVEILLANCE TWEETS INSTAGRAM FOURSQUARE FLICKR Activit s en VOLTAIREQEON BLUM d irect Acc dez aux informations F Connect sur les personnes Sw OWOTTID EDHON HH pnd 2HOTTTHOLTTDN OLID Meto AROCEDNA OCIDO 0 ID _ Rechercher une donn s _ Rechercher une donn e SHOOTO OLID H H
54. que Synth tiser Dans son m moire Marie Baudi re met l accent sur une des pr occupation des directeurs de biblioth que en ce qui concerne leur communication en direction des lus savoir le fait d aller au plus court et au plus parlant Du fait de son caract re d imm diatet la repr sentation visuelle r pond bien cette contrainte temporelle inh rente la communication en direction des tutelles de la biblioth que Qui plus est la visualisation des donn es a vocation par d finition tre synth tique comme l crit Lev Manovich auteur d un article intitul Qu est ce que la visualisation L infovis utilise des l ments graphiques tels que des points des lignes droites des courbes et des formes g om triques simples afin de repr senter les objets et leur relations entre eux sans tenir compte de savoir s il s agit de personnes de leurs relations sociales des prix en bourse des revenus nationaux des chiffres du ch mage ou quoi que ce soit d autre Cependant le prix payer de cette capa cit est une extr me sch matisation nous rejetons 99 de la sp cificit de chaque objet pour n en repr senter qu 1 dans l espoir que ces 1 nous r v lent des ten dances parmi les caract ristiques de ces objets Choropleth Map Number of WorldCat Libraries by US County Year 2013 x Colors Green Yelow Red B Template design from www clearlyandsimply com Librar
55. que sa premi re ducation tait provinciale Le v ritable probl me est que toute carte de la connaissance implique que la connaissance ait une g ographie qu elle ait une vue surplombante qu elle ait une forme Ainsi les acheteurs ont ils acc s directement aux feuilles que sont les livres sans avoir passer par les n uds de l arbre que forme la classification Dewey Ils 8 Nous reprenons l le d but du titre d un recueil d essais publi par Umberto Eco ECO Umberto 2010 De l arbre au labyrinthe tudes historiques sur le signe et l interpr tation Paris Grasset 1 WEINBERGER 2008 Amazon wants to sell us books Its organization of its offering is not bound by underlying geography Amazon is able to treat its enormous collection of books that is the books it can get if someone wants a copy as a miscellaneous pile that can be digitally sorted to reflect the individual interests of each visitor This fundamental problem with Dewey s system is not that he was an eccentric or that his early education was provincial The real problem is that any map of knowlegde assumes that knowledge has a geography that it is a top down view that it has a shape p 135 ci rappel sous la forme d une carte ce qui n est pas incompatible puisque une carte est form e sur le m me principe qu un arbre classificatoire LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 65 Droits d auteur r
56. que les donn es g n r es par nos comportement pass s permettent d inf rer sur nos comportement futurs plus nous sommes amen s nous poser la question de ce que sont les donn es et de ce que peut tre un indicateur pour nous chercheur ou d cideur En somme plus nous r fl chissons sur les rapports entre les variables que nous produisons et ce qu elles sont amen es repr senter nos yeux plus une prise de d cision inform e par ces variables requiert une recherche davantage approfondie sur la biblioth que et son environnement Ibid p 54 C est d j le cas comme on pourra le constater dans la seconde partie de cette tude LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 39 Droits d auteur r serv s OU LES DONNEES UN ATOUT POUR LA GESTION D UNE BIBLIOTHEQUE La production de connaissances sur un tablissement est un atout pour son directeur qui pourrait alors par exemple tre en mesure d am liorer son fonctionnement Cette question de connaissances sur la biblioth ques entra ne donc naturellement une autre interrogation qui pourrait tre formul e de cette mani re dans quelle mesure les donn es peuvent elles informer les d cisions relatives la gestion d une biblioth que Et si l on inclut dans ce que l on entend par gestion d une biblioth que la communication autour de son activit quel peut tre cet gard l apport de la science des donn es et notamment
57. s est en effet propos de cartographier le r seau documentaire de son SCD figure ci dessous Figure 4 Visualisation d un r seau de SICD par tienne Cavalier La visualisation des donn es conna t donc un succ s grandissant notamment dans le milieu des biblioth ques Nous nous proposons d s lors de tenter de donner quelques l ments d explication ce succ s S duire Comme l crit Marie Baudi re dans son m moire pour le directeur de la biblioth que le principal objectif de ses contacts avec son lu est le convaincre Les strat gies de communication qu il d ploie pour cela sont multiples car l asym trie de son rapport hi rarchique avec l lu lui impose une plus grande cr ativit la question des strat gies de conviction de la prise en compte de l interlocuteur dans la construction de l argumentaire au management de l lu se rapproche parfois de celle de la s duction ou de la manipulation 80 Visualizing Network Flows Library Inter lending hangingtogether org sans date en ligne Consult le 3 juin 2014 Disponible l adresse http hangingtogether org p 3053 S Library Data Visualization sans date en ligne Consult le 20 mai 2014 Disponible l adresse http librarydatavisual blogspot fr 12 CAVALI Etienne sans date Mais que fait Gephi Biblioth ques reloaded en ligne Consult le 17 juillet 2014 Disponible l adresse
58. sente les concepts les plus re pr sentatifs Les concepts qui leurs sont li s sont calcul s partir du proces sus d apprentissage et sont plac s dans les cellules avoisinantes Les algorithmes de regroupement et de calcul de distances permettent de faire merger les relations entretenues par plusieurs concepts entre eux et de l font appara tre une organisation des connaissances Les visualisations qui sont produites partir de ces op rations font appara tre de nouvelles hi rarchies entre les id es et permettraient ainsi de d couvrir des associations inconnues jusqu alors Ces visualisations sont donc bien souvent en forme de r seaux s mantiques de labyrinthes en rhizomes si l on voulait employer l expression d Umberto Eco mais ont l inconv nient d tre assez d sordonn es Il est donc n cessaire de les simplifier au maximum ce qu ont propos Lin et Ahn avec l Expansion Visuelle de Requ te EVR dont le principe est de restreindre le r seau d un concept ses cinq relations les plus importantes le chiffre cing tant choisi arbitrairement Contrairement la recherche facettes d velopp e plus haut ces visualisations de structures de connaissances labor es partir de techniques d extraction de donn es telles que d velopp es dans les exemples que nous venons de citer ne permettent pas v ritablement de naviguer dans les collections d une biblioth que l exception peut tre de
59. site is reco rd strictly forbidden without the permission of the University of Illinois and the holder of the copyright in the original manuscript where copyright in the original manuscriptis held by another party Please contact the University of Illinois Archives at illiarch uiucedu for more information Toolkit e Query builder TreeGraph About the project Table des annexes Be Library Observatory Library Observatory enables users to scan the diverse collections of the DPLA and discover items of particular interest To get started click in the nested graph below rovider P a2 University of Illinois at x LE Urbana Champaign collection James Reston Papers z format LEP ES mang 17 7 12 8lack and white photographs O 1933 1937 O Tom Domrud s Bake Shop Company 722 of Hovland Civilian Conservation Corps Camp Hadar 5x31 Studio portrats O 9130 Representative Charles L Sawyer 1913 2914 Legislative Session Minnesota Legislature mO O Representative Tom E Davis 1917 1918 Legislative Session Minnesota Legislature 5x3 7 Black and white photographs 1810 Bebresetaie Ton FN RATES ER sou Tere 1907 O O Representative Charles L Sawyer 1907 1908 Legislative Session Minnesota Legislature 19150 O Representative Charles L Sawyer 1915 1916 Legislative Session Minnesota Legislature saar sido ponams O 1841 O O Representative Noah W Sawyer 1941 1942 Legislative Session Minnesota Legislature pansi 140 O Represen
60. t r sidant sans doute dans un outil sur mesure de publication de rapports permettant d aller au del des simples rapports sommaires que l on peut observer par exemple sur l outil Cognos Prenons ainsi l exemple d une enqu te annuelle men e dans la biblioth que universitaire intitul e Qui pose des questions et o Durant quatre cycles par an d une dur e d une semaine chacun la biblio th que collecte des donn es sur diverses sortes de questions pos es des points de services ou des bureaux de biblioth caire En m me temps que les questions nous comptons galement le nombre de documents emprunt s et rang s de m me que le nombre de sorties de nos diff rents sites sur le cam pus Nous avons remarqu que ces donn es sont corr l es de mani re tr s si gnificative et le renouvellement annuel des comptes permet d observer r gu li rement les relations qui existent entre elles Ces donn es sont utilis es pour donner des estimations comme par exemple la fr quence des usages sur place des collections Mieux les comptes nous permettent d valuer la distri bution la variation et les changements dans les services de r f rence disper s es dans les communaut s que nous desservons et leur biblioth que M8 Thid In so doing the study has led us to consider how usage data could help define and answer the fundamental questions of collection development are we collecting what our user need
61. un outil de navigation dans les collections l oppos les algorithmes des grands acteurs du domaine de l information sur le net parce que concus scientifiquement permettraient un acces neutre au savoir et laisseraient tout loisir ses utilisateurs de classer la connaissance et le r el selon leurs propres sch mas mentaux Mais si l on soutient au contraire l id e que la mani re avec laquelle le monde acc de a l information aujourd hui serait moins le r sultat d une volution technologique r cente que celui d une volution philosophiques d j ancienne quel peut tre l apport r el de la science des donn es l exploration des connaissances aujourd hui La CLASSIFICATION D CIMALE UNIVERSELLE CDU LA RECHERCHE D UNE M TAPHORE VISUELLE En 2013 s est tenu La Haye un s minaire organis par le consortium UDC c est dire l organisme d diteurs qui est en charge de la gestion de la Classification D cimale Universelle cette classification labor e par les juristes belges Paul Otlet et Henri La Fontaine et dont le but tait l origine de reprendre la classification d cimale de Dewey ainsi que de la rendre plus exhaustive gr ce la cr ation d indices plus complexes Portant sur la classification et la visualisation ce s minaire tait le quatri me d une s rie d v nements destin s faire avancer la recherche en mati re de classifications bibliographiques mais aussi promouvoir un dialogue en
62. 0 2 WEINBERGER 2008 Everything Is Miscellaneous The Power of the New Digital Disorder Op cit LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 n 66 Les Donn es un outil de navigation dans les collections d ailleurs pr t conc der Cependant il ne semble pas remarquer cette nouvelle g ographie du savoir h rit e de leur tradition a savoir le labyrinthe en rhizome mis en lumi re par Umberto Eco un mod le en r seau pr voit la d finition de chaque concept repr sent par un terme grace a l interconnexion de tous les autres concepts qui l interpr tent chacun se tenant pr t devenir le concept interpr t par tous les autres L encyclop die est bien fond e sur ce syst me notamment travers le syst me de l index qui permet le renvoi d une notion une autre ind pendamment de leur classement alphab tique Or Eco souligne que c est pr cis ment cette conception du savoir en r seau qui est l origine des ontologies utilis es dans l Intelligence Artificielle et par extension dans les nouvelles technologies num riques Par l peut on dire que ce ne serait pas ces nouvelles technologies qui sont l origine de notre conception labyrinthique du savoir mais plut t l inverse l image du Web sur le mod le duquel elles ont t con ues les biblioth ques num riques ainsi que les catalogues en ligne sont donc form s en vastes r seaux labyrinthiques dans
63. 2 12 data artifacts rising cultures of collecting from preservation to participation MALPAS Constance sans date Sliding scale mapping local group and system wide library infrastructure hangingtogether org en ligne Consult le 21 juillet 2014 Disponible l adresse http hangingtogether org p 3149 mbattles_udcseminar2013 pdf sans date en ligne Consult le 1 septembre 2014 Disponible a l adresse http www udcds com seminar 2013 media slides mbattles udcseminar2013 pdf Penn Library Data Farm sans date en ligne Consult le 13 mai 2014 Disponible l adresse http datafarm library upenn edu Penn Library Graduate Student Workshops sans date en ligne Consult le 16 ao t 2014 Disponible l adresse http datafarm library upenn edu desksurvey index html PRENTICE Jennifer ALSTINE Colin Van BENSON Amy et FORD Jacqueline 2013 ADS Monograph Matches in the Internet Archive Excel en ligne juin 2013 Consult le 19 ao t 2014 Disponible l adresse http figshare com articles ADS Monograph Matches in the Internet Archive 7 10921 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 94 Bibliographie SAO NASA ADS Custom Query Form sans date en ligne Consult le 19 ao t 2014 Disponible l adresse http adsabs harvard edu abstract service html Sizing Up Big Data Broadening Beyond the Internet sans date Bits Blog e
64. 5 Data set 2014 Wikipedia the free encyclopedia en ligne Consult le 14 d cembre 2014 Disponible a l adresse http en wikipedia org w index php title Data_set amp oldid 625099781 Page Version ID 625099781 Fouille de textes 2014 Wikip dia en ligne Consult le 14 d cembre 2014 Disponible a l adresse http fr wikipedia org w index php title Fouille_de_textes amp oldid 107660108 Page Version ID 107660108 Indicateur 2014 Wikip dia en ligne Consult le 9 novembre 2014 Disponible a l adresse http fr wikipedia org w index php title Indicateur amp oldid 106207898 Page Version ID 106207898 Ontologie informatique 2014 Wikip dia en ligne Consult le 14 d cembre 2014 Disponible a l adresse http fr wikipedia org w index php title Ontologie_ informatique amp oldid 109058774 Page Version ID 109058774 Repr sentation graphique de donn es statistiques 2014 Wikip dia en ligne Consult le 12 d cembre 2014 Disponible a l adresse http fr wikipedia org w index php title Repr C3 A9sentation graphique de donn C3 AYVEs_statistiques amp oldid 108854835 Page Version ID 108854835 Rhizome philosophy 2014 Wikipedia the free encyclopedia en ligne Consult le 14 d cembre 2014 Disponible a l adresse http en wikipedia org w index php title Rhizome_ philosophy amp oldid 637871872 Page Version ID 637871872 Sp cifications fonctionnelles des notice
65. 914 La Feuille des jeunes Naturalistes Tom 33 p 202 13530 O Ingles amp Sawyer 1937 12 30 O O Sawyer Memorial Baptist Cope SC anes aga An Mas asec far o al RENZI Negatives photographic O 1974 0508 O 8 Hennepih County Commissions Ton Siion sed Shei Bonald Smedt in parade Mesa o nO Address delivered by Hon FA Sawyer upon the common schools what they can do fora sta wae 193 Printed pamphlet ard broadside announcing the candidacy of Tom B Pearce for governor Prints visual works Hand colaringmage jpeg 1821 The Royal Exchange Tom pointing out to Jerry a few of the primest features of Life in London 14 Studio portraits O 1973 O O Portrait of Tom O Connor Mankato Minnesota 10O Letter to Tom Taylor 1881 undefined O 1898 Celia John Shaw Billings and Tom Reed 1898 1983 05 O Oral history with Tom and Hermina Waring format creator James B Reston Transcript typescript rights Digital publication of this manuscript is Copyright 2007 Board of Trustees of the objects University of Illinois This resource is provided for research consultation and for scholarly purposes only Further distribution and or any commercial use of the works from this site is reco rd strictly forbidden without the permission of the University of Illinois and the holder of the copyright in the original manuscript where copyright in the original manuscriptis held by another party Please contact the Universi
66. C View all formats and languages Langue ditions et formats 5 Hamlet de Laurence Olivier Basil Sydney Eileen Herlie Norman Wooland Felix Aylmer Terence Morgan Jean Simmons Desmond Dickinson Helga Cranston William Walton Roger Furse Roger Ramsdell William Shakespeare Janus Films J Arthur Rank Enterprise Firm Two Cities Films Criterion Collection Firm i vue i Langue An diteur Irvin VD View all formats and languages 1948 iterion Collection Base de don Qramusr Document View all formats and languages University Press Editions et formats T Hamlet de Kenneth Branagh William Shakespeare E Livre View all formats and languages Langue Anglais HAMLET W Norton amp Co ridCat Editions et formats Figure 12 Suggestions de WorldCat pour Hamlet 2 R sultats pour su Hamlet Legendary character Drama WorldCat org sans date en ligne Consult le 8 septembre 2014 Disponible a l adresse http www worldcat org search q su 3AHamlet 28Legendary character29 Drama amp qt hot subject LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 98 Table des annexes Document 2 SUGGESTIONS D AMAZON POUR HAMLET Produits fr quemment achet s ensemble Prix pour les trois EUR 6 00 Afficher la disponibilit du produit et le mode de livraison Cet article Hamlet d
67. Can usage data help us pinpoint these needs Have we sufficiently served both our faculty and students Do ILL requests represent collections failures or user wants beyond the scope of current collection policies By helping to provide fresh insights into these questions the ultimate goal of this study was to refresh the dialogue between selectors and users and to re energize library colection development thinking 11 Penn Library Data Farm sans date en ligne Consult le 13 mai 2014 Disponible l adresse http datafarm library upenn edu 12 Penn Library Graduate Student Workshops sans date en ligne Consult le 16 ao t 2014 Disponible l adresse http datafarm library upenn edu desksurvey index html 121 Ibid In four week long cycles each year the Library collects data on various kinds of questions asked at service points and librarian offices Along with questions we count the number of items circulated and reshelved as well as the number of exits from our campus locations We have found that these data are highly correlated and the annual renewal of counts helps to monitor the relationships between them These data are used to estimate outputs such as the LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 46 Les donn es un atout pour la gestion d une biblioth que Voil donc ce qu il nous semble un exemple approfondi d valuation par un dispositif de collecte syst
68. E Etienne sans date Mais que fait Gephi Biblioth ques reloaded en ligne Consult le 17 juillet 2014 Disponible l adresse http bibliotheques wordpress com 2014 07 03 mais que fait gephi LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 92 Bibliographie Choropleth US libs by county jpg Image JPEG 1017 x 653 pixels Redimensionn e 96 sans date en ligne Consult le 21 ao t 2014 Disponible l adresse http hangingtogether org wp content uploads 2013 07 Choropleth_US_ libs by county jpg COHEN Dan 2012 Visualizing the Uniqueness and Conformity of Libraries Dan Cohen en ligne 13 d cembre 2012 Consult le 11 juin 2014 Disponible a l adresse http www dancohen org 2012 12 13 visualizing the uniqueness and conformity of libraries Content Management Services for Libraries and Publishers sans date en ligne Consult le 8 d cembre 2014 Disponible l adresse http www swets fr Data Mining Big Data A Strategy for Improving Library Discovery Blog Serials Solutions sans date en ligne Consult le 9 mai 2014 Disponible a l adresse http www serialssolutions com en words detail data mining big data a strategy for improving library discovery Dissertation Browser Information sans date en ligne Consult le 23 mai 2014 Disponible a l adresse http www nlp stanford edu projects dissertations Du jeu de donn
69. E Rapha lle DCB M moire d tude d cembre 2014 36 Les donn es une r volution pist mologique pour les biblioth ques Dav ae record i objects formats collectior providers Find something interesting whilst exploring collection Take a screenshot and share it on our Underwood amp Underwood Glass Stereograph Collection 1895 1921 Anthropology Smithsonian American Art Museum Collection Figure 2 Visualisation g n r e par un usager de l Observatoire de la biblioth que anomalie du type register dans la classification arborescente de la Smithsonian Institution Apr s avoir fait remarquer que la carte arborescente r v lait une tendance institutionnelle de la part de la Smithsonian Institution privil gier l anthropologie Matthew Battles commente ainsi L impasse o m ne le type registre peut refl ter une erreur dans l ingestion de donn es ou des d saccords entre les mod les de donn es de la Smithsonian Institu tion et la DPLA Les tailles vari es des collections refl tent peut tre la significa tion relative de certains objets dans le programme de d veloppement des collec tions mais nous ferions bien de nous rappeler que la DPLA est une m ga m ta collection d objets num riques elle r v le non seulement les habitudes de collecte de ses institutions partenaires mais aussi la concentration et la vitesse relative des efforts de num risation de toutes
70. FF Thierry EVANS Christophe ION Christina PICARD David Georges RAPATEL Livia TESNIERE Val rie Quel mod le de biblioth que 2008 Presses de l ENSSIB ISBN 9782910227739 THOMAS Neal 2012 Algorithmic subjectivity and the need to be in formed dans LATZKO TOTH Guillaume MILLERAND Florence TEM 2012 Proceedings of the Technology amp Emerging Media Track Annual Conference of the Canadian Communication Association Waterloo May 30 D June 1 2012 Consult le 3 aout 2014 http www tem fl ulaval ca www wpcontent PDF Waterloo_2012 THOMASFTEM 2012 pdf TILLICH Paul et GOUNELLE Andr 2012 Dynamique de la foi Gen ve Qu bec Paris Ed Labor et fides les Presses de l Universit Laval diff les d du Cerf ISBN 9782830914801 2830914805 9782763796024 2763796028 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 90 Bibliographie TUFTE Edward 2001 The Visual Display of Quantitative Information Graphical Excellence Cheshire Connecticut Graphics Press WEINBERGER David 2008 Everything Is Miscellaneous The Power of the New Digital Disorder Henry Holt and Company ISBN 9780805088113 WEINGART Scott B From trees to webs uprooting knowledge through visualization dans NTERNATIONAL UDC SEMINAR SLAVIC 2013 WRIGHT Alex 2008 Glut Mastering Information Through the Ages Cornell University Press ISBN 0801475090 YAU Nathan 2013 Data visualisation D
71. Internet Archive Excel en ligne juin 2013 Consult le 19 ao t 2014 Disponible l adresse http figshare com articles ADS Monograph Matches in the Internet Archive 710921 12 How to Beat Bibliographic Data into Submission pt 2 143 Internet Archive Search Engine Sans date Consult le 19 ao t 2014 Disponible l adresse Web http archive org advancedsearch php raw 144 SAO NASA ADS Custom Query Form sans date en ligne Consult le 19 ao t 2014 Disponible a l adresse http adsabs harvard edu abstract_service html 145 ERDMANN 2014 OpenRefine is a helpful stepping stone to the more advanced training in Python The OpenRefine interface allows you to run simple funcions and regular expressions while hiding some of the complexities of programming It also allows you to perform some data analysis p 23 146 Cette distinction que nous faisons entre visualisation pr te l emploi et sur mesure provient de l ouvrage de Nathan Yau Certains logiciels de type glisser d placer sont pr ts l emploi D autres n cessitent un peu de programmation Cependant il existe aussi des outils qui n ont pas t con us sp cifiquement pour les graphiques de LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 52 Les donn es un atout pour la gestion d une biblioth que permet en effet de charger les donn es sur son serveur puis de cr er un affichage interactif des donn es et
72. Journal 2010 Vol 2 n 1 pp 1 50 Consult le 6 ao t 2014 Disponible l adresse Web http www johannadrucker com pdf graphesis 2011 pdf The instrumental use towards specific ends and tasks that characterizes bureaucratic adoption of statistical methods and their graphic representation shifts the management of information from an intellectual to a political sphere We can discern the ideological aspect of any scientific inquiry but the applied use of information management makes use of the cultural authority in statistical graphics in a way that exceeds the qualified reservations of scientific method p 15 16 7 TUFTE Edward 2001 The Visual Display of Quantitative Information Graphical Excellence Cheshire Connecticut Graphics Press p 13 Les diagrammes en barre par exemple proviennent du champ des analyses et fonctions statistiques tandis que les structures arborescentes sont le fait de la biologie volutionnaire et de la g n alogie 7 DRUCKER 2010 But the cultural history of information graphics diagrams maps charts and other schematic images is a rich field to mine for productive models within the horizon of the theoretical tools provided by the humanities p 25 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 32 Les donn es une r volution pist mologique pour les biblioth ques Un changement pist mologique Par le simple fait qu elle permet d embrasser du regard l ens
73. L acte fondateur d une biblioth que crit Benoit Tuleu est toujours un geste politique En France historiquement le chef politique est quelqu un qui veut laisser sa trace historique dans la pierre des batiments et si possible dans celle des monu ments publics La biblioth que joue ce r le mais aussi participe au dessin d un centre ville structure un quartier devient un rep re toponyme pour les habitants qui en sont donc tous un peu usagers Avec Beno t Tuleu nous aimerions affirmer que tout difice d acc s la connaissance qu il soit physique ou virtuel monumental ou algorithmique comporte un pr suppos politique qu il transpose dans cet difice De ce fait m me l re d internet et d une navigation individuelle travers une information fragment e la subjectivit qui autrefois tait inh rente la classification est d plac e au niveau des algorithmes et des adaptations et appropriations qu ils impliquent chez leurs utilisateurs quant leur comportement de recherche En cons quence de m me que le geste architectural travers la construction d une biblioth que avait pour r le d exprimer et de rendre visible une vision politique sous jacente un projet relatif la connaissance de m me le geste visuel peut il permettre d exprimer m taphoriquement dans l espace virtuel cette vision politique tout en lui conf rant une visibilit par la captation de l attention des in
74. Le d bat La chandelle de Jefferson sans date en ligne Consult le 7 ao t 2014 Disponible l adresse http le debat gallimard fr articles 2012 3 la chandelle de jefferson 6 Jbid 87 Ibid 88 Nous renvoyons au m moire de Cl ment Tisserand sur le sujet TISSERANT Cl ment 2013 Domaine public et biens communs de la connaisance Sous la direction de Cristina Ion Disponible l adresse Web http www enssib fr bibliotheque numerique documents 64245 domaine public et biens communs de la connaissance pdf BATTLES Matthew 2013 Data artefacts tracking knowledge ordering conflicts through visualization dans INTERNATIONAL UDC SEMINAR Slavi Aida et UDC CONSORTIUM THE HAGUE d 2013 Classification amp visualization interfaces to knowledge proceedings of the International UDC Seminar 24 25 October 2013 The Hague the Netherlands organized by UDC Consortium The Hague W rzburg Ergon This paper introduces the expression data artefact with the understanding that artefact has at least three meanings In technical language an artefact in data is an inadvertent product of human processes of organization and management From a cultural perspective an artefact is a designed object situated in a cultural context Finally from a historical perspective an artefact is an evidentiary trace in a forensic encounter with the past Never raw all data carry traces of human labor interpretations and v
75. One of the popular methods used to extract knowledge structures is the self organizing mapping alhorithm SOM developed by Teuvo Kohonen Kohonen 1990 The algorithm makes use of an artificial neural network that can be trained from the feature vectors of the text data set at the positions of the concept extraction Kaski et al 1998 The trained map includes a number of cells that represent most representative concepts Related concepts are calculated from the training process and they are placed in the neighbouring cells p 80 36 Cf annexe p 110 figure 31 237 LIN AHN 2013 p 83 cf annexe p 108 figure 28 38 Thid This way the user picks up terms to build the query semantic AND verbal learning AND cognition to search in PubMed p 83 239 Tag Galaxy sans date en ligne Consult le 9 septembre 2014 Disponible l adresse http taggalaxy de 40 RAZPOTNIK SAUPERL 2013 p 216 219 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 74 Les Donn es un outil de navigation dans les collections Cette fois ci cependant nous pouvons descendre jusqu au niveau du document dont le visuel est lui m me int gr la repr sentation contrairement a l EVR pour lequel la visualisation s arr te simplement la construction de la requ te Tag Galaxy est en effet un explorateur visuel utilis par Flickr afin de permettre ses utilisateurs de naviguer plus facilement dans l amas s
76. RE Rapha lle DCB M moire d tude d cembre 2014 31 Droits d auteur r serv s OU UNE MANIERE INNOVANTE DE PRODUIRE DES CONNAISSANCES SUR LES BIBLIOTH QUES LA VISUALISATION DE DONNEES Les humanit s num riques apportent un cadre critique aux nouvelles possibilit s introduites par les outils du Big Data et permettent de renouveler la mani re de produire des connaissances notamment par le biais d une visualisation des donn es prenant en compte la subjectivit de l observateur L exemple de l Observatoire de la Biblioth que d velopp par le Metalab d Harvard illustre ce propos La visualisation au regard critique des humanit s num riques D s le d but du XIX si cle l administration fran aise a rendu famili re la visualisation de donn es ou plus exactement certaines de ses composantes que sont les graphiques et les cartes Sous Napol on l administration est en effet grande consommatrice de statistiques l instrumentalisation de ces derni res au service de desseins politiques ont loign pendant longtemps la possibilit d un regard auto critique et scientifique sur cette discipline comme l crit Johanna Drucker dans son essai intitul Graphesis la production et la repr sentation visuelle de connaissances L h ritage positiviste et politique qui sous tend donc l emploi de la visualisation donn es conduit ses premiers th oriciens en revendiquer l objectivit et l auto vidence l i
77. RED Consult le 2 ao t 2014 http archive wired com science discoveries magazine 16 07 pb theory TULEU Beno t 2011 Trop loin trop proche en ligne 1 janvier 2011 Consult le 11 d cembre 2014 Disponible a l adresse http bbf enssib fr consulter bbf 20 1 1 02 0014 002 SITES INTERNET Amazon fr Hamlet sans date en ligne Consult le 8 septembre 2014 Disponible a l adresse http www amazon fr s ref nb_sb noss 1 mk fr FR C3 8BS5M C3 85 CS5 BD C3 9I5 C3 9I amp url search alias 3Daps amp field keywords Hamlet About metaLAB at Harvard sans date en ligne Consult le 7 ao t 2014 Disponible l adresse http metalab harvard edu about ADMIN 2012 Data Mining Research Area en ligne 4 ao t 2012 Consult le 29 janvier 2014 Disponible a l adresse http oclc org research activities mining html ANDERSON Rick sans date What Patron Driven Acquisition PDA Does and Doesn t Mean An FAQ The Scholarly Kitchen en ligne Consult le 6 d cembre 2014 Disponible l adresse http scholarlykitchen sspnet org 2011 05 31 what patron driven acquisition pda does and doesnt mean an faq Astronomy Texts in the Internet Archive sans date Tableau Software en ligne Consult le 21 ao t 2014 Disponible l adresse http public tableausoftware com views AstronomyTextsintheInternetArchive Wh atwasthetopdownloadedastronomywork show VizHome no CAVALI
78. S Emmanuel 2012 L attention au monde Sociologie des donn es personnelles l re num rique Armand Colin LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 76 Les Donn es un outil de navigation dans les collections a la vraie vie mais ils ne sont que des moyens de sortir d une conomie de l at tention pure 4 Le contexte num rique actuel est donc d crit comme une conomie de l attention pure selon les mots de Richard Lanham cit s par Kessous On pourrait objecter a cela que le livre d Emmanuel Kessous est une sociologie il se contente de d crire et d expliquer un ensemble de conception dont il fait une nouvelle cit venant s ajouter aux autres et ob issant des principes sup rieurs communs En ce sens il ne d crirait pas tant une nouvelle r alit qu une nouvelle pens e conomique N anmoins c est bien dans ce cadre de l conomie de l attention qu Emmanuelle Berm s d crit tr s justement ce qu il nous semble les probl mes actuels des biblioth ques Elle d crit en effet le monde de l information en utilisant la m taphore du milieu urbain l instar de la biblioth que physique implant e dans son environnement urbain la biblioth que virtuelle implant e dans l environnement d Internet doit se signaler se rendre visible Sur le r seau que l on peut percevoir comme un vaste espace d information dans lequel les internautes naviguent en s
79. TION PIST MOLOGIQUE POUR LES BIBDIOTH QUES 2 iicitatinutinnunnuiinuiiiminianitinantiunaiuuduatunin 19 Les donn es parlent elles d elles m mes sssssseeee 19 Des tudes de publics aux acteurs du Big Data 19 La pr tention GT OD CCHIT iis icicles hers oeenioa a 21 Les algorithmes au regard critique de la sociologie 24 L exemple de l Online Computer Library Center OCLC ssssssssssss 27 Une section consacr e l extraction et l analyse de donn es 27 L algorithme Work Set FRBR Ds tombes 28 Une des publications de l OCLC Livres sans fronti res 31 Une mani re innovante de produire des connaissances sur les biblioth ques la visualisation de donn es 32 La visualisation au regard critique des humanit s num riques 32 Un changement CHISTCINOLO SIGUE ss nm 33 L exemple de l Observatoire Biblioth que ss 34 Conclusion De la connaissance la d cision 38 LES DONN ES UN ATOUT POUR LA GESTION D UNE BIBLIO PHROUE nommant 41 S appuyer sur l analyse de donn es pour valuer la biblioth que 41 De la macro la Micro ondes 42 Quelques exemples innovants d analyse des donn es en biblioth que 45 Penser les donn es des biblioth ques non comme des indicateurs mais comme des symboles de son GCTIVILC wvasscesivszocscatasvasuretasnineraalecedaaesicommucdapailecssnareCona iets 47 DST4L un exemple de formation sp cialement con ue pour des biblioth cairesS e soe
80. a Viktor Mayer Schoenberger et Kenneth Cukier introduisent le sujet de leur livre par ces mots Le ph nom ne des m gadonn es d signe tout ce qui peut tre fait une large chelle et non une chelle plus r duite afin d extraire de nouvelles connaissances ou de cr er de nouvelles formes de valeur bouleversant ainsi les march s les organismes les relations entre citoyens et gouvernements et bien plus Parce qu elles peuvent tre vues comme des institutions massivement productrices de donn es il semble difficile d envisager que les biblioth ques ne soient pas elles m mes touch es d une mani re ou d une autre par cette r volution La question est donc de savoir quel peut tre l apport v ritable du Big Data notamment pour la production de connaissances portant sur les biblioth ques L existence de la section de fouille exploratoire de donn es data mining de l OCLC montre que le monde de la documentation commence effectivement s int resser ces nouvelles m thodes Reste savoir dans quelle mesure ces innovations seraient r ellement r volutionnaires serait ce parce qu elles conf reraient davantage d objectivit comme le pr tendent certains auteurs ou plut t parce qu elles permettent par le biais de la visualisation de donn es de r v ler des aspects des biblioth ques qui jusqu pr sent taient rest s ignor s LES DONN ES PARLENT ELLES D ELLES MEMES Parce que les m
81. a lle DCB M moire d tude d cembre 2014 63 tte EI EEE Droits d auteur r serv s OU repenser la mise en espace de la biblioth que num ris e en d veloppant des m taphores de navigations sp cifiques Nous nous proposons donc en dernier lieu d observer dans quelle mesure la visualisation des collections est effectivement un atout pour la communication de la biblioth que mais aussi pour la navigation dans les collections apr s avoir expos plusieurs exemples de visualisations exp rimentales partir de la classification UDC nous d velopperons des vues plus personnelles sur ce qu il nous para t int ressant d envisager l avenir pour naviguer dans les collections l aide des donn es DE LA CLASSIFICATION LA NAVIGATION Dans son essai intitul Tout est fragment David Weinberger d veloppe l id e que le bouleversement apport par l volution vers le num rique ne r side pas tant dans la mutation de l information en elle m me que dans l acc s l information proprement parler C est ainsi que pour le d montrer il compare Amazon Melvil Dewey En soi Amazon est aussi loign que possible d une biblioth que appli quant la classification Dewey Dewey a cr une mani re unique de regrouper les livres Amazon t che d en trouver autant que possible Melvil Dewey s est charg lui m me de la conception du syst me Amazon quant lui laisse tout le monde cr er se
82. act ris e par le fait que l on puisse placer un m me objet plusieurs endroits diff rents de la classification Il illustre son id e de cette mani re Mettons que vous vouliez un exemplaire du Livre de cuisine de la Petite Maison dans la Prairie la Cuisine de la Fronti re d apr s le classique de Laura Ingalls de Barbara Walker Si vous cherchez le titre la Biblioth que Publique de New York vous trouverez cinquante deux exemplaires r partis dans ses nombreuses an nexes La plupart le range dans la section jeunesse Si vous souhaitez voir tous les livres portant la fois sur la cuisine et sur l his toire sans sp cifier que ces livres doivent tre pour enfants ou tre associ s a un classique de la litt rature Amazon construira avec joie cette liste pour vous C est 207 Tl voque effectivement mais de mani re assez br ve les encyclop distes WEINBERGER 2008 p 25 28 ECO 2010 p 79 2 Thid p 82 83 Dans le cadre des recherches les plus r centes de l Intelligence artificielle et des sciences cognitives le th me des r seaux s mantiques a donn naissance une th orie des ontologies En d pit de son utilisation impropre ce concept d ontologie dont la signification philosophique est toute autre d signe l organisation cat goriale d une portion d univers qui prend la forme de n importe quel arbre classificatoire ou r seau s mantique 210 Le web s mantique est lui m me fond su
83. aient donc plus grandes que dans le monde physique Pour l auteur ce bouleversement se caract rise par trois propri t s offertes par le 1 Ibid p 59 1 WEINBERGER 2008 197 Jbid Amazon itself is about as far from a Dewey compliant library as one can get Dewey created a single way to cluster books Amazon finds as many ways as it can Melvil Dewey took the design of the system upon himself Amazon lets anyone create her own category give it a fun name and publish it Dewey prized neatness and order bowing to the metric gods when he created a system based on multiples of ten Amazon likes a friendly disorder stuffing its pages with alternative ways of browsing and offbeat offers peculiar to each person s behavior When you go to find a book in a Dewey based library you may be delighted to find another book on the same topic next to it on the shelf when you go to buy a book at Amazon the planned serendipity shows you a far wider range of books determined by Amazon s editors algorithms and fellow shoppers Dewey s system prizes the stability that comes with the physical world books on bookshelves white ink on spines Amazon prides itself on its ability to cluster and recluster instantly p 132 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 64 Les Donn es un outil de navigation dans les collections num rique d abord la remise en cause d un syst me unique de classification de l univers p
84. aire d une race appartenant elle m me la sous esp ce des canid s relevant quant elle de l esp ce mammif re cette derni re s inscrivant au niveau sup rieur dans le genre animal La classification Dewey est elle m me organis e selon ce mod le puisque elle divise la connaissance en grands domaines appel s classes regroupant philosophie religion sciences sociales sciences de la nature et math matiques etc ces classes connaissant des divisions en disciplines et sous disciplines etc jusqu en arriver l exemplaire unique du livre Les livres dans ce contexte repr sentent les feuilles de l arbre classificatoire Or tout le propos de David Weinberger consiste dire que l volution vers le num rique tend supprimer la m taphore unique de l arbre pour ne garder que les feuilles que l on peut alors r organiser souhait selon ses propres cat gories Il donne l exemple de la musique pour illustrer son propos Amazon veut nous vendre des livres L organisation qu il donne a son offre n est pas contrainte par une g ographie sous jacente Amazon est capable de traiter son norme collection de livres savoir les livres qu il peut se procurer si quelqu un en veut un exemplaire comme un amas h t rog ne qui peut tre num riquement class afin de refl ter les int r ts individuels de chaque visiteur Le probl me fondamental de Dewey ne r side pas dans le fait qu il tait un excentrique ou
85. alues p 244 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 35 Droits d auteur r serv s OU Elle permet de naviguer dans les collections a partir d une visualisation repr sentant les collections sous forme d une carte arborescente en anglais tree maps A un premier niveau la carte arborescente permet de se faire une id e de la taille relative des contributions de chacune des institutions ayant particip a la biblioth que num rique am ricaine mais permet permet galement de naviguer dans les collections de la DPLA figure ci dessous m Library Observatory Library Observatory enables users to scan the diverse collections of the DPLA and discover items of particular interest To get started clickin the nested graph below provider wa The Portalto Texas Mountain West Digital HathiTrust collection Library format National Archives and objects Records record LEE Administration L The New York Public orti olina Digital Toolkit Ae Library o Query builder Treecraph Institution University of Southern alifomia Libraries About the project Find something interesting while exploring a collection Take a screenshot and share it onourtumblr Figure 1 Interface de l Observatoire montrant la taille relative des institutions ayant particip la DPLA En effet lorsque l on clique sur l un des carr s correspondant un d p t une autre carte arboresc
86. an author with a title or a solitary uniform title If we don t have an author or a uniform title then we try to find name fields 7XX tags to help identify related items Records that only have a 24X field no 1XX or 7XX fields exist in the record get combined with their Worldcat number to force unique keys We cannot combine those matching titles since we don t have enough information to reliably group the items WEINBERGER David 2008 Everything Is Miscellaneous The Power of the New Digital Disorder Henry Holt and Company Ibid The most abstract concept of FRBR describes is a work such as Hamlet in all the different ways it is performed and published p 251 Ibid All this sound quite neat but it gets messy quickly Is the version of Hamlet rewritten for children with a happy ending still Hamlet How about works inspired by Hamlet such as Tom Stoppard s Rosencrantz et Guildenstern Are Dead and Lisa Fiedler s Dating Hamlet Ophelia s Story The FRBR says that when the modification of a work involves a significant degree of independent intellectual or artistic effort it becomes a new work 6 BORGES Jorge Luis 1944 Pierre M nard auteur du Quichotte dans Fictions Editions Gallimard LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 29 Droits d auteur r serv s OU mais il ne le plagie pas et Borges soutient qu il s agit d une autre ceuvre puisque produite a trois si cle d i
87. aphique de donn es statistiques 2014 Wikip dia en ligne Consult le 12 d cembre 2014 Disponible l adresse http fr wikipedia org w index php title ReprC3 A9sentation graphique de donn C3 A9es statistiques amp oldid 108854835 Page Version ID 108854835 1 The Life and Death of Data sans date 18 About metaLAB at Harvard sans date en ligne Consult le 7 ao t 2014 Disponible a l adresse http metalab harvard edu about The Life and Death of Data sans date I propose thinking of data visualizations as projections to emphasize the speculative quality of such images as well as their relationship to metaphorical thinking Indeed visualizations are no more than visual metaphors translating various kinds of quantitative data into spatial and graphical form As metaphors visualizations map source domains data sets to target domains graphical structures For instance in the timeline visualizations portrayed in this essay time from accession data is mapped onto the space of the screen in coordinates LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 15 Droits d auteur r serv s OU le terme manifester la raison pour laquelle nous avons choisi comme fil directeur de cette tude la visualisation est cette qualit intrins que qu elle peut avoir lorsque elle est utilis e dans le cadre des humanit s num riques reconna tre explicitement son c
88. ar le d sordre num rique ensuite l affranchissement des contraintes du monde physique gr ce la possibilit de cr er des classification multidimensionnelles s adaptant instantan ment selon les points de vue et permettant de disposer un m me objet plusieurs n uds d une classification enfin le passage d une vision universelle de l ordre de l univers per ue comme pouvant poser des probl mes de soci t une vision propre chaque individu Ainsi le d sordre num rique doit il tre dans ce qu envisage l auteur pour les ann es venir l origine d un changement radical de notre mani re de percevoir le monde Peut tre serait il bon d exposer la fois les bouleversements effectivement introduits par les donn es et les mythes qui nous semble t il ne manquent pas d accompagner cette transformation De l Arbre au Labyrinthe Dans son essai David Weinberger fait remonter les origines de nos syst mes de classification actuels qu il s agisse de la classification lin enne des esp ces ou du syst me d cimal de Dewey appliqu dans les biblioth ques au premier syst me labor par Aristote et devenu au II si cle le c l bre arbre de Porphyre Le principe de cet arbre est de regrouper l univers dans un tronc commun puis de diviser celui ci en autant de branches qu il y a de genres eux m mes divis es en esp ces puis en sous esp ces et ainsi de suite jusqu l individu un chien est ainsi un exempl
89. aract re construit et les pr suppos s sur lesquels elle s appuie Par opposition les autres techniques dont nous avons parl plus haut auraient tendance consid rer que les techniques d interpr tation des donn es prolongent l humain Cependant elles ne font pas de ce dernier une caract ristique centrale du processus d interpr tation des donn es ce qui peut tre pr judiciable lorsqu il s agit de faire parler les donn es provenant de cet objet humain social et politique qu est la biblioth que et plus g n ralement l information On ne saurait donc crire que les donn es manifestent une connaissance nous faisons en sorte qu elles la manifeste dans toute les phases de leur laboration depuis leur collection jusqu leur organisation en un ensemble structur et lisible la fois par un ordinateur et par une personne Ayant conscience du caract re obscur de cette derni re proposition cette tude tentera d approfondir cet aspect particulier mais central et pour lequel il nous semble qu il vaille v ritablement la peine de s int resser aux donn es des biblioth ques savoir la nature construite et artificielle du sens et du discours que l on peut faire merger de ces donn es sur les institutions qui les ont produites Nous proposons donc d claircir cela en nous penchant sur trois domaines dans lesquels les biblioth ques ont traditionnellement utilis les donn es Tout d abord un premier domaine qui est conc dons
90. aries themselves to think or act any differently p 7 112 ALONZO RENARD 2012 p 107 108 13 ORCUTT 2010 Where macroevaluation is concerned with what a set of variables says about an organization microevaluation addresses how that set of variables is impacted by other sets of variables and why the organization behaves as it does under the influence of these variables p 10 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 44 Les donn es un atout pour la gestion d une biblioth que fet sur les interactions des usagers distants avec la biblioth que les politiques mises en place au sein de l tablissement les contraintes horaires les contenus des cours etc S il est vrai que cela complique beaucoup l analyse la micro valuation fournit une r ponse plus compl te nos questions en tentant de prendre en consi d ration des facteurs situ s en dehors de la port e initiale des donn es Mesurer par le biais d autres jeux de donn es l impact de certains facteurs sur les indicateurs observ s c est donc le but de la micro valuation Nous pourrions nous pencher maintenant sur quelques exemples qui illustrent peut tre davantage les id es d velopp es par Jamene Brooks Kieffer Quelques exemples innovants d analyse des donn es en biblioth que Un premier exemple qui nos yeux illustre une plus grande souplesse et une plus grande profondeur d valuation que nos traditionnels tableau
91. athryn La Barre qui avait d velopp l exemple de la navigation par facettes en appelle elle m me d couvrir d autres fa ons de visualiser l information Les nouvelles techniques de traitement des donn es permettent d innover dans l laboration de visualisations performantes du savoir et de son organisation Souvent crivent Lin et Ahn il n existe pas de structures de connaissances explicite et d j pr te tre visualis e D s lors il faut faire l effort d extraire la structure de connaissances de 231 LIN Xia AHN Jae WOOK Challenges of knowledge structure visualization dans INTENRATIONAL UDC SEMINAR SLAVIC 2013 p 79 2 LA BARRE 2013 p 100 101 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 73 Droits d auteur r serv s OU donn es non structur es en utilisant des techniques vari es de fouille de texte avant de pouvoir visualiser les structures Les auteurs d crivent ensuite un processus de regroupement clustering Une des m thodes les plus populaires utilis es pour extraire des structures de connaissances est l algorithme cartographique auto organisant d ve lopp par Teuvo Kohonen L algorithme utilise un r seau neuronal artifi ciel qui peut tre appris a partir des vecteurs caract risant l ensemble des donn es textuelles selon les positions de l extraction de concepts La carte ap prise inclut un nombre de cellules qui repr
92. aye Star Trek Into Darkness End Credits Preview 2013 SD sans date en ligne Consult le 30 juillet 2014 Disponible a l adresse http www youtube com watch v W6XIWOiMA Tag Galaxy Create Your Own Flickr Photo Universe 2011 en ligne Consult le 29 ao t 2014 Disponible l adresse http www youtube com watch v uDMYByYOCad amp feature youtube gdata player LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 96 Table des annexes ANNEXE 1 LES SUGGESTIONS EN LIGNE PLUSIEURS DEFINITIONS DE L IDENTIT DEL OOY RE siisicansinicninvinainnenininmncnmincuine 98 ANNEXE 2 L OBSERVATOIRE DE LA BIBLIOTH QUE 100 ANNEXE 3 LA VISUALISATION AU SERVICE DE LA COMMUNICATION DU BIBLIOTHECAIRE VERS SON ELU OU SON DIRECTEUR D UNIVERSITE cccccccssssscsssssessscsscscseccecccsssssecesecsscosececececsacssecsecaces 103 ANNEXE 4 DE LA VISUALISATION A LA NAVIGATION 108 Lap tre Rapha lle DCB M moire d cembre 2014 97 Droits d auteur r serv s OU cc EE ANNEXE 1 LES SUGGESTIONS EN LIGNE PLUSIEURS DEFINITIONS DE L IDENTIT DE L UVRE Document 1 SUGGESTIONS DE WORLDCAT POUR HAMLET vez des critiques Identifi us ou cr ez un compte gratuit continuant d utiliser ce site vous acceptez qu OCLC place des cookies sur votre appareil Plus de d tails su Hamlet Legendary character Drama a EX Recherche avanc e Trouver une biblioth que
93. b http www tarletongillespie org essays Gillespie 20 20The 20Relevance 200f 20Algorithms pdf What we need is an interrogation of algorithms as a key feature of our information ecosystem and of the cultural forms emerging in their shadows with a close attention to where an din what ways the introduction of algorithms into human knowlegde practices may have political ramifications 2 THOMAS Neal 2012 Algorithmic subjectivity and the need to be in formed dans LATZKO TOTH Guillaume MILLERAND Florence TEM 2012 Proceedings of the Technology amp Emerging Media Track Annual LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 24 Les donn es une r volution pist mologique pour les biblioth ques des algorithmes permet de mettre en vidence les pr suppos s socioprofessionnels qui ont pr sid l volution des algorithmes utilis s pour la recherche documentaire De son point de vue en effet l algorithme renvoie cette capacit humaine transposer sous la forme logique du langage informatique ce qui rel ve du signe savoir l expression formelle d un objet ou d un concept Google par exemple transpose en langage informatique et logique la repr sentation qu il se fait du besoin dans le processus de recherche d information C est en ce sens que l on peut dire que Google est un m dium algorithmique l algorithme est le moyen par lequel la pens e est litt ralement fait
94. blioth que mod les d organisation et de classification des connaissances mod les de visualisation de ces organisations et en dernier lieu mod les de navigation dans les collections virtuelles mais aussi physiques Envisager l exploration des collections sur le th me de l exploration spatiale ce serait se faire l cho des remarques de Val rie Tesni re sur la biblioth que envisag e comme espace de la collection nous avons souhait en effet nous demander de quelle mani re l interaction des lecteurs avec les collections par l interm diaire des donn es et de leurs techniques pouvait contribuer d finir l espace de la biblioth que virtuelle et construire un v ritable dialogue entre monde num rique et monde physique Nous passerions donc de la biblioth que comme espace de la collection la collection comme espace de la biblioth que 26 TESNIERE 2008 Face une in luctable hybridation de la biblioth que par la fonction de documentation la notion de collection est elle bloquante ou bien pense t on ceci parce que le rapport collection biblioth que reste mal d fini C est bien l que l on per oit l ambigu t profonde du terme biblioth que num rique comme r f rence un lieu ou un contenant avant que d tre la r f rence au contenu savoir la collection Or dans les repr sentations collectives de la biblioth que pas toujours explicit es il y a en effet attach la biblioth que
95. blioth que num rique de l Enssib Consult le 30 ao t 2014 Disponible l adresse Web http www enssib fr bibliotheque numerique documents 56709 du choix de l implantation aux strategies de localisation bibliotheques dans la ville pdf 23 Ibid p 21 254 DRUCKER 2010 Digital technology depends on visual presentation for much of its effectiveness The ubiquitous graphical user interface and design of icons for navigation daily activities and functions are familiar graphic structures Higher level functions using visualization are commonplace for analysis of statistical data Many creative original works in all areas of design for industry art entertainment engineering and technological activity at micro and macro levels are graphically enabled through design p 1 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 78 Les Donn es un outil de navigation dans les collections Le design ne nous dit rien sur les choses elles m mes mais sur ce que nous pensons des choses Il est l interface o les chose que nous extrayons de la cro te terrestre rencontrent une r alit pleinement humaine de sentiments d attitudes et d ambitions Et si l instar d Emmanuelle Berm s nous parlions de catalogue en ligne de biblioth que et que nous lui ajoutions une dimension visuelle par l interm diaire des donn es qu il contient nous ajouterions l un autre l ment fondamental de l conomie de l attention
96. c bien l d une progression hi rarchique et arborescente le principe de l arbre tant de cacher les propri t s g n rales d un objet derri re des propri t s particuli res la d signation d une chose comme un chien sous entend n cessairement qu elle est aussi un mammif re et un animal De m me les catalogues de biblioth ques qui proposent une navigation dans leur collection par facettes proposent en r alit ce qui peut tre consid r comme la visualisation d un arbre l affichage Primo des 225 xlin udcseminar2013 pdf sans date en ligne Consult le 8 septembre 2014 Disponible l adresse http www udcds com seminar 2013 media slides xlin udcseminar2013 pdf 26 RAZPOTNIK Spela SAUPERL Alenka Enhancing browsing experience through visual presentation of subject terms dans INTENRATIONAL UDC SEMINAR SLAVIC 2013 e g coeliac disease 616 341 008 6 est subordonn e 616 34 qui est subordonn 614 3 etc p 212 27 Cf annexe p 109 figure 29 28 VuFind FAQ Frequently Asked Questions sans date en ligne Consult le 29 ao t 2014 Disponible l adresse http www library illinois edu learn find vufind vufind_faq html Facets divide a single set of items like results from a search engine into smaller sub sets based on something those items share in common Faceted searching provides a way for a user to quickly narrow down a very broad set of loosely related items into sma
97. c document I believe is called x p 4 5 6 Jbid Taylor was concerned to model the lived interactions between a reference librarian and an inquirer p 6 7 Ibid He especially sought to account for how the inquiring process went through communicative phase of adaptation between the actors the librarian seeking to discover the document that answered the knowledge question of the inquirer 8 Thid the theoretical framework is a utilitarian economic correspondence between subject and object More simply it is based in rational choice theory p 4 Ibid Contemporary network interfaces like Google rely on the collective posing and satisfaction of ongoing socially contextualized problem situations 5 Ibid perpetually reorganizing a neighborhood of records for present users according to paths laid down by prior ones p 9 Sur les pr suppos s inh rents des algorithmes comme k NN on peut consulter O Neil et Schutt The k NN algorithm is an example of a nonparametric approach You had non modeling assumptions about the underlying data generating distributions and you weren t attempting to estimate any parameters But you still made some assumptions which were Data is in some feature space where a notion of distance makes sense E Training data has been labeled or classified into two or more classes LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 25 Droits d aut
98. ce d une conception conomique de l individu savoir une correspondance utilitarienne conomique entre le sujet et l objet Plus concr tement elle est bas e sur la th orie du choix rationnel Google con oit d sormais le besoin d information comme la formulation et la satisfaction de situations probl mes en cours et socialement contextualis e D s lors le besoin d information serait d termin en grande partie par ses propres traces et par les comportements pass s de pr c dents utilisateurs Dans ce contexte l algorithme k NN tait celui qui transposait le mieux la th orie du besoin d information propre Google puisqu il r organise perp tuellement un voisinage de traces pour les utilisateurs pr sents en fonction des chemins trac s par les pr c dents Conference of the Canadian Communication Association Waterloo May 30 D June 1 2012 Consult le 3 ao t 2014 http www tem fl ulaval ca www wpcontent PDF Waterloo 2012 THOMASFTEM2012 pdf Ibid p 2 4 Ibid The efficiency for human beings can be found where thinking can literally be made mechanical p 3 45 Ibid A focus on an instrumental need for a specific document that follows a simple best match engineering principle search was simply a matter of correct encoding and deconding To put it in a phrase need was essentially expressed through the form of the semantically precise query I need to find the specifi
99. certes pas volumineux mais nombreux ce qui signifie que cette biblioth que dispose de collections v ritablement importantes en astronomie figure ci dessous Enfin un clic sur la Duke University Library nous contraint chercher du regard les rares petits points bleus lui correspondant sur l image de fait l institution n a pas une collection ancienne tr s tendue dans le domaine de l astronomie What was the top downloaded astronomy work gt mn What was the top downloaded astronomy work Contributing Institution ee e o e P ere eo os f LA Leo be e e gt e y e PL e ji g fHarvard University x e e e e AA e c p3 n 8 e e y ae irat Q a oe e e x Sum of User Downloads for digitized Astronomy works Color shows details about Contributing Institution Size shows Running Sum of User Downloads aso Download RA i t tableau Figure 7 La collection en Astronomie de la Biblioth que d Harvard On pourra trouver ce type de comparaison dans un autre post de blog celui de Dan Cohen directeur ex cutif de la DPLA les collections de chaque biblioth que ayant particip la DPLA ont t visualis es sous la forme de diagramme en barres repr sentant le nombre d ouvrages qu elles poss dent en commun les unes avec les autres Chaque diagramme permet de visualiser ce qui fait la particularit d une biblioth que et de sa politique d acqui
100. ction collection rive eel Sjoerd Koopman format Library Postcard Collection objects record Maps of Africa to 1900 Motley Collection of Theatre and Teaching with Digital H Toolkit Content Digital Costume Design Query builder Cultural Heritage a Trech Community Aboutthe project Find somethinginteresting while exploring a collection Take a screenshot and share it onourtumblr Figure 14 Visualisation au second niveau de l institution Universit d Illinois BE Library Observatory Library Observatory enables users to scan the diverse collections of the DPLA and discover items of particular interest To get started click in the nested graph below ee ES Speech transcript Transcript typescript urbana champaign 7 escript collection v YP 2 James Reston Papers format Letter typescript objects i record Letter carbon typescript Toolkit querybulder andum Memorandum carbon Tres craph typescript in Find somethinginteresting de while exploring collection E Take a screenshot and shareit ui onourtumblr Ur TE ve Figure 15 Visualisation des formats Universit d Illinois gt Collection fJames Reston Papers gt Format gt tapuscrits des notes de discours objects University of Illinois This resource is provided for research consultation and for scholarly purposes only Further distribution and or any commercial use of the works from this
101. d erreur de 1 4 3 2 points cette marge d erreur serait en cons quence inexistante pour des pourcentages calcul s partir de la totalit d une population d utilisateurs Qui plus est les m gadonn es apporteraient une plus grande souplesse dans leur utilisation que les chantillons de donn es Dans une enqu te statistique traditionnelle en effet on peut tre amen vouloir distinguer plus finement les diff rences de r ponse au sein de groupes particuliers D s lors on pourra cr er des sous populations sur la base de certains crit res qui peuvent tre combin s par 3 EVANS Christophe dir Mener l enqu te guide des tudes de publics en biblioth que 2011 Collection La bo te outils p 130 131 Ibid p 62 5 Ibid p 45 2 Autant affirmer d s ce stade de notre r flexion que cette id e selon laquelle la science des donn es pourrait se passer des statistiques inf rentielles est fausse comme l crivent notamment O Neil et Schutt In the current popular discussion of Big Data the focus on enterprise solutions such as Hadoop to handle engineering and computational challenges caused by too much data overlooks sampling as a legitimate solution At Google for example software engineers data scientists and statisticians sample all the time Non pagin dans sa version lectronique Par ailleurs le fait de disposer de toutes les donn es ne signifie pas que les biais s en trouvent effac s
102. d that access to information at the digital age is now more individual and can allow to circumvent the bias of traditional classification we claim that those bias are transposed in the algorithms that allow this access today Thus it is important to consider a way of navigating into the information that make obvious and submit for discussion those bias In this respect a library catalog conceived as a data game is a metaphoric and funny way to explore library collections while not taking too seriously such an knowledge organisation Keywords Big Data library data data visualization Patron Driven Acquisition Evaluation Communication browsing interface metaphore classification Droits d auteurs Droits d auteur r serv s Toute reproduction sans accord expr s de l auteur a des fins autres que strictement personnelles est prohib e WO Mo Cette cr ation est mise a disposition selon le Contrat Paternit Pas d Utilisation Commerciale Pas de Modification 2 0 France disponible en ligne hftp creativecommons org licenses by nc nd 2 0 fr ou par courrier postal 4 Creative Commons 171 Second Street Suite 300 San Francisco California 94105 USA LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 5 Droits d auteur r serv s OU cc EE Sommaire SIGLES ET ABR VIATIONS dun untiuoandennmiannument 9 INTRODUCTION ssinmnmmvadimandnmaundontiaei sdonin 11 LES DONN ES UNE R VOLU
103. de d cembre 2014 93 Droits d auteur r serv s OU How to Beat Bibliographic Data into Submission pt 1 Data Scientist Training for Librarians sans date en ligne Consult le 7 juillet 2014 Disponible a l adresse http altbibl 1o dst4l how to beat bibliographic data into submission pt 1 How to Beat Bibliographic Data into Submission pt 2 Data Scientist Training for Librarians sans date en ligne Consult le 7 juillet 2014 Disponible l adresse http altbibl 1o dst4l how to beat bibliographic data into submission pt 2 Internet Archive Search Engine Sans date Consult le 19 ao t 2014 Disponible l adresse Web http archive org advancedsearch php raw Lev Manovich What is Visualization Data Visualisation sans date en ligne Consult le 30 juin 2014 Disponible a l adresse http www datavisualisation org 2010 11 lev manovich what is visualization Library Observatory sans date en ligne Consult le 29 janvier 2014 Disponible a l adresse http www libraryobservatory org Library Data Visualization sans date en ligne Consult le 20 mai 2014 Disponible l adresse http librarydatavisual blogspot fr LOUKISSAS Yanni sans date Data Artifacts Rising Cultures of Collecting from Preservation to Participation metaLAB at Harvard en ligne Consult le 19 mai 2014 Disponible l adresse http metalab harvard edu 201
104. donn es quantitatives constituant des indicateurs qui comme le souligne Nadine Delcarmine ne sont certes que des points de rep res qui doivent imp rativement tre resitu s dans le contexte au moment de l analyse suffisent elles informer sur l tat de la biblioth que et sur son fonctionnement C est la question que se pose Jamene Brooks Kieffer auteur d un article sur la p rilleuse artificialit des donn es des biblioth ques Les mani res traditionnelles avec lesquelles les biblioth caires rassemblent et traitent les donn es vont rarement jusqu a l emploi des techniques d analyse de traitement ou d exploration qui serait consid r es comme une n cessit dans toute autre profession aussi riches en donn es que la n tre De telles techniques ne sont pas ais es a employer mais elles produisent des r sultats remarquablement infor matifs si ce n est parfois inconfortables Mais a la place nous pr f rons n avoir af faire qu a la signification superficielle et rassurante de nos donn es nous reposant sur une pr dominance des variables quantitatives et les conclusions simples et arithm tiques que nous pouvons en retirer Ces conclusions sont rassurantes car elle ne m nent que rarement des r sultats inattendus 10 Ibid p 103 110 BROOKS KIEFFER Jamene Yielding to persuasion Library Data s Hazardous Surfaces dans ORCUTT Darby 2010 Library Data Empowering Practice and Persuasion
105. e m canique Ces repr sentations th oris es du processus de recherche d information ne deviennent videntes que lorsqu on retrace l volution des algorithmes qui les ont mod lis s ce qu a fait Neal Thomas Si donc l on en croit son propos l informatique traditionnelle a d abord d fini le besoin d information comme la simple correspondance entre le besoin d un document sp cifique et le document lui m me Pour le dire en quelques mots le besoin tait essentiellement exprim travers la forme de la requ te s mantiquement pr cise j ai besoin de trouver le document sp cifique dont je pr sume qu il est appel x Cette premi re th orisation du processus de recherche a ensuite volu vers une autre th orie celle du besoin cognitif influenc e cette fois non par l informatique mais par le milieu des biblioth ques et des sciences de l information l algorithme devait cette fois mod liser l interaction v cue entre un biblioth caire de r f rence et une personne venue demander des renseignements Cette mod lisation devait prendre en compte le processus par lequel la recherche passait par des phases d adaptation communicative entre les acteurs savoir le biblioth caire cherchant d couvrir le document qui pourrait r pondre la question connaissance de la personne en recherche de renseignement L dessus la th orie du besoin de l information volue encore cette fois sous l influen
106. e Session Minnesota Legislature 2 198 episl ative Session Minesota Legislature Representative Torn J She 1682 Fegslatve Sessir Uinnesola Cepeatire Representative Charles L Sawyer 1907 1908 Legislative Session Minnesota Legislature Representative Charles L Sawyer 1915 1916 Legislative Session Minnesota Legislature Representative Noah W Sawyer 1941 1942 Legislative Session Minnesota Legislature Representative Noah W Sawyer 1943 1944 Legislative Session Minnesota Legislature Representative Noah W Sawyer 194 Senator Tom Nelson Minnesota Legislature 1981 1982 Legislative Session Jom McGoey pilet in bi plare Duluth Minn Tom MEGS Bad iwo vAuferohes man and BT Plane Dulue Nauchnye rezul taty puteshestvyl N M Praheval shkago po Sentra nol Az Otdiel me pre Representative Ton Rees 1946 Legalative Session Minnesota Legislature Mrresota Bur wager Birds pow to know an how to ci them by Een He mar Maras By aranpasa ow is araci hem By Fank N chapman Iisang Saanks ss hs ete skates aad rays By HS Mt Fanale it Tom R pare gs iarl l OTRON beds of the Yellowstone River Basin Montana by amphibians of Massow by Tom R ohon Hee ay hibang of of Messoun AGarland of New Songs The battle of the Nile Tom Starboard The sailor s adieu Tom Bowling Portrait of Tom Keller Scene on the Dock at the Rip Raps Generals Wool and Butler Testing the Sawyer Gun and Proje James F Bymes Tom Co
107. e William Shakespeare Br EUR 2 00 Z Othello de William Shakespeare Poche EUR 2 00 Macbeth de William Shakespeare Broch EUR 2 00 Les clients ayant achet cet article ont galement achet Page 1 sur 15 a g Othello Macbeth Le roi Lear Le songe d une nuit d t Richard Ill gt feuilleter Wiliam Shakespeare gt William Shakespeare gt William Shakespeare gt William Shakespeare gt William Shakespeare AE 5 Accor 9 totctotck 9 Ah 18 Ardre 10 Poche Broch Poche Poche Broch EUR 2 00 EUR 2 00 EUR 2 00 EUR 2 00 EUR 2 00 Figure 13 Suggestions d Amazon pour Hamlet Amazon fr Hamlet sans date en ligne Consult le 8 septembre 2014 Disponible l adresse http www amazon fr s ref nb sb noss 17 mk fr FR C3 85M C3 85 C5 BD C3 95 C3 91 amp url search alias 3Daps amp field keywords Hamlet LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 99 274 Droits d auteur r serv s OU ANNEXE 2 L OBSERVATOIRE DE LA BIBLIOTHEQUE DOCUMENT 1 INTERFACE DE L OBSERVATOIRE MONTRANT LA TAILLE RELATIVE DES INSTITUTIONS AYANT PARTICIP A LA DPLA Bz Library Observatory Library Observatory enables users to scan the diverse collections of the DPLA and discover items of particular interest To get started click in the nested graph below provider Univestyotiincsst BE Picture Chicago John Starr Stewart Ex Portraits of Actors 1720 1920 Urbana Champaign k Libris Colle
108. e analogie entre un ph nom ne et sa repr sentation elle explique que la longue liste de distorsions de dessins de sp cimens pour lesquels aucune classification conceptuelle n tait encore tablie plaide fortement en faveur des effets des images mentales et de leur influence sur la perception La repr sentation d un ph nom ne notamment grace a la visualisation des donn es qu il peut produire joue un r le important dans sa compr hension Mais o se situe donc la Classification D cimale Universelle par rapport a cela Remarquons en premier lieu que Paul Otlet avait con u sa classification de mani re ce qu elle pr sente davantage de souplesse qu un arbre hi rarchique traditionnel Il avait en effet fait en sorte qu elle puisse combiner plusieurs facettes d un m me objet ce qui rendait sa classification davantage multidimensionnelle que celle de Dewey Mais au del de cela Otlet a cherch pr senter visuellement cette multi dimensionnalit et beaucoup de ses illustrations taient caract ris es par des repr sentations non hi rarchiques de la classification ressemblant des r seaux et pr voyant des parcours indirects sans passer par des troncs ou des hi rarchies particuli res Dans ce contexte tout l enjeu du s minaire de la CDU tenu en 2013 tait de parvenir repr senter graphiquement la classification et l instar de Paul Otlet son concepteur d aller au del de la traditionnelle figure
109. e contenus Les indices computationnels construits de mani re r cursive de m me que le classement algorithmique peuvent r duire les potentialit s intentionnelles des Mois aux possibilit s logiques de personnes socialement reconnues travers le renforcement des recherches pr c dentes et des recherches des autres Ce qui dans l analyse de citation commence comme des explications comportementales dans le but de l analyse de citation se termine en algorithmes qui contr lent la construction de l identit ainsi que l intention dans la recherche et la communica tion d information travers les pr suppos s psychologiques et sociologiques de groupes 5 De fait l affirmation selon laquelle la PDA serait au plus pr s des besoins r els des lecteurs en mati re de documentation contrairement la traditionnelle politique documentaire impuls e par les sp culations des biblioth caires concernant ces m mes besoins serait ainsi relativement erron e la PDA ne fait que remplacer la subjectivit des responsables de collections par celle des algorithmes et des usagers qui int riorisent eux m mes les pr suppos s bibliom triques de ces derniers Ce processus de m diatisation de la recherche documentaire par m diatisation est entendu ici la transformation d un objet en m dia c est dire en interface transposant l opinion juste ou non d un groupe social deviendrait particuli rement probl matique parti
110. e l extraction des donn es leur repr sentation graphique Editions Eyrolles ISBN 9782212135992 REVUES ALAIN Corbin 1991 Arlette Farge Le go t de l archive Annales conomies Soci t s Civilisations 1991 Vol 46 n 3 p 595 597 DARNTON Robert sans date La chandelle de Jefferson Le d bat en ligne Consult le 7 ao t 2014 Disponible l adresse http le debat gallimard fr articles 2012 3 la chandelle de jefferson CARDON Dominique 2013 Dans l esprit du PageRank R seaux 1 avril 2013 Vol 177 n 1 pp 63 95 DOI 10 3917 res 177 0063 DENNI Ga lle 2010 Quatre cat gories d outils pour l auto valuation au SICD2 de Grenoble en ligne 1 janvier 2010 Consult le 26 juillet 2014 Disponible l adresse http bbf enssib fr consulter bbf 2010 04 0023 005 DRUCKER Johanna 2010 Graphesis Visual knowledge production and representation Poetess Archive Journal 2010 Vol 2 n 1 pp 1 50 Consult le 6 ao t 2014 Disponible l adresse Web http www johannadrucker com pdf graphesis 2011 pdf DRUCKER Johanna 2011 Humanities Approaches to Graphical Display en ligne 2011 Vol 5 n 1 Consult le 1 novembre 2014 Disponible l adresse http www digitalhumanities org dhq vol 5 1 000091 00009 1 html E LINK Forrest TOSAKA Yuji WENG Cathy Mining and Analyzing Circulation and ILL Data for Informed Collection Devlopment Preprint a paraitre
111. e relevant de la politique documentaire savoir l ensemble des d cisions ayant trait l acquisition la gestion et la mise en valeur des collections des biblioth ques Certains d entre eux comme celui qui concerne les niveaux d audience ont permis le d veloppement de services devant tre int gr s l interface de recherche de WorldCat Ils ont t pr sent s en 2013 Strasbourg lors du meeting du conseil r gional de l EMEA par Roy Tenant gestionnaire principal de projet de l OCLC Roy Tenant insiste particuli rement sur l laboration des identit s WorldCat qu il d crit comme 5 CARTIER Aurore 2012 Biblioth que et Open data Et si on ouvrait les biblioth ques sur l avenir Consult le 15 d cembre 2014 Disponible l adresse Web http www enssib fr bibliotheque numerique documents 60401 bibliotheque et open data et si on ouvrait les bibliotheques sur l avenir pdf p 61 ADMIN 2012 Data Mining Research Area en ligne 4 ao t 2012 Consult le 29 janvier 2014 Disponible l adresse http oclc org research activities mining html 55 Ibid LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 27 Droits d auteur r serv s OU algorithmiquement construite partir de la base de donn es de WorldCat Le principe des identit s est en effet de rassembler sur une m me page l ensemble des donn es concernant un auteur ou cr ateur en les extrayant de la base de do
112. el Schutt a l inf rence statistique savoir la discipline qui se pr occupe du d veloppement de proc dures de m thodes et de th or mes qui nous permettent d extraire du sens et de l information de donn es qui ont t g n r es par un processus stochastique al atoire Faire parler les donn es ce serait donc en premier lieu en extraire du sens et de l information tout en sachant que ce sens est d avantage construit qu extrait Plus pr cis ment l inf rence statistique d signe des d ductions produites sur une population partir d un chantillon de cette population que l on observe Mais en 2014 les acteurs du Big Data se contentent ils de statistiques inf rentielles pour faire parler leurs donn es De fait ce proc d s inscrit dans la discipline plus g n rale de ce qu on appelle aujourd hui la science des donn es suivant les propos d O Neil et Schutt plus pr cis ment un scientifique des donn es est une personne qui sait comment extraire du sens des donn es et les interpr ter ce qui n cessite la fois des outils et des m thodes provenant des statistiques et de l apprentissage automatique et aussi d tre humain FRANCE Biblioth que nationale de sans date BnF Les enjeux du web de donn es en biblioth que en ligne Consult le 2 novembre 2014 Disponible l adresse http www bnf fr fr professionnels innov num web donnees a web donnees enjeux _bibliotheque
113. emble du ph nom ne qu elle d crit la visualisation de donn es peut tre consid r e comme productrice de connaissances Johanna Drucker d crit ainsi trois mani res fondamentales par lesquelles l image est amen e devenir informative 1 en offrant une analogie visuelle ou une ressemblance morphologique 2 en fournissant une image visuelle d un ph nom ne non visible ou 3 en fournissant des conventions visuelles pour structurer des op rations ou des proc dures Mais parall lement l nonciation de ces diff rentes m thodes ce qui caract rise la visualisation de donn es dans le cadres des humanit s num riques c est un changement pist mologique fondamental L o Edward Tufte pr supposait implicitement l id e que non seulement les donn es pr existent leur pr sentation graphique mais aussi que les donn es ont une identit absolue en dehors de leur repr sentation Johanna Drucker consid re au contraire que l epist mologie visuelle est bas e sur une th orie plus radicale de la connaissance Le concept radical de la subjectivit et la nature co d pendante de la connais sance et de l interpr tation ont t essentielles la physique quantique depuis pr s d un si cle mais aussi aux tudes cognitives depuis 50 ans La graphesis consi d re ces concepts comme fondamentaux et les utilise pour construire une th orie de la connaissance travers l attention por
114. en vidence la sp cificit des biblioth caires de la Wolbach library dont le r le est de faciliter la r utilisation des donn es produites par l activit de recherche astronomique Beaucoup de ce que nous biblioth caires faisons permet de faciliter la re cherche et la d couverte d objets dans l ADS mais ce qui est plus important c est que nous g n rons un grand nombre de liens vers les donn es que les astronomes utilisent de mani re quotidienne Cette activit de gestion permet galement de me surer les performances des t lescopes et instruments Je pense que ce genre d acti vit est une condition fondamentale pour centrer une biblioth que sur les don n es D une certaine mani re nous pourrions dire que les biblioth ques d astronomies disposent d une relative avance dans la mise en place de service de gestion et d ouverture des donn es de la recherche comme en t moigne l exemple fran ais du centre des donn es de Strasbourg cit par R mi Gaillard dans son m moire sur l Open research data Or la mise en place de ces services au sein des biblioth ques de recherche n cessite une formation ad quate des biblioth caires afin de pouvoir se plonger dans les donn es manipuler le cycle de vie de la donn e de recherche et se frotter au milieu 129 The Life and Death of Data sans date op cit 50 ERDMANN Christopher 2014 Teaching librarians to be data scientists Information outlook e
115. engine that can be scaled all the way up to institutional level Non pagin dans sa version lectronique 185 DAY 2014 Recursively constructed computational indices as well as algorithmic ranking can narrow the intentional potentialities of selves to the logical possibilities of socially recognized persons through the strenghtening of previous searches and the searches of others What in citation analysis start as behavioral explanations for the purpose of citation analysis end up as algorithms that control identity construction and intention in information searching and communication through group psychological and sociological assumptions p 69 186 Affirmation que l on peut trouver notamment dans le blog the ScholarlyKitchen RICK ANDERSON sans date What Patron Driven Acquisition PDA Does and Doesn t Mean An FAQ The Scholarly Kitchen en ligne Consult le 6 d cembre 2014 Disponible l adresse http scholarlykitchen sspnet org 2011 05 31 what patron driven acquisition pda does and doesnt mean an faq Si de fait la sagesse des foules est un argument avanc pour justifier la pr f rence pour un mod le dirig par les usages plut t que par les biblioth ques les pr suppos s et repr sentations v hicul es par les nouvelles techniques accompagnant la PDA incitent se poser la question de savoir jusqu quel point les foules peuvent tre sages Cf Des bouquets aux acquisitions faites par les usag
116. eno Figure 29 Amazon exemple par excellence d interface a facettes Worldcat Identities Network Explore Identities A ciate Relationships Search E Poe Edgar Allan 1809 1849 s RELATED IDENTITIES FOR POE EDGAR ALLAN 1809 1849 R A Hawthorne Nathaniel 1804 1864 Melville Herman 1819 1891 f Related Works Related Works Essays and reviews r of blackness Hawthome Poe Melville The power of blackness Hawthome Poe Melville Frontier American literature and the American Wes The marriage of heaven and earthaichemical regeneration in the works of Taylor Poe e Architects of the abyss the indeterminate fictions of Poe Hawthome and Melville Fe Hawthorne and Fuller The raven and the whale the war of words and wits in the era of Poe and Melville Ruined Eden of the present Hawthorne Melville and Poe critical e n honor of Darrel N nasters Cooper Hawthorne Emerson Poe Lowell Henry James Abe T titles and more in WorldCat m WorldCat Identities page for Hawthorne Nathaniel 1804 1864 m Occurrence 30811 ccurrence 29330 A 4 eur c JU Z1JJ ILHUET A LI LIEU uc IC LILLLLUIL puootvite cle T GP UIRE w urle requ te LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 110 Table des annexes DocuMENT 3 VISUALISATION S MANTIQUE EN R SEAU DDC Search Clear Figure 31 Visualisation des r seaux s mant
117. ente s affiche et repr sente les diff rentes collections propos es par l institution choisie puis une fois choisie la collection une troisi me visualisation permet de choisir l int rieur de la collection un format souhait et ainsi de suite jusqu au document proprement parler chaque niveau indiquant une taille relative des objets visualis s Ajoutons qu une autre navigation est propos e sous forme d arbre mais que le principe reste le m me partir de cette visualisation l Observatoire propose un tumblr plate forme de microblogage sur laquelle les utilisateurs de l application sont invit s poster toutes les anomalies remarqu es dans les cartes arborescentes ou les arbres simples ainsi que les commentaires que leur inspire ces anomalies Un utilisateur a par exemple post une capture d cran montrant la carte arborescente des collections de la Smithsonian Institution au niveau de ses collections figure ci dessous Cette visualisation montre une collection intitul e type registre type register qui lorsqu on cliquait dessus ne menait rien mbattles udcseminar2013 pdf sans date en ligne Consult le 1 septembre 2014 Disponible l adresse http www udcds com seminar 2013 media slides mbattles_udcseminar2013 pdf Cf annexe p 100 figure 14 Cf annexe p 100 figure 15 Ce tumblr est actuellement disponible l adresse Web http libobserve tumblr com LAPOTR
118. er 22 Cf annexe p 111 document n 5 263 TESNI RE Val rie dans BERTRAND Anne Marie BETTEGA Emilie CLEMENT Catherine ERMAKOFF Thierry EVANS Christophe ION Christina PICARD David Georges RAPATEL Livia TESNIERE Val rie Quel mod le de biblioth que 2008 Presses de l ENSSIB p 146 24 Watch Dogs WeAreData sans date Watch Dogs WeAreData en ligne Consult le 31 ao t 2014 Disponible l adresse http wearedata watchdogs com Cf annexe p 111 document n 4 2 Du jeu de donn e au jeu avec les donn es sans date LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 81 Droits d auteur r serv s OU reprendre la m taphore du cosmos employ e par Umberto Eco pour d signer l exploration des connaissances aujourd hui C est la raison pour laquelle nous pensons que le r el apport du Big Data l acc s l information ne r side pas dans les moteurs de recherches ou les syst mes de recommandation mais bien dans la mise en avant par la visualisation de l aspect m taphorique intrins que toute exploration des connaissances l image et en particulier l image du labyrinthe ou du cosmos est particuli rement en mesure de permettre la d couverte de connexions nouvelles entre des domaines de connaissance pourtant auparavant loign s En d finitive ce que nous avons cherch d crire dans le troisi me temps de cette tude est peut tre une r flexion sur les mod les de bi
119. er les donn es pour en dresser un tableau complet la communaut universitaire Afin de dresser un tableau de la situation une premi re id e peut tre de montrer son interlocuteur des photographies des rayonnages surcharg s de la biblioth que D ailleurs certains directeurs de biblioth ques d apr s Marie Baudi re n h sitent pas organiser des visites de la biblioth que en direction de leurs lus afin qu ils puissent se faire une image de leur tablissement C est l un moyen effectif mais qui ne prend pas en compte le fait qu lus et directeurs n ont pas toujours beaucoup de temps consacrer ces visites I peut donc s av rer plus efficace de pr senter les donn es de la biblioth que visuellement De simples diagrammes pour commencer peuvent faire l affaire deux courbes sur un m me graphique tel que celui pr sent par Elguindi et Mayer peuvent repr senter le volume r el des rayons de la biblioth que d une part et le nombre de livres poss d s par l institution d autre part alors que la premi re variable reste stable et n augmente plus la seconde augmente constamment ce qui met bien en vidence l in luctabilit de la saturation des espaces Un second graphique met en sc ne sous la forme d un diagramme en barres le nombre d tag res pleines d une part et le nombre total d tag res d autre part la barre correspondant la premi re variable tant plac e l int rieu
120. erait pens comme un outil de m diation dont l int r t principal serait sa visibilit et son attraction cognitive Ajoutons que l int r t du jeu vid o est galement qu il peut tre jou plusieurs il peut donc tre utilis pour animer une communaut Cette communaut pourrait tre constitu e de lecteurs et d s lors la biblioth que remplirait en quelque sorte son r le politique savoir celui de concevoir un projet d acc s commun la connaissance Mais puisque par ailleurs il s agit bien d un jeu quel pourrait tre l objectif qui lui serait assign Nous pourrions penser une comp tition portant sur la distance parcourue par un lecteur dans l univers d une biblioth que le but serait ainsi de conduire le lecteur tendre ses horizons et rechercher la distance qui peut exister entre plusieurs livres Des ponts existeraient d une galaxie une autre l o le lecteur aurait remarqu des similarit s peut tre inattendues entre plusieurs livres Le biblioth caire pourrait lui m me jouer virtuellement son r le de m diation en orientant conseillant recommandant des ouvrages sugg rant des passerelles etc Par l nous r pondrions peut tre d une certaine mani re la n cessit contradictoire de proposer un langage commun qui garantisse une autonomie des usagers tout en r pondant leurs points de vue multiples Un exemple dont la port e s tend au del du monde des biblioth ques en est
121. ers un nouvel quilibre trouver 5 7 sans date en ligne Consult le 8 d cembre 2014 Disponible l adresse http www bibliobsession net 2011 03 03 du bouquet aux acquisitions faites par les usagers un equilibre a trouver 187 GULLIGAN Sans date The high level snapshot could then be used for a host of purposes including refining institutional objectives building teaching programmes based on topics that are being used by the actual faculty determining preset materials that are applicable to a particular course based on actual usage or micro acquisition data over time for the same course and allowing the library to develop ancillary services around the core content offering which would be largely automated based on the collective collection building of all library users LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 61 Droits d auteur r serv s OU Si l on reprend en effet la vision de Larry Page sous tendant l algorithme de PageRank dont il est le concepteur ce dernier fonctionne essentiellement sur l autorit des liens hypertextes qui selon ses mots encodent une somme consid rable de jugements humains latents Ainsi prendre des d cisions institutionnelles en se fondant sur les r sultats d un tel algorithme reviendrait finalement se fier des repr sentations des objets d crits par ces algorithmes plut t qu une connaissance proprement parler de ces obje
122. es et avec elles la visualisation des collections et des publics pourrait elle permettre de donner une visibilit nouvelle la biblioth que dans le contexte num rique actuel Car la question de la repr sentation est bien ce qu il nous semble intrins quement li e celle de l identit Nous avons jug n cessaire de rappeler en premier lieu les caract ristiques du nouvel environnement num rique des biblioth ques ainsi que les probl mes qu il pose Nous aimerions d montrer dans un second temps la n cessit d un geste visuel fort pour rendre visible la biblioth que dont nous aimerions dessiner les principaux traits dans un troisi me moment de cette r flexion Les biblioth ques dans l conomie de l attention Le Web a pour effet imm diat de cr er une conomie de l abondance d information crit Emmanuelle Berm s la biblioth que n est plus un passage oblig pour acc der aux documents Toute d marche orient e utilisateur dans l environnement du Web doit donc prendre en compte comme param tre premier le besoin de visibilit La lo gique du portail est insuffisante sur le Web c est dans les moteurs g n ra listes eux m mes tels que Google Yahoo Bing etc qu il faut gagner en vi sibilit si l on veut capter l attention des internautes Capter l attention des internautes c est bien l une phrase caract ristique de cette conomie dont Emmanuel Kessous a d cr
123. es cat gories sociod mographique d termin es au pr alable gr ce aux donn es issues des recensement de l INSEE par exemple lorsque l on souhaite reproduire la structure d une population connue dans l chantillon C est l un point fondamental sur lequel les m thodes statistiques traditionnelles diff rent des m thodes de traitement des donn es du Big Data Deux l ments caract risent en effet les m gadonn es d une part la facult de traiter stocker et d analyser des masses de donn es mesur es en t raoctets et non plus de se cantonner des chantillons limit s et d autre part le co t moindre de la collecte de ces donn es notamment parce qu elles sont g n r es automatiquement par exemple chaque interaction d un usager avec un service en ligne Dans ce contexte la m thode de l chantillonnage destin e produire un substitut la population cibl e deviendrait dans une certaine mesure caduque quoi bon si l on suivait donc les enseignements de Cukier et Mayer Schoenberger se contenter d une petite partie des usagers d une biblioth que quand on peut les avoir tous en fouillant les donn es produites par exemple par l interaction du public avec le site internet de la biblioth que Que penser galement des calculs des marges d erreurs intrins quement li s cette m thode Consid rant par exemple que les pourcentages calcul s sur un chantillon de 1000 personnes peuvent comporter une marge
124. es d ouvrages s lec tionn es de mani re al atoire Dans tous les cas il faut substituer au texte descrip tif notice de l ouvrage des indices visuels qui permettront une lecture de survol de l ensemble de l cran Pour tre honn te le passage des nouvelles classifications offertes par le num riques la navigation dans des collections virtuelles par le moyen de la visualisation des donn es est un domaine en voie d exp rimentation et n cessite de 1 Nous renvoyons ici au deuxi me chapitre de notre premi re partie portant sur l algorithme FRBR compar ceux de Google et d Amazon p 30 9 Fouille de textes 2014 Wikip dia en ligne Consult le 14 d cembre 2014 Disponible l adresse http fr wikipedia org w index php title Fouille_de_textes amp oldid 107660108 Page Version ID 107660108 2 Text mining 2014 Wikipedia the free encyclopedia en ligne Consult le 14 d cembre 2014 Disponible l adresse http en wikipedia org w index php title Text_mining amp oldid 637280039 Version ID 637280039 193 CRAMER Florian CUBAUD Pierre DACOS Marin JAMES Yannick LANTENOIS Annick dir 2011 Lire l cran contribution du design aux pratiques et aux apprentissages des savoirs dans la culture num rique actes de la journ e d tude Lectures num riques Valence 11 mars 2010 Organis e par l cole sup rieure d art et design Grenoble Valence p 57 194 Ibid LAPOTRE Raph
125. ession telle que l dition particuli re d une traduction Enfin le document repr sente l exemplaire tel que celui de l dition de la traduction d une uvre Leveraging WorldCat Data Mining the largest library database in the World 2013 en ligne Consult le 14 juillet 2014 Disponible l adresse http www youtube com watch v atA2QadzTdY amp feature youtube gdata player 5 Ibid Sp cifications fonctionnelles des notices bibliographiques 2014 Wikip dia en ligne Consult le 4 ao t 2014 Disponible l adresse http fr wikipedia org w index php title Sp C3 AYcifications fonctionnelles des notices bibliographiques amp oldid 103576162 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 28 Les donn es une r volution pist mologique pour les biblioth ques C est pr cis ment ce cadre conceptuel qui va tre repris dans le but de d finir un algorithme permettant de regrouper ensemble des notices qui ont trait la m me uvre et ce toujours dans le but de faciliter et d enrichir la navigation des utilisateurs de WorldCat les FRBR permettent en effet de d finir des crit res selon lesquelles on pourra classer ensemble des notices qui se ressemblent Les ensembles de ces notices rassembl es selon ces crit res sont appel s groupes uvre Pour constituer ces groupes l algorithme devra attribuer chacune des notices une cl unique sur la base desquelles ces
126. et Open data Et si on ouvrait les biblioth ques sur l avenir Consult le 15 d cembre 2014 Disponible l adresse Web http www enssib fr bibliotheque numerique documents 60401 bibliotheque et open data et si on ouvrait les bibliotheques sur l avenir pdf p 61 GAILLARD R mi 2013 De l Open data l Open research data quelle s politique s pour les donn es de recherche Biblioth que Num rique de l Enssib Consult le 18 aout 2014 Disponible a l adresse Web http www enssib fr bibliotheque numerique documents 64 13 1 de l open data a l open research data quelles politiques pour les donnees de recherche pdf TISSERANT Cl ment 2013 Domaine public et biens communs de la connaisance Sous la direction de Cristina Ion Disponible l adresse Web http www enssib fr bibliotheque numerique documents 64245 domaine public et biens communs de la connaissance pdf MONOGRAPHIES ALEMBERT Jean Le Rond d et CONDORCET Jean Antoine Nicolas de Caritat marquis de 1821 uvres de d Alembert A Belin Volume 1 p 44 ALONZO Val rie RENARD Pierre Yves dir 2012 valuer la biblioth que Biblioth ques Paris 1978 0184 0886 BATTLES Matthew 2013 Data artefacts tracking knowledge ordering conflicts through visualization dans INTERNATIONAL UDC SEMINAR Slavic Aida et UDC CONSORTIUM THE HAGUE d 2013 Classification amp visualization interfaces to knowledge proceedings of the Interna
127. ether org wp content uploads 2013 07 Choropleth US libs by county jpg Cf annexe p 105 figure 23 172 MALPAS sans date For this I think the county level choropleth is actually quite useful It helps to show how demand is distributed at above the institution scale and this is important for understanding the r le of logistics in optimizing the flow of library ressources BAUDIERE 2014 p 55 174 Astronomy Texts in the Internet Archive sans date Tableau Software en ligne Consult le 21 ao t 2014 Disponible l adresse http public tableausoftware com views AstronomyTextsintheInternetArchive Whatwasthetopdownloadedastronomywor k showVizHome no LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 58 Les donn es un atout pour la gestion d une biblioth que l image se grise tandis que les pastilles de couleur correspondants l institution restent color s ce qui permet de les distinguer par rapport aux autres De la sorte on peut se faire une id e assez directe de l importance de l institution dans la collection globale de l Internet Archive Lorsque l on clique sur la Fisher University of Toronto par exemple on s aper oit qu elle dispose des deux documents les plus t l charg s mais qu en dehors de ces documents cette biblioth que n a pas fourni beaucoup d autres ouvrages Lorsque l on clique sur l universit d Harvard en revanche on observe que les points rouges ne sont
128. eur r serv s OU En voquant cette d monstration faite par Neal Thomas de la subjectivit des algorithmes il appara t que ces derniers sont amen s voluer non pas tant en fonction d une recherche constante d am lioration et d efficacit qu en fonction des al as d une concurrence entre des visions radicalement diff rentes de la soci t et de ses besoins La conception conomique du besoin d information peut tre du fait de la pr dominance que lui conf re la pens e contemporaine l a emport sur les autres th ories provenant de l informatique et des biblioth ques cet gard l efficacit de Google ne se mesurerait pas tant sa capacit apporter des r ponses pertinentes nos questions qu sa capacit transposer de mani re ad quate dans ses algorithmes un cadre conceptuel dominant Ces algorithmes qui peuvent servir faire parler les donn es sont donc eux m mes des m dia dont les volutions transcrivent des luttes politiques entre des visions sociales diff rentes Mais malgr son caract re mythologique la revendication de l objectivit des algorithmes travers celle de leur impartialit continue tre r guli rement mis en avant par les acteurs du Big Data Par dessus toute autre chose les fournisseurs d algorithmes informationnels doivent affirmer que leurs algorithmes sont impartiaux L effectivit de l ob jectivit algorithmique est devenue fondamentale au maintien de ces out
129. ey a fait transpara tre dans la classification unique qu il a propos comme mod le toutes les biblioth ques du globe mais bien plut t le fait que sa classification adopte une forme unique et invariable peu adaptable aux d sirs et aux go ts de chacun Tout d abord il convient de dire que m me dans la nouvelle configuration num rique la connaissance garde une g ographie et une forme celle du labyrinthe ou rhizome plus couramment appel r seau En r alit l volution actuelle de l information n est pas tant en voie de produire un bouleversement de notre mani re de penser le monde comme le pense David Weinberger que l inverse c est l volution de la pens e moderne qui a ce qu il nous semble a fait naitre les conditions n cessaires au bouleversement num rique actuelle et notre nouvelle mani re de rechercher et d acc der l information Le syst me g n ral des sciences et des arts est une esp ce de labyrinthe de chemin tortueux o l esprit s engage sans trop conna tre la route qu il doit tenir crit en effet d Alembert dans le Discours pr liminaire l Encyclop die D Alembert exprime par l une id e ch re aux lumi res savoir le refus de toute tentative de fonder un syst me a priori des id es et la conception d un savoir qui s articule comme une carte g ographique sans fronti res sur laquelle des parcours infinis sont possibles 7 Le passage d une classificati
130. fers to whatever Google s search engine finds Would it be better to be a prescriptionist and refer to an authority such as the Oxford English Dictionary Unfortunately the OED probably doesn t have an entry yet and we don t have time to wait for it Let s agree that there s a spectrum that one authority doesn t feel right and that the masses doesn t either O NEIL SCHUTT 2013 Non pagin dans sa version lectronique 5 THOMAS 2012 6 Tl nous semble que cette volont de ce contenter de profils num riques et algorithmiques pour prendre des d cisions concernant notre individualit est pr cis ment le probl me que soulignent galement Antoinette Rouvroy et Thomas Bern ROUVROY Antoinette et BERNS Thomas 2013 Gouvernementalit algorithmique et perspectives d mancipation R seaux 1 avril 2013 Vol 177 n 1 pp 163 196 Sans consid rer ceci comme vain nous voulons signaler ici avec force l indiff rence de ce gouvernement algorithmique pour les individus d s lors qu il se contente de s int resser et de contr ler notre double statistique c est dire des croisements de corr lations produits de mani re automatis e et sur la base de quantit s massives de donn es elles m mes constitu es ou r colt es par d faut Bref ce que nous sommes en gros pour reprendre la citation d Eric Schmidt ce n est justement plus aucunement nous m mes tres singuliers Et c est justeme
131. gadonn es et leurs outils d analyse permettraient de ne moins avoir recours l chantillonnage de donn es porteur de marges d erreur plus ou moins grandes ni aux questionnaires des m thodes d enqu tes critiqu s pour leur biais plus ou moins assum s les acteurs du Big Data revendiqueraient de leur c t une plus grande exactitude ainsi qu une plus grande objectivit conf r es suppos ment par le caract re scientifique et technique des m thodes employ es Ces m thodes reposent cependant sur des algorithmes qui traduisent en langage math matique et m canique les a priori de leur concepteurs Les m gadonn es portent donc en elles une subjectivit qui est d autant plus trompeuse qu elle est parfois opaque et dans certain cas non assum e Des tudes de publics aux acteurs du Big Data D sireuses d am liorer les services qu elles offrent leurs usagers les biblioth ques sont parfois amen es produire des tudes statistiques sur leurs publics Ce fut le cas en 2005 de la BIUSJ qui dans le cadre de changements fondamentaux touchant son organisation comme ses espaces cherchait dresser un tableau fid le des besoins en mati re de biblioth que au niveau de 2 MAYER SCHOENBERGER Viktor et CUKIER Kenneth 2014 2 Ibid big data refers to things one can do at a large scale that cannot be done at a smaller one to extract new insights or create new forms of value in ways that change markets organ
132. gessenbadundatnecndeubscesius isss sovio ten esse een eines 81 CONCLUSION DONN ES ET POLITIQUE ccssssssssssssssssssssssesscsscassscacecencees 83 BIBLIOGRAPHIE s icscsssssexssassduncestoanosnasadsssdcsons s caensusdeatspuuseahonsesdconseadansiesduassarcabsncatel 87 Articles ENCY CLOPECIQUESS i 105 i sccssessassrnedsccosonsosesbvouvesvenssssevbnsvoncecoustoeehscsttavesestensuee 87 N MOIT S se nt ei tee ne ns nn ee r lee 88 Monographies Sn nids eos en ns de ose er ase S toes 88 FREVULES EEEE E E A TEE 91 SITES TNCSE CU c cusvecetectawcshcvsbedesstesteibeuiectceschpecaueuslocseassbuseeusiuced puteacsuessoteabevadesvesuaseaces 92 VIGEOSPA PIES ce csscscacssaceeccccsssantanscdsdacassssed sastnokcosuesaseopadoncasbastadensbcedensoonetesnoneoastoniens 96 TABLE DES ANNEXES ss nr nids ssonsasceckesessvaasnnscacesonsgaesarstandenss 97 TABLE DES ILLUSTRATIONS wisscccsscssscassiacsadssussnssencsnccsnavosnvsassensarsantoseseneaperenes 112 TABLE DES MATI RES aineisiin iaeei ieena nt trs neies 115 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 Sigles et abr viations ADS Astrophysics Data System API Application Programming Interface BIUSJ Biblioth que Interuniversitaire Scientifique de Jussieu BnF Biblioth que Nationale de France Bpi Biblioth que Publique d Information BUPMC Biblioth que Universitaire Pierre et Marie Curie CSV Comma Separated Values DPLA Digital Public Library of America DSTAL Da
133. gorithme reste un processus subjectif 38 MAYER SCHONBERGER CUKIER 2013 p 55 et p 60 O NEIL SCHUTT 2013 Can N all Here s the thing it s pretty much never all And we are very often missing the very things we should care about most Non pagin dans sa version lectronique LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 23 Droits d auteur r serv s OU l application des algorithmes aux donn es sociales les pr suppos s vont plus loin encore que ceux impliqu s simplement par la th orie et les math matiques comme l crit Ronald E Day a propos des analyses bibliom triques Ce que nous d couvrons c est que les algorithmes d informatique sociale telle que PageRank algorithmes d analyse des liens et les syst mes de re commandation renforcent la v racit des lois bibliom triques telles que la loi de Lotka simplement parce qu ils automatisent les th ories comporte mentales inh rentes de telles lois puis r infusent cela dans le comporte ment des utilisateurs Les d couvertes empiriques ne parlent jamais d el les m mes D s lors les objets d tude et leur mesures empiriques ainsi que les outils et algorithmes qui y participent ne seraient rien d autre que des instruments de r affirmation de normes sociales culturelles et poli tiques La seule chose qu ils affirment est la certitude de l id ologie Les algorithmes contribuent
134. h matiquement Et en ce qui concerne 3 The End of Theory The Data Deluge Makes the Scientific Method Obsolete WIRED Consult le 2 ao t 2014 http archive wired com science discoveries magazine 16 07 pb_theory 36 MAYER SCHONBERGER CUKIER 2013 p 55 In the big data age it is no longer efficient to make decisions about what variables to examine by relying on hypotheses alone The data sets are far too big and the area under consideration is probably far too complex Fortunately many of the limitations that forced us into a hypothesis driven approach non longer exist to the same extent We now have so much data available and so much computing power that we don t have to laboriously pick one proxy or a small handful of them and examine them one by one Sophisticated computational analysis can now indentify the optimal proxy as it did for Google Flu Trends after plowing through almost half a billion mathematical models 7 Cf O Neil et Schutt propos de l extraction de variable feature extraction This process we just went through of brainstorming a list of features for Chasing Dragons is the process of feature generation or feature extraction This process is as much of an art as a science It s good to have a domain expert around for this process but it s also good to use your imagination O NEIL SCHUTT 2013 Non pagin dans sa version lectronique On voit par 1a que la s lection de variables m me au moyen d al
135. h and teaching unit at Harvard University dedicated to exploring and expanding the frontiers of networked cultures in the arts and humanities 5 LOUKISSAS Yanni sans date Data Artifacts Rising Cultures of Collecting from Preservation to Participation metaLAB at Harvard en ligne Consult le 19 mai 2014 Disponible l adresse http metalab harvard edu 2012 12 data artifacts rising cultures of collecting from preservation to participation The Internet inspires libraries archives museums and arboreta to make their collection open participatory and democratic This cluster of values emergent in networked cultures is taking hold at institutions that carry long legacies of prior norms preservation expertise comprehensiveness excellence and commemoration In some cases the emerging values adduce to older ones in other cases they seem to clash Through critical attention to cataloging and classification schemes across varied institutional contexts Data Artifacts will historicize cultures of collecing and the understandings of material culture and intellectual value they embody LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 34 Les donn es une r volution pist mologique pour les biblioth ques avaient pr sid a sa fondation Au gigantesque projet de num risation port par Google Book et ce qu il tait devenu a savoir une op ration de recherche transform e en
136. have been on the written word but the rise in digital formats and files has carved out a new r le for the library one that supports information in all its forms from the written word to the digital image the streaming media sample and the numeric data file Moreover our promotion of information literacy and emphasis on information literate users means we need to pay attention to all types of information sources even the non textual Users may not immediately associate numeric data sources with the library but inreasingly libraries and librarians are being called upon to purchase support and archive these sources p 2 13 Pour la d finition d un jeu de donn es Cf introduction de cette tude p 13 note n 7 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 50 Les donn es un atout pour la gestion d une biblioth que il s agit essentiellement d all ger le travail des data scientists en effectuant toutes les t ches qui se situent en amont de l analyse et qui occupent cependant 80 de leur temps Pour autant l analyse et la visualisation des donn es constituent une grande partie du programme de la formation puisqu on peut y observer que pas moins de sept s ances sur quinze sont consacr es aux statistiques la programmation et la visualisation des donn es Et nous aimerions souligner qu en d finitive Christopher Erdmann insiste moins sur l apport des biblioth caires ainsi form s la com
137. horopleth Map Number of WorldCat Libraries by US County Year 2013 A Coke Colors ae X Table des annexes DOCUMENT 3 VISUALISATION DES TABLISSEMENTS AFFILIES A WORLDCAT DANS LA PERSPECTIVE DU PEB aux Erats Unis 2 What was the top downloaded astronomy work Which CE What was the top downloaded astronomy work y 5 Contributing Institution a t D run ny VA Han a 112 317 downloads e lass dels cut sey e 5 4 e e Si Sum of User Downloads for digitized Astronomy works Color shows details about Contributing Institution Size shows Running Sum of User Downloads l gt Share X Boo aod Download Share your perspective See more by this au H obleav E biblioth ques sous forme de points lt What was the top downloaded astronomy work Which institutional collection of digitized astronomy texts de worth the most Top 25 Most Expensive Books to Digitize Astronomy publishing hotspots gt Select Contributor w What was the top downloaded astronomy work Contributing Institution 5 e s Sum of User Downloads for digitized Astronomy works Color shows details about Contributing Institution Size shows Running Sum of User Downloads Share gt DT co asd Download Share your perspective e more 8 ableau E a a LLLUSLIULLUTL 4I LISUL UE t EPrESXEFMLULLUTL SeUS uprnigue Uu 1 GD v
138. ie la plus int ressante de mon stage au fil des conversations des r actions de tous ordres sur les sp cificit s que dessinaient moyennes m dianes maximums et minimums se laissaient entrevoir l histoire des collections de la BPI la personnalit des personnes qui avaient contribu les fa onner ann es apr s ann es les v nements qui avaient pu marquer un changement dans la mani re de collecter la proximit marqu e du Centre Georges Pompidou les visions du monde diff rentes que pouvaient r v ler les conflits dans les mani res de classer les ouvrages La richesse culturelle et institutionnelle de la Bpi mergeait ainsi me semble t il de ces aller retours entre les donn es et les conversations avec les professionnels qui acceptaient de r agir ce que je leur montrais Si je pourrais difficilement qualifier ma contribution au d sherbage des collections de la BPI de d cisive ce stage a cependant aiguis ma curiosit pour les donn es et notamment les donn es des biblioth ques comment en effet d finir ces derni res Pourquoi serait il particuli rement int ressant d en parler en 2014 Comment faire parler les donn es des biblioth ques et surtout dans quel but Ces questions dont les r ponses ne peuvent tre d finitives me semblent cependant constituer un pr alable essentiel une tude qui voudrait essayer de percevoir toutes les possibilit s et les limites offertes par la r utilisation des donn
139. ientent sa jouissance dans une perspective qui lui est propre Il reste voir comment ces th ories s appliquent a la visualisation des donn es des biblioth ques L exemple de l Observatoire Biblioth que Le contexte de cr ation de l Observatoire Le projet de l Observatoire Biblioth que Library Observatory est n de l effort commun de deux institutions MetaLAB le centre des humanit s num riques de l Universit d Harvard d une part et la Digital Public Library of America DPLA d autre part Le MetaLAB se d finit lui m me comme une unit de recherche et d enseignement d di e l exploration et l expansion des fronti res de la culture en r seau dans les arts et les humanit s Un des projets les plus int ressants du MetaLAB demeure sans doute l Artefact de donn es ou Data Artifact en raison notamment de sa r flexion approfondie sur la nature des donn es culturelles et leurs origines L Internet inspire les biblioth ques les archives les mus es et arboretums dans leur mouvement pour rendre leurs collections ouvertes participa tives et d mocratiques Cet ensemble de valeurs mergentes dans les cultures en r seau se saisit d institutions qui charrient depuis longtemps avec elles les legs de normes pr c dentes la conservation l expertise l exhausti vit l excellence et la comm moration Dans certains cas ces valeurs mer gentes apportent des l ments a
140. ientist is quoted as saying Let s pu everything in and let the data speak for itself If you read the whole article you ll learn that this algorithm tries to find diamond in the rough types of people to hire A worthy effort but one that you have to think through Say you decided to compare women and men with the exact same qualifications that have been hired in the past but then looking into what happened next you learn that those women have tended to leave more often get promoted less often and give more negative feedback on their environments when compared to the men Your model might be likely to hire the man over the woman next time the two similar candidates showed up rather than looking into the possibility that the company doesn t treat female employees well O NEIL et SCHUTT 2013 Non pagin dans sa version lectronique 184 GULLIGAN Finbar Sans date Where search tools act as gatekeepers for nearly all scholarly content they will need to be refined in not only the extent of their indexes but also in the underlying algorithms that allow them to harvest index and connect the wealth of content available across the net Advanced semantic techniques can aid the LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 60 Les donn es un atout pour la gestion d une biblioth que Cependant d apr s Ronald E Day cela aurait tendance a limiter d une certaine mani re le champ des d couvertes possibles d
141. ies symbols o 1t04 Sto 10 to 19 20 to 29 30 to 39 40 to 49 50 to 99 100 to 149 gt 150 Source OCLC US Library Symbols by ZIP Code Lavoie I AU 2 AN O0R mondina odi NO Te nadae Figure 6 Essai de repr sentation g ographique de l offre documentaire aux Etats Unis visualisation des biblioth ques sous forme de d grad de couleurs L extr me capacit de sch matisation et de simplification est donc une caract ristique propre la visualisation des donn es une bonne visualisation en effet est celle qui a su liminer tout ce qui paraissait superficiel par rapport ce qu elle cherche montrer En ce sens elle est un excellent exercice de synth se Constance Malpas chercheur l OCLC d montre cela par les visualisations exp rimentales qu elles labore partir des donn es de WorldCat dans un post du blog Hanging 15 L l ment strat gique le plus r current dans les r ponses des directeurs de biblioth que est l laboration de documents synth tiques car selon sa repr sentation sociale l lu est toujours press il a peu de temps disponible Ce point fait d ailleurs l objet de demandes sp cifiques de la part des lus Il n y a pas vraiment de qualit s requises pour les documents que doit me remettre le directeur de biblioth que mais lors de son entretien il a t port attention sur le fait que les documents doivent tre synth tiques BAUDIERE 2014 p 54 16 Levy Manovich
142. ile de parler des donn es sans se repr senter les logiciels les plus communs qui permettent de les traiter savoir Excel SPSS ou les bases de donn es relationnelles telles que MySQL Dans ce contexte c est la notion de jeu de donn es qui se profile savoir selon R mi Gaillard l agr gation sous une forme lisible de donn es brutes ou d riv es pr sentant une certaine unit rassembl es pour former un ensemble coh rent D s lors les donn es brutes d signent des microdonn es savoir un unique enregistrement de quelque chose et les donn es d riv es des donn es produites partir d un premier jeu par nettoyage et synth se statistique ce stade de notre r flexion il nous semble important de souligner le caract re ambigu de la donn e l o en effet R mi Gaillard affirmait qu une donn e pouvait rarement tre isol e de son contexte de production et de ce fait ne pouvait tre qualifi e de brute qu avec une certaine pr caution nous aimerions ajouter avec Johanna Drucker qu il serait pr f rable de parler non de donn e mais de capt e la donn e n est pas un objet produit d une mani re ext rieure et ind pendante de l homme par le r el elle est d avantage une perception enregistr e du r el construite selon certaines techniques et certaines contraintes s lectionn e pour r pondre des objectifs d finis en amont de sa conception Commen
143. ils comme courtiers de la connaissance pertinente Aucun fournisseur n a plus insist sur la neutralit de ses algorithmes que Google qui r pond r guli re ment aux demandes qui lui sont adress es de modifier les r sultats de ses re cherches par l affirmation que l algorithme ne doit pas tre manipul Les m thodes analytiques du Big Data offrent bien des avantages par rapport aux statistiques traditionnelles notamment au regard de leur faible co t et de la souplesse qu elles offrent Mais l o les enqu tes de publics assumaient et prenaient en compte dans leurs r sultats la subjectivit inh rente leur laboration les outils du Big Data et leurs algorithmes au contraire peuvent parfois revendiquer leur objectivit tout en mod lisant de mani re implicite des pr suppos s th oriques D s lors il devient n cessaire avant toute utilisation d un algorithme dans un projet d analyse des donn es de prendre en compte les aspects politiques qui peuvent lui tre attach s Mais au del du simple enjeu pist mologique et de la volont d honn tet intellectuelle la prise en compte et la reconnaissance des id ologies qui fa onnent notre recherche de l information sur internet et dans les biblioth ques est aussi on l aura compris un enjeu d mocratique You pick the number of neighors to use k You re assuming that the observed features and the labels are somehow associated They may not be but u
144. insi de m me que les symboles vivent et meurent avec les communaut s qui les ont cr s de m me les m tadonn es vivent et meurent avec les contextes sociaux et culturels qui les ont vu na tre De ce fait il nous semble que c est bien reconna tre le caract re symbolique des donn es que de proposer de privil gier la visualisation comme moyen d acc der aux connaissances l apprentissage d un tel langage reste aujourd hui inventer et mettre en place pour les professionnels des biblioth ques DSTAL UN EXEMPLE DE FORMATION SP CIALEMENT CON UE POUR DES BIBLIOTH CAIRES La DST4L Data Scientist Training for Librarian est une formation l analyse des donn es sp cifiquement destin e aux biblioth caires Elle a t mise en place au sein du Harvard Smithsonian Center for Astrophysics par Christopher Erdmann directeur de la John G Wolbach library Nous nous proposons ici d en d crire les caract ristiques principales avant d tudier les projets mis en place en son sein notamment ceux impliquant la visualisation des donn es Contexte et objectifs de la formation Dans la pr sentation qu il fait de sa formation Christopher Erdmann insiste en premier lieu sur l environnement institutionnel dans lequel volue sa biblioth que savoir d une part la communaut d astronomes que celle ci dessert et d autre part la base bibliographique de la NASA Astrophysics Data System ADS Cet environnement institutionnel met
145. iques de la classification Dewey Document 4 VISUALISATION EN GALAXIE Figure 32 toile de photographies sur Flickr 284 xlin_udcseminar2013 pdf 285 Tag Galaxy sans date en ligne Consult le 9 septembre 2014 Disponible l adresse http taggalaxy de LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 111 Droits d auteur r serv s Document 4 UN EXEMPLE DE Data Game Avenue Parmentier METRO VELOS LIBRE SERVICE CHAMPS ELECTROMAGNETIQUES RELAIS INTERNET HOTSPOTS WIFI MOBILE Boulevard Voltaire DISTRIBUTEURS PANNEAUX PUBLICITAIRES FEUX DE CIRCULATION X TOILETTES PUBLIQUES CAMERAS DE VIDEOSURVEILLANCE TWEETS INSTAGRAM m FOURSQUARE A Activit s en VOLTAIREQ ON BLUM direct Acc dez aux intonations MEME sur les personnes 340 0 1I0D OHOLI HH pnd 2MO II O IIDH O IDN A Meto AODA sone onnne Rechercher une donn e SHOTTHORID OLID HD H H 20040 Figure 33 L incroyable We are Data mod lisation interactive des donn es de Paris Londres et Berlin Ici le onzi me arrondissement de Paris Document 5 UNE VISUALISATION EN R SEAU POUR ASSISTER LA NAVIGATION 7 Worldcat Identities Network dentities Associate Relationship Search Poe Edgar Allan 1809 1849 Ww E RELATED IDENTITIES FOR POE EDGAR ALLAN 1809 1849 Hawthorne Nathaniel 1804 1864 Melville Her
146. ires sur la culture des donn es notamment dans le cadre de la recherche Enfin un troisi me domaine d utilisation des donn es des biblioth ques est celui des catalogues en ligne les OPAC au m me titre que les syst mes de recommandation sont l exemple type d un produit de donn es savoir un dispositif permettant un acteur d interagir avec son public cette l interaction pouvant tre utilis e pour modifier ce dispositif De mani re plus concr te les catalogues en ligne permettent au public d une biblioth que d explorer virtuellement sa collection chaque donn e d une notice tant sa mani re une m taphore pointant vers la r alit physique du livre qu elle d signe et qui se trouve localis dans la biblioth que La visualisation nous para t tre une m thode LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 Introduction permettant de proposer une exploration collective de la connaissance tout en soulignant par son caract re m taphorique la faillibilit de cette proposition Elle demeure sans doute un moyen int ressant d explorer virtuellement les collections et d animer une communaut de lecteur autour de la repr sentation virtuelle de la biblioth que et de son contenu LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 17 Droits d auteur r serv s OU _ LES DONNEES UNE REVOLUTION EPISTEMOLOGIQUE POUR LES BIBLIOTHEQUES Dans leur ouvrage intitul Big Dat
147. isualisation des biblioth ques sous forme de d grad de couleurs 2 Sliding scale mapping local group and system wide library infrastructure hangingtogether org sans date en ligne Consult le 21 juillet 2014 Disponible l adresse http hangingtogether org p 3149 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 Droits d auteur r serv s OU 105 CIE DOCUMENT 4 VISUALISATION DES COLLECTIONS D ASTRONOMIE PRESENTE DANS L INTERNET ARCHIVE PAR INSTITUTIONS D ORIGINE harvard 140000 120000 100000 80000 60000 40000 20000 0 Record Count 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 H Lafayette College Record Count S 8 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 H Sum of User Downloads for digitized Astronomy works Color shows details about Contributing Institution Size shows Running Sum of User Downloads Share ER DJ oo aod Download Share your perspective 3 persp th tableau gt Figure 25 La collection en Astronomie de la Duke University Library 28 Astronomy Texts in the Internet Archive sans date Tableau Software en ligne Consult le 21 ao t 2014 Disponible l adresse http public tableausoftware com views AstronomyTextsintheInternetArchive Whatwasthetopdownloadedastronomywor k showVizHome no LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 106 Table des annexes Document 4
148. it en d tail les r gles dans son ouvrage intitul L attention au monde sociologie des donn es personnelle l re num rique L attention cette facult de l esprit de se consacrer exclusivement un objet y est d crite comme une ressource d autant plus limit e que l information est devenue l poque d Internet surabondante Si au XX si cle la psychologie a mis en vidence les limites cognitives de l attention humaine le XXI si cle ajoute cette raret un acc s d cupl l information Si le cyberespace se d veloppe pour englober les interactions entre les mil liards de personnes aujourd hui sur la plan te ces types d interaction seront totalement diff rents de ce qui pr valait durant ces derniers si cles ou m me avant Lanham rejoint sur ce point Goldhaber et parle propos d Internet d conomie pure de l attention Il y a un segment de notre vie actuelle qui constitue une conomie de l attention l tat pur Que nous l appelions cybe respace virtualit communication m di e par ordinateur ou tout simplement le Net l bas l attention est tout Bien s r il y a une foule de signes de retour 244 L emploi du nous d signe ici la fois les professionnels de la documentation et le public ou non des biblioth ques 245 BERMES Emmanuelle ISAAC Antoine et POUPEAU Gautier 2013 Le Web s mantique en biblioth que ditions du Cercle de La Librairie p 23 6 KESSOU
149. ithmes de recherche de l information D s lors il devient n cessaire de penser un syst me de navigation qui exprime ce biais et le soumette davantage une discussion transformer un catalogue de biblioth que en data game pourrait tre une solution pour exprimer de mani re ludique la m taphore sous jacente toute organisation des connaissances Descripteurs Big Data visualisation interface de navigation classification m taphore valuation communication Patron Driven Acquisition Abstract This work is about the issues raised by the re use of library data at the age of Big Data Regarding the production of knowledge about libraries and their users the new analysis technologies are not reducing inherent bias of traditional statistics Nevertheless data visualization as considered by the Digital Humanities is a very interesting tool because it make the human subjectivity implied by such technologie a central element through which we can consider the library more as a political object LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 As for library management authors are calling for analysis driven rather than data driven decisions Thus training librarians in data analysis could be a good solution in the context of open data and open research data Data visualization is a funny way to learn data analysis and is a very effective way of communicating about the library activities Lastly if it can be rea
150. izations the relationship between citizens and governments and more p 6 Jbid Nous faisons r f rence ici un des titres de l ouvrage de Mayer Schoenberger et Cukier Letting the data speak p 6 Lap tre Rapha lle DCB M moire d cembre 2014 19 ee Ey Droits d auteur r serv s OU l universit pour juger de la qualit et de l utilit du r seau documentaire existant La BIUSJ et plus largement la BUPMC a donc eu recours une enqu te quantitative par questionnaire outil favori voir f tiche dans le paysage des tudes sur les publics dont l objectif est de mieux conna tre les profils sociod mographiques des publics pr sents inscrits ou non inscrits de conna tre les raisons de leur pr sence sur les lieux et de d terminer si leurs besoins sont satisfaits ou non Le succ s de ce type d enqu te nous invite en examiner les caract ristiques principales notamment le principe de l chantillonnage dans la mesure o les enqu tes quantitatives ont un co t et que leur cible peut tre vaste il n est pas possible d interroger la totalit de la population cibl e par l enqu te On choisit donc de s lectionner un chantillon repr sentatif de cette population sa repr sentativit devant tre garantie par un tirage al atoire et par un nombre relativement lev de personnes interrog es ou bien par la m thode des quotas dont le principe est de s appuyer sur d
151. l Expansion Visuelle de Requ te qui permet terme de construire une requ te selon des op rateurs bool ens Elles permettent simplement de visualiser l organisation des connaissances et ne sont donc en d finitive qu un appui pour des chercheurs qui voudraient se repr senter leur domaine de recherche Dans ce contexte l exemple de l utilisation du logiciel d exploration Tag Galaxy dans un catalogue de biblioth que figure ci dessous d velopp par Razpotnik et auperl apporte un l ment nouveau de m me que l Expansion Visuelle de Requ te Tag Galaxy donne la capacit de construire visuellement des requ tes complexes en ajoutant un concept un autre pour restreindre la recherche 3 Cf note n 190 234 Cluster analysis or clustering is the task of grouping a set of objects in such a way that objects in the same group called a cluster are more similar in some sense or another to each other than to those in other groups clusters It is a main task of exploratory data mining and a common technique for statistical data analysis used in many fields including machine learning pattern recognition image analysis information retrieval and bioinformatics Cluster analysis 2014 Wikipedia the free encyclopedia en ligne Consult le 14 d cembre 2014 Disponible l adresse http en wikipedia org w index php title Cluster_analysis amp oldid 63575264 Page Version ID 635752641 235 LIN AHN 2013
152. lations chaque consommateur exerce une sensibilit personnelle une culture 76 Jbid Images embody information through three different models each of which has a different structural relation to the referent They can work 1 through offering a visual analogy or morphological resemblance 2 through providing a visual image of non visible phenomena or 3 by providing visual conventions to structure operations or procedures p 4 77 Ibid The assumption is not only that the data pre exists the graphical presentation but that the data have an absolute identity outside of their representation p 24 7 Terme forg en 1975 par Marie Rose Logan et d signant l ensemble des r flexions produites l poque sur l criture et l inscription 7 Ibid Rather than imagine discrete phenomena available for observation or the subject object relationship as a dialogue between two independent entities the quantum theorist suggests that phenomena arise when an observer intervenes in a field of potentialities p 28 8 Ibid Ernst von Glaserfeld s work in radical constructivism suggests that human cognition emerges dynamically in a relationship of exchange between physiological capabilities and circumstantial stimulation in a continually mutating system p 27 28 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 33 Droits d auteur r serv s OU d termin e des go ts des tendances des pr jug s qui or
153. le assez vague et large puisqu il va de l tude de l volution des pratiques culturelles et notamment de la lecture et de la fr quentation des biblioth ques l histoire des biblioth ques elles m mes s il est vrai que les nouvelles techniques apport es par la science des donn es sont susceptibles de bouleverser les m thodes traditionnelles qui nous permettaient de produire des connaissances sur les biblioth ques et leur public il reste que la m thode la plus honn te et la plus probante nos yeux est celle de la visualisation et notamment la visualisation des m tadonn es par leur caract re d artefact les m tadonn es r v lent les conditions mat rielles les syst mes logiques et classificatoires les valeurs institutionnelles et culturelles qui les ont vu na tre Nous nous penchons ensuite sur les enjeux soulev s par l application de la science des donn es au pilotage des tablissements documentaires une poque o la tendance consiste fonder les d cisions sur des preuves chiffr es peut tre serait il bon de redonner du sens l utilisation des donn es Ainsi par son caract re m taphorique et ludique la visualisation peut elle tre une bonne approche pour apprendre manipuler les donn es tout en permettant une communication efficace sur l tablissement et son activit Cet apprentissage peut par ailleurs s appuyer sur ce vaste mouvement qui tend ouvrir les comp tences des biblioth ca
154. le avait lieu aujourd hui d terminer quelle cible serait la plus int ressante pour les tats Unis si nous tions encore en guerre froide voir jusqu o s tendrait la contamination provoqu e par une bombe nord cor enne touchant S oul Si le principe de ce type de jeu est de se fonder sur des donn es d objets r ellement existants la population d une ville le nombre de ses voies de communications etc cela signifie que l on pourrait tout aussi bien choisir les donn es bibliographiques d un OPAC et proposer un jeu dont le but serait de les explorer La vertu principale du data gaming est en effet de proposer une exploration interactive des donn es et de leur caract ristiques Dans un jeu il y a le plus souvent un conflit une opposition un obstacle comprendre pour mieux le surmonter vous de construire une exp rience en proposant des choix qui seront int ressants pour votre public Ainsi vous l am nerez explorer analyser et comparer des l ments afin de prendre la meilleure d cision possible pour atteindre l objectif fix Explorer analyser comparer Voila un outil de m diation fort int ressant pour qui veut maintenir pour longtemps l attention d un public diversifi sur le catalogue en ligne d une biblioth que ce reflet de la collection physique comme l crit Emmanuelle Berm s un data game dont les donn es seraient celles d un catalogue permettrait donc d ex
155. le go t de chaparder sans vergogne les paroles prononc es au hasard des conversation publiques frequency of in house collection use More important the counts allow us to assess the distribution variation and change in reference services across the communities we serve and their libraries 12 ORCUTT 2010 123 Jbid First the faddish phrase data driven decision making misleads many librarians into believing that they are acting correctly by basing their decisions on how many of something or what percentage it is of some other thing Yes these are decisions based on data analysis but I hope that I have shown that relying solely on such a minimal form of data analysis ofr organizational assessment is like trying to decode the human genome with a pocket calculator Data driven decision making is a simplistic approach to a complex problem It often bypasses all but the most basic forms of data analysis and ignores the possibility that decisions should consider factors other than quantitative data In Lancaster s usage this is decisions making based solely on macroevaluation p 12 124 FARGE Arlette 1997 Le Go t de l archive Paris Seuil p 126 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 47 Droits d auteur r serv s OU Ainsi ne nous a t il pas paru primordial de traiter la question de l enjeu d atteinte a la vie priv e que comporterait le Big Data Les donn es au m me titre que le
156. lioth ques fran aises s appuient sur une longue tradition d valuation Il n est qu prendre l exemple de la cr ation de l Inspection g n rale des biblioth ques en 1822 pour s en convaincre cette derni re tait en effet charg e de mener des enqu tes ponctuelles sur le fonctionnement des biblioth ques afin de compl ter les renseignements souvent lacunaires que les tablissements de lecture devaient transmettre au minist re de l Instruction Publique par le biais des rapports annuels adress s par les pr fets et recteurs Dans ce contexte il serait erron d affirmer que l utilisation des donn es des biblioth ques fran aises dans le but de piloter ces derni res serait un fait totalement nouveau tout nous montre au contraire que cela a t pratiqu d s leurs origines si l on fait remonter ces origines aux confiscations r volutionnaires D s lors l analyse des donn es des biblioth ques effectu e dans le contexte nouveau de la science des donn es n aurait elle rien de neuf apporter 1 ALONZO Val rie RENARD Pierre Yves dir 2012 valuer la biblioth que Biblioth ques Paris 1978 0184 0886 p 38 Lap tre Rapha lle DCB M moire d cembre 2014 41 Droits d auteur r serv s OU cc EZA De la macro la micro valuation Mis en place depuis 2006 le syst me d valuation du SCD2 de Grenoble est remarquable par bien des aspects notamment par la mobilisation de toute
157. llant des sciences sociales aux sciences dures en passant par les Humanit s Num riques L une des cons quences d un tel mouvement pourrait tre d ouvrir la profession sur la gestion des donn es et les connaissances scientifiques qui l accompagne La formation des professionnels la gestion et l analyse des donn es pourrait donc b n ficier du mouvement d ouverture des donn es de la recherche Bien s r on pourrait objecter cela que ce mouvement ne concernerait que les professionnels appel s travailler dans des biblioth ques de recherche Mais en r alit nous pourrions dire avec Lynda Kellam et Katharyn Peter que ce mouvement touche tous les types de publics et avec eux tous les types de biblioth que Il y a en effet deux facteurs a prendre en consid ration aujourd hui d une part le fait qu Internet a rendu l acc s et la circulation de jeux de donn es plus ais s et d autre part l essor de l utilisation d outils abordables tels que les tableurs Excel Ces deux facteurs participent de fait cr er une culture du nombre de plus en plus accessible et partag e que les biblioth ques m mes publiques pourraient tre amen es prendre en compte Avec ces changements dans l acc s aux donn es num riques les biblioth caires ont pris une place centrale dans l aide aux usagers Notre activit prin cipale a peut tre t le mot crit mais la mont e des formats et des fichiers num riques a fait merger un r
158. ller sub sets Popular examples of the use of facets can be found on Amazon eBay and many online shopping sites as well as some library catalogues and article databases For example a search for shoes at an online store allows you to narrow further by men s shoes or women s shoes and then provides further refinements to narrow by color price tec Consortium of Academic Research Libraries in Illinois 2011 22 LA BARRE Kathryn Sempre avanti Some reflections on faceted interfaces dans INTERNATIONAL UDC SEMINAR SLAVIC 2013 p 94 30 Cf annexe p 109 figure 30 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 72 Les Donn es un outil de navigation dans les collections biblioth ques de l Universit de l Illinois UIUC sugg re dans son menu un certain nombre de cat gories format localisation sujet auteur collection date de publication etc elles m mes divis es en sous cat gories on trouvera dans la cat gorie format les sous cat gories articles p riodiques livres articles de journaux etc Si l on prend donc la visualisation dans son sens large d affichage de l information les espaces s parant les cat gories et la mise en gras des titres de cat gories constituent eux m me une visualisation de l organisation de l information de m me que l organisation d un livre en parties et chapitres Limited facets after Rich facets upon initial search selecting
159. lles d une r alit et l ments participatifs de la r alit qu elles d signent le travail sur les donn es permet d ouvrir des niveau de connaissance et de r alit qui autrement resteraient inaccessibles Plus concr tement travailler sur des variables qui seraient d sign es comme symboliques plut t qu indicatives de la biblioth que et de son activit permet de ne pas verrouiller leur signification qui resterait ainsi construire de mani re collective par les professionnels de l tablissement qui les a produit 125 Ibid p 18 126 ALAIN Corbin 1991 Arlette Farge Le go t de l archive Annales conomies Soci t s Civilisations 1991 Vol 46 n 3 p 595 597 7 Indicateur 2014 Wikip dia en ligne Consult le 9 novembre 2014 Disponible l adresse http fr wikipedia org w index php title Indicateur amp oldid 106207898 Page Version ID 106207898 128 TILLICH Paul et GOUNELLE Andr 2012 Dynamique de la foi Gen ve Qu bec Paris Ed Labor et fides les Presses de l Universit Laval diff les Ed du Cerf p 47 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 48 Les donn es un atout pour la gestion d une biblioth que Par leur nature ontologique les m tadonn es participent pleinement de ce caract re symbolique l essai intitul The life and death of data cherche pr cis ment mettre en lumi re l instabilit essentielle des m tadonn es A
160. ltimately your evaluation will help you determine how good the algorithm is at labeling You might want to add more features and check how that alters the evaluation metric You d then be tuning both which features you were using and k But as always you re in danger of overfitting O NEIL SCHUTT 2013 Non pagin dans sa version lectronique 5 GILLEPSIE para tre Above all else the providers of information algorithms must assert that their algorithm is impartial The performance of algorithmic objectivity has become fundamental to the maintenace of these tools as legitimate brokers of relevant knowledge No provider has been more adamant about the neutrality of its algorithm than Google which regularly responds to requests to alter their search results with the assertion that the algorithm must not be tampered with L aspect politique des algorithmes est pr cis ment ce qui doit tre mis en avant davantage que les aspects techniques qui les concernent Ibid In attempting to say something of substance about the way algorithms are shifting our public discourse we must firmly resist putting the technology in the explanatory driver s seat While recent sociological study of the Internet has labored to undo the simplistic technological determinism that plagued earlier work that determinism remains an alluring analytical stance A sociological analysis must not conceive of algorithms as abstract technical achievements but must u
161. m thode scientifique obsol te les hypoth ses test es sur des donn es tant remplac es par des analyses reposant sur de simples corr lations d pourvues de pr requis Si dans un premier temps Mayer Schoenberger et Cukier s attachent nuancer cette id e la suite de leur propos contribuent pourtant appuyer les propos d Anderson l re du Big Data il n est plus efficace de d cider quelle variables examiner en s appuyant seulement sur des hypoth ses Les jeux de donn es sont beaucoup trop larges et le domaine consid r probablement bien trop complexe Heureusement un grand nombre de contraintes qui nous poussait une approche conduite par hy poth se ne p se plus autant qu auparavant Nous avons d sormais tant de donn es disponibles et tant de capacit de calcul que nous n prouvons plus le besoin de choisir laborieusement une ou plusieurs variable d approximation et de les exami ner une par une Des analyses computationnelles sophistiqu es permettent d sor mais d identifier l approximation optimale comme cela s est pass pour Google Flu Trends apr s avoir examin pr s d un demi million de mod les math ma tiques En r alit nous dirions plut t que les pr suppos s inh rents au choix des variables fonction des hypoth ses de d part d une recherche se sont d plac s de ce choix des variables au choix des principes sur lesquels reposent les algorithmes les analyses computationnelles co
162. man 1819 1891 Related Works Related Works Th wer of blackness Hawthorne Poe Melville lawthome Poe Melville nerican literature and the American West e The marriage of heaven and earthaichemical regeneration in the works of Taylor Poe f the the indetermi ions of Poe Hawthorne and Melville Hawi ne and Fuller e Th nd ti hale the of words and wits in of Poe and Melville in fiction Ruined Eden of the present Hawthorne Melville and Poe critical essays in honor of Darrel erican prose masters Cooper Hawthorne Emerson Poe Lowell Henry James Abe Fis and more in WorldCat Find th s and more in WorldCat Es View th oridCat Identities page for Hawthorne Nathaniel 1804 1864 View the w iCat Identities page for Melville Herman 1819 1891 aoe Figure 34 Visualisation propos e par l OCLC pour explorer les identit s de WorldCat 286 Watch Dogs WeAreData sans date Watch Dogs WeAreData en ligne Consult le 31 ao t 2014 Disponible l adresse http wearedata watchdogs com 7 RESEARCH OCLC sans date WorldCat Identities Network en ligne Consult le 2 septembre 2014 Disponible l adresse http experimental worldcat org IDNetwork display html query lccn n83 162771 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 112 Table des mati res SIGLES ET ABR VIATIONS unanini anai ne E 9 INTRODUCTION E E AS 11 Qu est ce que les donn es des biblioth ques 7 12 Po
163. matique de jeux de donn es h t rog nes la ferme des donn es permet de corr ler plus facilement des variables de natures assez diff rentes et peut tre a un niveau de pr cision plus fin que ce qui est actuellement permis par les outils utilis s aujourd hui en biblioth que Penser les donn es des biblioth ques non comme des indicateurs mais comme des symboles de son activit Dans son article sur la dangereuse superficialit des donn es des biblioth ques Jamene Brooks Kieffer tire une conclusion qu il nous a paru int ressant de souligner L expression la mode de prise de d cision fond e sur les donn es fait faussement croire de nombreux biblioth caire qu ils agissent correctement en fondant leur d cisions sur la quantit d une chose ou le pourcentage de telle autre chose La prise de d cision fond e sur les donn es est une approche simpliste d un probl me complexe Elle contourne toutes les formes les plus basiques d ana lyse des donn es et ignore la possibilit que les d cisions devraient prendre en consid ration des facteurs autres que des donn es quantitatives Il nous semble que ce que l auteur critique principalement n est pas tant l utilisation de variables quantitatives pour informer les d cisions concernant la biblioth que que la trop grande confiance accord e a ces variables du fait de la volont de certitude qui sous tend le pilotage d un tablissement Or
164. mplexes permettant ventuellement de choisir ces variables notre place De fait lorsque les auteurs faisant la promotion du Big Data pour son objectivit opposent une conception scientifique traditionnelle aux nouvelles m thodes d analyse du Big Data ils opposent implicitement une conception de la science moderne et platonicienne une conception antique et aristot licienne en parlant d elles m mes les donn es massives remettraient Aristote au go t du jour Mais les donn es parlent elles v ritablement d elles m mes Rien n est moins s r car ce serait oublier que les techniques d analyse employ es ont largement recours aux algorithmes et de ce fait aux math matiques Or pour retrouver Aristote crit Olivier Rey il faudrait oublier non telle ou telle th orie mais le cadre math matique lui m me ce qui n est plus en notre pouvoir lorsqu il s agit d interroger scientifiquement la nature Il est donc erron de penser que les donn es puissent parler d elles m mes Est ce que vraiment N tout se demandent O Neil et Schutt C est bien l le probl me ce n est quasiment jamais tout Et nous passons souvent c t de ce quoi nous devrions pr ter le plus attention Par la seule pr tention selon laquelle une variable suffirait repr senter un ph nom ne complexe les algorithmes continuent faire revivre le pr jug galil en qui consiste voir en l univers un livre crit mat
165. munaut qu ils desservent que sur ce que cette formation leur a permis de faire afin d am liorer les services de leur tablissement Un autre objectif de la DST4L tait de renouveler les comp tences des biblioth caires et beaucoup de participants utilisent d sormais leurs nouvelles capacit s Par exemple Veronica Downey a automatis certaines t ches de la biblioth que en utilisant Python Alex Holachek aide l ADS am liorer ses outils de visualisation et Katie Frey cherche introduire les technologies s mantiques en astronomie Mais s il est vrai que ce type de formation s av re n cessaire est il r aliste et faisable de former des biblioth caires la programmation et de leur faire acqu rir une expertise en analyse des donn es 139 9 Comment dompter les donn es bibliographiques Au sein de la formation mise en place par Christopher Erdmann certains participants ont t associ s un projet dont l objectif tait d am liorer le fonctionnement de certaines t ches de l ADS Il s agissait en effet de rep rer dans l immense biblioth que num rique de l Internet Archive IA les documents d j poss d s par l ADS et ceux qui ne l taient pas ce afin de compl ter les collections num rique de l ADS en pointant vers les ressources de l Internet Archive l o celles ci faisaient d faut Le projet a d abord subi quelques modifications quant ses objectifs du fait de l incompatibilit
166. n ligne Consult le 1 novembre 2014 Disponible a l adresse http bits blogs nytimes com 2013 06 19 sizing up big data broadening beyond the internet Sliding scale mapping local group and system wide library infrastructure hangingtogether org sans date en ligne Consult le 21 juillet 2014 Disponible l adresse http hangingtogether org p 3 149 su Hamlet Legendary character Drama WorldCat org sans date en ligne Consult le 8 septembre 2014 Disponible l adresse http www worldcat org search q su 3 AHamlet 28Legendary character 29 Drama amp qt hot_ subject Tag Galaxy sans date en ligne Consult le 9 septembre 2014 Disponible a l adresse http taggalaxy de The Life and Death of Data sans date en ligne Consult le 2 novembre 2014 Disponible a l adresse http lifeanddeathofdata org Top 250 CIC borrowers by location jpg Image JPEG 658 x 435 pixels sans date en ligne Consult le 21 ao t 2014 Disponible l adresse http hangingtogether org wp content uploads 2013 07 Top 250 CIC borrowers by location jpg UDC Seminar 2013 sans date en ligne Consult le 16 mai 2014 Disponible a l adresse http seminar udcc org 2013 programme php Visualizing Network Flows Library Inter lending hangingtogether org sans date en ligne Consult le 3 juin 2014 Disponible a l adresse http hangingtogether org p 3053
167. n ligne mai juin 2014 Vol 18 n 3 Consult le 17 ao t 2014 DOI 10 5281 zenodo 11217 Disponible l adresse https zenodo org record 11217 files DataScientistTraining pdf 131 Ibid Much of what we librarians do helps facilitate search and discovery in the ADS but more importantly we generate many of the data links that astronomers use on a daily basis This curation activity also supports analyses of how telescopes and instrumentation are performing I believe this type of work forms the back drop of the data centric library p 21 132 GAILLARD 2013 p 71 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 49 ee ED EEE Droits d auteur r serv s OU de la science des donn es Pour pouvoir d velopper l Open Research Data dans les biblioth ques universitaires il faut donc d abord envisager des programmes de formation innovants tels qu Immersive Informatics un programme pilote anglo australien labor par les universit de Melbourne et de Bath dont le but est d apprendre des biblioth caires g rer un jeu des donn es en vue de sa conservation et de sa diffusion future En voquant ce contexte d ouverture des donn es de la recherche nous souhaitons souligner que la formation des biblioth caires l analyse des donn es dont nous avons d montr plus haut l int r t pour l valuation et la gestion des biblioth ques s inscrit dans un mouvement plus global a
168. ndre visible la biblioth que sur Internet 76 Les biblioth ques dans l conomie de l attention 76 De la monumentalit au geste visuel 77 Un data gamesstellaire ses ann a ane E on tos 79 Nouveau mod le de biblioth que ou renouvellement d un mod le de DIDHOTR QUE 7 manifestent 81 CONCLUSION DONN ES ET POLITIQUE ccsssssssssssssssssssssssesscsseassscassssncees 83 BIBLIOGRAPHIE sentiments 87 Articles ENCY CLOPECIQUES 6 cc0cscaces cosaccisiessscvenssoccasecbanessusdenadbucvsncsscaraneieedsoncasecdeouonene 87 NVI CM OUE CS 3a cc jnsedsdscescaiccsapscantencaucienowecsdbadscadecsovsuanceuciscsssnsessseodsieccchusebiesusestecsaucsesuccusets 88 MOROS APDRI S sacsvissc si ccossahaceutucvesssssasndsoeostesscaossedsabacuussuseavedsusbssuabdasseasscuans Reinass 88 REVUES sn E Sn A a Es nn nn 91 Sites LOUE 112 DRE ne A ee RER PE 92 MAGEO SPADES sssccicsiscccasdizs cobden vast cxsetedubsccouchsssuaieuss eubansespsbuaversuenedensesesouenaneasseceansabesie 96 TABLE DES ANNEXES sessessesssssesessossssossossssesssessscosossessossssesssessosossssessssssssssssessesos 97 TABLE DES TELUS TRA TIONS wsisscissssccscsosves sssescssscnossasesesonsendnsasesgessegeasvenscs sants 112 TABLE DES MATIBRES nn din 115 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 116
169. ne of those branches however has it listed under its call number 641 59 W That translates to Technology and applied sciences gt Home economics and family living gt food and drink That s one logical place for it But just one If you search for the same book at Amazon you ll find a similar classification scheme But Amazon lists The Little House Cookbook under three categories _ Children s Books gt Author amp Illustrators A Z gt W gt Williams Garth _ Children s Books gt History amp Historical Fiction gt United States gt 1800 s _ Children s Books gt Sports amp Activities gt Cooking If you want to see all books about both cooking and history without specifying that the books have to be associated with a work of literature Amazon will happily build that list for you It s like having a Dewey Decimal Classification System written to order p 126 212 Porphyre trace un arbre des substances unique tandis qu Aristote utilise la m thode de la division avec beaucoup de pr caution voire de scepticisme En th orie nous sommes autoris avancer l hypoth se qu il Aristote n aurait pas su construire un arbre de Porphyre fini et m me en pratique car nous le voyons dans Les parties des animaux renoncer de fait construire un arbre unique et r ajuster des arbres compl mentaires au gr de la propri t dont il veut expliquer la cause et la nature essentielle ECO 2010 p 20
170. nn es a l aide d algorithmes et de programmes En somme l id e est de rassembler toutes les informations possibles sur un auteur partir de donn es dispers es Ces informations sont de plusieurs types Citons dans l ordre la p riode de publication de l auteur ainsi que de l ensemble des uvres qui ont t publi es sur lui l ensemble des formes sous lesquelles le nom de cet auteur se rencontre l ensemble des langues dans lesquelles il a t publi les uvres de cet auteur les plus poss d es par les biblioth ques le niveau du public vis par ses ceuvres jeunesse g n ral ou sp cialis des liens vers le fichier VIAF de cet auteur mais aussi vers l article Wikip dia qui le concerne inversement des liens ont t inclus dans les articles de Wikip dia pointant vers le fichier VIAF et enfin le nuage de sujets couverts par cet auteur permettant de voir quel th mes principaux sont associ s son uvre Toutes ces informations doivent permettre d enrichir la navigation de l utilisateur sur l interface de WorldCat ces enrichissements pouvant tre vus comme la valeur ajout e apport e par l application de la science des donn es aux donn es bibliographiques Si donc la section de data mining de l OCLC a recours des outils relevant de la science des donn es quels peuvent tre les pr suppos s qui leur sont inh rents L algorithme Work Set FRBR En ce qui concerne l laboration des identit s
171. nn es de circulation d acquisition de fr quentation etc ne sont elles pas construites elles aussi dans le contexte bien particulier de l activit d un tablissement et non dans le but de rendre compte de cette derni re De ce fait l id e de faire parler les donn es ne serait pas autre chose que d essayer de penser l invention d un langage qui s adapte elles et qui si l on voulait reprendre les mots d Alain Corbin autorise une qu te en profondeur sans que le chercheur pr tende en puiser le sens Pour l heure la visualisation est sans doute le langage qui le mieux cherche appr hender le caract re social et construit des donn es Mais il n est pas dit qu il soit impossible l avenir d int grer cet aspect dans d autres langages tels que les algorithmes et l apprentissage automatique Par ailleurs cette r flexion autour du langage des donn es impliquerait n cessairement cette autre id e sous jacente selon laquelle faire parler les donn es pose la question du r el et de ses repr sentations Par l il devient pertinent d interroger la notion d indicateur notamment dans le contexte de la gestion d une biblioth que En effet si comme l affirme wikip dia l utilit d un indicateur d pend d abord de sa capacit refl ter la r alit peut tre serait il plus honn te de lui pr f rer la notion de symbole telle que d crite par Paul Tillich la fois repr sentations conventionne
172. nnally Harry 5 Truman and Arthur Vandenberg at German airport July James F Bymes Tom Connally Joseph T McNamey and Arthur Vandenberg in Germany Septer Systema naturae per regra tris naturae secundum classes ordines genera species cum chara Corchyliclagie systematique Tom 1 Le Regne Animal 1st Ed Tom 4 1817 Regre animal 2nd Ed Tom 3 1830 Histoire naturelle des Animaux sans vertebres 2nd Ed Tam 2 La Feuille des jeunes Naturalistes Tom 33 p 202 ngies amp Sawyer Sawyer Memorial Baptist Cope SC tee jams Letter 37 Jan nes Henley Homes LEE 2 Jan lames Henley jams etter 42 Jan Jens Hen F1 ams ie dir Janes Henley ams 1 34 Jan James Henley fams Letter 29 Jan Shes Harley fame Letter 47 jan ames Henley ne Letter 47 Jan Jones Henley fame Fete 29 Jan james tjene s p jams Sarah s account of root nes Henley of ams Sarah s account of Ses Heni D ams Sarah s account of mes Henley of Rede lite ms Sarah s Be Count 9 ones Henley pots fi nk Sarah account Ol Hennepin County Commissioner Tom Olson ard Sherif Donald mod in parade Minneapolis Hennebn County Commissioner Tom Olson a onald Omodt in parade Minneapolis Address delivered by Hon FA Sawyer upon the common schools what they can do for a sta Printed pamphlet and beoadside announcing the candidacy of Tom B Pearce for governor The Royal Exchange Tom pointing out to Jerry a few of the primest feature
173. nnes pourraient bien tre les personnes que nous aurions besoin de sonder afin de comprendre les probl mes de notre pays concernant le vote En effet les donn es si massives qu elles puissent tre ne disent pas tout celles d un SIGB par exemple n apportent aucune information sur les personnes qui n utilisent pas les services d une biblioth que et a cet gard les enqu tes sur les pratiques culturelles des fran ais 27 Ibid p 78 8 O Neil et Schutt font de ce pr suppos selon lequel nous disposons de toutes les donn es le plus gros probl me l re du Big Data Pour tayer cela elles prennent l exemple de comptage des votes lors d une lection Indeed we d argue that the assumption we make that N all is one of the biggest problems we face in the age of Big Data It is above all a way of excluding the voices of people who don t have the time energy or access to cast their vote in all sorts of informal possibly unnannounced elections Those people busy working two jobs and spending time waiting for buses become invisible when we tally up the votes without them To you this might just mean that the recommendations you receive on Netflix don t seem very good because most of the people who bother to rate things on Netflix are young and might have different tastes than you which skews the recommendation engine toward them But there are plenty much more insidious consequences stemming from this basic idea
174. notices seront regroup es ensemble comme l explique Thomas Hickey Le but est de cr er une cl capable d identifier de mani re s re et unique un grou pe FRBR Le cas le plus ais est celui o nous avons un auteur et un titre ou un titre solitaire et uniforme Si nous n avons pas un auteur ou un titre uniforme alors nous essayons de trouver des champs correspondants au nom les tiquettes 7XX pour aider identifier des documents associ s Les notices qui ne poss dent que des champs 24X il n y pas de champ 1XX ou 7XX dans la notice sont combin es avec leur nombre WorldCat pour construire une cl unique Nous ne pouvons pas combiner ces titres qui s associent tant donn que nous n avons pas assez d infor mations pour grouper de mani re fiable ces documents Les contournement d velopp s pour palier au fait qu une uvre peut tre sans titre ni auteur montrent bien que le concept d uvre tel qu il est d fini par les FRBR et qui commande l algorithme que nous venons de d crire n a rien d vident Pour le d montrer David Weinberger prend l exemple d Hamilet si l on suit en effet la description FRBR Hamlet constitue bien une uvre au sens platonicien du terme puisqu elle n a jamais exist en tant que telle de par toutes les mani res diff rentes avec lesquelles elle a t jou e et publi e La version d Hamlet incluse dans le Premier Folio constitue alors une des expression de l uvre le
175. nouveau tre une possibilit int ressante par son caract re m taphorique elle rend bien compte du caract re fondamentalement symbolique des variables qui sont choisies pour repr senter son activit Elle est par ailleurs un moyen ludique d apprendre faire parler les donn es tout en faisant sentir l apprenant le caract re construit de ce langage ne serait ce que parce que cet apprentissage implique de r fl chir au choix d une m taphore pour exprimer la biblioth que Par ailleurs l aspect instable des donn es ou des variables pens es comme des symboles permet galement d envisager que le sens qui est construit partir des donn es ne peut tre fixe et certain la confrontation des variables entre elles telle que recommand e par Jamene Brooks Kieffer implique de questionner de mani re permanente le sens des donn es De ce fait la biblioth que par le biais de ses donn es est au c ur d un dialogue permanent avec l lu Or par ces qualit s communicationnelles la visualisation est ce qui par excellence permet d enclencher et de renouveler r guli rement les termes de ce dialogue avec les tutelles de la biblioth que Mais quid dans ce contexte du dialogue avec les usagers de la biblioth que La PDA il est vrai a permis de nourrir l espoir d une participation int grale des usagers dans le pilotage de la collection d un tablissement par le biais notamment de moteurs de recherches et d acquisitions la con
176. npack the warm human and institutional choices that lie behind these cold mechanisms LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 26 Les donn es une r volution pist mologique pour les biblioth ques Il convient maintenant de se demander dans quelle mesure l analyse des donn es des biblioth ques peut prendre en compte ou non la subjectivit inh rente a la science des donn es L EXEMPLE DE L ONLINE COMPUTER LIBRARY CENTER OCLC L OCLC dispose d une section enti rement consacr e la science des donn es Cette derni re s attache produire des rapports sur l volution des collections physiques des biblioth ques am ricaines dans le contexte de la num risation de masse Une section consacr e l extraction et l analyse de donn es Organisation mondiale but non lucratif d di e aux biblioth ques mais aussi organisme de recherche l OCLC se pr tait tout particuli rement la r utilisation des donn es bibliographiques C est elle qui en effet est derri re le pilotage de WorldCat consid r comme le plus grand catalogue OPAC du monde De fait l OCLC s est engag e depuis 2012 dans un processus d ouverture de ses donn es bibliographiques en envisageant la cr ation d une r serve mondiale de donn es partag es qui pourrait tre utilis e et r utilis e pour la description des ressources r duisant ainsi le travail redondant inh rent aux processus actuels de catalogage
177. nstar des donn es qu elle est cens e repr senter la visualisation parlerait d elle m me C est notamment ce qu explique Edward Tufte consid r comme l un des premiers penseurs de la visualisation de donn es lorsqu il recommande l infographe de montrer les donn es et d viter de transformer ce que les donn es ont dire Dans ce contexte le r le des humanit s num riques consiste non seulement laborer un cadre critique en repla ant chacune des composantes de la visualisation de donn es dans le contexte th orique qui l a vu na tre mais galement promouvoir un enrichissement th orique de la visualisation au moyen des textes de praticiens th oristes du XX si cle qui ont fond l enseignement du graphisme et du design Wassily Kandinsky Laszlo Moholy Nagy et Paul Klee pour ne citer qu eux L histoire culturelle des infographies des diagrammes des cartes des graphiques et des autres images sch matiques crit Johanna Drucker est un champ riche explorer pour trouver des mod les productifs l horizon des outils th oriques fournis par les humanit s Ainsi consid r e au regard des humanit s Num riques la visualisation de donn e peut tre vue comme plus informative du point de vue de ses m thodes que les autres techniques incluses dans le champ de la science des donn es 7 DRUCKER Johanna 2010 Graphesis Visual knowledge production and representation Poetess Archive
178. nt ce message aux bi blioth ques am ricaines que les seules statistiques significatives sont des col lections de donn es num riques et de simple calculs effectu s sur ces don n es devrait on s attendre ce que les biblioth ques elles m mes pensent ou agissent de mani re diff rente Il nous semble d ailleurs que ce constat portant sur l environnement institutionnel des biblioth ques am ricaines s applique aussi bien celui des biblioth ques fran aises l observatoire de la lecture publique tant d crit par Val rie Alonzo comme un r servoir statistiques d une grande richesse dans la limite de la compl tude et de l exactitude des r ponses apport es aux enqu tes permettant d exploiter les statistiques de fa on synth tiques calcul de ratios de valeurs moyenne ou m diane Cependant quelle m thode d analyse Jamene Brooks Kieffer propose t elle la place des traditionnelles donn es quantitatives et des indicateurs qui tiennent lieu pour nous de statistiques Pour r pondre cette question l auteur commence par opposer la macro valuation dont l objet est de s int resser ce qu un ensemble de variables peut dire d un organisme la micro valuation qui se concentre elle sur la mani re dont ce jeu de variables est affect par d autres ensemble de variables Pour illustrer ce propos Brooks Kieffer prend l exemple d une situation particuli re celle o un direc
179. nt cela le probl me probl me qui comme nous le verrons rel verait plut t d une rar faction des processus et occasions de subjectivation d une difficult devenir des sujets que d un ph nom ne de d subjectivation ou de mise en danger de l individu p 180 GILLESPIE para tre LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 30 Les donn es une r volution pist mologique pour les biblioth ques Une des publications de l OCLC Livres sans fronti res Un exemple de l utilisation de l algorithme que nous venons de d crire peut tre observ dans la publication de Brian Lavoie et Roger Schonfeld intitul e Livres sans fronti res un bref horizon de la collection d imprim s l chelle du syst me Partant du principe que de nos jours les d cisions ayant trait 4 un nombre important de domaine tirerait b n fice de consid ration provenant du contexte plus large du syst me les auteurs se posent la question de savoir de quelle mani re la collection globale d crite par les donn es de WorldCat se r partit a l chelle des diff rentes institutions qui y participent et en quoi ces informations pourraient dans un futur proche influencer les politiques de num risation de conservation et de m diation des collections Les conclusions des analyses des auteurs effectu es sur les quelques 32 millions de donn es provenant des notices des livres imprim s con
180. nt par la confrontation de syst mes de recommandation et d algorithmes de classement au sein de WorldCat et d Amazon Mais pourrait on objecter quel rapport peut il y avoir entre la connaissance sur les usages des biblioth ques que pourraient prodiguer les enqu tes de publics et la connaissance institutionnelle que pourrait effectivement apporter la visualisation des m tadonn es Peut on v ritablement mesurer les apports du Big Data et de la sciences des donn es en comparant des pratiques aux m thodes et aux objectifs fort diff rents Quel est dans ce contexte le r el apport des nouveaux outils par rapport aux pratiques d j existantes permettant de conna tre les biblioth ques De fait les biblioth ques n ont pas attendu les nouvelles techniques apport es par les m gadonn es pour faire parler leur donn es On trouve en effet dans le Guide des tudes de publics en biblioth que un chapitre entier consacr la connaissance des publics via les donn es de la biblioth que qui d veloppe l id e selon laquelle avant m me d envisager la r alisation d une enqu te les biblioth ques disposent elles m mes d une multitude d informations dont l exploitation permet de fournir une connaissance riche et parfois unique des usagers et des usages dont elles font l objet Si donc les biblioth ques font d j usage des donn es d inscriptions pour appr hender la capacit de l tablissement susciter l int r
181. ntation naturelle pour la classification et par l la navigation D ailleurs les sites de commerce en ligne l ont bien compris puisqu ils proposent bien souvent une interface facettes pour naviguer dans leur catalogue de produits figure ci dessous comme l explique le consortium de biblioth ques universitaires de l Illinois dans sa page consacr e aux questions fr quemment pos es Les facettes permettent de diviser un ensemble de documents comme une liste de r sultats provenant d un moteur de recherche en des sous ensembles plus petits partir d un l ment commun que partagent ces documents La recherche facett e permet de fournir un moyen l utilisateur de restreindre rapidement un ensemble large de documents vaguement li s entre eux en des sous cat gories plus petites Des exemples populaire de l utilisation de fa cettes sont Amazon eBay et beaucoup d autres sites d achats en ligne de m me que quelques catalogues de biblioth ques ou de bases de donn es d ar ticles Par exemple une recherche pour le terme chaussures sur un maga sin en ligne vous permet d avancer en restreignant chaussures d homme ou chaussures de femmes puis de restreindre encore par couleur prix etc En clair les interfaces proposant une recherche facettes permettent d affiner une id e comme on pellerait un oignon et d avancer dans l information en partant du g n ral pour arriver au particulier Il s agit don
182. ntervalle et par l crite dans une autre perspective selon d autres valeurs que celles qui avaient pr sid l criture du Quichotte de Cervant s Les termes du d bat sont donc les suivants doit on identifier l uvre du point de vue de sa conception de son autorit comme le fait l algorithme de l OCLC ou bien de sa r ception et de son interpr tation comme le ferait l algorithme d Amazon qui effectue ses regroupements en fonction des go ts pass des usagers exprim s par leurs activit s de t l chargement lecture commentaires notations ou par le fait de mettre le document dans ses favoris par exemple Si l algorithme FRBR de l OCLC choue regrouper l int gralit des uvres en fonction de leur autorit puisque nous avons vu que cela tait loin d tre une vidence l algorithme d Amazon y r ussit il davantage en cherchant d terminer la r ception de l uvre Pour Tarleton Gillespie la r ponse est n gative Dans ces cycles d anticipation ce sont les bits d information qui sont les plus lisibles pour l algorithme et qui ainsi ont tendance repr senter les uti lisateurs Facebook sait beaucoup de ses utilisateurs mais cependant il ne sait que ce qu il est capable de savoir L information la plus connaissable la g o localisation la plate forme informatique les informations du profile les amis les mises jour de statut les liens suivis sur un site le temps pass sur un site l ac
183. of DST4L was to upgrade the skills of librarians and many of the participants are now using their new found skills For instance Veronica Downey has automated library processes using Python Alex Holachek is helping the NASA ADS improve its visualization tools and Katie Frey is implementing technologies in astronomy 13 Nous traduisons ici le titre des deux posts du blog de la DST4L qui nous serviront d exemple ici How to Beat Bibliographic Data into Submission pt 1 Data Scientist Training for Librarians sans date en ligne Consult le 7 juillet 2014 Disponible a l adresse http altbibl io dst4l how to beat bibliographic data into submission pt 1 et How to Beat Bibliographic Data into Submission pt 2 Data Scientist Training for Librarians sans date en ligne Consult le 7 juillet 2014 Disponible l adresse http altbibl io dst4l how to beat bibliographic data into submission pt 2 14 Thid pt 1 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 51 a a EI EEE Droits d auteur r serv s OU que celles qui n y correspondaient pas r v lant ainsi les manques qui peuvent exister dans les collections num riques de la NASA Grace a ce proc d les participants ont pu construire un tableur dans lequel figurent d une part les donn es r cup r es de l ADS et d autre part celles r cup r es de l Internet Archive chaque ligne du tableau faisant correspondre ou non les donn es
184. ollections Dans un premier temps j ai donc explor le catalogue en ligne en esp rant assez na vement rep rer quelques zones sensibles des endroits o la collection tait peut tre trop ancienne si tant est que ce crit re puisse tre valable en lettre et sciences humaines peut tre trop sp cialis e par rapport au grand public de la Bpi mais de ce point de vue une th se d universit peut parfois se r v ler plus accessible qu un manuel de premier cycle universitaire peut tre trop redondante dans les sujets couverts mais certains sujets sont naturellement plus couverts que d autres Finalement d courag e par la masse des collections a explorer je me suis d cid e recourir l entrep t de donn es de la Bpi afin d extraire des listes d ouvrages par domaine et d essayer de les synth tiser par des estimateurs statistiques il s agissait de d terminer pour chaque tranche de cote les dates d dition les plus anciennes les plus r centes l ge moyen de l ensemble les auteurs et les sujets les plus repr sent s en essayant de visualiser cela au moyen de diagrammes en barres et de simples camemberts Naturellement je ne pouvais pas d duire grand chose de ces analyses exploratoires sans une connaissance approfondies des r alit s documentaires vers lesquelles elles pointaient et j ai donc pris la d cision d interroger des responsables de collections sur mon petit travail statistique Ce fut sans doute la part
185. on unique un d sordre selon le terme du titre de l ouvrage de Weinberger que chacun parcours selon sa propre conception du monde avait donc d j t ent rin au temps des Lumi res ce que Weinberger est 201 Cf note n 190 22 WEINBERGER 2008 For The Little House Cookbook the list of Statisically Interesting Phrases includes sterilizing kettle pie paste pastry surface buttered pie pan and blood warm water Click on any of these phrases and Amazon will show you other books that also use them sterilizing kettle turns out to occur in The Fall A Novel by Simon Mawer p 129 203 Cette pens e est d velopp e par Eco mais est galement au c ur du projet de Gilles Deleuze et F lix Guattari intitul Capitalisme et Schizophr nie Rhizome is a philosophical concept developed by Gilles Deleuze and F lix Guattari in their Capitalism and Schizophrenia 1972 1980 project It is what Deleuze calls an image of thought based on the botanical rhizome that apprehends multiplicities Rhizome philosophy 2014 Wikipedia the free encyclopedia en ligne Consult le 14 d cembre 2014 Disponible l adresse http en wikipedia org w index php title Rhizome philosophy amp oldid 637871872 Page Version ID 637871872 24 ALEMBERT Jean Le Rond d et CONDORCET Jean Antoine Nicolas de Caritat marquis de 1821 uvres de d Alembert A Belin Volume 1 p 44 25 ECO 2010 p 7
186. ond Bibliometrics Harnessing Multidimensional Indicators of Scholarly Impact Cambridge Massachusetts MIT Press ISBN 9780262525510 DELCARMINE Nadine Tableaux de bord en biblioth que dans ALONZO et RENARD 2012 ECO Umberto 1965 L uvre ouverte Collection Points Editions du Seuil Paris ECO Umberto 2010 De l arbre au labyrinthe tudes historiques sur le signe et l interpr tation Paris Grasset 978 2 246 7485 1 9 ELGUINDI Anne C MAYER Bill Telling your library s story how to make the most of your data in a presentation dans ORCUTT 2010 EVANS Christophe dir Mener l enqu te guide des tudes de publics en biblioth que 2011 Collection La bo te outils 1259 4857 FARGE Arlette 1997 Le Go t de l archive Paris Seuil ISBN 2020309092 9782020309097 KELLAM Lynda M et PETER Katharin 2011 Numeric data services and sources for the general reference librarian Oxford Chandos Publishing ISBN 1843345803 9781843345800 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 89 on EI EEE Droits d auteur r serv s OU INTERNATIONAL UDC SEMINAR SLAVIC Aida et UDC CONSORTIUM THE HAGUE d 2013 Classification amp visualization interfaces to knowledge proceedings of the International UDC Seminar 24 25 October 2013 The Hague the Netherlands organized by UDC Consortium The Hague W rzburg Ergon ISBN 9783956500077 3956500075 KESSOUS
187. ondre aux questions fondamentales du d velop pement des collections s lectionnons nous ce dont les usagers ont besoin Les donn es d usages peuvent elles nous aider cerner ces besoins Avons nous suffi samment rendu service la fois notre facult et nos tudiants Les demandent de PEB repr sentent elles des failles dans les collections ou bien des d sirs des usagers qui iraient au del de la port e de nos politiques documentaires actuelles 114 Ibid To determine for instance why patrons check out items at a rate 75 percent less than that of local patrons we need to conduct a micro valuation We can gather other quantitative and qualitative data from the ILS and from distance patrons themselve to expand our original analysis The pratcice of micro evaluation requires that we also examine other issues that affect distant patron s interactions with the library library policies scheduling constraints course content and so forth While complicatin the analysis a great deal micro evaluation provides amore complete answer to our question by attempting to consider factors outside the data s scope p 11 M E LINK Forrest TOSAKA Yuji WENG Cathy Mining and Analyzing Circulation and ILL Data for Informed Collection Devlopment Preprint para tre dans College amp Research Libraries 2015 Microsoft Word Link Tosaka Weng docx crll4 632 full pdf sans date en ligne Consult le 8 d cembre 2014
188. ous donner la peine de relire la progression de notre r flexion la lumi re de cet aspect politique essentiel qui lui est attach trois axes se d gagent ou plut t trois questions se posent comment mieux conna tre cet objet politique qu est la biblioth que et travers elle l information Comment piloter la biblioth que quand celle ci est au c ur d un dialogue permanent entre un trio d acteurs que sont le biblioth caire son lu et ses usagers Et enfin comment fournir un acc s pour tous la connaissance et aux collections de la biblioth que quand celui ci est n cessairement le r sultat d une vision propre un groupe dominant concernant le monde et son organisation L histoire des biblioth ques comme leurs professionnels souffre de corporatisme crivait Martine Poulain Cette histoire est en effet encore insuffisamment li e l histoire culturelle sociale politique g n rale des soci t s et des poques auxquelles elles appar tiennent et dont elles sont n cessairement un miroir et un reflet Quoi de plus n cessairement politique pourtant dans toute l histoire des soci t s que l his toire des conceptions du livre de l crit et de leur partage Si l on veut donc concevoir la biblioth que et ses m ta donn es comme un objet politique miroir de l volution des normes et des valeurs avec lesquelles elles interagit continuellement il devient n cessaire de penser un outil de connais
189. pen data a l open research data quelles politiques pour les donnees de recherche pdf p 19 Ibid p 18 gt DRUCKER Johanna 2011 Humanities Approaches to Graphical Display en ligne 2011 Vol 5 n 1 Consult le 1 novembre 2014 Disponible a l adresse http www digitalhumanities org dhq vol 5 1 000091 000091 html LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 Introduction quoi elles font r f rence Mais en dehors de ces m tadonn es existent pour les biblioth ques les donn es relatives leurs activit s acquisitions d sherbages jauge de fr quentation circulations des documents inventaire des collections donn es de logs capt es au moment o les utilisateurs se connectent au site internet de la biblioth que ou bien a ses bases de donn es Si nous devions donner un exemple pr cis de ces donn es peut tre pourrions nous d crire un tableau contenant des informations relatives aux abonnements de la biblioth que a des p riodiques Ainsi pourrait on y lire des informations sur le mode d acquisition abonnement don d p t l gal le nombre de num ros r guliers a recevoir la date d arriv e pr vue du premier num ro la date d annulation la date de la facture la date de parution du dernier num ro g n r le num ro d identification unique du titre le num ro logique de la notice bibliographique etc Un tel tableau contenant un ensemble de variables relatives a plusieurs
190. plorer virtuellement les collections d une biblioth que Mais il est galement question ici d objectifs c est la 255 Richard Lanham dans KESSOUS 2012 p 170 6 Ibid Les filtres et les moteurs de recherche ou de recommandation constituent un moyen de r pondre aux ph nom nes de surcharge cognitive mais permettent aussi des ouvertures exploratoires en jouant sur la curiosit p 173 7 Du jeu de donn es au jeu avec les donn es The Pixel Hunt sans date en ligne Consult le 30 juillet 2014 Disponible l adresse http florentmaurin com p 471 258 Thid 25 BERM S ISAAC POUPEAU 2013 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 79 Droits d auteur r serv s OU le propre de la ludification Le jeu permet en effet l apprentissage l appropriation d un objet complexe par le biais d une exp rience interactive ob issant des r gles astreinte un ou plusieurs objectifs particuliers et produisant des r sultats variables en fonction de l action du joueur il suffirait alors de masquer l exploration des donn es du catalogue derri re un sc nario qui s appuierait sur une m taphore Il reste savoir quelle pourrait tre cette m taphore Umberto Eco avait soulign la conformit de la m taphore du cosmos avec la repr sentation d une organisation du savoir Cette m me m taphore ayant t d velopp e dans l exemple de Tag Galaxy pr sent plus haut po
191. pourrions commencer par examiner ces pr suppos s l chantillon comme on l a vu est construit en fonction d une probl matique particuli re qui d termine sa constitution en ciblant une population L exemple le plus r v lateur en est la m thode des quotas que l on utilise lorsque la population cibl e est connue Quant au hasard suppos garantir la repr sentativit de l chantillon il est difficile obtenir de mani re absolue D apr s le Guide des tudes de publics en biblioth que l enqu teur doit en effet s assurer que le sondage respecte bien la r alit du terrain les jours et heures d ouverture les lieux prospecter dans le cadre d un r seau etc et limiter l effet de proximit qui tend a s instaurer entre l enqu teur et l interrog e le premier ayant naturellement tendance choisir des personnes qui lui para tront les plus abordables en fonction de leur ge de leur sexe de leur milieu social et aussi de leur valeurs En ce qui concerne les questionnaires les biais proviennent la fois de l enqu teur et de l interrog En effet la formulation des questions d une part peut avoir pour effet d orienter les r ponses des interrog s et c est bien en vertu de ce principe qu il est recommand par exemple de mesurer la satisfaction au moyen d chelles vitant le refuge vers une position moyenne Les r ponses des usagers d autre part peuvent tre affect es par leur propres p
192. principes sous tendant cette organisation En cela le mouvement du Big Data apporterait quelque chose de radicalement nouveau 77 Thid 27 Ainsi Ronald E Day explique t il propos du Science Citation Index principe bibliom trique l origine m me du fonctionnement de l algorithme de Google DAY 2014 That a small number of authors publish a greater number of works is a sociological fact not a bibliometric one It belongs to the logic and distributions the grammars of social power in particular types of sociocultural systems Feeding this back into the production system in terms of social rewards or in temrs of favored search term leads to exponentially increasing the powers of the sociological systems and does little for the more marginal or unrepresented authors and works that were present or not for counting in the first place p 70 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 85 Droits d auteur r serv s OU Bibliographie ARTICLES ENCYCLOPEDIQUES Big data 2014 Wikipedia the free encyclopedia en ligne Consult le 1 novembre 2014 Disponible a l adresse http en wikipedia org w index php title Big_data amp oldid 631791921 Page Version ID 631791921 Classification d cimale universelle 2014 Wikip dia en ligne Consult le 27 ao t 2014 Disponible l adresse http fr wikipedia org w index php title Classification_d C3 A9cimale universelle amp oldid 10577356
193. quelque chose qui r siste qui concerne la collection en tant qu outil public C est l me semble t il le sens de l attachement du public le nier serait se couper du sens commun p 144 145 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 82 CONCLUSION DONNEES ET POLITIQUE Nous n avons pu nous emp cher de constater au cours de la r daction de cette tude la proximit troite qui existe entre les donn es des biblioth ques et de l information et ce que l on pourrait appeler le politique au sens de vision globale du monde organisant la vie de la cit L insistance sur la volont de neutralit qui se lit dans les discours accompagnant l acc s l information l re du Big Data qu il s agisse de ses aspects pist mologiques travers une certaine lecture de la science des donn es de la fourniture de contenus travers la PDA ou de l organisation de ces contenus travers le refus d une classification g n rale et collective au profit d un acc s individuel et fragment l information nous para t caract riser ce qui pr cis ment est par nature politique savoir l information et cet objet de diffusion de la connaissance qu est la biblioth que Comment ne pas penser en effet que cette revendication de la neutralit est d autant plus forte que l absence du politique est loin d tre une vidence quand il s agit de l information en contexte d mocratique D s lors si nous voulons n
194. r jug s Ces biais sont bien connus des enqu teurs et sont toujours pris en compte dans l analyse des r sultats Ils auraient tendance dispara tre dans un environnement de type Big Data ce qu affirme par exemple Andrew Nagy propos des donn es g n r es par Summon sorte de Google Scholar sp cifiquement destin aux biblioth ques universitaires am ricaines Toutes les requ tes des usagers dans un m me index unifi quelque soit le degr de personnalisation de leur interface Summon locale peuvent tre vus comme la cl pour obtenir des donn es significatives et interpr tables Ces donn es peuvent mettre en vidence des comportements qui illustrent les v ritables usages des services des biblioth ques contrairement aux usages d un petit nombre de participants observ s dans des situations peu habituelles telles que celles offertes par les t ches non ordinaire impos es l occasion des tudes d utilisabilit Outre la pr tendue disparition de ces biais les outils du Big Data feraient galement dispara tre toute hypoth se ou th orie pr alable une quelconque 3 EVANS 2011 p 63 Ibid p 74 3 What is Summon University Libraries Virginia Tech sans date en ligne Consult le 2 ao t 2014 Disponible l adresse http www lib vt edu help summon what is summon html Data Mining Big Data A Strategy for Improving Library Discovery Blog Serials Solutions
195. r 2013 sans date en ligne Consult le 16 mai 2014 Disponible adresse http seminar udec org 2013 programme php 718 Classification d cimale universelle 2014 Wikip dia en ligne Consult le 27 ao t 2014 Disponible l adresse http fr wikipedia org w index php title Classification_d C3 A9cimale_universelle amp oldid 105773565 219 INTERNATIONAL UDC SEMINAR SLAVIC Aida et UDC CONSORTIUM THE HAGUE d 2013 Classification amp visualization interfaces to knowledge proceedings of the International UDC Seminar 24 25 October 2013 The Hague the Netherlands organized by UDC Consortium The Hague W rzburg Ergon p X Recently notable advances have been made in the field of knowledge visualization especially in relation to knowledge ordering systems in the sciences in data mining applications and in an attempt to improve the use of large datasets and large databases The 2013 Seminar addresses the issue of visualization which is at the heart of the information discovery problem and by extension is an issues of concern for all bibliographic classifications The poor exploitation of classification in information retrieval has been long attributed to the lack of appropriate interface solutions that would make the complexity of knowledge classification easier to present and use in knowlegde browsing LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 69 Droits d auteur r serv s OU
196. r de la seconde ce qui par superposition permet d observer le mince cart quantitatif des deux variables c est l une autre mani re de repr senter la saturation Enfin une derni re figure repr sente sous la forme d une balance l id e que les espaces de la biblioth ques consacr s l apprentissage empi tent n cessairement sur les espaces consacr s aux collections Ces figures sont bien s r tr s simples et n apprennent pas grand chose sur l objet qu elles doivent repr senter mais elles constituent une premi re image de l activit de l tablissement et permettent d ouvrir un dialogue entre la biblioth que et sa tutelle 1 ELGUINDI Anne C MAYER Bill Telling your library s story how to make the most of your data in a presentation dans ORCUTT 2010 p 26 28 16 Jbid As the decision to move out the bound journals had come from the analysis of some highly divergent sources of data shelving statistics usage statistics of print and online journals and monographs computer use statistics physical plant statistics and an examination of what makes a library it seemed best to use data to paint a full picture to the university community p 26 16 BAUDIERE 2014 p 62 162 ELGUINDI MAYER 2010 Figure 3 2 p 27 16 Ibid Figure 3 3 p 27 164 Thid Figure 3 4 p 28 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 56 Les donn es un atout pour la gestion d une biblioth
197. r du moment o les algorithmes et leur produits seraient utilis s pour piloter la politique g n ral d un tablissement scientifique comme le sugg re notamment Finbar Galligan Cet instantan haute r solution pourrait ensuite tre utilis pour une multitude de buts notamment affiner les objectifs institutionnels laborer des programmes d enseignement fond s sur des sujets qui sont utilis s par la facult d aujourd hui d terminer des ressources qui sont applicables un cours en particu lier et pr d finies en fonction des usages actuels ou des donn es de micro acquisi tions sur plusieurs unit s temporelles pour ce m me cours et permettre la biblio th que de d velopper des services auxiliaires autour de l offre principale de conte nus qui serait elle m me largement automatis e travers la construction d une col lection par l action collective de tous les usagers de la biblioth que discovery process linking individual pieces of content and making suggestions and connections that are relevant to a single researcher s profile and reading preferences Data at the microlevel of the simple researcher is interesting but it starts to become really useful when you can aggregate it up over several layers of granularity This could mean that content will not only be recommended based on the individual preferences but on similar researchers and what they are using giving an automatic recommendation
198. r les principes de l ontologie et forme un r seau s mantique Ontologie informatique 2014 Wikip dia en ligne Consult le 14 d cembre 2014 Disponible l adresse http fr wikipedia org w index php title Ontologie_ informatique amp oldid 109058774 Page Version ID 109058774 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 67 Droits d auteur r serv s OU comme si l on avait un syst me de classification d cimal de Dewey crit sur commande L auteur oppose donc la flexibilit de la classification num rique a l uniformit de la classification labor e dans le monde physique l innovation technologique tant tenue responsable du passage de l un l autre Pourtant Umberto Eco d montre que l arbre classificatoire h rit d Aristote poss dait une certaine souplesse ce dernier ayant finalement renonc construire un arbre unique pour construire plusieurs classifications correspondant des objectifs chaque fois diff rents Ces r flexions laissent penser que ce ne serait pas tant en raison des contraintes physique ou des nouvelles opportunit s offertes par le num rique qu en raison de choix politiques que nous aurions abandonn le syst me classificatoire unique seulement au d but du XXI si cle Les Lumi res en effet ont remis en cause l arbre classificatoire unique pour lui substituer une vision labyrinthique de la connaissance mais il ne s agit pas que de
199. r une carte choropl the figure ci dessus dans laquelle les d grad s de couleur permettent de montrer comment la demande est distribu e une chelle au del de l institution afin de comprendre le r le de la logistique dans l optimisation de la circulation des ressources des biblioth ques Ces visualisations grande chelle telles que celles produites par l OCLC partir des donn es de WorldCat sont aussi tr s utiles pour comparer les biblioth ques entre elles Comparer Tenir compte de l image de l lu est un des l ments des strat gies d ploy es par les directeurs de biblioth que en agissant notamment sur l mula tion entre les collectivit s un directeur de biblioth que interrog expliquait que pour r ussir obtenir un budget d investissement important pour un pro jet qui lui semblait prioritaire il s tait inform aupr s du Minist re de la Culture et de la Communication et aussi aupr s de coll gues pour conna tre l avancement des autres quipements similaires sur ce type de chantier afin de situer sa propre biblioth que Il avait ensuite fait une note qu il avouait avoir un peu pouss e sur cette question en montrant le retard de sa biblio th que La comparaison parait tre un l ment fondamentale de la communication des biblioth caires en direction de leur tutelle institutionnelle Or la visualisation des donn es lorsqu elle est faite grande
200. rve pour commencer la mani re dont les donn es ont t collect es il faut avoir l esprit que l Internet Archive a ouvert ses donn es et mis la disposition de tous un formulaire de recherche qui permet de les r cup rer ais ment et il en va de m me pour l ADS puisque la NASA du fait de son statut d agence gouvernementale a t dans l obligation d ouvrir ses donn es Quant aux formats des donn es fournies par ces sources il s agit de XML pour l ADS d une part et de JSON pour l IA d autre part deux formats donc tr s lisibles pour des ordinateurs et permettant facilement la r utilisation des donn es contrairement des fichiers PDF Word et JPEG qui peuvent tre affich s mais non lus par un ordinateur L absence de droit de propri t intellectuelle sur les donn es de l ADS et de l IA permettent par ailleurs de les r utiliser librement En ce qui concerne la structuration des donn es le logiciel OpenRefine a galement permis de se passer de l criture d un code notamment pour faire passer les donn es d un format un autre Par ailleurs OpenRefine s av re tre un outil facile d utilisation et utile l apprentissage de la programmation De m me l outil de visualisation utilis Tableau Public est un outil pr t l emploi plut t qu une visualisation faite sur mesure gr ce au code Tableau 1 PRENTICE Jennfer ALSTINE Colin Van BENSON Amy et FORD Jacqueline 2013 ADS Monograph Matches in the
201. s d un ordinateur les noms des acteurs tant remplac s par des titres de livres ou par des noms d auteurs C est d ailleurs un mod le que Google propose sa mani re en introduction son knowledge graph figure ci dessus Chaque entit est en effet repr sent e sous la forme d un n ud connect e d autres entit s 20 Star Trek Into Darkness End Credits Preview 2013 SD sans date en ligne Consult le 30 juillet 2014 Disponible l adresse http www youtube com watch v _ W6XIWOiMA LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 80 Les Donn es un outil de navigation dans les collections qui gravitent autour d elle sur un fond toil il ne s agit cependant pas d un outil de navigation mais d une simple illustration de la structure encyclop dique du knowledge graph L OCLC propose une visualisation similaire non pas cantonn e cette fois ci un role d illustration mais pr sent e comme une v ritable exp rience interactive un clic sur les auteurs pr sent s sous la forme de n uds permet de visualiser leurs relations Cependant cela ne concerne que des auteurs ou cr ateurs et ne permet pas d aboutir directement aux documents ni de construire v ritablement une requ te L avantage du jeu vid o dans ce contexte est de pr senter le catalogue de la biblioth que de mani re ludique ni v ritablement catalogue ni v ritablement biblioth que num rique il s
202. s archives ne permettent pas r ellement de saisir la r alit des individus et encore moins la r alit d une biblioth que L archive p trifie ces moments au hasard et dans le d sordre chaque fois celui qui la lit la touche ou la d couvre est d abord provoqu par un effet de certitude La parole dite l objet trouv la trace laiss e deviennent figures du r el Comme si la preuve de ce que fut le pass tait enfin l d finitive et proche Comme si en d pliant l archive on avait obtenu le privil ge de tou cher le r el D s lors pourquoi discourir fournir de nouveaux mots pour ex pliquer ce qui tout simplement git d j sur les feuilles ou entre elles Dans une certaine mesure les donn es se comportent de la m me mani re que les archives donnant une premi re impression de r el qui tendrait disqualifier le travail de l historien si les donn es parlent d elles m mes quoi bon les faire parler De fait s il est une chose que la lecture attentive des archives notamment judiciaires nous apprend c est que le discours capt des justiciables est un discours construit pour la circonstance et fonction des strat gies individuelles de chacune des parties qu il s agisse de plaignants de d fendeurs ou des juges Or il ne nous semble pas que les donn es soient d une nature fondamentalement diff rente puisque galement d pendantes des circonstances et du contexte qui les ont vu na tre les do
203. s bibliographiques 2014 Wikip dia en ligne Consult le 4 ao t 2014 Disponible l adresse http fr wikipedia org w index php title Sp C3 AQYcifications fonctionnelles des notices _bibliographiques amp oldid 103576 162 Lap tre Rapha lle DCB M moire d cembre 2014 87 Droits d auteur r serv s OU cc EE SPSS 2014 Wikip dia en ligne Consult le 12 d cembre 2014 Disponible a l adresse http fr wikipedia org w index php title SPSS amp oldid 109086133 Page Version ID 109086133 Text mining 2014 Wikipedia the free encyclopedia en ligne Consult le 14 d cembre 2014 Disponible a l adresse http en wikipedia org w index php title Text_mining amp oldid 63 7280039 Version ID 637280039 M MOIRES BAUDI RE Marie 2013 Le biblioth caire son lu son directeur Marie Baudi re Biblioth que num rique de l Enssib Consult le 20 ao t 2014 Disponible l adresse Web http www enssib fr bibliotheque numerique documents 64142 le bibliothecaire son elu son directeur pdf BLOT JULIENNE Gr gor 2012 Du choix de l implantation aux strat gies de localisation biblioth ques dans la ville Biblioth que num rique de l Enssib Consult le 30 ao t 2014 Disponible l adresse Web http www enssib fr bibliotheque numerique documents 56709 du choix de l implantation aux strategies de localisation bibliotheques dans la ville pdf CARTIER Aurore 2012 Biblioth que
204. s html 5 O NEIL SCHUTT 2013 More precisely statistical inference is he discipline that concerns itself with the development of procedures methods and theorems that allow us to extract meaning and information from data that has been generaed by stochastic random processes Non pagin dans sa version lectronique 4 L appellation de science pour cette discipline fait aujourd hui d bat O Neil et Schutt y voient plut t un art 15 Ibid More generally a data scientist is someone who knows how to extract meaning from and interpret data which requires both tools and methods from statistics and machine learning as well as being human Non pagin dans sa version lectronique LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 Introduction Mais s il semble vident que la science des donn es comprendrait l ensemble des m thodes visant faire parler les donn es la d finition de cette science n en reste pas moins d licate cerner Peut tre pourrait on commencer par l exemple qui illustre le mieux ce proc d dans le monde de l information et des biblioth ques celui d un syst me de recommandation La construction de ce type de syst me n cessite en effet de savoir utiliser un large ventail de m thodes relevant de la science des donn es il faut commencer par cr er un r seau ou graphe entre des donn es d crivant des utilisateurs par exemple des lecteurs et des donn es de produi
205. s impressions ou enregistrements qui en ont t faits ses manifestations Chaque exemplaire de ses manifestation on l a vu constitue alors un document de l uvre Hamlet Tout cela semble assez clair crit David Weinberger mais cela se complique rapidement La version d Hamlet r crite pour les enfants avec une fin heureuse est elle en core Hamlet Et que penser des uvres inspir es par Hamlet telles que le Rosen crantz et Guildenstern sont morts de Tom Stoppard et le Sortir avec Hamlet L histoire d Oph lie de Lisa Fiedler Les FRBR disent que lorsque la modification d une uvre implique un degr signifiant de travail artistique ou intellectuel ind pendant elle devient une nouvelle uvre L algorithme des ensembles FRBR pose donc la question fondamentale de l identit de l uvre Dans sa nouvelle intitul e Pierre M nard auteur du Quichotte Borges exposait les termes du probl me M nard n essaye pas d crire un nouveau Quichotte mais le Quichotte Son texte est identique celui de Cervant s HICKEY Thomas B TOVES Jenny 2009 FRBR Work Set Algorithm v 2 0 OH OCLC Online Computer Library Center Inc Research division Consult le 4 aout 2014 a l adresse Web http www oclc org research activities past orprojects frbralgorithm 2009 08 pdf The goal is to create a key that can uniquely and confidently identify a work set The best cases occur when we have
206. s mais permettent de se faire une premi re id e de ce que peut tre une collection collective Elle ne prend pas en compte ou n assume pas la subjectivit de l analyse et ne fait pas non plus appel la subjectivit d un observateur les probl mes de normalisation des donn es qu elle rencontre sont vus comme des obstacles devant tre surmont s pour clarifier son propos Au contraire les observations faites au sein de l Observatoire portent sur une chelle beaucoup plus restreinte et reposent sur la r action subjective d un utilisateur vis vis de la visualisation des donn es de la DPLA non seulement elle assume la subjectivit mais elle en fait le point de d part de toute connaissance possible sur le contexte institutionnel des biblioth ques qui ont particip au projet On voit donc l l application des principes nonc s plus haut par Johanna Drucker les conflits de classification impliqu s par les formats d origine tr s diverses des donn es sont per us comme un outil indispensable de connaissance CONCLUSION DE LA CONNAISSANCE LA D CISION Nous avons tent dans ce premier moment de notre r flexion de faire le tour des diff rentes techniques employ es ce jour pour faire parler les donn es depuis les statistiques inf rentielles utilis es l occasion des enqu tes de publics jusqu la visualisation interactives des m tadonn es d une gigantesque biblioth que num rique telle que la DPLA en passa
207. s of Life in London 14 Portrait of Tom O Connor Mankato Minnesota Letter to Tom Taylor 1881 Celia John Shaw Billings and Tom Reed 1898 Oral history with Tom and Hermina Waring Figure 18 Visualisation arborescente de la collection de la DPLA Murmurs Montage Mobs Metrics Mounds ANNEXE 3 LA VISUALISATION AU SERVICE DE LA COMMUNICATION DU BIBLIOTHECAIRE VERS SON ELU OU 276 Thid LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 102 Table des annexes SON DIRECTEUR D UNIVERSITE Document 1 La VISUALISATION DES SENTIMENTS WE FEEL Fine 2 Feeling Gender Age Weather Location Date i feel so selfish when i think my life is terrible when they yell and scream and tell me to do this and that and i think that my life is the worst possible way to live F mford Year 2008 lt Backward Forward gt 7We Feel Fine by Jonathan Harris and Sep Kamvar sans date en ligne Consult le 20 ao t 2014 Disponible l adresse http wefeelfine org Et We Feel Fine sans date Media Molecule en ligne Consult le 8 septembre 2014 Disponible l adresse http www mediamolecule com blog article we_feel_fine LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 103 Droits d auteur r serv s OU Document 2 LE NAVIGATEUR DE THESES DE L UNIVERSITE DE STANFORD Stanford Dissertation Bro History Department 2000 C
208. s propres cat gories leurs donner un nom amu sant puis les publier Dewey a privil gi la clart et l ordre se prosternant de vant les dieux de la m trique en cr ant un syst me bas sur des multiples de 10 Amazon appr cie au contraire un d sordre chaleureux sugg rant partout dans ses pages des mani res alternatives de naviguer ainsi que des offres in solites particuli res chacun Lorsque l on cherche un livre dans une biblio th que organis e sur le mod le de Dewey on peut tre tr s content de trouver un autre livre sur le m me sujet juste c t du premier sur l tag re Mais lorsque l on cherche acheter un livre sur Amazon la s rendipit planifi e vous conduit vers un choix bien plus large de livres d termin par les di teurs d Amazon les algorithmes ainsi que les autres consommateurs Le sys t me de Dewey privil gie la stabilit qui accompagne le monde physique des livres sur des tag res de l encre blanche au dos des livres tandis qu Amazon se targue de sa capacit grouper et regrouper de mani re instan tan e ses produits Le propos de David Weinberger est donc d affirmer que la transformation num rique en cr ant des donn es partir de toutes choses est dans la capacit de nous faire d couvrir une information bien plus importante quantitativement mais aussi qualitativement gr ce la diversit des propositions les possibilit s de trouver un objet inattendu ser
209. s strongly for the effects of mental images and their influence on perception p 5 24 WEINGART 2013 Many of Otlet s illustrations featured non hierarchical network like representations of classification with circuitous paths and no discernible trunk or preferred hierarchy p 50 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 71 Droits d auteur r serv s OU hi rarchies qui existent entre eux La m taphore de l arbre est bien souvent utilis e par volont a la fois de simplification et de pr cision du fait de ses contraintes hi rarchiques il n est pas possible de d velopper un trop grand nombre de branches partir d un terme ce qui est aussi un avantage car cela permet d viter le d sordre inh rent une visualisation en r seau cette derni re n ayant ni d but ni fin ni ext rieur ni int rieur C est une visualisation qui se r v le galement peut tre plus facile d approche du fait de la familiarit naturelle et universelle que l on peut entretenir vis a vis de la m taphore arborescente La Classification Universelle D cimale l instar de toutes les classifications traditionnelles se pr te assez bien a une visualisation arborescente tant donn qu elle est elle m me con ue sur le mod le de l arbre par exemple la maladie c liaque en 616 341 008 6 est subordonn e 616 34 qui est subordonn 614 3 etc L arbre appara t donc comme une repr se
210. sage satisfaction des besoins PEB insatisfaction des besoins satisfaction des besoins efficacit des politiques d acquisition ont un caract re enti rement construit et chouent sans doute pour une grande part rendre compte du bon fonctionnement ou non de la politique documentaire de l tablissement Mais ils reconnaissent en m me temps que le grand m rite de cette r flexion men e en continu est d avoir su r tablir un dialogue entre les acqu reurs et leur public ce qui d une certaine mani re constitue peut tre un r sultat plus int ressant que l valuation des collections en elle m me L exemple de la biblioth que de la facult du New Jersey est cependant un exemple d valuation ponctuelle des activit s de l tablissement Si l on voulait examiner un dispositif d valuation syst matique l exemple le plus accompli est sans doute celui de la ferme de donn es de la biblioth que universitaire de Pennsylvanie Ce projet de ferme est en effet n de la frustration prouv e par les biblioth caires chaque fois qu ils tentaient de d celer de mani re significative les comportements des usagers de leur biblioth que partir du flot de donn es d usage des ressources lectroniques dont ils disposaient Ne contenant initialement que des donn es de log la ferme a finit par s tendre toute sorte d autres donn es provenant de sources multiples l aspect le plus int ressant de ce gigantesque entrep
211. sance qui conf re ce caract re politique une place centrale C est pr cis ment ce que tentent de faire les Humanit s Num riques qui ont voulu laborer un cadre critique pour la visualisation des donn es et ont fait de la subjectivit inh rente cette derni re le point de d part d une connaissance de la biblioth que et de son histoire en t moigne l excellent essai The life and death of metadata Il n est pas exclure que les algorithmes puissent tre utilis s de la m me mani re et d ailleurs ils le sont d j dans une certaine mesure puisque d une part nous avons vu que des sociologues se sont attach s d cortiquer leurs pr suppos s et d autre part la visualisation repose largement sur ces algorithmes N anmoins il nous 27 Google dans la page de pr sentation de son quipe se revendique comme tant une d mocratie classant ses pages par la m canique objective des liens hypertextes 4 La d mocratie sur le Web fonctionne dans 10 principes fondamentaux Soci t Google sans date en ligne Consult le 11 d cembre 2014 Disponible l adresse http www google fr intl fr about company philosophy 28 POULAIN Martine 2002 Retourner Tocqueville en ligne 1 janvier 2002 Consult le 11 d cembre 2014 Disponible l adresse http bbf enssib fr consulter bbf 2002 05 0066 001 2002 5 fam apropos varia 2 The Life and Death of Data sans date op cit Lap tre
212. sans date en ligne Consult le 1 novembre 2014 Disponible l adresse http shop oreilly com product 0636920028529 do Non pagin dans sa version lectronique Sizing Up Big Data Broadening Beyond the Internet sans date Bits Blog en ligne Consult le 1 novembre 2014 Disponible l adresse http bits blogs nytimes com 2013 06 19 sizing up big data broadening beyond the internet Big Data is a vague term used looely if often these days But put simply the catchall phrase means three things First it s a bundle of technologies Second it s a potential revolution in measurement And third it is a point of view or philosophy about how decisions will be and perhaps should be made in the future LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 13 Droits d auteur r serv s OU D une certaine mani re nous pourrions dire que les biblioth ques contribuent y participer par la masse traditionnellement importante de leur propres donn es mais aussi par la volont d ouverture qui les accompagne le mouvement des m gadonn es intervient en effet dans un contexte d change et de libre partage des donn es sans obstacle juridique technique ou financier et c est l pr cis ment la d finition de l open data Or les biblioth ques sont directement concern es par l ouverture de leurs donn es notamment de leurs donn es bibliographiques les initiatives comme celle de la BnF
213. savoir au pr alable ce que l on cherche ni quel genre d chantillon il faudrait fournir Alors que les chantillons ne permettent que difficilement une analyse exploratoire tre en possession de toutes ou presque les donn es conf rerait davantage de libert pour les explorer les observer sous des angles diff rents ou encore approfondir certains de leurs aspects C est ainsi en partant du principe bancal qu l re du Big Data nous serions en possession de toutes les donn es N tout que Mayer Schoenberger et Cukier pr tendent que les donn es parleraient d elles m mes La pr tention l objectivit Un des domaines les plus significativement touch par N tout sont les sciences sociales crivent Mayer schoenberger et Cukier Elles ont perdu leur monopole sur l interpr tation des donn es sociales empi riques tant donn que l analyse des masses de donn es remplace les enqu teurs experts du pass Mais lorsque les donn es sont collect es passivement chaque fois qu une personne fait ce qu elle ferait naturellement de toute fa on les anciens biais inh rents l chantillonnage et aux questionnaires disparaissent C est ici que nous aimerions discuter ce discours m me si nous sondons absolument toutes les personnes qui quittent les bureaux de vote crivent O Neil et Schutt nous ne comptons toujours pas les personnes qui d s le d part ont d cid de ne pas voter Et ces perso
214. seesseesoesoosseesoesoosseesoesooesoesoesoossoesoecoossossoeseossoesseesossosesessoesoessesssoe 49 Contexte et objectifs de la FOTIMAMON mmorises 49 Comment dompter les donn es bibliographiques 7 51 L apport de la visualisation pour la communication 53 BO a ee ee E eae 54 PUTER OP ner indien en rende E 55 SPAIN OT emma R E EA TARE RETS 56 COMPA AR nd E AAE E A AN 58 De la politique documentaire la navigation dans les collections 60 LES DONN ES UN OUTIL DE NAVIGATION DANS LES COLLECTIONS 1 esscisciscsscessavarniccsantersearranetscestuanintenccusunianenenuanacientiaaeinaevanmann 63 De la classification la navigation seeessoesssesssesssesssoossoosssoesssesssesesoossossseseseso 64 De l Arbre LOI RER M ee nan 65 De l universalit de la classification l individualit de la navigation 67 La Classification D cimale Universelle CDU la recherche d une MCLAP NORE VIS elle Gendnatananadnundanadinenmanii 69 La n cessit d une MEDAD Emo mm nn 70 De l arbr AU SRE sobre nude 71 Rendre visible la biblioth que sur Internet 76 Les biblioth ques dans l conomie de l attention 76 Lap tre Rapha lle DCB M moire d cembre 2014 eTa Droits d auteur r serv s OU cc EE De la monumentalit au geste visuel hasta 77 Un data game stellaire dust teiaineite 79 Nouveau mod le de biblioth que ou renouvellement d un mod le de bibliothegte lossis onsssenvntencdduscscasthecrvade cy
215. ser l Histoire en 1993 Stanford Il nous semble en effet que la disposition circulaire a rienne et color e de chaque discipline est agr able voir D un clic sur l un des points il est possible de voir se rapprocher ou s loigner les autres disciplines qui lui sont attenantes ce qui permet de se faire assez rapidement une opinion sur l volution d une discipline en particulier L histoire par exemple fait se rapprocher et s loigner d elle successivement les sciences de l ducation ou encore la sociologie la taille du point tant fonction du nombre de th ses publi es dans la discipline marquant ainsi l volution de l int r t des tudiants pour cette derni re Voil qui permettrait ce qu il nous semble d informer efficacement un pr sident d universit sur l activit scientifique de son institution Illustrer La visualisation permet galement de r sumer et de donner plus de clart un argumentaire il s agit clairement pour le biblioth caire de donner a son interlocuteur une vision de son tablissement Nous pourrions ainsi prendre l exemple d une tude de cas d velopp e dans l article d Anne C Elguindi et de Bill Mayer intitul Raconter l histoire de votre biblioth que comment tirer le meilleur parti de vos donn es dans une 155 YAU Nathan 2013 Op cit 156 HARRIS Jonathan KAMVAR Sep sans date We Feel Fine en ligne Consult le 20 ao t 2014 Disponible l adresse
216. sition les diagrammes s appuyant vers la gauche caract risent des biblioth ques qui ont un grand nombre d ouvrages qu elles seules d tiennent comme Harvard par exemple qui a mis l accent sur la constitution d une 175 Cf annexe p 106 figure 24 176 Ibid 17 Cf annexe p 106 figure 25 118 COHEN Dan 2012 Visualizing the Uniqueness and Conformity of Libraries Dan Cohen en ligne 13 d cembre 2012 Consult le 11 juin 2014 Disponible l adresse http www dancohen org 2012 12 13 visualizing the uniqueness and conformity of libraries LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 59 Droits d auteur r serv s OU cc ETAT collection de livres rares tandis que d autres biblioth ques universitaires comme la Lafayette College ont pr f r constituer des collections plut t universelles et accessibles tous Il est vrai que ces visualisations ne nous apprennent pas grand chose sur les biblioth ques qu elles repr sentent surtout lorsqu on les compare des outils comme l Observatoire de la Biblioth que dont la pr cision est sans doute plus grande N anmoins elles sont remarquables pour leur capacit situer de mani re visuellement agr able pr cise directe et globale l activit d un tablissement notamment lorsque l on est en situation de devoir la mettre en valeur au cours d un court entretien avec un lu ou un directeur d universit DE LA POLITIQUE DOCUMENTAIRE
217. sualisation dont nous parlerons dans la suite de cette tude prendra pour une grande partie sa r f rence dans l usage qu en font les Humanit s Num riques davantage que dans la perception qu en ont les scientifiques des donn es Prenons ainsi la d finition donn e par l auteur de l essai intitul The life and death of metadata mis en ligne dans le cadre du Metalab un laboratoire d Harvard fond par Jeffrey Schnapp et d di la culture en r seau Je propose de penser la visualisation de donn es comme des projections pour souligner la qualit sp culative de telles images ainsi que leur lien avec la pens e m taphorique En effet les visualisations ne sont pas autre chose que des m taphores visuelles transposant divers types de donn es quantitatives sous forme graphique et spatiale En tant que m taphores les visualisations relient des domaines source des jeux de donn es des domaines cible des structures gra phiques Par exemple dans les visualisations temporelles d crite dans cet essai le temps partir des donn es d acc s est reli l espace de l cran en coordon n es La visualisation serait donc ce qui permet de projeter spatialement les donn es afin de mettre en vidence de mani re directe les tendances et particularit s que ces donn es prises dans leur ensemble sont susceptibles de manifester Il convient de rebondir ici sur IS Repr sentation gr
218. sultation Cependant il appara t n cessaire de penser les limites d un tel syst me si le pilotage d une biblioth que doit se faire par le biais d algorithmes utilis s par des usagers et si ces algorithmes sont bien des m dias comme nous l avons crit dans notre premi re partie alors la PDA reviendrait dans ces circonstances m diatiser la biblioth que savoir la transformer en un moyen de communication o se refl teraient les opinions dominantes fond es ou non des utilisateurs de la biblioth que De fait si la biblioth que devait tre int gralement con ue sur ce mod le elle serait davantage amen e exprimer les pr f rences d un certain public plut t qu v ritablement proposer des citoyens un projet relatif l information pourrait on dans ces conditions parler d un dialogue entre le biblioth caire et ses usagers Si donc l on voulait maintenir ce dialogue permanent l re des m gadonn es et leurs technologies comment envisager les donn es des biblioth ques en faisant 77 TULEU Beno t 2011 Trop loin trop proche en ligne 1 janvier 2011 Consult le 11 d cembre 2014 Disponible l adresse http bbf enssib fr consulter bbf 2011 02 0014 002 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 84 Conclusion Donn es et politique en sorte que l aspect politique de la biblioth que comme lieu de connaissance soit affirm et soumis une discussion
219. t e aux formes graphiques et ses nom breuses expressions La visualisation des donn es n existe donc pas pour repr senter une information qui lui pr existe mais bien pour faire merger une connaissance partir de l interpr tation de l observateur pour le d montrer Johanna Drucker se r f re en premier lieu la physique quantique qui sugg re qu un ph nom ne appara t lorsqu un observateur intervient dans un champs de potentialit s La visualisation incarne ainsi ce champ de potentialit s dans lequel intervient un spectateur appel a cr er une connaissance par le biais d un processus dynamique L auteur fait galement r f rences aux tudes cognitives dont le psychologue gestaltiste Ernest von Glaserfeld peut tre vu comme le pr curseur sugg rant que la cognition humaine merge de mani re dynamique dans une relation d change entre des capacit s physiologiques et des stimulation circonstancielles dans un syst me continuellement changeant D s lors la connaissance n est plus transmise et r v l e un observateur passif mais bien labor e de mani re dynamique par une interaction entre deux subjectivit s celle du cr ateur de la visualisation et celle de son spectateur tout cela n est gu re loign en un sens de l id e d uvre ouverte ch re Umberto Eco selon laquelle en r agissant la constellation des stimuli en essayant d apercevoir et de comprendre leurs re
220. t d finir dans ce contexte les donn es des biblioth ques Celles qui viennent imm diatement l esprit sont les m tadonn es savoir les donn es d crivant les documents de la biblioth que Or le caract re minemment ontologique de ces m tadonn es doit tre soulign c est en effet cet aspect qui fait la richesse des donn es des biblioth ques et par extension des donn es des institutions culturelles mus es archives arboretum etc L o en effet les autres donn es peuvent tre g n ralement consid r es comme de simple reflets du r els les m tadonn es pointent directement vers lui en posant la question de la nature de KELLAM Lynda M et PETER Katharin 2011 Numeric data services and sources for the general reference librarian Oxford Chandos Publishing p 7 8 gt SPSS Statistical Package for the Social Sciences est un logiciel utilis pour l analyse statistique C est aussi le nom de la soci t qui le revend SPSS Inc SPSS 2014 Wikip dia en ligne Consult le 12 d cembre 2014 Disponible l adresse http fr wikipedia org w index php title SPSS amp oldid 109086133 Page Version ID 109086133 gt GAILLARD R mi 2013 De l Open data l Open research data quelle s politique s pour les donn es de recherche Biblioth que Num rique de l Enssib Consult le 18 ao t 2014 Disponible l adresse Web http www enssib fr bibliotheque numerique documents 64131 de l o
221. t de la population qu il dessert des donn es de portiques pour mesurer la fr quentation de la biblioth que du volume de non inscription pour se sources preservation concerns and the susceptibility of various kind of objects to digitzation p 252 Cf annexe p 98 figure 12 p 99 figure 13 POISSENOT Claude La connaissance des publics via les donn es internes de la biblioth que dans EVANS 2011 p 47 Ibid p 48 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 Les donn es une r volution pist mologique pour les biblioth ques faire une id e de la capacit de l quipement fid liser et donc satisfaire ses usagers des donn es d emprunts pour mesurer le taux de rotation de ses collections etc quels changements peuvent bien apporter le fait que ces donn es soient plus massives que les techniques qui permettent de les appr hender soient plus performantes et que les r sultats de ces analyses soient mobilis es dans le processus de prise de d cision pour un tablissement La r ponse cette question pourrait se trouver pr cis ment dans les discours qui accompagnent aujourd hui la science des donn es et le mouvement du Big Data dont elle est la traduction jamais en effet le discours de l innovation et de la r volution n a davantage pos la question du statut ontologique des donn es En clair plus les Google et Amazon affirment avec force
222. ta Scientist Training For Librarians EMEA Europe Middle East Africa EVR Extension Visuelle de Requ te FRBR Functional Requirement for Bibliographic Records JPEG Joint Photographic Expert Group JSON Javascript Object Notation K NN k Nearest Neighbors NASA National Aeronautics and Space Agency OCLC Online Computer Library Center OPAC Online Public Access Catalog PDF Portable Document Format PEB Pr t Entre Biblioth ques SICD Service Inter tablissement de Coop ration Documentaire VIAF Virtual International Authority File XML Extensible Markup Language Lap tre Rapha lle DCB M moire d cembre 2014 on ae JE Droits d auteur r serv s OU INTRODUCTION De mars juin 2013 j ai eu l opportunit d effectuer un stage d observation a la Biblioth que Publique d Information a l occasion duquel V ronique Poirier d l gu e la politique documentaire de l tablissement m avait demand de r fl chir l approfondissement des crit res de d sherbage afin de pouvoir liminer de mani re plus importante certains ouvrages imprim s notamment dans les domaines cumulatifs que sont les lettres et sciences humaines En pleine r organisation l tablissement envisageait en effet le d m nagement de ses collections et se posait avec acuit la question de la saturation de certaines de ses tag res la Bpi ne disposant pas de magasins permettant de stocker le surplus ventuel de ses c
223. tative Noah W Sawyer 1943 1944 Legislative Session Minnesota Legislature 1945 0 O Representative Noah W Sawyer 1945 1946 Legislative Session Minnesota Legislature 1981 O Senator Tom A Nelson Minnesota Legislature 1981 1982 Legislative Session Slack and white photographe O O48 8 Fen MEG PP uade men and plore Duluth Minnesota 1889 O Nauchnye rezul taty puteshestvy N M Praheval skago po entraf nol Az Otdiel zoologiche cen ins G Bag de ex kasd hore mest eb Ft Er nt 19630 8 Sada RAR ses the da shakes Se cays by Harold MG oa om len ih of Tom R J Me 8 Re is of the Yellowstone River Basin Montana by Books O 1805 O O AGartand of New Songs The battle of the Nile Tom Starboard The sailor s adieu Tom Bowling Film 30 Portrait of Tom Keller Ncstrated Newspapers O 1861 09 09 O O Scene on the Dock at the Rip Raps Generals Wool and Butler Testing the Sawyer Gun and Proje k O 1450 James F Byres Tom Connally Hany 5 Truman and Arthur Vandenberg at German airport July 1946 03 06 O James F Byes Tom Connally Joseph T McNamey and Arthur Vandenberg in Germany Septes mycollection O wmo O Systema naturae per regra tria naturae secundum classes ordines genera species cum chara 1908 O O Conchyliolagje systematique Tom 1 wO O Le Regne Animal 1st Ed Tom 4 1817 Journal AtizieC 1829 0 O Regre animal 2nd Ed Tom 3 1830 x P 1835 O O Histoire naturelle des Animaux sars vertebres 2nd Ed Tom 2 1870 2
224. tellaires de photographies quotidiennement post es tagu es et comment es sur le site Il suffit de rentrer dans la barre de recherche un sujet comme par exemple BnF pour que l explorateur propose un soleil central repr sentant ce tag ainsi que plusieurs plan tes gravitant autour de ce soleil et repr sentant les concepts affins Par un clic sur l une des plan tes le concept qui lui est attach s ajoute la requ te initiale Un autre clic sur le soleil permet de voir s afficher en mosa que sur l toile l ensemble des photographies recherch es restreint par la liste des concepts qui auront t pr c demment s lectionn s parmi les plan tes de la galaxie Razpotnik et Sauperl ont d montr que cet outil tait tout fait adaptable l univers d une biblioth que FR RNEirecrure NIGHT a y 3 pa a f Figure 10 galaxie se formant autour du tag BnF sur Flickr Inutile de dire qu il s agit l la fois d une mani re de visualiser l organisation des connaissances mais aussi de naviguer jusqu un document recherch Par ailleurs les galaxies sont construites par des algorithmes qui donnent math matiquement une structure aux masses de donn es qui lui sont soumises il est donc possible de d couvrir en dehors des hi rarchies d j connues des affinit s jusque l non envisag es entre plusieurs concepts D s lors Tag Galaxy apporte ceci de nouveau qu il permet d op rer une synth se en
225. tenues dans WorldCat sont les suivantes Un premier constat est qu il existe en moyenne 1 2 manifestation par uvre S interrogeant ensuite sur le degr de redondances des diff rentes collections entre elles les auteurs font part de leur admiration devant la relativement faible part de redondance observ e Vient alors la r partition des collections par dates de publication Lavoie et Schonfeld observent que la moiti des documents ont t publi s apr s 1977 ce qui t moigne donc d une forte acc l ration de l activit ditoriale dans le dernier tiers du XX si cle Quant aux langues des publications un peu plus de la moiti des livres dont les notices sont contenues dans WorldCat sont publi s en anglais les autres langues majoritaires tant l allemand et le fran ais Enfin une estimation tr s grossi re permet d affirmer que depuis 1940 pr s de 48 de la litt rature globale toutes disciplines confondues est couverte par les fonds dont les notices sont enregistr es dans WorldCat Que penser de ces observations Certes l utilisation de l algorithme FRBR n a t elle peut tre pas tant d influence sur les r sultats finaux des analyses il est en tout cas difficile de le savoir Le probl me s il doit y en avoir un r side peut tre d avantage dans le fait que l analyse des donn es un niveau aussi large permet effectivement de se faire une id e des caract ristiques fondamentales des collections globales et institu
226. ternautes C est bien l le r le que peut remplir nous semble t il un data game dont le contenu serait les m tadonn es d une ou de plusieurs collections Ce jeu vid o fonctionnant sur les donn es d un catalogue permettrait ainsi de donner un support all gorique l acc s la connaissance tout en refusant de prendre trop au s rieux cette all gorie en lui reconnaissant son caract re intrins que de m dia Le principe fondateur d un jeu vid o n est il pas de simuler A ce titre nous pourrions par exemple faire comme si la connaissance s organisait en un vaste cosmos comme si le lecteur tait un cosmonaute explorant les nouveaux horizons insoup onn s du savoir et comme si le biblioth caire tait lui m me un guide dans cet univers fictif le comme si tant la cl conventionnelle devant veiller et susciter la r action de ceux qui il s adresse De la sorte s laborerait avec un nouveau mod le de biblioth que un nouveau sens du politique l o Google en h ritier du lib ralisme politique se contentait de d finir une organisation juste de la connaissance par le biais de son classement tout en ne reconnaissant pas n cessairement les valeurs qui constituent malgr lui cette organisation 1l s agirait d sormais de proposer une organisation bonne c est dire porteuse d un sens construit d mocratiquement tout en donnant au citoyen les moyens de reconna tre et de discuter le bien fond des
227. teur d une biblioth que universitaire cherche savoir dans quelle mesure les services de pr t r pondent aux besoins en documentation des usagers distants de la biblioth que Pour r pondre cette question une macro valuation se pencherait sur un indicateur possible de performance savoir le nombre total de documents emprunt s distribu en fonction des codes postaux des usagers Nous ne sommes donc gu re loin des indicateurs construit dans le cadre de la LOLF o par exemple l addition du nombre de pr ts du nombre de documents t l charg s du nombre de documents communiqu s sur place et du nombre de pr ts PEB doivent renseigner sur l usage des collections et imprim es et num riques de la biblioth que Mais l analyse ne doit pas s arr ter l crit Brooks Kieffer Pour d terminer par exemple pourquoi les usagers distants empruntent des documents un taux de 75 inf rieur celui des usagers locaux nous avons besoin de conduire une micro valuation Nous pouvons rassembler d autres donn es quantitatives et qualitatives provenant du SIGB et des usagers dis tants eux m mes afin d tendre notre analyse de d part La pratique de la mi cro valuation exige que nous examinions aussi d autres enjeux qui ont un ef 1 Ibid When national agencies send the message to U S Libraries that meaningful statistics are collections of numeric data and simple calculations performed on that data should we expect libr
228. tional UDC LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 Bibliographie Seminar 24 25 October 2013 The Hague the Netherlands organized by UDC Consortium The Hague W rzburg Ergon ISBN 9783956500077 3956500075 BERMES Emmanuelle ISAAC Antoine et POUPEAU Gautier 2013 Le Web s mantique en biblioth que Editions du Cercle de La Librairie ISBN 9782765414179 BORGES Jorge Luis 1944 Pierre M nard auteur du Quichotte dans Fictions Editions Gallimard ISBN 9782070366149 BRIEY Laurent de 2009 Le sens du politique essai sur l humanisme d mocratique Editions Mardaga ISBN 9782804700102 CUKIER Kenneth MAYER SCHOENBERGER Viktor et DHIFALLAH Hayet 2014 Big Data Paris ROBERT LAFFONT ISBN 9782221140048 BROOKS KIEFFER Jamene Yielding to persuasion Library Data s Hazardous Surfaces dans ORCUTT Darby 2010 Library Data Empowering Practice and Persuasion ABC CLIO ISBN 9781591588269 CRAMER Florian CUBAUD Pierre DACOS Marin JAMES Yannick LANTENOIS Annick dir 2011 Lire l cran contribution du design aux pratiques et aux apprentissages des savoirs dans la culture num rique actes de la journ e d tude Lectures num riques Valence 11 mars 2010 Organis e par l cole sup rieure d art et design Grenoble Valence DAY Ronald E The Data It is Me Les donn es c est Moi dans CRONIN Blaise et SUGIMOTO Cassidy R 2014 Bey
229. tionnelles mais gu re sur le pourquoi ni sur le comment de ces chiffres En r alit ces analyses ne nous parlent pas car elles ne font pas intervenir la subjectivit des professionnels qui ont uvr pour la constitution de cette collection globale il manque peut tre aux rapports de l OCLC un aller retour entre les donn es et les discours des biblioth caires qui les ont con us tel qu on pourrait l observer notamment dans l essai The life and death of metadata Il est peut tre n cessaire dans ce contexte de se mettre la recherche d autres approches qui permettraient de compl ter ces premi res analyses C est dans cette perspective que nous nous proposons maintenant d interroger l apport de la visualisation de donn es dans le cadre des humanit s num riques S LAVOIE Brian F SCHONFELD Roger C Books without Boundaries A Brief Tour of the System wide Print Book Collection dans DEMPSEY Lorcan LAVOIE Brian F MALPAS Constance CONNAWAY Lynn S SCHONFELD Roger C SHIPENGROVER J D et WAIBEL G nter 2013 Understanding the Collective Collection Towards a System wide Perspective on Library Print Collections Dublin Ohio OCLC Research Consult le 5 ao t 2014 Disponible l adresse Web http oclc org research publications library 2013 2013 09 pdf Ibid p 9 7 On voit ici une application de l algorithme des groupes uvre FRBR 7 The Life and Death of Data sans date op cit LAPOT
230. tivit sur un autre site comportant des boutons j aime ou des co okies est un rendu de l usager un dossier num rique ou une identit algorithmique qui est imparfaite mais suffisante Ce qui est moins li sible ou ne peut pas tre connu des utilisateurs est tomb dans l oubli ou est grossi rement approch Comme Balka 2011 l crivait les syst mes d infor mation produisent des corps ombres en mettant l accent sur certains aspects de leurs sujets et en passant sur d autres La o nous aurions tendance nous offusquer de l immixtion de Google dans nos vies priv es c est au contraire sa volont tenace de nous classer en d pit de son insuffisance nous cerner qu il faudrait d noncer C est d ailleurs la raison pour laquelle nous n avons pas souhait nous appesantir dans cette tude sur les enjeux de vie priv e propres au Big Data Mais si l on peut dire qu un algorithme utilis par l OCLC pour naviguer dans WorldCat est d une certaine mani re biais que penser alors des recherches plus globales sur les biblioth ques am ricaines dans lesquels il a t utilis 4 On retrouve le m me d bat certes formul autrement dans O Neil et Schutt We could do a Google search for data science and perform a text mining model But that would depend on us being a usagist rather than a prescriptionist with respect to language A usagist would let the masses define data science where the masses re
231. tivit s hors de la biblioth que la mairie dans d autres tablissements culturels participent toutes d une d marche visant guider l utilisateur la biblioth que avec pour argument le contenu Ainsi de m me que la biblioth que physique doit sortir de ses murs pour aller la rencontre de ses usagers le catalogue en ligne doit pouvoir s ouvrir aux formats du Web S mantique pour que les informations qu il contient puissent appara tre dans les r sultats des moteurs de recherche La pr sence des biblioth ques sur les r seaux sociaux comme Facebook et Twitter participe galement de cette id e de rendre visible la biblioth que par sa pr sence dans le tissu virtuel Cependant dans son m moire consacr au choix de l implantation de la biblioth que dans la ville Gr gor Blot Julienne indique que le positionnement urbain de la biblioth que ne fait pas tout Pour lui la monumentalit demeure comme un signe Outre qu elle signale la biblioth que plus efficacement que tous les pan neaux elle seule permet d int grer la volont politique autant que la finalit m me de la biblioth que Et comme la biblioth que est difficile d finir comme objet d architecture elle constitue la monumentalit comme une n cessaire distinction par laquelle elle d finit sa place autant que son r le En distinguant la biblioth que du reste du b ti le geste architectural contribue conf rer
232. tre la navigation par des interfaces facettes arborescentes et des op rations effectu es m caniquement sur des donn es afin d en faire merger des structures invisibles auparavant Par ailleurs c est une mani re ludique et agr able de rechercher l information m me s il est vrai que le design de l outil d j vieux de quelques ann es pourrait tre am lior Les technologies affili es aux donn es permettent d aller plus loin encore que la simple navigation et d explorer virtuellement les collections 41 Cf annexe p 110 figure 32 2 D monstration en ligne Tag Galaxy Create Your Own Flickr Photo Universe 2011 en ligne Consult le 29 ao t 2014 Disponible a l adresse http www youtube com watch v uDMYByYOCad amp feature youtube gdata player 3 RAZPOTNIK SAUPERL 2013 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 75 Droits d auteur r serv s OU RENDRE VISIBLE LA BIBLIOTHEQUE SUR INTERNET Que peut tre une biblioth que l heure d Internet et du num rique C est sans doute une banalit de le dire mais la question de l identit de la biblioth que est au c ur de nos pr occupations contemporaines tant cette derni re est interrog e par les nouveaux usages introduits l re du num rique Nous tenterons dans ce dernier chapitre d apporter quelques l ments de r ponses cette question en nous en posant une autre en quoi la visualisation des donn
233. tre le domaine de la bibliographie et les autres sciences de l information requ rant une organisation de la connaissance Dans l introduction du recueil des communications qui en a t publi les diteurs crivent R cemment des avanc es remarquables ont t faites dans le champ de la visua lisation de la connaissance notamment en relation avec les syst mes d organisation du savoir dans les sciences dans les applications de l extraction de donn es et dans les tentatives faites pour am liorer l utilisation de tr s grands jeux de donn es et bases de donn es Le s minaire de 2013 aborde l enjeu de la visualisation qui est au c ur du pro bl me de la d couverte de l information et par cons quent est un enjeu qui concerne toutes les classifications bibliographiques L exploitation m diocre de la classification dans la recherche de l information a longtemps t attribu au manque de solutions d interface qui rendrait la complexit de la classification de la connaissance plus facile pr senter et utiliser pour la navigation dans ces connaissances La visualisation des connaissances et de leur organisation rendue possible notamment par les nouvelles possibilit s techniques d extraction des donn es est donc consid r comme un enjeu central pour faciliter la navigation dans l information et l chelle d une biblioth que dans les collections Contrairement la fragmentation de 27 UDC Semina
234. ts tant donn les exemples pass s de classements populaires ou de masses l application d algorithmes enracin s dans la psychologie de groupe la production de connaissance conduit se demander quoi la d l gation de la connaissance l opinion en tant que telle pourrait ressembler Si donc nous en venons l avenir faire de la navigation virtuelle dans les collections de la biblioth que le moteur de la gestion de ces m mes collections et de l tablissement qui les fournit ou les contient il est certain qu il devient n cessaire de r fl chir un moyen de mettre en avant la subjectivit inh rente un tel syst me subjectivit que les discours actuels autour de ces innovations tendrait en effet occulter C est un tel moyen que nous nous emploieront consacrer le troisi me temps de notre r flexion 188 Larry Page cit dans CARDON Dominique 2013 Dans l esprit du PageRank R seaux 1 avril 2013 Vol 177 n 1 pp 63 95 DOI 10 3917 res 177 0063 p 71 18 DAY 2014 Within the citation rat race and citation mongering it becomes unclear what the r le of truth is or how one can find a position for critique that itself is not a commodity or at least seen as a commodity and self commodification Instead given past examples of popular or mass rankings the expansion of algorithms rooted in group psychology to the production of knowledge lead one to wonder what the delegation of kno
235. ts par exemple des livres Il faut ensuite apprendre un ordinateur regrouper des lecteurs et des livres en fonction de leur pr f rence en s inspirant de pr f rences d j exprim es par le pass Ce classement s appuiera lui m me sur un algorithme c est dire un mode d emploi permettant d accomplir une t che particuli re en l occurrence cela pourrait l tre l algorithme des plus proches voisins ou k NN pour k Nearest Neighborgs dont le but est de classer un ensemble d objets partir d un classement qui a d j t effectu sur des objets similaires En dernier lieu la particularit d un syst me de recommandation est qu il cr e une boucle de r troaction au sens o son utilisation sur le web pourra influencer des utilisateurs qui en retour influenceront le syst me de recommandation gr ce aux donn es g n r es par leur comportement Mise en r seau apprentissage automatique algorithmes sont des moyens de faire parler les donn es mais il en existe un autre sur lequel les humanit s num rique s appuient particuli rement savoir la visualisation des donn es Si l on devait d finir assez g n ralement cette derni re nous pourrions retenir les termes de Wikip dia savoir une repr sentation graphique de donn es statistiques fournissant un r sum visuel des donn es statistiques chiffr es et permettant de saisir en un seul coup d oeil la tendance g n rale N anmoins la vi
236. ty of Illinois Archives at illiarch uiuc edu for more information Toolkit Query builder Tree Graph Figure 17 Visualisation de Document Universit de l Illinois gt Collection Papiers de James Reston gt Format gt Tapuscrit de notes de discours gt Notes d un discours prononc la c r monie de remise des dipl mes de l Universit de Columbia LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 101 Droits d auteur r serv s OU Document 2 VISUALISATION ARBORESCENTE DE LA DPLA Black and white photographs Sx27 Studio portraits 53 7 Black and white photographs 5x3 7 Studio portraits Black and white photographs Book Books Film Ilustrated Newspapers Images mycallection undetined j Journal Artirie Maruscriptd Negatives photographic Pamphlets Prints visual works Mand coloring mage ipex Studio portraits defined 1933 1937 1913 1917 1981 1907 1915 0 1941 1943 1945 1981 C 1911 1889 1918 1963 1945 1946 09 06 1770 1808 O 1817 1829 C 1835 1870 1914 1953 1937 12 30 C 1944 01 1944 02 1974 05 08 C 1871 1934 182 C wn 1881 1898 1983 05 DOO Tom Domrud s Bake Shop Company 722 of Hovland Civilian Conservation Corps Camp Hovtar Representative Charles L Sawyer 1913 1914 Legislative Session Minnesota Legislature Represemative Tom E Davis 1917 1918 Legislativ
237. tzer Prize 27 Home amp Garden 20 268 Travel 12 690 PDF 21 Amazon s Best of 2008 67 Automotive 7 799 Biographies amp Hugo amp Nebula Awards 11 Se a Pestova A Any Binding Literature amp Fiction 95 177 Business amp Investing 24 955 Entertainment 12 687 Paperback 135 954 Hardcover 51 222 Any Feature or Promotion 4 for 3 Books 9 147 Comics amp Graphic men a ee Bargain Books 4 678 Novels 778 Board Book 49 Professional amp School amp Library Binding 9 Customer Review Technical 40 982 Lior retaper aed Health Mind amp Body 22 446 Option what s tnia Wieteie amp Up 96 084 Science 22 902 Any Shipping Option Ars amp Up 109 761 Medicine 7 923 Prime Eligible RATE amp Up 102 627 Free Super Saver Shipping R amp Up 104 934 Reference 19 415 Children s Books 8 229 Parenting amp Families 7 223 Law 4540 Science Fiction amp Fantasy 12 701 Mystery amp Thrillers 11 200 Home amp Garden 5 280 Outdoors amp Nature 8 276 History 22 938 Computers amp Internet 5 174 Romance 4 103 sssssssoss amazon com TT EEETTTTTTTL J emn Figure 29 Amazon exemple par excellence d interface a facettes Show
238. ue documentaire la programmation culturelle l avanc e des projets leur semblent m me de donner l lu une image r elle du fonctionnement de la m diath que Un autre conser vateur le con oit comme un outil de d couverte de la biblioth que pour l lu Il faut arriver faire d couvrir des choses aux lus Les d cideurs ne connaissent pas les m tiers pr cis ils ont une id e sur la biblioth que mais il faut arriver leur faire comprendre l activit avec des donn es chiffr es Attention il faut choisir les informations les plus frappantes les bons chiffres Pourtant la plupart des direc teurs reconna t que le bilan annuel est g n ralement un document trop complet trop complexe que l lu ne lit pas Un double constat semble donc merger de cette tude d une part celui de l efficacit des donn es pour expliquer l lu l activit du service de lecture publique de sa collectivit et d autre part celui de la trop grande complexit des bilans annuels o sont habituellement pr sent es les donn es statistiques qui concernent la biblioth que Or la visualisation des donn es poss de un certain nombre de qualit s intrins ques qui permettent de pr senter de mani re plus efficace l information Les biblioth caires am ricains l ont bien compris eux qui ont multipli les posts de blogs s appuyant sur la visualisation Citons le blog de l OCLC hanging together sur la question des PEB par
239. uivant un cheminement qui correspond leur propre pratique le site Web de la biblioth que joue le m me r le que le b timent dans la ville Il doit bien s r tre fonctionnel et imm diatement identifiable Toute fois cela n est pas suffisant car il ne se trouve pas naturellement sur le chemin de l internaute dans sa navigation celui ci va fr quenter son moteur de recherche pr f r la page d accueil de son fournisseur d acc s des sites comme Facebook Wiki p dia Twitter et c est partir de l que se construit sa navigation Si la biblio th que ne parvient pas se rendre visible au sein de ce cheminement naturel alors il y a toutes les chances que l internaute passe c t et utilise d autres outils pour atteindre ses objectifs que ceux ci soient de loisirs d apprentissage ou de vie pra tique l instar des visualisations propres la navigation que nous avons d crit plus haut c est de nouveau sous la m taphore de la spatialisation que se d crit l acc s au savoir et l information dans l environnement num rique Le probl me de l attention la biblioth que de sa visibilit se pose donc en terme de cheminement urbain Or nous avons soulign plus haut l importance de la m taphore quant la compr hension de l organisation de l information c est donc avec la m taphore urbaine que nous nous proposons maintenant de montrer l int r t de la visualisation pour la visibilit de la biblioth
240. ur activit le volume la nature et les usages des collections imprim es Pour couronner le tout un outil de calcul sous la forme d une suite informatique appel e Cognos doit permettre d laborer des rapports et tableaux de bord pr programm s par l quipe du SICD Il s agit d un outil technique en effet plut t complexe mais permettant cependant de simplifier la collecte et l analyse mutualis es des donn es du SICD les indicateurs ainsi construits devant permettre d informer les d cisions prises sur l ensemble de l tablissement Or ces indicateurs quels sont ils Il s agit de donn es pour l essentiel quantitatives comme on l observe dans les diff rents tableaux de bords publi s en annexe du chapitre de Nadine Delcarmine ainsi que dans la figure ci dessous permettant d informer le biblioth caire sur un certain nombre de points La r partition des effectifs de la biblioth que entre d partements par exemple est un indicateur permettant de mesurer l impact du service public et de sa composante la formation des lecteurs sur l activit globale de la biblioth que De m me l observation de l volution du nombre d articles consult s par base le calcul du co t d une consultation d une recherche ou d une session rapport une population d utilisateurs donn e permettent de v rifier l adaptation de l offre documentaire ou du dispositif de formation la recherche documentaire
241. ur r serv s OU R sum Cette tude se penche sur les enjeux de la r utilisation des donn es des biblioth ques l re du Big Data En ce qui concerne la production de connaissances sur le monde des biblioth ques et de l information les technologies d analyse du Big Data contrairement ce que pr tendent les discours qui peuvent parfois les accompagner ne r duisent pas les biais et pr suppos s inh rents aux statistiques traditionnelles Cependant la visualisation de donn es telle que revue et critiqu e par les Humanit s Num riques pourrait permettre de prendre en compte d une mani re beaucoup plus centrale la nature fondamentalement politique des biblioth ques Regardant le pilotage des tablissements documentaires certains auteurs appellent fonder les d cisions non sur les donn es et chiffres mais sur l analyse de donn es De fait l ouverture de la profession de biblioth caire sur la science des donn es pourrait tre un bon moyen de faire voluer les m thodes d valuation et de pilotage La visualisation est un moyen ludique d apprendre l analyse de donn e et permet de communiquer efficacement sur l activit de l tablissement En dernier lieu les discours actuels accompagnant l re du num rique font l apologie d un acc s individualis et fragment l information qui permettrait de se passer des biais inh rents toute classification universelle N anmoins ces biais sont transpos dans les algor
242. urquoi parler des donn es des biblioth ques en 2014 7 13 Comment faire parler les donn es sn nn atom euactexsdecwieads 14 LES DONN ES UNE R VOLUTION PIST MOLOGIQUE POUR LES BIBLIOTREQURS iicpccniccanunnnciunenidinndinunaddasinuduininaiiien 19 Les donn es parlent elles d elles m mes 7e 19 Des tudes de publics aux acteurs du Big Data 19 La pr tention ODA pneus niminenines usine 21 Les algorithmes au regard critique de la sociologie 24 L exemple de l Online Computer Library Center OCLC ssssssssssss 27 Une section consacr e l extraction et l analyse de donn es 27 L algorithme Work Set FRBR Desert 28 Une des publications de l OCLC Livres sans fronti res 31 Une mani re innovante de produire des connaissances sur les biblioth ques la visualisation de donn es 32 La visualisation au regard critique des humanit s num riques 32 Un changement pisl mologique sssssss sense 33 L exemple de l Observatoire Biblioth que sssatesemnmennet anneens 34 Le contexte de cr ation de PODSErVatoire aissivassiadssecssasstissaaseesasacvaraneasccaaaeys 34 Comment fonctionne l Observatoire anses ententes 35 Conclusion De la connaissance la d cision 38 LES DONN ES UN ATOUT POUR LA GESTION D UNE BIBLIOTHEOUE nipona dioni nana 41 S appuyer sur l analyse de donn es pour valuer la biblioth que 41 De la macro la MICTO CVGLUGIION nic dctiarnerciviatiiciareiim
243. urrait s appliquer un data game labor partir des donn es d un catalogue de biblioth que Chaque livre ou chaque auteur ou chaque sujet particulier pourrait tre repr sent par une plan te appartenant un syst me qui serait lui m me constitu par l ensemble des livres plan tes que l ordinateur aurait jug proches selon les crit res que l on souhaite selon son sujet son auteur son ambiance sa couleur la plus pr sente etc ces syst mes tant leur tour regroup s en galaxies Figure 11 Pr sentation du knowledge graph de Google Ici les femmes et le prix Nobel L exploration des collections de la biblioth que serait alors d velopp e selon le th me de l exploration spatiale un th me qui nous semble t il est relativement universel car le ciel toil est un bien commun et familier de tous Ajoutons qu il s agit d un th me transg n rationnel la fois s rieux si l on pense aux derniers projets en date de la NASA concernant la plan te Mars mais aussi divertissant si l on se r f re aux blockbusters les plus r cents Citons d ailleurs le g n rique des derni res adaptations cin matographiques de Star Trek port es sur le grand cran par le r alisateur Jeffrey Jacob Abrams qui nous para t illustrer ce que pourrait tre l exploration spatiale d un catalogue de biblioth que l instar de la cam ra le lecteur avancerait de galaxies en galaxies form es rappelons le par les calcul
244. ux plus anciennes dans d autres cas elles semblent en conflit Grace une attention critique port e au catalogage et aux sch mas de classifications au travers de contextes institutionnels va ri s l Artefact de Donn es aura pour objectif d historiciser les cultures de collecte et de comprendre les cultures mat rielles et les valeurs intellectuelles qu ils incarnent Pour mettre au jour les valeurs institutionnelles et politiques qui ont pr sid la cr ation des donn es des collections et les ventuels conflits suscit s par leur agr gation il ne faudrait donc plus alors consid rer les donn es comme brutes mais comme des m dias au m me titre que les algorithmes qui permettent de les analyser Quel meilleur exemple pouvait on choisir dans ce contexte que la DPLA biblioth que num rique am ricaine Dans un article intitul La chandelle de Jefferson Robert Darnton minent historien directeur de la biblioth que d Harvard et co fondateur de la DPLA expliquait en effet les motivations qui 81 ECO Umberto 1965 L uvre ouverte Collection Points Editions du Seuil Paris p 17 Library Observatory sans date en ligne Consult le 29 janvier 2014 Disponible l adresse http www libraryobservatory org About metaLAB at Harvard sans date en ligne Consult le 7 ao t 2014 Disponible a l adresse http metalab harvard edu about Metalab is a researc
245. ve Lohr dans un article du New York Time datant de 2013 qui pr sente le Big Data comme une nouvelle mani re de prendre des d cisions en se fondant sur l analyse de grandes masses de donn es telles qu elle est rendue possible par les technologies d aujourd hui Malgr cela il est n cessaire de rappeler que le mouvement des m gadonn es ne se r duit pas la simple prise de d cision inform e par les donn es il se caract rise galement par une volont de p renniser les donn es et d en extraire des connaissances si possible nouvelles sans toutefois que cette connaissance soit subordonn e l aspect politique et d cisionnel sous l angle duquel la question est examin e dans ce m moire The Life and Death of Data sans date en ligne Consult le 2 novembre 2014 Disponible l adresse http lifeanddeathofdata org 7 Data set 2014 Wikipedia the free encyclopedia en ligne Consult le 14 d cembre 2014 Disponible l adresse http en wikipedia org w index php title Data_set amp oldid 625099781 Page Version ID 625099781 CUKIER Kenneth MAYER SCHOENBERGER Viktor et DHIFALLAH Hayet 2014 Big Data Paris ROBERT LAFFONT Big data 2014 Wikipedia the free encyclopedia en ligne Consult le 1 novembre 2014 Disponible l adresse http en wikipedia org w index php title Big_data amp oldid 631791921 Page Version ID 631791921 10 O NEIL Cathy SCHUTT Rachel Doing Data Science
246. wledge to opinion as well may look like p 73 LAPOTRE Rapha lle DCB M moire d tude d cembre 2014 62 Les Donn es un outil de navigation dans les collections LES DONNEES UN OUTIL DE NAVIGATION DANS LES COLLECTIONS Par leur caract re ontologique les m tadonn es ont un statut particulier par rapport aux autres types de donn es des biblioth ques elles ont valeur de symbole par rapport aux objets de la collection qu elles d signent De ce fait l enjeu de faire parler les donn es des biblioth ques lorsque ces donn es sont en r alit des m tadonn es est radicalement diff rent et peut tre plus important il est par exemple d sormais possible de construire des moteurs de recherche et des syst mes de recommandation taill s la mesure de chaque usagers qui les utiliseraient avec toutes les limites que nous avons d j pu souligner Ainsi l o le caract re unique et standardis de la classification permettait dans le monde physique de se d placer dans les collections tout en visualisant une g ographie du savoir dans le monde num rique une classification qui permet une navigation efficace de l utilisateur est une classification qui s adapte troitement la personnalit de l individu classification et navigation tendent alors se confondre Cette classification sur mesure aurait t impensable dans le monde physique du fait des contraintes spatiales que ce dernier implique
247. wv 5 O N cD E a E oO SU TD oO TD 5 4 O TD Cc 2 oO TD OU O Q UNIVERSIT DE LYON Dipl me de Conservateur des Biblioth ques Faire parler les donn es des biblioth ques du Big Data la visualisation de donn es Rapha lle Lap tre Sous la direction de Julien Velcin Ma tre de Conf rence en informatique Universit Lumi re Lyon 2 Remerciements Mes remerciements vont en premier lieu a mon directeur de m moire Julien Velcin pour sa patience son d vouement et sa compr hension ce travail est largement redevable tant aux pr cieux conseils qu il m a prodigu s qu la libert d actions qu il m a laiss e tout au long de sa r daction Ils s adressent ensuite Bertrand Calenge qui a bien voulu faire confiance ce projet pourtant complexe et qui l a accompagn de sa bienveillance tout au long de son laboration Je remercie galement V ronique Poirier Jean Pierre Berthon Val rie Bouissou et Denis Cordazzo pour l enthousiasme qu ils avaient manifest lors de mes premi res et modestes exp riences avec les donn es de la Biblioth que Publique d Information Enfin un grand merci Florent Derex Dominique et Didier Lap tre Morgane Spinec Louise Daguet et Marc Bruchet qui ont support quotidiennement mes tats d mes et mes doutes depuis le premier jour de cette entreprise Lap tre Rapha lle DCB M moire d cembre 2014 3 Droits d aute
248. x de pilotage nous semble tre une tude conduite en 2013 la biblioth que de la facult du New Jersey 5 Cette tude a attir notre attention pour trois raisons qui sont intrins quement li es ses qualit s m thodologiques En premier lieu il ne s agissait pas d une tude visant simplement produire des connaissances sur la biblioth que mais bien valuer l activit d un tablissement dans le but d influer directement sa gestion en l occurrence il s agissait de mesurer la pertinence des acquisitions les plus r centes de la biblioth que pour ensuite influer sur la politique documentaire de l tablissement Deuxi mement les auteurs ont choisi pour r pondre leur objectif d interroger la corr lation de trois variables diff rentes les acquisitions r centes les circulations r centes et les demandes de pr t entre biblioth ques galement r centes cela s ajoute la volont de choisir une chelle restreinte en divisant les variables par groupes de lecteurs Enfin l int r t principal de ce travail r side sans doute nos yeux dans le fait que les auteurs on voulu r fl chir du d but jusqu la fin de leur tude sur les rapports qu entretenaient les variables choisies pour remplir leur objectif d valuation avec la r alit qu elles taient cens es repr senter Ce faisant l tude nous a conduit envisager de quelle mani re les donn es pou vaient nous aider d finir et r p
Download Pdf Manuals
Related Search
Related Contents
2 - 取扱説明書ダウンロード ShelterLogic 86047 Instructions / Assembly - A.J.Pinto パワモニ 商 品 仕 様 書 Copyright © All rights reserved.
Failed to retrieve file