Home
        Au-delà de la critique big data
         Contents
1.                                                                       Obama  2008  Source  Issuecrawler net      Govcom org Foundation  2008  mentionn          2    Figure 4  Graphique produit par Issuecramler sur les interconnections entre les diff  rents sites Internet  consacr  s       dans Krippendorff  2012    Les mesures alternatives d impact ou altmetrics diff  rent de celles issues de la  scientom  trie traditionnelle dans le sens      elles comptabilisent les citations des    ouvrages universitaires publi  s non dans des revues mais sur les blogs  Twitter     ou tout autre r  seau social universitaire ou plate forme de citation de type http       28 Traces num  riques et territoires       academia edu ou Mendeley  La comptabilisation  et l interpr  tation  de r  f  rences  bibliographiques sur les r  seaux sociaux participe d une approche analytique plus  large de la mati  re substantielle et des responsabilit  s de la soutce sur une question  d actualit   ou un r  seau id  ologique  observ   par exemple sur Facebook ou Twitter     On peut prendre comme exemple les contenus les plus r  f  renc  s sur Twitter  dans       cas pr  cis  ceux qui renvoient le plus    des pages Web  par les fonctionnaires  hollandais rattach  s    des minist  res  Il s av  re que ces fonctionnaires tendent  naturellement    suivre les actualit  s  les hommes ou femmes politiques  ainsi que  les observateurs des nouveaux m  dias et de la vie politique  plut  t que de simples  citoyens  voir
2.     ou gestion de version      le  ahyare     ou logiciel malveillant      le  codage  la plate forme  le profil  etc  Des   tudes telles que celles de Lawrence Lessig  et Eben Moglen ont express  ment soulign   l utilisation  dans le discours juridique  des nouveaux m  dias  des mots form  s    partir du pr  fixe   re     des termes tels  que le remix  le reuse     ou t   utilisation  la redistribution  la r  vision et le recyclage      redistribute  revise et recycle      qui apparaissent comme autant de d  fis lanc  s par les  m  dias num  riques aux lois et m  urs existantes  De facon similaire  l   tude des  natifs num  riques  ou ses enjeux  qui est mise en avant dans la notion m  me de  m  thodes num  riques  propose de r  orienter la m  thodologie du m  dium et des  concepts qui lui sont associ  s  et de les appliquer    la recherche en sciences sociales  et politiques  Cette variante du tournant num  rique invite en effet      tudier non  seulement ce qui est num  ris   mais   galement le num  rique natif  en se servant  des donn  es et en suivant un raisonnement qui reprenne les m  thodes du m  dium   Comment faire pour r  orienter  dans le cadre de la recherche en sciences politiques  et sociales  les techniques et notions num  riques vers une utilisation en ligne      Pour r  pondre    cette question  je vais m int  resser    un nouvel espace  dexpression politique  Facebook  et d  velopper une approche analytique    la  fois qualitative et quantitative  ou quali 
3.   Foot et Schneider  2006  Foot      A  et Schneider  S  M   2006  Web Campaigning  Cambridge         MIT Press      Graves et Kelly  2010  Graves  L  et Kelly  J   2010    Confusion Online  Faulty Metrics and the  Future of Digital Journalism    Tow Center for Digital Journalism  New York   Columbia University Graduation School of Journalism      Hansell  2006  Hansell  S   2006  8 ao  t    AOL removes search data on vast group of web users     New York Times      Krippendorff  2012 Krippendorff      H   2012  Content Analysis  An Introduction to its Methodology   London  Sage      Lazer e al   2014  Lazer  D   Kennedy  R   King      et Vespignani  A   2014           Parable of  Google Flu  Traps in Big data Analysis    Science  343  6176   1203 1205      Lazer e   al   2009  Lazer  D   Pentland  A   Adamic  L   Aral  S   Barab  si  A  L   Brewer  D    Christakis  N   Contractor  N   Fowler  J   Gutmann  M   Jebara  T   King  G    Macy  M   Roy  D  et Van Alstyne  M   2009    Computational social science     Science  323 5915   721 3      Latour  1991  Latour  B   1991    Technology is society made durable    In Law  J     d    A Sociology  of Monsters  Essays on Power  Technology and Domination  London  Routledge  pp 103   131      Latour  2004  Latour  B   2004  Paris  Invisible City  http    www bruno latour fr virtual EN   index html      Manovich  2011  Manovich  L   2011     Trending  The Promises and the Challenges of Big Social  Data    http    www manovich net  DOCS
4.   Manovich  2011  Michel ef      2010  Priem e al  2010  Rogers  2013   Je  m int  resserai particuli  rement    ce que l on a appel   les m  thodes et techniques  quali et quanti du tournant num  rique  ainsi qu aux m  thodes de recherche utilis  es  lors d un   data sprint    en les envisageant s  par  ment du ph  nom  ne bzg dara     En premier lieu  on peut diff  rencier l   ensemble des m  thodes utilis  es en sciences  num  riques les unes des auttes  selon qu elle utilise un type de document plut  t  qu un autre  ou une m  thode bien pr  cise  ceci revient    distinguer les   tudes  qui utilisent des documents et des m  thodes issus de la num  risation  les natifs  num  riques  ou une combinaison des deux   Sur la question des documents  les  chercheurs en humanit  s num  riques  tout particuli  rement  se voient de plus en  plus offrir de nouveaux corpus de recherche alors que les biblioth  ques nationales   les archives et les mus  es livrent r  guli  rement des fourn  es fra  ches de mati  re  num  ris  e et index  e  On parle m  me de crise dans certains domaines de recherche  en humanit  s num  riques  car l accueil r  serv   par les chercheurs    ces nouveaux  documents n a pas   t      la hauteur de cette ru  e vers la num  risation  Par exemple   les archives Web sont encore rarement utilis  es    des fins scientifiques  si l on en  juge        le nombre de publications citant des collections archiv  es de donn  es  Web  Dougherty e al   2010  Thomas ef al   20
5.   galement Rogers  2009      Au del   de la critique big data 19       que Twitter  et dans quels cas  ou jusqu o    est il possible d   tudier gr  ce    Twitter  des ph  nom  nes soci  taux      l   tat naturel    A l occasion d un concours organis    en 2013 par le Centre am  ricain pour le contr  le et la pr  vention des maladies  US  Centers for Disease Control           une s  rie d   tudes avait   t   publi  e qui avait montr    comment l   volution de la grippe pouvait   tre suivie sur Internet non seulement  gr  ce au moteur de recherche de Google mais   galement par le type de pages  vues sur Wikip  dia et de tweets g  otagg  s sur Twitter  On pourrait qualifier cette  m  thode qui consiste    obtenir des r  sultats    partir de donn  es disponibles en  ligne d   inf  rence en ligne    les r  sultats sont souvent accessibles sur des interfaces  type tableaux de botd  avec des cartes montrant les zones d activit    comme l a  fait par exemple le laur  at du concours du CDC    Pr  dire la prochaine saison de  grippe  un site de pr  vision des maladies infectieuses  grippe  de l Universit   de  Columbia    CPID  2015   Si l algorithme de pr  vision s appuie sut la combinaison  de donn  es de surveillance compil  es par le CDC avec l aide d un Google Flu  Trends r  vis    et r  habilit     l authenticit   des r  sultats n   en repose pas moins sur  les r  gimes de surveillance traditionnels tels que les admissions    l h  pital  ce qui  leur donne davantage de cr  dibili
6.   son endurance  Sur les  r  seaux sociaux et sut tout autre environnement num  rique personnel quantifi     par exemple les logiciels d   valuation d un programme fitness   les m  triques  comptabilisent et communiquent l intensit   de l activit       les   J aime   sur  Facebook par exemple      et ont   t   notamment critiqu  es pour leur incitation         vouloir toujours plus   poussant les gens    vouloir toujours plus de  J aime    plus de commentaires  et plus d amis    Grosser  2014      L utilisation du suffixe  nomique est moins directement li  e    la question des  relations entre l industrie du Web et les sciences  il renvoie    la   loi    dans le  sens des lois de la nature  et fait donc allusion aux fondamentaux de la vie et  la recherche fondamentale  Il partage avec le terme   m  thodes   une approche    pist  mologique illimit  e  Quelle que soit notre progression dans le travail  et  quelle que soit la d  marche adopt  e  les m  thodes soulignent la construction par    tapes d une proc  dure ou d un protocole de recherche  Si l on applique cette  description aux m  thodes num  riques  celles ci pourraient embrasser l ensemble  des proc  dures utilis  es pour l   tude des documents num  riques  m  me si le  terme d  signe plus sp  cifiquement les m  thodes utilis  es en ligne pour l   tude  des donn  es du Web  Je reviendrai    cette question apr  s un bref examen de  l analytique culturelle  de la culturomique  de la cyberm  trie et des m  triques    apr 
7.  Figure 5   De plus  le sujet le plus r  f  renc   est l utilisation  par les  fonctionnaires  des nouveaux m  dias et les actions et campagnes innovantes sur le  Web  ce qui signifie que le contenu partag   est avant toute chose auto r  f  rentiel  et centr   sur les m  dias putet qu un sujet d actualit                 A Tm  ajboekestjBracRObamg mer          statstekci  mam us Sopa                 nre wMNaglieroesEU      s                          JCE TEE          gt   tin      aximeVerhagerltRiiSbuijink    Qa argnpypeeevscherrenb             Kram d pain 2                   AlexanderNL  wamoaandre Pp mat  legraat    SIN Era                                 aste  andre  gt  Caoa            lMderspw                       7           11560             da            JaapJand  ii   fritswester      Laradi    TheTwestOfGos JoaniaeHennis   p PS panting      Domiipiquatieydo              UTI                   nmm    RPlasterk  Jw  Giederiksamsom          WasslaHachchi      hgroenusa    Tr Sid                     annesgar  nes Gbhoelomar                           APechtold e  Tong nomen Borisham      T               ur Jutchcowboys u Gender t      onina 4  Koningin                  Dostevanhetweb  N U n                                   Frank e Mina ZK    Figure 5  R  seau   largi des follow followers des fonctionnaires minist  riels hollandais  mars 2013   Donn  es recueillies bar TCAT  DMI Amsterdam  et repr  sentation graphique avec Gephi  Source   Baetens et al   2013    Comme nou
8.  Manovich trending paper pdf      Manovich  2015  Manovich  L   2015    Analyzing Cultural Data    https    docs google com   document d 1DsAQUQ7paWimVQMNwXDO5Qgm7xnpeqv9HQdpn9E  Pwsg      Michel e   a  2011  Michel     B   Shen  Y  K   Aiden          Veres  A   Gray  M  K   Pickett  J   P   Hoiberg  D   Clancy  D   Norvig  P   Orwant  J   Pinker  S   Nowak          et Aiden  E  L   2011    Quantitative Analysis of Culture Using Millions of  Digitized Books    Science  331  176 182      Moretti  2005  Moretti      2005  Graphs  Maps  Trees  London  Verso    Moretti  2000  Moretti  F   2000    Conjectures on World Literature    New Left Review  1  54 68     32 Traces num  riques et territoires        Ohm  2010  Ohm  P   2010    Broken Promises of Privacy  Responding to the Surprising  Failure of Anonymization    UCLA Law Review  57  1701      Parks  2005  Parks  L   2005  Cultures in Orbit  Durham  Duke University Press    Piper  2013  Piper  A   2013    Reading s Refrain  From Bibliography to Topology    ELH   80 2   373 99      Priem e a    2010 Priem  J   Taraborelli  D   Groth  P  et Neylon  C   2010     Alt metrics  a  manifesto    http   altmetrics org manifesto      Puschmann et Burgess  2013  Puschmann  C  et Burgess  J   2013           Politics of  Twitter Data           Discussion Paper Series  2013 01  http    sstn com   abstract   2206225      Richmond  2011  Richmond  R   2011  27 septembre    As    Like    Buttons Spread  So  Do Facebook    Tentacles    New York 
9.  leaning  containing obama       Ordered by left leaning Ordered by center leaning Ordered by right leaning  1  obama accomplishments W E 1  obama pois W   1 1  cost of              trip to india    w     2               accomplishments W         una 2                    w m    2          Wh       2  2 2 y          3  obama trip 10        cost W  forgiveness 7                    4  obama        numbers W c m        4 obama press coference             gt  obama        rumors      5  barack             refigion Y   ra 5 don w  5     of obama chema collective save 2    aocompluhments W     00                  Insights by Yahoo  Labs depays the proportion of times a search query resuis in    Cick rough on             blog of a partcutar leaning Blue stands for left ieaning  biogs  grey for center  and        for nighteaning blogs  For more information see the        pace    Copyright    2011 Yahoo  Inc  Al rights reserved  Halo   Privacy   Terms of Service    Figure 3  Political Insights  Yahoo  Labs  montrant les recherches des sympathisants de gauche et de  droite ayant pour sujet Obama  2011  Source  Borra et Weber  2012    En sciences sociales num  riques  la cyberm  trie consiste    appliquer des m  thodes  d analyse de citations en utilisant des liens Internet  principalement  de la m  me  mani  re que s ils   taient des citations extraites d ouvrages universitaires  et en  traitant le lien Internet comme un gage de cr  dibilit   ou de mesure d impact   Thelwall ef      200
10.  manifestations  et recueillis sur des m  dias en ligne  et pour lesquels on pouvait reconstituer une  chronologie des   v  nements   cela avait   t   notamment le cas avec des images prises  au parc Gezi    Istanbul durant les manifestations de mai juin 2013       utilisant la  technologie ImagePlot  on assiste    la transformation qui a travers   cette   r  volution  des arbres   en Turquie  comme le dit un t  moin    la transformation de l espace  public en espace priv   montre pourquoi le but de l occupation du parc Gezi n   tait  pas seulement de sauver des arbres mais de sauver la d  mocratie turque    voir Figure  2   Turkey EJOLT team  2013   La couleur verte dominante d  cline progressivement  et c  de la place aux images de manifestants asperg  s de gaz lacrymog  nes puis  plus  g  n  ralement     la lutte pour les droits     La culturomique    galement pratiqu  e par les humanit  s num  riques  est une  discipline qui interroge     partir de Google Ngram Viewer  la base de livres  num  ris  s de Google sur des mots pr  cis  faisant ainsi ressortir des tendances  culturelles ou soci  tales  elle se concentre essentiellement sur les ouvrages en  anglais parus entre 1800 et 2000  bien que l on trouve aussi des livres dans d autres  langues  Michel ef al  2011   On obtient  sous forme de graphiques  la variation  de fr  quence d utilisation de mots cl  s    travers la p  riode mentionn  e  ces  graphiques rappellent     la fois m  thodologiquement et visuellement  les 
11.  objets du  m  dium et ceux qui en d  rivent  Latour  2004      La distinction entre natifs num  riques et documents num  ris  s peut   galement  s appliquer    la m  thode employ  e dans les sciences humaines et sociales  On  trouve  d   un c  t    des m  thodes qui ont effectu   une migration vers le Web     les  enqu  tes en ligne par exemple      et de l autre  des m  thodes sp  cialement cr    es  pour une utilisation en ligne  comme le PageRank de Google  un classement    20 Traces num  riques et territoires       qui privil  gie un site Web plut  t qu un autre  ou l EdgeRank mis en place par  Facebook  qui privil  gie un ami plut  t qu un autre selon votre affinit   avec lui      On peut donc placer les diff  rentes approches en recherche num  rique sur une  matrice binaire  ou  si l   on pr  f  re  les disposer sur un graphique en   ventail   ou bien les faire d  filer horizontalement    l   aide d   un curseur   o   l   on verrait  appara  tre quels types de documents sont davantage sollicit  s pour les donn  es   num  ris  s ou natifs  et quelles m  thodes sont imit  es ou natives  voir Tableau 1      Enfin  en lieu de la num  risation des concepts comme cela a   t     voqu   plus haut   existe un discours sp  cifique    l usage du Web  que l on entend aussi bien dans la  presse professionnelle que dans l utilisation des logiciels critiques  un langage dont  on pourrait tirer une utilisation analytique  le spa7  les creative commons  la wikification   le versioning 
12.  s les avoir pr  sent  es  j offrirai quelques pistes pour les adapter    la recherche  en sciences politiques et sociales     La premi  re de ces approches en humanit  s num  riques  l   analytique culturelle  a  souvent comme objet d   tude des collections num  ris  es  par exemple l ensemble  des couvertures historiques de Time Magazine  toutes les peintures de Rothko ou  de Mondrian  etc    et s int  resse    leurs propri  t  s formelles et la mani  re dont  elles changent avec le temps  Son logiciel attitr   est ImagePlot  qui regroupe des  images selon leurs propri  t  s formelles telles que la luminosit   et la saturation  voir  Figure 1   On appelle le produit de cette analyse un   espace de style      les images  visuellement similaires sont dites proches  celles qui sont diff  rentes se retrouvent    loign  es les unes des autres    Manovich  2011   Ce terme s inspire de la notion de  styles utilis  e en histoire de l art  qui permet de regrouper et de r  unir en cat  gories  des   uvres d art     24 Traces num  riques et territoires       MONDRIAN ROTHKO       Figure 1  Rothko contre Mondrian  Produit par le logiciel ImagePlot et Cultural Analytics   Comparaison des espaces de style  L axe des abscisses montre la luminosit    l axe des ordonn  es la  saturation  Source  Software Studies Initiative  2011    Photo            ef he 2013 protesi Terry  mmr                      Figure 2  Caract  risation d image sur les premi  res images apparues sur Google Images lors 
13.  top of the  search enpne               marshall org  8  cimatearkog  4  E Mes A  realclimate org  35       sourcewatch org  21          Product  o   the Digital Methods          dimi oes  cl  Analysis        Figure 6  Pr  sence des climato sceptiques sur les principaux sites consacr  s aux changements  climatiques selon bttp     google com  juillet 2007  Source  analyse    distance par Google Scraper dit  L  ppmannian Device  dispositif Lippmanian      Digital Methods Initiative  Amsterdam  2007    CONCLUSION    On ne peut pas consid  rer les m  thodes num  riques  dans leur application g  n  rale  ou dans celle  plus sp  cifique  de r  orientation de dispositifs  comme de simples  bo  tes    outils ou comme le mode d   emploi d   une s  rie de logiciels   les m  thodes  num  riques questionnent plus largement la mani  re de faire de la recherche en  ligne  Elles invitent    consid  rer ou    imaginer d   un point de vue sociologique les  opportunit  s de recherche qu offre la culture en ligne  en se laissant guider par  le m  dium au lieu de le faire r  pondre    des ordres disciplinaires  conceptuels   Prenons l exemple  en guise de conclusion  de l activisme politique  On pourrait  observer d un   il critique la mont  e du slacktivisme ou du clicktivisme  cette  activit   en ligne qui requiert  par un simple clic  un engagement minimum mais  donne pour autant l impression d avoir   t   utile    une cause  On pourrait      l inverse    tudier dans quelle mesure aimer  part
14. 10   De plus  certaines interrogations  subsistent quant    l   quipement et la formation des enseignants chercheurs et des    tudiants  l        l enjeu essentiel porte    la fois sur la pertinence et la mani  re  d enseigner la programmation  ou le codage   Manovich  2015      Pour les chercheurs en sciences sociales num  riques  les donn  es num  riques  natives  issues du Web  pourraient pr  senter un plus grand int  r  t que les objets  patrimoniaux num  ris  s  dans la mesure o   les donn  es sont utilis  es pour   tudier  les tendances  les opinions  les rumeurs  les prises de position  etc   ainsi que l avait  signal   en 2009 un groupe de chercheurs en sciences sociales qui s   tait pench   sur  le tournant computationnel dans sa discipline  Lazer e   al  2009   Reste    savoir si  vraiment  comme certains se le sont demand    on peut   valuer l opinion publique  en   tudiant les tendances    partir  par exemple  de donn  es recueillies sur Twitter   Existe t il une corr  lation entre l humeur d  tect  e sur Twitter et le comportement  des   esprits animaux   sur le march   boursier  Bollena ef 41  2011   Peut on inf  rer  l incidence de maladies et de troubles m  dicaux  des tweets touchant    la sant     Mitchell et Hitlin  2013   Le probl  me se pose dans les m  mes termes que pour  le Google Flu Trends    tudie t on ici une tendance soci  tale ou le fonctionnement  des r  seaux sociaux   Dans quels cas l   tude de donn  es Twitter ne concerne t elle       1 Voir 
15. 5  Ackland  2013   On retrouve l approche cyberm  trique dans  des logiciels tels que Issuecrawler ou VOSON  qui fouillent m  ticuleusement  ou    crawl    les sites Web  identifient des liens et repr  sentent ces relations sous la  forme de graphes de r  seaux  ils en montrent ainsi les caract  ristiques  y compris la  centralit   ou la p  riph  ralit   d un ou plusieurs acteurs  Elle peut   galement mettre en    vidence une strat  gie en ligne  comme l ont montr   les graphes de r  seaux publi  s  par Issuecrawler suite    la campagne en ligne d Obama en 2008  Le caract  re  exceptionnel de la forme   toil  e du r  seau s explique par la strat  gie de mise en  relation par laquelle s est illustr  e la campagne d Obama en 2008  voir Figure 4    Le c  ur du r  seau est form   par le site http    barackobama com et ses sous sites   tels que http   latinos barackobama com  http   faith barackobama com et http      students barackobama com  La p  riph  rie est constitu  e en majeure partie par des  sites de r  seaux sociaux consacr  s    Obama  ainsi que par les pages du candidat       2 Voir   galement Foot and Schneider  2006    Krippendorff  2012      27    Au del   de la critique big data       te par ailleurs d   autres sites et ne          2                           sut LinkedIn  Facebook  Flickr  etc  Le t    fait donc pas   tat des campagnes     Web     populaires influenc  es par les nouveaux    m  dias  comme celle de Howard Dean en 2004  qui avait permis aux utilisat
16. Apr  s d importantes mises    jour de certains de  ses algorithmes par Google  Panda en 2011 par exemple   des sites internet ont  vu leur classement baisser  notamment ceux qui pr  sentaient liens   spammy     fermes de spam ou r  p  titeurs de contenus    content repeaters    en nombre trop  important  Singhal et Cutts  2011   Il y a fort    parier que si l on   tudiait l   volution  dans le temps des classements des r  sultats des moteurs de recherche  on verrait     quel point des algorithmes instables produisent des positionnements fluctuants   METHOD    NATIVELY  DIGITAL    DIGITISED       DIGITISED FOR  gt  Altmetrics       4 7 e cs       Cultural Analytics ix    DATA    NATIVELY       Webometrics    Digital Methods  DIGITAL    Tableau 1  Cinq mani  res d   tudier les bumanit  s num  riques et les sciences sociales num  riques  repr  sent  es selon les types de donn  es et m  thodes privil  gi  s    LES   TUDES NUM  RIQUES    Ces dix derni  res ann  es  les m  thodes et techniques d  ploy  es dans le cadre de la  recherche num  rique  qui utilise    la fois des donn  es num  ris  es et des donn  es  en ligne   ont   t     nonc  es selon une large gamme de desctipteurs  notamment   l analytique  les indicateurs  les sciences  nomiques ou toutes m  thodes connexes   projetant ainsi tout un panel de nuances sur l objet mesur    En recherche num  rique   on associe naturellement l utilisation de l analytique    l   industrie de surveillance des  nouveaux m  dias  qui est d
17. Times  http   bits blogs nytimes   com 2011 09 27  as like buttons spread so do facebooks tentacles      Rochlin  1997  Rochlin  G   1997  Trapped in the Net  Princeton       Princeton University Press    Rogers  2013  Rogers  R   2013  Digital Methods  Cambridge  MA  MIT Press      Rogers  2009  Rogers  R   2009  The End of tbe Virtual  Amsterdam  Amsterdam University  Press      Rogers  2005  Rogers  R   2005    Old and New Media  Competition and Political Space     Theory and Event  8  2      Savage et Burrows  2007  Savage  M  et Burrows  R   2007    The Coming Crisis of Empirical  Sociology    Sociology  41  885 899      Sullivan  2010  Sullivan  D   2010    Why Google Can t Count Results Properly  Search  Engine Land    http    searchengineland com why google cant count results   properly 53559      de Solla Price  1963  de Solla Price  D J   1963  Little Science  Big Science    and Beyond  New York   Columbia University Press      Singhal et Cutts  2011  Singhal  A  et Cutts  M   2011    Finding more high quality sites in  search    http    googleblog blogspot nl 2011 02 finding more high quality   sites in html      Thelwall e a l   2005  Thelwall  M   Vaughan  L       Bj  rneborn  L   2005    Webometrics    In  Cronin  B     d    Annual Review of Information Science and Technology  39  Medford   NJ  Information Today  81 135      Turkey EJOLT Team  2013  Turkey EJOLT Team  2013     Turkey s Tree Revolution     part 2   Everyday I m chapulling     EJOLT  Mapping Envir
18. Traces num  riques  et territoires    Marta Severo  Alberto Romele    24                ParisTech    Partie 1    La trace  les m  thodes et les donn  es    Au del   de la critique big data    La recherche sociale et politique    l   re num  rique    Richard Rogers    INTRODUCTION   BIG DATA ET LE TOURNANT COMPUTATIONNEL    Parmi les d  bats actuels se pose la question de l harmonisation de la recherche en  sciences politiques et sociales avec          du num  rique  Comment faire face aux  d  fis que posent Internet et le num  rique  notamment les donn  es d  sormais  accessibles en ligne     la recherche  Alors que le terme big data connait un succ  s  grandissant  il semble que la recherche  tout comme l ensemble de ce que l on  pourrait appeler le calendrier programmatique  num  ros sp  ciaux des revues   appels    financement  titres des conf  rences  s  minaires  etc    soit guid  e par  des m  thodes et des outils bien sp  cifiques  Pour certains  ce ph  nom  ne a pris  le nom de tournant computationnel  qui d  signe l int  gration des techniques  informatiques et des big data en plein essor  aux pratiques appliqu  es    la recherche  en sciences sociales  Berry  2011   Dans un premier temps  je propose d examiner  le tournant computationnel  les big data et les multiples critiques qui leur ont    t   adress  es  pour ensuite les   tudier ind  pendamment de ce que l on pourrait  appeler le   tournant num  rique    Ce dernier offre en effet certaines opportunit  s  de re
19. UES DE LA TRACE NUM  RIQUE                  211  DE LA TRACE    LA CARTE ET DE LA CARTE    LA TRACE                  112  213  Matthieu Noucher   DIMENSIONS SPATIALES DE L  ACTUALIT                                                         225    Laurent Beauguitte  Marta Severo  RECONFIGURATION DES PRATIQUES PARTICIPATIVES                                        239  Nicolas Douay  Maryvonne Pr  vot    REMERCIEMENTS  5559 ve p ie Os Ere Ex            e                REPE dS 259                                               261    
20. ager et commenter un contenu  est une preuve d engagement  et par l   m  me   tudier  par exemple  autour de  quelles vid  os et quelles photos se rassemblent aujourd hui les groupes et pages  anti islamiques sur Facebook  voir Figure 7   L   tude de l engagement s   inspire         d   un cadre analytique qui capte aussi bien les clics que les commentaires et qui    30 Traces num  riques et territoires       identifie le contenu qui rassemble  ouvrant ainsi la porte    d autres interpr  tations   Il s agit ici  d  s la phase pr  liminaire  de s appuyer sur les mesures d activit   du  m  dium  et de se demander ensuite quels enseignements peuvent        tre tir  s     Most engaged with image Most commented image    Cultural differences    Getting stoned    LES    Taking shots   gt     Fe       3      Gay guys hanging out    LE ESA    LI    79          Figure 7  Contenus les plus suivis sur les r  seaux Facebook europ  ens anti djibadistes  janvier  2013  Tir   de   W hat does tbe Internet add  Studying extremism and counter jibadism online     International Workshop and Data Sprint      Digital Methods Initiative  Amsterdam  2013    R  F  RENCES BIBLIOGRAPHIQUES     Adobe  2014  Adobe  2014    Adobe Analytics    http    www adobe com solutions  digital   analytics html      Ackland  2013  Ackland  R   2013  Web Social Science  Concepts  Data and Tools for Social  Scientists in the Digital Age  London  Sage      Baetens  amp  al   2013  Baetens  T   Juetten  T   Maessen  J   B
21. ante et l enjeu des d  bats sur les modes  de production de la connaissance    partir des big data et des techniques de lecture     distance  appara  t ici pleinement  Schulz  2011  Allison e   a4  2011   Non seulement  faut il   tre  si l on peut dire  proche des donn  es pour pouvoir les lire    distance  il  faut encore obtenir le droit de les approcher et d y acc  der physiquement     Il faut encore ajouter    cela le temps pass      travailler sur les donn  es  une mission  tr  s longue  surtout lorsque l on doit rester sur place  avec les donn  es  Comme il a   t    mentionn   plus haut lorsqu ont   t     voqu  s les ph  nom  nes de pseudonymisation et  de d  personnalisation des donn  es  avant m  me l analyse des donn  es  il faut parfois  entreprendre des d  marches nouvelles en terme de pr  vention  des d  marches  r  cemment apparues qui r  pondent aux actes de d  sanonymisation initi  s par des  tiers  Journalistes et d  fenseurs de la vie priv  e notamment   Il est important de  se pr  parer    la mont  e de ce que l on appelle la science de la r   identification     Au del   de la critique big data 17       ou l ensemble des techniques qui permettent de r  tablir l identit   de personnes  d  lib  r  ment brouill  e  Ohm  2010   On a  par cons  quent  ajout   au nettoyage des  donn  es une   tape pr  paratoire suppl  mentaire     Pour r  sumer  la critique des big data a des points d ancrage   pist  mologiques   esth  tiques et   thiques     commencer par une rup
22. ce des v  ritables noms  Une autre mani  re de r  pondre aux questions   thiques  qui   mergent de l analyse des big data personnelles est de les agr  ger et de les  d  personnaliser  c est le cas  par exemple  lorsque l on recueille les listes des int  r  ts  post  s sur leur page Facebook par les amis des candidats    la pr  sidence am  ricaine   ou de n importe quelle autre personnalit   publique qui poss  de une page officielle   dans le but de les observet et d en d  duire certains rapports de cause    effet  comme  pat exemple l influence des guerres entre cultures ou les pr  f  rences m  diatiques  des amis selon leur orientation politique    gauche ou    droite     16 Traces num  riques et territoires       Aujourd   hui  les critiques des big data pointent une tendance    davantage se  fier    des flux et des signaux de donn  es disponibles  par exemple les APIs  des r  seaux sociaux  plut  t qu    appliquer la m  thode usuelle qui consiste    en  chercher de nouveaux mais qui demande davantage d efforts  Vis  2013   Dans  les fondamentaux de la recherche  les donn  es auraient elles remplac   une vision  qui privil  giait les probl  mes    r  soudre  Par exemple  quelqu un qui voudrait  g  olocaliser des poches de haine ou d intol  rance doit il s engager sur la piste  potentiellement prometteuse des tweets g  otagg  s  ou doit il prendre en compte  des donn  es nouvelles et les moyens de les recueillir  Dans ce cas  c est la  disponibilit   imm  diate des donn  es 
23. cherche s appuyant sur l analyse mais selon une approche diff  rente de ce que  l on a pu observer dans le tournant computationnel et les big data     Le d  bat consiste en partie    estimer l   troitesse des liens qui unissent le tournant  computationnel    l influence croissante des big data  une notion qui  dans le   hype  cycle   du cabinet Gartner  a   volu   du stade des   attentes exag  r  es   en juillet  2013    celui du   gouffre des d  sillusions   un an plus tard  Gartner  2014   Cette  descente coincidait avec le probl  me de surestimation dont fut victime le site  Google Flu Trends  un projet novateur de big data en recherche m  dicale et sociale  gr  ce auquel les recherches sur les sympt  mes de grippes ou associ  s effectu  es  sur le moteur de recherche sont g  olocalis  es et utilis  es pour mesurer l activit    r  elle de la grippe et sa localisation  Ce service avait sur  valu   l importance de  la grippe  par un coefficient de deux  par rapport aux chiffres publi  s par les  syst  mes habituels de surveillance de l Institut national de la Sant   am  ricain et  ses   quivalents  ceci avait amen   les chercheurs    s interroger sur les m  thodes  de mesure pratiqu  es sur le Web et si celles ci ne se limitaient pas    identifier  des effets m  diatiques plut  t que des r  alit  s sur le terrain  Lazer ef al   2014    A l annonce d une nouvelle vague de grippe  constate t on plus d activit   sur  le moteur de recherche  sachant que la personne qui effectue 
24. d une recherche sur  le terme  Gezi   selon   save the trees      sauver les arbres    en vert  ou   bring down the government      faire  chuter le gouvernement    en rouge   juin 2013     Digital Methods Initiative  Amsterdam  2013    Au del   de la critique big data 25       Cette notion d espace de style a   t   utilis  e dans l analyse des selfies  ces autoportraits  photographi  s    l aide d un smartphone et post  s ensuite sur Instagram par des  utilisateurs dans plusieurs villes  Le projet avait pour but d analyser les propri  t  s  formelles des portraits  afin de les regrouper et d en extraire certaines constantes  comme la pose  inclinaison de la t  te   le sexe  l     ge et l expression du visage  dans les  villes de Berlin  Moscou  Sao Paolo  Bangkok et New York  parmi les conclusions   on peut mentionner le fait qu il y ait nettement plus de femmes que d hommes qui  prennent des selfies  qu    Sao Paulo on pose avec beaucoup de s  rieux  avec un angle  d inclinaison de la t  te    environ 17 degr  s  Certaines villes  Sao Paulo et New York   affichent plus de bonne humeur que d autres  Berlin et Moscou  o   les auteurs de  selfies sont plus   g  s   L   tude ne va pas jusqu    mesurer la teinte et la saturation  pour en inf  rer des conclusions sur la culture de l exposition en ligne chez les jeunes     Comment appliquer l analytique culturelle    la recherche en sciences politiques  On  peut citer en exemple une   tude qui portait sur des clich  s pris lors de
25. e plus en plus impliqu  e dans la surveillance des r  seaux  sociaux et l   coute sociale  comptabilisant et transformant en indicateurs l activit    des utilisateurs  On capture et on analyse les mentions  puis on en d  duit une  signification afin d obtenir   une vision op  rationnelle    pour reprendre les termes  d un fournisseur de logiciels  Adobe  2014   Dans la plupart des cas  la recherche de  la signification concerne l impact et la mesure du sentiment  Un nom  un mot cl     une marque ou un autre terme s   est il elle propag   e    S est il elle diffus   e  au   del   d un public captif  par exemple les followers d un r  seau social   trouvant ainsi    Au del   de la critique big data 23       un   cho en dehors de cette   bulle    Cette diffusion a t elle   t   bienveillante  On  peut   galement mettre en place une veille sur la comp  tition entre des noms  des  mots cl  s  des marques et autres termes  et voir dans quelle mesure une campagne   ou un programme  trouve davantage d     cho  parmi les prescripteurs  que sa contre   campagne  ou contre programme   Latour  1991      Les m  triques  metrics  sont des normes de mesure  leur nomenclature provient  des techniques de comptage utilis  es notamment en biblioth  que et en sciences  de l information  telles que la bibliom  trie et la scientom  trie  Ils s int  ressent  au facteur d impact     la pertinence et    l influence  en d autres termes non pas  uniquement    la force brute mais    la force relative et  
26. e sur le Web  comme l a r  v  l   un cas bien connu  la  requ  te associ  e    un terme g  n  rique comme  voitures   cars  produit moins de  r  sultats que celle  plus cibl  e  de  voitures d occasion   cars    used   Sullivan  2010    En effet  les donn  es num  riques natives ne partagent pas n  cessairement les m  mes  propri  t  s que les   good data   car le Web de mani  re g  n  rale  et les plates formes  de r  seaux sociaux en particulier  sont des m  dias instables  c est    dire   ph  m  res   et en perp  tuel mouvement  Constamment de nouvelles caract  ristiques  et par  cons  quent des types de donn  es  sont ajout  es ou rendues obsol  tes     La question de la fiabilit   des m  thodes de mesure du Web dans une   tude  longitudinale pose donc probl  me  Le bouton   J aime   de Facebook en est un  tr  s bon exemple  sa date de cr  ation remonte    2010 et  par cons  quent  toute  mesure ant  rieure de l activit   de Facebook ne pourra prendre en compte cette  caract  ristique  qui est l une des plus populaires du site  De plus  de sa cr  ation     la fin de l ann  e 2011  l utilisation du bouton a augment   de mani  re progressive  si bien que les analyses sur cette p  riode risquent d   entra  ner une sous   valuation    22 Traces num  riques et territoires       des donn  es    underreporting     m  me en cas de pic d activit    Richmond  2011    De la m  me mani  re  les r  sultats de recherche sur Google font preuve d une  certaine volatilit   dans le temps  
27. eqoyoeieq uioo 1                      GL   uio   eueqooeJeq         2 92  OT  51   uio   sjasseBunpiowkquoriejsta  6  GT   uo   eureqoxoeJeq eJ0 s  8  GT   euieqoxoejeq uio             61        lt                9  91   uroyopeureqoyoejeq sojoud  uoo HI 5  91   eueqoyoereq uoo aqninof    y  9T   tuo euieqoyotieq      LT                                fu    Z  81   eureqoyoejeq uio2 eaeds ui T           aeudiued pue                a0        zuno  uiui      s3upquey            iepiansuy  uonepunod    coron      fa        ME DENSS                                3uno9            2    2  aded   yo   00 40   8002 4e TT       60   8002 JEN IT  aerus                           dew AUrT 09                         jenuopisaJd                       woo soy  jiep             e     30                                         nus                                                    euieqoyoeJeq         aqninof                                   lo    euleqoyoejeq siuopms    euieqoyoe1eq uioo aoedsKui    eueqo yoeJeq uoo eneui    1109 9409 u8Uq       I    ewegoyseseg wo0 nuana               Wov eweqoyoeseg   20                               apud    Woo                                 8        109                   uo   eweqoyoeieg    e 9 yoe1eq ui09 088    euieqoyoeJeq  ui02 400q929J   qsoud   corre ge ere     e EET e  qoxoeJeq  uio2 xooqooeJ Kq    o2  eujeqoyoeeq UM                   8                          18                                                                    eureqoyoeieq  
28. eurs de    leurs propres histoires lors des rencontres   il s efforce davantage de montrer    une approche centralis  e  concentr  e sur le message    d  livrer  Rogers  2005      cr  et                   siuueq               uoneysi8e1 1930  910A      oct                                                                            4   jeu  30N       uospieuons iig                           124819 YIN           quepiseudjojuospieuoL                                                         duu    8109           5                                    eor        G                     E    8   uo  soxfiiep  ze  LT                                                 YT                               soqui  DE       wor eureqowoeeq apud    62                                        8 782         l0 euieqoyoejeq                 72  Vl                                               92  PL ulo   euueqoyoereq squapngs 62  PL   Wwov eweqoyoeseq                   pz         uo eujeqoyoereq 500112     z  ST                                      8    22  GI   euleqo                                   Z  GT   eureqoyoeieq uiooxooqeoej fqsaid    02  GI              yoeJeq uo   esequje     ET  GT                                                          gr  GL                                suoa 21  GT                                                791  ST                                 eBuejegfu  GT  ST              woe1eq uoo ajuaiIU  T  GT   uio   a ouBuq          ST   ulo   onooyuBuq      721  GT   euu
29. incarnent notamment ces ordinateurs portables              d autocollants et  les Hacking Workshop  pourrait   tre le tournant num  rique       l   tude et les  m  thodes de la culture num  rique influencent la recherche d  s lors qu elle utilise  les donn  es  en ligne   les logiciels d analyse et la visualisation infographique   Faire la distinction entre le tournant computationnel  des big data  et le tournant  num  rique permet de ne pas c  der    une compr  hension monolithique  ou  unitaire  de l   volution des besoins en recherche politique et sociale    l   re du  num  rique  Lovink  2014      Au sein m  me du tournant num  rique  il existe tout un panel d approches qui  englobent les humanit  s num  riques  les sciences sociales num  riques et celles des  m  dias num  riques  qui forment toutes les     tudes num  riques   ou digital studies   et dont les engagements et positionnements ontologiques et   pist  mologiques  se distinguent    premi  re vue nettement les uns des autres  Je vais t  cher ici de    18 Traces num  riques et territoires       contextualiser et d examiner certaines pratiques de la recherche num  rique  observ  es en humanit  s num  riques  analytique culturelle et culturomique   en  sciences sociales  cyberm  trie et mesures alternatives d impact ou a Zzerrics   et  dans des   tudes crois  es  m  thodes num  riques   et de montrer     travers quelques  exemples  en quoi elles peuvent contribuer    la recherche en sciences politiques et  sociales
30. iper  2013   Franco Moretti  qui a th  oris   la lecture    distance  a montr    que la lecture de pr  s produit un canon qui a pour cons  quence de limiter la  port  e de ce qui est lu  et encourage     l inverse     apprendre    ne pas lire  Moretti   2005   En utilisant ces techniques  il serait possible de soumettre    l analyse une  plus grande production  et non plus seulement des ceuvres canoniques     Dans le domaine des big data  l infrastructure computationnelle et les moyens de  la pr  server deviennent des obstacles    la saisie scientifique  On pourrait  d une  certaine mani  re  comparer l investissement    fournir    celui d un grand moteur  de recherche ou d une chaine d information  Il faut pouvoir faire preuve d   quipes  d  di  es de techniciens chercheurs et de programmeurs scientifiques capables  d entreprendre une telle t  che  ce qui implique une expertise dans le traitement  de donn  es et une certaine habilet   dans l utilisation de logiciels d analyse et de  leurs nombreux param  tres  En d autres mots  il n est plus possible d exploiter des  ensembles de donn  es au moyen d   un tableur ou      la main       Ceci a des cons  quences directes sur les syst  mes r  putationnels appliqu  s au  domaine scientifique  En basculant vers des infrastructures d   envergure avec leurs    quipes d analystes et de techniciens  l   cart entre supra science et petite science se  creuse    nouveau  au sein             cette fois ci  des sciences humaines et des scie
31. les recherches est    14 Traces num  riques et territoires       susceptible de ne ressentir aucun sympt  me  Parmi les principales critiques  adress  es aux big data est le fait que l on peut tr  s bien voir un mod  le l   o   il n en  existe pas  ce que boyd et Crawford  dans leur contribution au d  bat  d  signent  par apoph  nie  boyd et Crawford  2012      BIG DATA  POINTS DE VUE CRITIQUES    L av  nement des   g data est cens   avoir entra  n   une rupture  notamment     cause du remplacement de l interpr  tation par la recherche de mod  les  Savage  et Burrows  2007  Watts  2007  Lazer e      2009   Cela signifie que dans une  d  marche type de recherche  le pr  l  vement d un   chantillon  en sciences sociales   ou l identification d une collection  en sciences humaines  serait remplac   par  une collecte de donn  es par quadrillage syst  matique  dont la finalit   n est pas  simplement la constitution exhaustive d un mais plut  t de plusieurs ensembles  de donn  es  de grande taille et collect  s selon plusieurs m  thodes  notamment  la capture en temps r  el  L apprentissage automatique et l analyse des r  seaux  formeraient les points de d  part de telles d  marches analytiques  On pratiquerait en  effet l analyse non pas par une lecture   de pr  s   mais par une lecture      distance     ou topologique  qui   l  verait  en points de mire des r  sultats  la cooccurrence de  mots  les tendances du moment  les prescripteurs  ainsi que l anomalie et le hors   norme  P
32. nces  sociales  Price  1963   Avec l av  nement du tournant computationnel et de sa vision  orient  e vers les supra sciences  la valeur d une   tude se mesure    travers le prisme    Au del   de la critique big data 15       des dispositifs de capture de donn  es employ  s  ainsi que par la taille et la complexit    de ces donn  es  L application d une m  thode et d un proc  d    la combinaison de la  force brute de l   quipement    la finesse des param  tres choisis  sont ici capitales     Les r  sultats des analyses produisent par ailleurs des modes de connaissance     distance     savoir des comp  tences particuli  res dans la compr  hension de clusters  graphiques et autres complexit  s visuelles  On peut comparer ces nouvelles  connaissances chez les scientifiques    celles que poss  dent des gestionnaires de  syst  mes d exploitation  comme les contr  leurs a  riens ou les analystes d images  satellites  Rochlin  1997   Parks  2005      En collectant en continu des donn  es en temps r  el  faire de la recherche reviendrait     observer une sorte de veille m  diatique    l aide d un dispositif de capture en    back end   mais aussi d un tableau de bord en   front end    L interface de       tableau de bord     partir duquel on peut g  rer    la fois la r  ception des donn  es et  les r  sultats d analyses  offre de nombreux modes de visualisations  par exemple les  graphiques  cartes et arbres de Moretti  mais   galement des cartes g  ographiques  qui pourraient nous re
33. nseigner sur les points de densit   de l attention  La courbe  d apprentissage pourrait alors inclure des informations comme les dimensions  des tuiles et les noms des fournisseurs de tuiles qui produisent les carr  s utilis  s  pour la composition de la carte     Lorsque l on s int  resse aux big data  certaines questions connexes peuvent se r  v  ler  tr  s importantes  En tout premier lieu  on ne peut ignorer le vaste d  bat sur la  pertinence ou non d analyser les donn  es personnelles    l aide des big data  sachant  qu on a peu de chance d obtenir une autorisation d utilisation des donn  es et qu il  est tout    fait d  licat de se substituer    cette autorisation en s appuyant sur les  conditions d utilisation de l entreprise  Si un cas d   thique est jug   acceptable  il faut  alors mettre en place des strat  gies qui  tout en n exigeant pas d autorisation  ne  soient pas pr  judiciables  La solution de l anonymat ne convient pas forc  ment  cela  tient en partie    la situation    laquelle furent confront  s les chercheurs en donn  es  d AOL  lorsque des journalistes et des d  fenseurs du droit    la vie priv  e ont pu  identifier certains utilisateurs du moteur de recherche apr  s que leurs recherches des  six derniers mois ont   t   rendues publiques  Sweeney  2000  Hansell  2006   On peut    galement citer la technique du           ou de dissimulation  plus commun  ment  appel  e pseudonymisation  par laquelle des identifiants artificiels sont ins  r  s    la  pla
34. onmental Justice  http   www   ejolt org 2013 06 turkeys tree revolution part 2 everyday im chapulling      Venturini  2012  Venturini  T   2012    Building on Faults  How to Represent Controversies  with Digital Methods    Public Understanding of Science  21  796 812      Watts  2007  Watts  D  J   2007     A  Twenty first Century Science    Narure  445  489     Table des mati  res    INTROBUC TION d vetus chro iode                    aer ae  lt a ee dui           7    Marta Severo  Alberto Romele    PARTIE 1   LA TRACE  LES M  THODES ET LES DONN  ES               11  AU DEL   DE LA CRITIQUE BIG DATA                                         13  Richard Rogers   LES M  THODES D INTERFACE                     1  1  1   1  1    n nnn nnn nnn nans nane na esa esas esas edis 33    Noortje Marres  Carolin Gerlitz   SOFT DATA quU 6l  Marta Severo  Alberto Romele   L IDENTIT   COMME BASE DE                                  ener enne    en nennen           87    Jos de Mul    PARTIE 2   RENCONTRE ENTRE TRACES NUM  RIQUES    T TERRITOIRES                         VER ED hid atia         ERRER 109    L   CUME NUM  RIQUE DES TERRITOIRES serres 111  Dominique Boullier   SPATIAEIT  S ALGORITHMIQUES          noce rele eoo n tree pe ERE tes UE Fla Bret               133  Boris Beaude   L BYPBRVIEDE          ee ita camere a hn Heredes 161  Franck Cormerais   DSRS DE DATA 2122                177    Maryse Carmes  Jean Max Noyer    268 Traces num  riques et territoires       PARTIE 3   LES PRATIQ
35. orra  E  et Rogers  R   2013  De  Uitzondering      de Regel  Over Ambtenaren in de Openbaarheid         Hague  Ministry  of Internal Affairs Emma Communicatie      Berry  2011  Berry  D  M   2011    The Computational Turn  Thinking About the Digital  Humanities    Culture Machine  12  1 22      Blood  2002  Blood  R   2002    Introduction         Rodzvilla       d    Weve Got Blog  How Weblogs  Are Changing Our Culture  Cambridge  MA   Perseus  ix xiii      Bollena ef al   2011  Bollena  J   Maoa  H  et Zengb  Z   2011    Twitter mood predicts the stock  matket    Journal of  Computational Science  2 1   1 8     Au del   de la critique big data 31        Borgman  2009  Borgman  C   2009    The Digital Future is Now  A Call to Action for the  Humanities    Digital Humanities Quarterly  3 4   http     digitalhumanities org dhq   vol 3 4 000077 000077 html      Borra et Weber  2012  Borra  E  et Weber  1   2012    Political Insights  Exploring Partisanship in  Web Search Queries    First Monday  17  http     irstmonday org ojs index php   fm article view 4070 3272      boyd et Crawford  2012  boyd  D  et Crawford  K   2012    Critical Questions for Big data   Provocations for a Cultural  Technological  and Scholarly Phenomenon     Information  Communication  amp  Society  15  662 679      CPID   2015 Columbia Prediction of Infectious Disease  CPID   2015  Infermational Research  Institute for Climate and Society  New York  Columbia University  http   cpid iri   columbia edu    
36. premi  res  versions du dispositif Google Insights qui montrait les statistiques associ  es     des recherches d utilisateurs par mots cl  s sur les moteurs de recherche  Ces  recherches peuvent rev  tir une nature politique  et certaines peuvent diriger les  utilisateurs vers des sites se situant plut  t    gauche ou plut  t    droite  Ainsi  dans  la course aux   lections pr  sidentielles am  ricaines en 2012  ceux qui rentraient le  terme   obamacare     taient orient  s en majorit   vers des sites identifi  s    droite   alors qu une recherche contenant les mots cl  s   obama student loan forgiveness       obama emprunt   tudiant dispense    vous amenait vers des sites identifi  s     gauche  voir Figure 3   Borra et Weber  2012   La recherche sur Internet comme  sujet de recherche     ce qui est une facon de d  crire la culturomique     ou l analyse    26 Traces num  riques et territoires       des termes de recherche peut   galement comprendre la g  olocalisation des  utilisateurs  et donc mener    un travail sur l utilisation des mots selon la localisation  de leurs utilisateurs  Sur le m  me mode que ce qui a   t   fait pour l   valuation et la  localisation de la grippe sur Google Flu Trends  on pourrait tr  s bien g  olocaliser  les discours de haine     partir d une recherche de termes linguistiques pr  cis  et  ainsi observer de mani  re longitudinale ses constantes ou ses fluctuations     politicalinsights eor          Search      Top political queries grouped by
37. quanti  qui utilisera les donn  es recueillies  sur Facebook  mentions J aime  partages  commentaires  mentions J aime sur les  commentaires  afin d   tudier l enpagement politique  une pr  occupation fr  quente  en sciences politiques mais   galement un terme utilis   par les analystes sp  cialis  s  en m  dias  Cette m  thode num  rique se fonde sur un mode op  ratoire appel    analyse des contenus en r  seau  networked content analysis  qui associe le comptage     l interpr  tation du contenu le plus sollicit   au sein d un r  seau d utilisateurs     Disons le d embl  e  les m  thodes num  riques fonctionnent  que ce soit pour  l analyse des contenus en r  seau ou d autres protocoles de recherche  et on voit  de plus en plus se d  velopper un nouveau format de recherche appel     data  sprint    Les data sprints  qui partagent quelques similarit  s avec les hackathons  les  barcamps  et autres formes exp  rimentales de workshops reposant sur le partage    Au del   de la critique big data 21       de comp  tences  op  rent sur un format court  en concentrant l ex  cution pratique  du travail de recherche sur une dur  e courte  par exemple une semaine  Des    quipes compos  es d   experts en la mati  re  analystes  programmeurs et designers  d   information  travaillent ensemble    la production d   un projet d     tudes sous la  forme d un court rapport et d une s  rie de graphiques  Il arrive souvent que  plusieurs projets soient conduits en parall  le et chacun des projet
38. qui d  clenche le questionnement scientifique  et la recherche qui en d  coule  et non une question soci  tale en soi     Souvent  lorsque les big data sont impliqu  es  on se tourne vers les grandes  compagnies de m  dias et de communications pour r  cup  rer des groupes de  donn  es  donn  es qui r  orientent ensuite vers d autres int  r  ts bien pr  cis   par exemple  l utilisation des donn  es mises    disposition par les compagnies  de t  l  phone mobile pour retracer les diff  rents types de trajets emprunt  s  quotidiennement   Une autre mani  re de s assurer un acc  s facile    des donn  es  exploitables est de s asseoir  litt  ralement     l un des postes de travail d un  laboratoire d une grande compagnie en tant qu invit   ou collaborateur chercheur   On peut alors mener la recherche sur place mais il est impossible de quitter le  b  timent avec les donn  es  ou de les sauvegarder sur un serveur    distance     Ainsi  les modalit  s d acc  s aux big data deviennent elles m  mes sujets d   tudes  y  compris pour celles qui b  n  ficient d un acc  s public  comme les archives Web des  biblioth  ques nationales et bient  t l archive Twitter du Congr  s am  ricain  Sur un  mode comparable au laboratoire d une grande compagnie  le chercheur doit souvent  se trouver au sein m  me de la biblioth  que pour pouvoir acc  der aux donn  es  qu il  ne peut emprunter comme il le ferait avec des livres  La diff  rence entre nouveaux  m  dias et m  dias traditionnels est ici flagr
39. s est pr  sent       tous les autres groupes    la fin de cette semaine de   sprint    C est une forme  de   science rapide   ou fast science  qui n est ni de la supra science ni de la petite   science  mais qui fait partie des pratiques apparues avec le tournant num  rique     DONN  ES NUM  RISEES ET DONN  ES NUM  RIQUES NATIVES    Lorsque l on entreprend de cr  er un corpus de documents num  ris  s  on peut  appliquer les m  mes principes que ceux utilis  s pour la constitution de   bonnes    donn  es ou donn  es fiables    good data        savoir la num  risation de donn  es    propres   et enti  res  couvrant toute la dur  e de vie de leur production  Borgman   2009   Dans le domaine des humanit  s num  riques  la collection compl  te des  ceuvres  connues  d un artiste ou celle de toutes les couvertures d un magazine  prescripteur tels que le Time Magazine repr  sentent des donn  es fiables et font  l objet d   tudes en analytique culturelle  comme je le montrerai plus loin  Dans  le domaine des sciences sociales  les mesures m  diatiques telles que les taux  d audience mesur  s par Nielsen et les tirages des journaux estim  s par le BPA   Business Publications            ont recours    d autres principes de fiabilit   des donn  es   comme l   chantillonnage d une population donn  e      Toutefois  on observe que le Web ne dispose pas d une telle instance de  comptabilisation  Graves et Kelly  2010   Prenons Google et le nombre de r  sultats  estim  s lors d une recherch
40. s l avons d  j   mentionn    pour certains  le terme   m  thodes  num  riques   couvre l ensemble des technologies du tournant num  rique que  nous avons d  crites plus haut  ou des techniques de recherche consid  r  es de  plus en plus comme   classiques    Venturini  2010   Plus pr  cis  ment  le terme  fait r  f  rence    l adaptation  inimaginable dans un autre contexte  de dispositifs  et plates formes r  serv  s au Web  par exemple le moteur de recherche Google   Facebook et Wikip  dia     la recherche en sciences politiques et sociales  Parmi  ces outils figure le d  veloppement du    Lippmannian Device    un Google Scraper  qui d  tecte les pr  f  rences ou les penchants d un acteur en se fondant sur le type    Au del   de la critique big data 29       de mot cl   mentionn    voir Figure 6   On peut alors  en parcourant plusieurs  sites Web sur les changements climatiques  effectuer une recherche par nom de  climato sceptiques et ainsi trouver des acteurs qui soient acquis    la cause  sans  oublier les sites de veille qui les suivent ou les mentionnent   Dans ce cas  on a  pr  f  r   r  orienter Google en v  ritable module destin      la recherche  plut  t que  de l utiliser  plus traditionnellement  en appareil concu pour informer des clients    Climate Change Sceptics on the Web  Frederick Seitz     Research Question  To what extent are c  mate change skeptics present  a the climate change spaces on the Web    Findings Theve is distance betamen the skecbics aed the
41. t       En termes de m  thode  on pourrait consid  rer que les sciences sociales et  humanit  s num  riques num  risent la m  thode  dans le sens      elles d  placent leurs  instruments sur le Web  enqu  tes  sondages  etc   ou les int  grent    des logiciels   en mesurant et   ditant les propri  t  s formelles des objets d art  comme dans le  cas du logiciel ImagePlot   On pourrait pousser le raisonnement un peu plus loin  et envisager la num  risation des concepts ou des projets de recherche  adaptant  ainsi au Web les m  thodes de recherche pratiqu  es en sciences politiques et sociales   pat exemple en   tudiant l expression de la sph  re publique dans les forums  en  s attaquant aux espaces r  serv  s aux commentaires pour y trouver des traces de  d  bat public  ou en   tudiant  Twitter comme source de l opinion publique      Faire la distinction entre des documents num  ris  s et des documents num  riques  natifs  entre m  thode et concept  revient    imposer des distinctions ontologiques  entre ceux qui   appartiennent au m  dium   et ceux qui l ont int  gr      la suite  d une migration  Blood  2002   Les blogs  que l on consid  re comme appartenant  au Web  sont dans ce cas des num  riques natifs  tandis qu un livre num  ris     disponible sur Google Books  est un nouvel arrivant num  rique  soit un document  num  ris    Les pages Web qui ne peuvent   tre imprim  es mais seulement captur  es     l   cran sont une autre mani  re de conceptualiser la distinction entre
42. ture conceptuelle en faveur de  la reconnaissance de mod  les  un mode analytique de l apprentissage automatique   des pr  f  rences en termes de graphiques  cartes et arbres  et tout ce qui touche     la mani  re de g  rer les donn  es de sujets humains  Les bzg data divisent aussi   en cr  ant des structures r  putationnelles par l intervention     chaque   tape de la  recherche  d une perspicacit       ou c  cit       computationnelle  collecter  acc  der   traiter  analyset  produire et pr  senter les donn  es     Les big data peuvent   tre commercialis  es  De nouveaux march  s de donn  es se  d  veloppent  ce qui implique qu il faille parfois payer pour mener des recherches  sur les donn  es  Puschmann et Burgess  2013   Pour acc  der aux donn  es  historiques de Twitter  fournies par Gnip  lui m  me d  tenu par Twitter   on  peut souscrire    un abonnement ou d  poser des demandes ponctuelles sur des  collections de tweets  ce qui  dans les deux cas  s  pare les bases de donn  es riches  des bases de donn  es pauvres  Sifter  l interface de Texifter qui propose l   acc  s     des donn  es historiques de Twitter  offre une estimation du co  t de la transaction    par exemple  fin 2014  une demande portant sur l acc  s    toutes les donn  es  historiques des tweets contenant un hashtag encore actif depuis 2007 revenait     20 000 USD     DU TOURNANT COMPUTATIONNEL AU TOURNANT NUMERIQUE    Une autre mani  re  plus subtile  de caract  riser l invasion des ordinateurs   qu 
    
Download Pdf Manuals
 
 
    
Related Search
    
Related Contents
Trak-CutTM Circular Saw With Miter  VM-10A - セコニック  Modelo serie 37245  Weider HABR60 User's Manual  DUALHIGH SPEED RS232 ISOLATION TRANSCEIVER  Bedienungsanleitung  Mode d`emploi Leak Controller 2000 Appareil de  Horizon Fitness AFG T6 User's Manual  Rapoo 8900P      Copyright © All rights reserved. 
   Failed to retrieve file