Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

Les billets du dimanche 07 mars 2010

Faut-il libérer les données ?

Ce billet a été rédigé par Christine Benoit dans le cadre du cours SCI6355 sur l'économie du document de la maîtrise en sciences de l'information de l'EBSI.

La réponse à cette question nous a déjà été imposée, la libération des données a commencé. Que ces données proviennent d’organismes publics, privés ou même des particuliers, elles entraînent des résultats qui ne sont pas toujours positifs. Plusieurs personnes encouragent la libération des données, comme Tim Berners-Lee dans sa présentation au TED de février 2009 ou Tim O’Reilly et John Battelle dans leur article « Le Web à la puissance 2 : le Web cinq ans plus tard » qui nous présentent les aspects les plus positifs ce cette libération, tout en passant sous silence les écueils qui peuvent en survenir. Mais plusieurs critiques s’élèvent aussi pour remettre en question la façon dont ces données sont libérées, comme Hubert Guillaud dans son article « Critiques du Web2 ».

Il est indéniable que la libération des données peut s’avérer positive, on peut citer par exemple le milieu scientifique qui a tout à gagner à obtenir un accès aux données des autres chercheurs (NYT). On peut aussi penser que cela peut entraîner l’arrivée de nouveaux services, améliorer la prise de décisions de différents organismes, etc. Mais il est difficile d’évaluer précisément les résultats de cette libération, comme il est constaté par Hubert Guillaud (ici). Les questions qui peuvent surgir quand on analyse les conditions dans lesquelles les données sont libérées sont nombreuses et sont souvent liées entre elles mais celle qui m’a le plus interpellée concerne la protection de la vie privée.

On retrouve de plus en plus de données personnelles sur internet, données qui sont générées par les gouvernements, les entreprises, les moteurs de recherche ou même par les particuliers. Il est de plus en difficile de s’assurer que les données libérées soient vraiment anonymes car la quantité de données qui s’accumulent rendent le couplage d’information de plus en plus efficace et facile, tel que démontré par Paul Ohm (ici). Par exemple, aux États-Unis, une compagnie d’assurances a mis en ligne des données médicales qui ont pu être ré-identifiées (). L’histoire des logs d’AOL donne aussi un exemple frappant de ré-identification (ici) où même rendues anonymes, plusieurs personnes ont pu être ré-identifiées et les déductions obtenues de leurs questions de recherche peuvent être très dérangeantes et peuvent amener des débats éthiques sur la façon de gérer les informations obtenues.

Une fois que les données sont libérées, on en perd le contrôle et elles deviennent indestructibles. Il est aussi difficile d’évaluer l’utilisation qui est faite de ces données et l’impact que cela peut avoir. Pour minimiser les risques liés à la libération des données c’est donc avant qu’elles soient libérées qu’il faut établir des règles et non après cette libération. Car même si des règles sont édictées pour encadrer l’utilisation des données disponibles, il serait impossible de vérifier tout ce qui peut être fait avec ces données.

Ce qui m’amène à me questionner sur les conditions de la libération de ces données. Il n’y a pas de principes clairs sur ces conditions de libération. Tim O’Reilly et John Battelle proposent huit principes concernant la libération des données publiques () et, malheureusement, la protection des renseignements personnels ne semble pas être dans leurs priorités. On peut penser que les gouvernements soient attentifs à cette problématique car ils sont, en quelque sorte, responsables devant leurs élus, même si des dérapages sont toujours possibles.

Mais qu’en est-il des données recueillies par les entreprises ou par les moteurs de recherche ? Ou même les données qui sont libérées par les particuliers eux-mêmes? On peut voir que les priorités de certaines entreprises, telles que Facebook, ne vont pas nécessairement à la protection de la vie privée (voir ici). Et les particuliers peuvent mettre eux-mêmes des renseignements très personnels en ligne sans avoir conscience de l’impact de ceux-ci ().

Quelle pourrait être alors la meilleure façon de gérer la libération des données, en ce qui a trait aux renseignements personnels ? Est-il réaliste de penser que des règles peuvent être mises en place pour protéger ces renseignements ou la tâche est-elle trop lourde? Dans un contexte de mondialisation, peut-on envisager que des lois nationales peuvent régler cette problématique ou devrait-on penser à instaurer des règles internationales ? Devra-t-on se résigner à perdre le contrôle d’une partie plus ou moins grande de nos renseignements personnels ? Quelle serait la meilleure façon d’instaurer un équilibre entre la protection de ces renseignements et la libération des données ?

Qu’en pensez-vous ?

Les "digital natives", menace ou opportunité ?

Ce billet a été rédigé par Iris Buunk dans le cadre du cours SCI6355 sur l'économie du document de la maîtrise en sciences de l'information de l'EBSI.

Imaginons le scénario catastrophe. Nous sommes en 2030, et les bibliothèques ferment les unes après les autres. Les jeunes générations ont délaissé ces institutions qu'ils considèrent trop éloignées de leurs intérêts et de leurs besoins. Les derniers usagers qui restent encore fidèles à ces anciens temples du savoir, sont les personnes âgées de la 3e génération, beaucoup plus nombreuses aujourd'hui comme l'avaient prédit les statistiques des années 2000. Les gouvernements devant continuer à faire face aux conséquences économiques des crises financières antécédentes, décident de ne plus subventionner les bibliothèques, trop coûteuses, estimant que les animations culturelles peuvent très bien être prises en charge par les maisons pour personnes âgées. Quant aux jeunes, ils se retrouvent entre eux, à la maison, à l'école ou dehors, puisqu'ils savent facilement accéder à toute l'information dont ils ont besoin, sans aucune contrainte, et sans aucune aide.

Sans vouloir m'attribuer des talents de scénariste, je pense néanmoins que ce type de vision est plutôt digne d'un film hollywoodien qui n'a, à mon avis et heureusement, rien à voir avec ce que le futur nous réserve. Faut-il pour autant s'empêcher de se questionner sur l'évolution des publics qui fréquentent les bibliothèques ? Non évidemment. Au contraire, cette réflexion est nécessaire, et le sera toujours. Mais de qui parle-t-on au juste ? Et l'existence des bibliothèques est-elle réellement remise en cause ?

Cela fait plusieurs années que l'on entend parler des digital natives, aussi communément appelés "génération Y" (pour les distinguer de la "génération X"). Un sujet qui est particulièrement relaté tant dans la littérature académique (sciences de l'information ou de l'éducation), que dans les médias, mais également abondamment commenté dans la blogosphère, surtout suite à la publication du désormais célèbre "Born digital" de John Palfrey, professeur à l'Université de Havard, ou encore aux interventions de Marc Prensky.

Une génération donc qui concerne les jeunes nés dès les années '80 (du moins dans les pays technologiquement développés) avec un ordinateur à la maison, et qui ont acquis presque naturellement, une aisance avec les outils technologiques, qu'ils ont pour la plupart hérités des baby-boomers. Souvent impatients, ils ont la faculté de pouvoir effectuer plusieurs tâches en même temps (multi-tasking), sans que cela nuise à leur concentration. De plus en plus, ils reçoivent une éducation interactive basée sur la résolution collaborative de problèmes, et l'enseignement en ligne est un style d'apprentissage qu'ils privilégient. En résumé, on peut donc décrire les digital natives comme étant des individus presque toujours connectés, particulièrement sur des réseaux sociaux (Facebook, Twitter, sms, Internet), s'adaptant facilement aux changements et à toute nouvelle technologie, aimant travailler, réfléchir et créer en équipe, et en appréciant la mobilité. Ils aiment l'interactivité et l'apprentissage, du moment que ce dernier n'est pas confiné à un lieu fixe.

En quoi est-ce que ces attributs viendraient-ils menacer, ou plutôt remettre en question les services et les espaces que les bibliothèques "classiques" peuvent offrir ? Les bibliothèques, du moins publiques, ne jouent-elles pas un rôle de lien social en offrant un espace d'apprentissage et de loisirs ? Le fait d'être autant connectés "en ligne" se ferait-il au détriment des contacts directs ? Selon Sylvie Octobre, la prééminence des technologies ne sonne pas (…) le glas de leur intérêt pour les autres pans de la culture. (…) Les jeunes générations figurent ainsi parmi les plus connaisseurs des musées, des bibliothèques et médiathèques, ainsi que des lieux de spectacle vivant. (Ainsi), la loi du cumul se vérifie malgré les mutations opérées par le numérique.

J'aime imaginer alors, que les services ne vont pas disparaître ou s'exclure mais se compléter et s'enrichir, intégrant ainsi autant des espaces qui mettent à disposition des outils technologiques, permettant des échanges vivants et collaboratifs, tout comme des endroits réservés à l'étude en silence. Une architecture adaptée en conséquence, et des bibliothécaires qui ajoutent à leur panoplie de compétences, des qualités de tuteurs, pour guider les digital natives à savoir se repérer dans le monde de l'information numérique, certes merveilleux mais parfois embrouillant , malgré leur aisance technologique. Peut-être qu'une nouvelle forme d'Information literacy est en cours, que l'on pourrait renommer comme le suggère Neil Selwyn digital media literacy.

Alors, est-ce que l'arrivée des digital natives ne serait justement pas une magnifique opportunité pour les bibliothèques de se renouveler, afin d'accueillir ce public en devenir ?

Je laisse les lecteurs sur cette question, en sollicitant leurs commentaires.

Débourser pour du contenu ou pour un contenant ?

Ce billet a été rédigé par Gabriel Parent dans le cadre du cours SCI6355 sur l'économie du document de la maîtrise en sciences de l'information de l'EBSI.

Comme on l'a déjà vu en 2007 sur le présent blogue (ici), les jeunes générations boudent les quotidiens, une tendance qui ne semble vouloir pas s'effacer de sitôt. Si la position de la presse écrite n'était pas rose il y a trois ans, elle est devenue encore plus inconfortable avec la récente crise financière. On a en effet pu voir des géants comme News Corporation, qui possède, entre autres, le New York Post et le Times de Londres, déclarer des pertes de 220 000 000 US$ l'année dernière (Andrew Clark 6 août 2009, ).

Il y a cependant des exceptions dans ce noir tableau : au premier trimestre 2009, malgré la crise financière mondiale, on a vu Le Devoir faire un bénéfice net de plus de 130 000 CAN$ (Presse canadienne, 1er mai 2009, ). Comment expliquer que ce journal québécois ait mieux fait que ses concurrents ? Loin de moi la prétention d'apporter une réponse parfaite, car je ne suis pas économiste, mais j'avancerais ici un élément qui, je crois, a largement participé au succès du Devoir : la stratégie numérique de ce journal.

Le 28 janvier dernier, à l'occasion d'une conférence donnée devant la Chambre de commerce du Montréal métropolitain, le directeur du Devoir, M. Bernard Descôteaux, a donné un portrait assez lucide de la situation actuelle de la presse vis-à-vis de l'univers numérique : « Une partie des revenus publicitaires des journaux se déplaça vers le web, mais pas de la manière espérée, vers les sites des journaux, mais plutôt à travers toute la planète Internet. Ceux qui avaient misé sur la publicité pour assurer le financement de leurs sites ont vite déchanté. Ce modèle d'affaires, sauf pour de rares exceptions, ne tient pas la route. Dans la réalité, la très grande majorité des sites Internet de journaux sont financés à travers les activités traditionnelles de ceux-ci. On pourrait même dire que les lecteurs de journaux subventionnent à travers leurs abonnements à la version papier la gratuité offerte à tous. » (Bernard Descôteaux 28 janvier 2010, ici)

Or, devant la dilution des revenus publicitaires, comment rentabiliser le contenu web ? Si l'on en croit l'expérience du Devoir, c'est en faisant payer son accès en ligne. Je ne parle pas ici de restreindre l'accès aux articles, car plus des ²/₃ des articles sont disponibles tout à fait gratuitement. En effet, la culture de la gratuité est peut-être beaucoup trop bien implantée chez les internautes pour que l'on puisse faire payer pour l'entièreté du contenu. En revanche, ce qu'offre l'abonnement au journal, c'est un accès à des outils purement web : de la veille informationnelle (nommée au Devoir «infolettre personnalisée»), la possibilité de déposer ses commentaires sur les articles parus ainsi que la recherche fine dans les archives du journal grâce à un moteur de recherche Cedrom-SNI. Le lecteur du Devoir ne paie essentiellement pas pour une deuxième édition du même journal, il paie pour un contenant possédant des fonctionnalités nouvelles.

Cela ressemble beaucoup aux éléments proposés en 2009 par l'American Press Institute (API) aux journaux américains pour se sortir de la crise (vu sur le blogue AFP-MediaWatch ici ). Entre autres suggestions, l'API affirmait que la presse devait « donner une valeur au contenu en ligne, ne pas hésiter à lancer différentes expériences ». De plus, les journaux avaient tout avantage à « investir dans la technologie, les plateformes et systèmes pour générer des revenus et livrer des contenus payants ». Concrètement, les propositions de l'API se résument en ceci : le web est un média différent de la presse écrite et il faut le traiter comme tel sur le plan stratégique. En effet, les modèles d'affaires qui fonctionnent bien pour l'objet journalistique ne sont pas les meilleurs dans un environnement virtuel.

C'est ainsi que la New York Times Company a annoncé récemment () la création d'une toute nouvelle infrastructure mi-gratuite, mi-payante pour le site Internet de son journal phare. On sait peu de choses sur ce nouveau modèle, si ce n'est qu'on pourra consulter un certain nombre d'articles gratuitement et qu'on devra débourser un montant forfaitaire si l'on dépasse ce quota. À ce stade, on ne peut savoir si le New York Times proposera, comme le fait Le Devoir, des fonctionnalités uniquement disponibles aux abonnés, mais la stratégie de ces deux journaux présente tout de même d'importantes similitudes. Ainsi, pour assurer la survie d'une présence virtuelle de la presse traditionnelle, il faut peut-être simplement que les journaux développent de nouveaux contenants payant, plutôt que d'abandonner les contenus gratuits (ou du moins à prix modique) auxquels sont habitués les consommateurs d'information numérique.