Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

Recherche - web média

mardi 26 avril 2011

Introduction au cours sur l'économie du document

La mise en ligne de la version 2011 du cours en ligne sur l'économie du document approche. Cette année, il sera concentré sur trois semaines pleines. Le temps réduit oblige les étudiants à avoir assimilé quelques notions fondamentales avant le début du cours.

C'est pourquoi j'ai développé la thématique de la séance introductive sous forme d'un texte rédigé comme un chapitre de livre. ici. Après avoir montré l'oubli de la notion de document par les économistes, le texte insiste sur sept caractéristiques de son économie, présentées comme sept piliers et montre qu'elles se combinent pour structurer trois marchés distincts.

Il reprend donc la parabole de la baguette et du journal déjà présentée sur le blogue dans une version plus ancienne et succincte, mais illustrée. ici

Pour approfondir, on pourra consulter cette bibliographie :

  1. Chris Anderson, “The Long Tail” (Change This, Décembre 13, 2004), .
  2. Yochai Benkler, The Wealth of Networks: How Social Production Transforms Markets and Freedom. New Haven, Conn: Yale University Press. 2006, (version française :La Richesse des réseaux. Marchés et libertés à l'heure du partage social, Presses Universitaires de Lyon., 2009, Introduction en ligne sur InternetActu ).
  3. Didier Durand, “ Revue de livre: "The Long Tail" ("La Longue Traîne") de Chris Anderson,” Media & Tech, Septembre 8, 2006, .
  4. Xavier Greffe, Introduction : L’économie de la culture est-elle particulière ?, Revue d'économie politique, 2010/1 (Vol. 120)
  5. Xavier Wauthy, “No free lunch sur le Web 2.0! Ce que cache la gratuité apparente des réseaux sociaux numériques,” IRES, Université Catholique de Louvain, no. 59, Regards économiques (Mai 2008),
  6. Carl Shapiro et Hal R Varian, Information Rules, A Strategic Guide to the Network Economy, (Harvard Business School Press, 1998). Site compagnon (voir en particulier <Themes> et <Teaching/The Information Economy>) : .

Exemples d'application du raisonnement :

lundi 18 avril 2011

La bibliothèque, média du temps long

Robert Darnton vient de publier un nouvel article dans lequel il dénonce cinq mythes au sujet de l'âge de l'information. Voici la traduction du quatrième :

«Les bibliothèques sont périmées». Partout dans le pays (USA) les bibliothécaires signalent qu'ils n'ont jamais eu autant de public. À Harvard, notre salle de lecture est pleine. Les gens s'entassent dans les 85 antennes du réseau public de bibliothèques de New-York. Les bibliothèques fournissent comme toujours des livres, des vidéos et d'autres documents mais elles remplissent aussi d'autres fonctions : l'accès à l'information pour les petites entreprises, l'aide aux devoirs et autres activités après l'école pour les enfants, les informations pour les offres d'emploi pour les chômeurs (la disparition des petites annonces d'emploi dans les journaux imprimés ont rendu l'accès en ligne par la bibliothèque crucial pour les chômeurs). Les bibliothécaires répondent aux besoins de leurs usagers de nombreuses façons inédites jusqu'ici, par exemple en les guidant dans la jungle du cyberespace jusqu'aux matériaux numériques pertinents et fiables. Les bibliothèques n'ont jamais été des entrepôts de livres. Tout en continuant à fournir des livres, elles seront à l'avenir des centres nerveux pour la communication de l'information numérique aussi bien à l'échelle du quartier que sur les campus universitaires.

Cela m'a rappelé un chapitre sur l'économie des bibliothèques que j'ai écris pour un manuel à paraître cet automne sur l'économie du patrimoine. Voici un cours extrait du début :

«Si l’histoire des bibliothèques ne se confond pas avec celle de l’humanité, elle est néanmoins très longue, bien plus longue que celle des médias classiques, parallèle à celle de l’accumulation et de la transmission des connaissances depuis qu’elles sont consignées sur un support grâce à l’écriture. On trouve les premières traces de bibliothèques dans l’Antiquité dès le début de la construction des civilisations et parallèle à celle des empires en Assyrie, en Égypte, en Grèce, en Chine. Chaque fois, elles furent un lieu de conservation des documents tout autant qu’un lieu de leur production, par la copie des exemplaires, nécessitée par la fragilité des supports qu’il fallait renouveler, et par la volonté de diffuser les documents.

Beaucoup plus tard vers les 12e et 13e siècles pour la Corée et la Chine et le milieu du 15e siècle pour l’Europe, l’invention de l’imprimerie à caractères mobiles a entraîné l’externalisation de la reproduction matérielle des documents qui a quitté alors le giron des bibliothèques pour devenir une des premières industries des temps modernes. Une activité économiquement autonome de production et diffusion des livres s’est organisée progressivement à partir tout d’abord des imprimeurs-libraires. Puis vers la fin du 18e siècle, l’économie commerciale du livre s’est construite autour de la figure de l’éditeur telle que nous la connaissons aujourd’hui (Mollier, 2003).

L’éditeur a pris progressivement une place dominante dans le processus de production-diffusion de l’objet livre, et les bibliothèques ont alors perdu leur monopole sur l’ensemble de la filière. La production intellectuelle du livre et des connaissances en général n’a pas pour autant échappé complètement aux bibliothèques qui sont restées un lieu familier pour les lettrés. Écrivains, professeurs, chercheurs, étudiants les fréquentent pour préparer leurs travaux et construire leurs œuvres.

Par la suite, l’émergence de nouveaux médias et de nouvelles indus-tries culturelles, la presse populaire au 19e siècle, les disques et la radio au début du 20e, la télévision et la vidéo venant après le cinéma ont élargi l’éventail de l’information et de la distraction pour le public. La place du livre s’est relativisée, mais chaque fois que cela était possible les bibliothèques ont intégré les nouveaux supports dans leurs collections sans modifier leur modèle, ni réduire leur rôle. Parallèlement au développement explosif d’autres médias, l’édition de livres imprimés d’abord, puis la presse, et ensuite la radio ou la télévision, la bibliothèque a bien maintenu son organisation, l’a développée par touches successives, a continué de la perfectionner, a accompagné et parfois devancé la gestion et la diffusion des connaissances dans les sociétés. Il faut ici faire une distinction entre les médias d’information enregistrées comme l’édition en général qui manipule des supports (livre, presse, disques) et les médias de communication qui distribuent du signal (radio, télévision). La production des premiers est intégrée directement dans les bibliothèques, celle des seconds ne peut l’être que dans la mesure où un enregistrement est effectué. Aujourd’hui le web qui mélange les deux modalités pose des questions inédites au modèle de la bibliothèque. L’évolution des bibliothèques, comme celle des centres d’archives et les musées, est en réalité parallèle à celle des sociétés et de leur rapport aux connaissances enregistrées, participant à la croissance économique. Certains (Hedstrom & King, 2006) parlent à leurs sujets d’ « infrastructures épistémiques » (Epistemics Infrastuctures), c’est-à-dire d’institutions facilitant l’organisation des connaissances.

Dans une société où les connaissances circulent de plus en plus vite, cette force tranquille a un avantage. Média le plus ancien, c’est aussi celui où l’on peut s’abstraire du cycle trop rapide des médias modernes qui tend à écraser les informations par leur renouvellement et à perdre l’attention du lecteur dans une surabondance. Le flot des médias contemporains est trop puissant, trop abondant pour autoriser un filtrage efficace. On va aussi à la bibliothèque pour y retrouver dans le calme des documents que les autres médias détruisent ou noient dans le renouvellement insatiable de leur production ou on utilise les services d’un bibliothécaire ou d’un documentaliste pour retrouver les informations utiles perdues dans le chaos général. Ainsi la bibliothèque est-elle le média du temps long s’adaptant à l’évolution des sociétés et tempérant la précipitation des médias plus jeunes, plus tempétueux et plus éphémères. Cette qualité, loin de rendre son économie obsolète est au contraire aujourd’hui un levier sur lequel la bibliothèque peut s’appuyer pour s’adapter aux défis nouveaux du numérique. »

mardi 05 avril 2011

La redocumentarisation (du journalisme) en deux citations

Après les quatre images du billet précédent, voici deux citations pour illustrer la redocumentarisation. Il s'agit de montrer l'inversion de la perspective du rapport à la vérité qui s'est opéré entre le début du 20e et celui du millénaire en prenant l'exemple du journalisme. Comme précédemment les commentaires sont bienvenus.

La première citation m'a déjà servi dans un précédent billet. Elle est tirée du livre de P. Starr The Creation of The Media (trad JMS) :

Lippmann {en 1920} exhortait les journalistes à être plus «objectifs», un mot qui venait d'apparaître pour décrire le journalisme. Les critiques aujourd'hui dénoncent l'objectivité comme une idéologie professionnelle, mais il est important de comprendre les pratiques professionnelles que Lippmann voulait faire adopter aux journalistes. Il voulait que les journalistes s'inspirent de la science en développant un «sens de la preuve» et en reconnaissant franchement les limites de l'information disponible : il les exhortait de démonter les idées reçues et les abstractions et de refuser de laisser de côté des nouvelles ou de mettre la morale ou n'importe quelle autre cause avant la véracité. Ce que Lippmann demandait avant tout aux journalistes était la responsabilité (accountability). p.396

La seconde citation est tirée d'un entretien sur RSLN avec Michael Cross du Guardian, un des plus avancés dans le journalisme de données :

(..) Que va t-il se passer si les données sont mal comprises et interprétées ? J’ai peur que nous ne puissions pas y faire grand chose et qu’il faille faire avec.

Dans le même temps, plus les données sont disponibles, plus il y a de chances pour que les gens en parlent, les analysent, les croisent : la discussion offre une chance de réinterpréter les données de manière efficace et fiable, même si elles sont peut-être utilisées pour servir un certain agenda.

Les données sont accessibles et, avec la puissance du web, nous pouvons faire en sorte que l’interprétation la plus fiable se retrouve mise en avant.

Reprenons les mots clés de l'une et l'autre citations sur un tableau pour les mettre en perspective. 1920 correspond à l'organisation systématique des systèmes documentaires qui a pour modèle la science positive. 2010 correspond à la transformation de notre rapport au document sur un tout autre modèle de rapport à la vérité. Le tableau montre l'écho de ce mouvement dans les pratiques journalistiques.

Redocumentarisation-journalisme.jpg

mercredi 30 mars 2011

La redocumentarisation en quatre images

Pour avancer dans les réflexions sur la redocumentarisation et la théorie du document dans la continuité du travail collectif sur Roger II, voici quatre images et quelques réflexions. Tous les commentaires et critiques sont bienvenues, j'avance sur un terrain encore à défricher.

Documentarisation

La première image est issue du livre testament de P. Otlet, premier théoricien de la documentation, et date de 1934 :

Otlet-1934.jpg

Les quatre premières lignes veulent présenter la construction des documents. À partir de l’univers, se forment les représentations grâce aux intelligences humaines particulières qui ensuite s’organisent et se confrontent dans la dynamique de la science et sont consignées dans des livres eux-mêmes réunis dans les bibliothèques.

Les trois lignes suivantes présentent les principaux éléments de l’ordre documentaire nouveau selon P. Otlet. Il s’agit d’abord de rédiger des notices bibliographiques et de les réunir dans un répertoire bibliographique universel. L’ensemble de ces fiches réunies dans les meubles à tiroirs a constitué le catalogue de la bibliothèque jusqu’à l’arrivée de l’informatisation à la fin des années soixante-dix. Il s’agit d’abord de l’outil de repérage des documents dans une collection de bibliothèque. La notice bibliographique est donc un substitut du document qui le remplace avantageusement dans le système documentaire du fait de son formalisme, aujourd’hui nous dirions qu’il s’agit de ses métadonnées. Le système documentaire est piloté par des catalogues normalisés et reliés entre eux. Pour P. Otlet, il doit même être centralisé dans un répertoire universel. L’auteur suggère un instrument supplémentaire, l’Encyclopédie, constituée d’une série de dossiers de synthèse sur tous les sujets constituant le savoir humain, réalisés et actualisés par les documentalistes à partir des documents existants et diffusables à la demande. Dernier élément essentiel à l’ordre documentaire : la classification. La classification joue pour P. Otlet un rôle central, organisant et reliant l’ensemble des instruments.

Ce modèle systématise et justifie le rôle de la bibliothèque qui l'appliquera et le perfectionnera jusqu'à aujourd'hui. Il sépare clairement la production du livre de la documentarisation qui vient ensuite.

Redocumentarisation

La seconde image est celle du «cake» du Web sémantique.

Web-semantique-2007.jpg

Dans le schéma de P. Otlet, on trouvait tout en haut les auteurs qui pensaient le monde, le représentaient en concepts grâce à la science et le consignaient dans des documents. Le schéma du W3C met à leur place des utilisateurs qui, plutôt que représenter le monde, vont reconstruire selon leurs besoins des réponses à leurs questions à partir des ressources documentaires existantes. On pourrait dire en raccourci le monde n’est plus représenté par un travail scientifique préalable, mais chacun se représente le monde à partir de données récoltées préalablement. On pourrait discuter longtemps de la pertinence épistémologique de l’une ou l’autre posture. Là n’est pas mon propos, je voulais simplement souligner que d’un point de vue documentaire celles-ci sont inversées : l’une part des producteurs de documents et classe ces derniers ; l’autre part des lecteurs qui reconstruisent les documents à partir de ressources classées.

Les trois dimensions

De plus sans discuter les détails d’un schéma qui n’est pour ses auteurs même qu’illustratif, on peut remarquer que l’on retrouve dans la succession des couches les trois dimensions du document . Déjà présentées pour le livre ainsi :

3-dimensions-document.jpg

Les couches les plus basses (URL/URI, XML, RDF) concernent les adresses et les formats des ressources, c’est à dire le repérage par la forme. Les couches intermédiaires (SPARQL, OWL, RDFS, RIF) s’occupent de la recherche, de l’indexation, de la sémantique, de la représentation des connaissances, c’est à dire un traitement à partir du contenu, du texte. Enfin les couches supérieures supportent des règles sociales (Unifying logic, Proof, Trust), celles-là même qui supportent la fonction du document, transmission et preuve. J’ai donc découpé le « cake » en tranche que j’ai redistribué sur les trois dimensions du document. Cette présentation, comparée à celle que j’avais présenté pour le livre souligne l’ampleur de la réingénierie documentaire. Précédemment nous trouvions une représentation du livre sur chacun des sommets du triangle, même si la différence de perspective soulignait les différences de dimensions. Cette fois, le document n’apparait plus qu’au centre, comme un navigateur qui le reconstruira à la demande de l’internaute. On pourrait dire que le système documentaire a réintégré la construction du document. La notion « parenthèse Gutenberg » prend alors une tout autre ampleur. L’imprimerie avait sorti la production documentaire des bibliothèques, des infrastructures épistémiques de l’époque. Le numérique réintègre la production documentaire dans l’infrastructure épistémique contemporaine : le web.

WS-dimensions-document.jpg

Cette représentation triangulaire a la vertu supplémentaire de casser l’empilement et sa lecture linéaire en montrant notamment les liaisons fortes qui existent entre les formats et les adresses et la confiance et la preuve.

mercredi 09 mars 2011

Les trois économies du ebook

Je ne dirai jamais assez combien je suis redevable de la veille effectuée par Jose Afonso Furtado (ici). La majorité des billets de ce blogue sur l'actualité du numérique sont sans doute issus de son repérage. Merci donc à lui ! Dans la moisson d'hier, deux articles ont attiré mon attention car ils illustrent les dilemmes de l'industrie du livre dans son passage au numérique et expliquent sa résistance (pour la résistance du livre imprimé, voir aussi ici et ). Ils seront ici le prétexte pour avancer encore d'un petit pas dans l'analyse de l'économie du e-book, sans prétendre tout régler, les commentaires sont bienvenus.

“Ebooks: durability is a feature, not a bug | Technology | guardian.co.uk,” Mars 8, 2011, ici.

Morris Rosenthal, “Is Google Books Destroying Publisher Website Visibility?,” Self Publishing 2.0, Mars 8, 2011, .

Dans le premier article, l'éditorialiste, Cory Doctorw (par ailleurs responsable du blogue Boing Boing) s'insurge contre la prétention de HarperCollins à vendre aux bibliothèques des copies de livres numériques qui s'autodétruiraient au bout de 26 consultations. Il conclut (trad JMS) : Celui qui croit que cela pourrait arriver n'a jamais passé un peu de temps avec un bibliothécaire.

Dans le second billet, un petit éditeur numérique constate que son site devient invisible dans les recherches par Google, au profit principalement de Google-Books qui détient une copie de ses livres.

Pour bien interpréter toutes ces interrogations et hésitations dont nous n'avons ici que deux anecdotes parmi beaucoup, beaucoup d'autres, il faut revenir à la théorie du document (ici) que j'ai traduit en termes économiques pour l'exemple du livre dans le tableau ci-dessous :

Les_3_economies_du_livre.png

Un livre, quelque soit son format, a comme tout document trois dimensions indissociables, présentées sur le tableau en trois lignes. Et à chacune de ses dimensions est associée une économie qui privilégie un élément de valeur concurremment aux deux autres. Mais, il faut toujours avoir en mémoire que privilégier une dimension n'efface pas les deux autres qu'il faudra impérativement prendre en compte.

Si l'on raisonne par rapport à l'objet, la forme première ligne du tableau, alors nous sommes devant une marchandise ordinaire, même si elle a des caractéristiques originales, et une économie classique de vente de biens rivaux. L'édition s'est construite sur cette dimension. Elle a résolu le problème des deux autres dimensions d'une part par le droit de propriété intellectuelle (réduisant la non-rivalité de la deuxième dimension) et la saisonnalité des publications (pour gérer le temps de la troisième).

Maintenant si l'on raisonne par rapport au texte, nous sommes devant un bien non-rival. Seule une économie publique, collective peut se construire. Ce fut, et c'est encore, le domaine des bibliothèques qui mutualisent l'accès aux textes. Cette économie a réduit les difficultés liées aux deux autres dimensions par d'une part la réunion d'exemplaire (ici des prototypes) en un seul lieu et d'autre part les prêts ou consultations limitées dans le temps pour permettre le partage pour une collectivité donnée et limitée.

Concernant la troisième dimension, celle de la lecture, nous retombons dans une économie de biens (ou plutôt de services) rivaux, puisque l'attention du lecteur est limitée. Le livre imprimé gérant un temps long, n'était que peu concernée sinon du fait de la concurrence des autres médias sur le temps de loisir et donc de l'érosion lente de la lecture de livre. L'économie de l'attention a été exploitée à partir de la mise en place des médias modernes, presse d'abord, puis radio-télévision qui ont géré l'espace temps de «lecture» pour pouvoir le vendre à des annonceurs. Les choses ont changé sur le web qui est fondé sur une économie de l'attention à partir de l'activité de lecture elle-même (voir ici) et autorise aussi la diffusion de livres.

Beaucoup considèrent que le ebook, comme d'ailleurs l'ensemble des médias numériques, privilégierait la seconde dimension. Mais cette position suppose alors une économie publique ou au moins collective peu vraisemblable à l'échelle du web, sauf à refermer des écosystèmes sur des collectivités particulières capables de l'entretenir.

Les deux anecdotes citées en introduction illustrent les tâtonnements pour trouver d'autres voies. HarperCollins tente de décliner la première dimension sur les bibliothèques, ce qui est clairement absurde. La seule voie réaliste pour l'articulation entre l'édition numérique et les bibliothèques parait celle de la license sans restriction d'accès qui préserve le caractère de bien commun du livre à l'intérieur de la communauté desservie sans épuiser le marché pour l'éditeur à l'extérieur. Quant au positionnement des éditeurs par rapport à Google, il faut comprendre que ce dernier tend progressivement à accaparer l'économie de l'attention à son seul profit (ici). Google est un média qui devra bien un jour rémunérer les producteurs.. mais le plus tard et le moins possible.

- page 8 de 38 -