Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

vendredi 24 septembre 2010

Réseaux, foules et marchés : un manuel

Ce gros manuel, publié cet été et aussi accessible en ligne, rédigé par deux professeurs de Cornell University risque devenir rapidement un incontournable pour initier quiconque s'intéresse à l'économie des réseaux et en premier lieu celle du web.

David Easley et Jon Kleinberg, Networks, Crowds, and Markets: Reasoning About a Highly Connected World, Cambridge University Press., 2010, 786p. ici.

C'est en effet ce que j'ai lu jusqu'à aujourd'hui de plus clair et actualisé sur le sujet. Les différentes théories de bases sont présentées. Une des explications de sa qualité est sans doute la complémentarité des auteurs : l'un est économiste, l'autre informaticien.

Le livre a été construit à partir d'un cours pour des étudiants de premier cycle et les auteurs font un parallèle dans la préface entre le déroulement des séances et les chapitres du livre. Ils suggèrent aussi d'autres façons de s'en servir pour intégrer telle ou telle thématique dans un cours ou construire des modules autonomes. L'écriture est limpide, des illustrations claires et des exemples concrets appuient les explications et démonstrations. Les chapitres proposent des exercices pour valider les acquis et souvent aussi une section avec des pistes pour ceux qui voudraient approfondir la thématique. Bref, un must, un vrai manuel comme on sait les faire en Amérique du nord, avec aussi ses limites comme parfois un manque de recul devant des théories présentées comme des affirmations.

Il ne faut évidemment pas en attendre des suggestions décoiffantes, mais plutôt un rappel ou une initiation aux concepts de base : théorie des graphes, théorie des jeux, pagerank, enchères optimales pour la vente de mots clés, information en cascade, loi de puissance, effets de réseau, épidémies, etc. tout est là, expliqué à partir de notions simples mais sans simplification exagérée.

Deux regrets néanmoins : un parti-pris trop exclusivement néo-classique pour l'économie, la figure du marché avec l'individu à la recherche de son intérêt, même dans un raisonnement nuancé par les effets de réseau, n'est sans doute pas la clé de toutes les explications ; la non-prise en compte des aspects physiques et matériels des réseaux numériques, comme les formats, les flux, la puissance des centres de données, qui aujourd'hui jouent un rôle important dans leur structuration.

mercredi 22 septembre 2010

Vie privée, bibliothèques et Google-Books

Dans une discussion récente avec Silvère Mercier (ici), je m'étonnais que les bibliothécaires francophones ne prêtent pas plus d'attention à l'anonymat de la lecture dans le monde numérique. Justement un papier vient de paraitre sur le sujet :

Elisabeth A. Jones et Joseph W. Janes, “Anonymity in a World of Digital Books: Google Books, Privacy and the Freedom to Read,” dans (présenté au Internet, Politics, Policy 2010: An Impact Assessment, Oxford Internet Institute, 2010). Pdf

À vrai dire l'article n'amène pas sur le fond d'autres arguments que ceux déjà connus (voir par ex ici). Mais il appuie son raisonnement sur un livre de Helen Bissenbaum paru en 2009 que je ne connaissais pas et qui m'a bien intéressé, du moins par sa présentation dans l'article et les extraits et commentaires que j'ai pu en lire jusqu'ici :

Helen Nissenbaum, Privacy in Context: Technology, Policy, and the Integrity of Social Life (Stanford Law Books, 2009).

Le concept clé de Nissenbaum est «l'intégrité contextuelle» (contextual integrity) qui n'est pas une définition de ce qui serait privé vs ce qui serait public, mais une construction à partir de normes informationnelles d'une situation appropriée, c'est-à-dire moralement acceptable dans un contexte donné. Les normes sont évolutives et leurs paramètres sont précisés (contextes, acteurs, attributs et principes de transmission). Enfin un cheminement par étapes est proposé pour juger de la validité d'une nouvelle intégrité contextuelle qui peut être résumé en deux phases : Les nouvelles pratiques sont-elles conformes aux normes de l'ancien contexte ? La négative ne signifie pas qu'il faille nécessairement les rejeter, tout dépend des risques encourus par rapport aux bénéfices généraux. Cette mesure en termes moraux fait l'objet de la seconde phase.

Il est facile de montrer ainsi que les pratiques de Google violent les principes de l'anonymat de la lecture édictés dans le contexte des bibliothèques publiques des États-Unis (phase 1) et les auteurs suggèrent que le nouveau contexte créé ne répond pas non plus aux considérations morales de liberté, d'autonomie et de justice. Ce deuxième point est discuté dans l'article à mon avis un peu rapidement, même si je suis d'accord avec la conclusion. La difficulté à trancher sur la deuxième phase montre peut-être la limite de la méthode de Nissenbaum. Néanmoins, il paraît difficile d'éviter un débat moral et politique lorsque l'on aborde les notions de sphères privée et publique, toutes deux indispensables à notre humanité.

Voici, pour finir un extrait d'une interview d'H Nissenbaum du 18 janvier 2010 (ici trad JMS) :

Les questions les plus urgentes soulevées par le livre sont à mon avis :

D'abord de démontrer que la distinction entre privé et public, aussi utiles qu'elles soient dans d'autres espaces de la philosophie du droit et de la politique, est une impasse complète pour conceptualiser un droit à la vie privée et pour édicter une politique. De mon point de vue, on a perdu bien trop de temps à décider si telle ou telle information, tel ou tel lieu étaient privés ou publics quand, en réalité, ce qui comptait au final était quelles contraintes devaient être imposées sur la circulation de cette information dans cet espace. Nous pourrions faire des progrès beaucoup plus rapides si nous prenions de front cette dernière question plutôt que de nous enfermer dans la première.

Ensuite de contester la définition de la vie privée comme un contrôle sur les informations qui nous concernent, qui domine le monde politique aujourd'hui, même si elle est moins répandue dans le monde académique. Le problème de cette définition est qu'elle met immédiatement la vie privée en contradiction avec d'autres valeurs, présentées comme plus pro-sociales. Si le droit de la vie privée est le droit de contrôle, alors, il doit être évidemment limité, négocié, modéré par l'intérêt général ! De plus, il n'est même pas évident que le contrôle offrira une meilleure protection au sujet. Imaginez, par exemple, que tout ce qui concerne le dossier santé d'un individu soit soumis à son consentement pour sa divulgation et mettez cet individu dans une situation où on lui offre en échange un emploi, un prêt ou un gain à la loterie.. Heureusement, la loi des États-Unis reconnait le besoin de réelles contraintes pour la circulation de l'information selon les lieux et les contextes de la vie et, bien que des critiques ont été émises sur les faiblesses de certains termes de ces lois, je crois que l'approche globale est bonne.

mercredi 15 septembre 2010

Théories du document

À la lecture de l'actualité, générale ou celle des Digital Humanities, je me disais que décidément on manquait d'une meilleure compréhension de la notion de document. Niels Lund a fait avec une collègue une excellente recension des théories à ce sujet dans laquelle il insiste sur l'originalité des apports francophones. Paradoxalement ceux-là paraissent bien méconnus au Québec ou dans l'Hexagone. Cela n'est pas nouveau. P. Otlet ou S. Briet ont été « redécouverts » par un professeur de Berkeley M. Buckland et la dernière rééditée en anglais, mais jamais en français..

Niels Windfeld Lund et Roswitha Skare, “Document Theory,” dans Encyclopedia of Library and Information Sciences, Third Edition, vol. 1, 1 vol., 2010, 1632-1639. (ici sur abonnement)

Voici la traduction du résumé de l'article :

Cet article donne une vue d'ensemble du développement historique des réflexions théoriques sur le document et de la formulation des théories du document. Partant de son prédécesseur latin documentum et des pratiques de la bureaucratie des États européens depuis le dix-septième siècle, le premier intérêt pour une théorie du document a été professionnel et se repère au début du vingtième siècle avec les noms de Paul Otlet et Suzanne Briet. Tandis que la notion de document et de documentation a été bien établie vers 1930, elle a été remplacée par celle d'information après la seconde guerre mondiale, au moins chez les anglophones. Néanmoins, à la même époque, une autre sorte de théorie du document a vu le jour, une théorie critique où l'on retrouve les noms de Michel Foucault, Harold Garfinkel et Dorothy E. Smith. Tandis que la théorie du document « professionnelle » développée par Paul Otlet et les autres insistait sur les connaissances plus ou moins contenus dans les documents et sur la façon dont quelque chose pouvait devenir document, la théorie générale développée par les théoriciens critiques comme Michel Foucault se préoccupait plus de ce qu'était et faisait un document. Depuis les années quatre-vingt-dix, on observe un renouveau de l'intérêt pour la notion de document et de documentation toujours à l'intérieur des sciences de l'information et des bibliothèques, avec des auteurs comme Michael Buckland, Ronald Day, and Bernd Frohmann. Ensemble avec un accent mis sur le document numérique, des théoriciens du document en Amérique du nord, en Scandinavie et en France ont souligné la complexité d'une théorie du document et la nécessité d'approches complémentaires articulant les dimensions physiques, sociales et culturelles pour comprendre ce qu'ils sont et ce qu'ils font.

Et voici en complément, quelques éléments de mon cru sur cette question, puisant largement dans l'article ci-dessus et dans les réflexions du RTP-DOC (ici) :

Pour la plupart des textes réglementaires ou des normes, le document est un objet (matériel ou électronique) sur lequel est consignée une information, en anglais on dira un record, un enregistrement. L’objet a une forme et l’information est un texte, au sens large c'est-à-dire aussi bien de l’écrit que de l’image ou du son représentés par des symboles. De ces premières définitions, il faut surtout retenir le terme « consigné ». Les sciences de l’information se sont construites autour de cette notion d’enregistrement, sans toujours bien le concevoir. Quand on y parle d’information il s’agit implicitement d’une information consignée.

Mais ces définitions officielles, aussi opérationnelles soient-elles pour régler bien des situations, restent à la surface des choses. Un document ne se réduit pas à sa forme et son contenu, sinon tout écrit en serait un. Dire qu'un écrit est document, c'est lui donner un statut, une fonction particulière. Plus précisément, un document a deux fonctions complémentaires qui se sont affirmées au cours des siècles avec la mise en place de procédures spécifiques : transmettre et prouver. La fonction principale du document est donc mémorielle : on enregistre une information sur un objet pour pouvoir la transmettre ou s’y référer. L’ensemble du système documentaire est en quelque sorte notre mémoire externe pour paraphraser M. Serres (ici).

Le RTP-DOC, au cours d’une réflexion collective, a proposé une représentation tri-dimensionnelle pour rendre compte de ces différentes facettes : forme, contenu ou texte et médium (ici). Les deux premières dimensions sont les plus communément indiquées, la troisième, le médium, renvoie à sa fonction sociale. En voici un petit résumé rapide que j’ai un peu adapté.

La première dimension du document, celle de la forme, est anthropologique. Il s’agit du rapport de notre corps et de nos sens à l’objet document, quelle que soit sa forme ou son support. Elle se traduit par l’équation Document = Support + inscription. L’inscription doit être lisible, c'est-à-dire déchiffrable. L’exemple le plus traditionnel est le livre imprimé. Pour bien des documents aujourd’hui, notamment les documents numériques, cette dimension passe par un appareillage spécial pour permettre leur lecture, et leur forme variera suivant le terminal de lecture. Cette dimension privilégie le repérage, le document doit pouvoir être vu.

La seconde dimension est intellectuelle. Il s’agit du rapport de notre cerveau et de ses capacités de raisonnement au contenu du document, au texte donc, quelle que soit la façon dont il est représenté. Elle se traduit par l’équation Document = Code + représentation. La représentation est préjugée être fidèlement rendue par le code, ce qui suppose donc qu’elle soit transposable et qu’elle existe préalablement. Si l’on reprend l’exemple de notre livre imprimé, l’accent cette fois est mis sur le texte, sur son sens sans se préoccuper de son support. La productivité du code informatique autorise une manipulation inédite des documents sous forme numérique, jusqu’à parfois les faire apparaître à la demande. Cette fois il ne suffit plus de repérer, cette dimension met en avant la signification, le document doit pouvoir être compris ou lu.

La troisième dimension est sociale. Il s’agit du rapport de notre humanité, de notre position dans une société, à la fonction du document, à sa capacité de médiation donc, quelle que soit sa forme ou son contenu. Elle se traduit par l’équation Document = Mémoire + transaction. Nous retrouvons alors les fonctions de transmission et de preuve. Dans le cas du livre imprimé, cette transmission passe par l’acte de lecture qui fait que l’information présentée est interprétée par le lecteur qui l’assimile. Le lecteur est transformé par l’information qui a été mise en mémoire sur le livre. Une fois de plus le numérique, cette fois principalement par la capacité des réseaux, modifie considérablement le rapport au temps et à l’espace, à la lecture au sens large et par la même sinon la fonction documentaire, du moins à la place du document dans le social. Cette dernière dimension insiste donc sur la fonction du document, la capacité de son contenu à être assimilé en dépassant le cercle intime et la barrière du temps, autrement à être su. 3-dimensions-document.jpg Chacune de ces dimensions a sa propre logique qui ne réduit pas aux autres et pourtant aucune n’est complètement indépendante des deux autres, et un document doit intégrer et coordonner les trois. Ses modalités anthropologiques (lisibilité-perception, forme-signe), intellectuelles (intelligibilité-assimilation, texte-contenu) et sociales (sociabilité-intégration, médium-relation) doivent non seulement être efficientes prises chacune séparément, mais encore être cohérentes entre elles.

Pour chacune de ces dimensions, les professions traditionnelles du document, archivistes, bibliothécaires et documentalistes, ont développé des outils adaptés : les classifications pour repérer les documents, l’indexation pour rendre compte du contenu et retrouver l’information, la conservation et les services d’accès pour les partager. Le numérique a fait surgir chaque fois des questions nouvelles qui ont été analysées et traitées par des expertises différentes, aussi bien en informatique que dans les sciences humaines et sociales.

J'ai souvent appliqué, sur ce blogue et ailleurs, cette grille de lecture pour analyser les développements actuels et leurs hésitations. Elle me parait tout à fait éclairante. Qu'est-ce que le web, sinon de l'information consignée et donc un système documentaire ?

mercredi 08 septembre 2010

Les contours de l'économie du document

Je suis en train de rédiger un manuel ou un livre pour accompagner le cours sur l'économie des documents, ce qui m'amène à réviser bien des notions présentées. J'en proposerai périodiquement quelques extraits pour les soumettre à une critique éventuelle. Voici donc un extrait du deuxième chapitre sur la délimitation du secteur.

La Commission européenne a publié en 2010 un livre vert sur les « industries culturelles et créatives » actuellement soumis à la discussion (ici) et qui s'appuie sur un rapport préalable sur la mesure des activités culturelles (pdf). Les experts européens, après avoir fait la synthèse des propositions des différents pays et organismes, ont suggéré de regrouper les activités culturelles en un « secteur culturel et créatif » dont les frontières sont définies dans le tableau ci-dessous (p.56).

Secteur-culturel-creatif-europe-56.jpg

On peut remarquer tout d’abord le découpage en un « cœur » et trois « cercles ». Le cœur représente les activités fondatrices du secteur : les arts visuels, les arts du spectacle, le patrimoine. Le cercle 1 reprend les industries culturelles dans leur acception classique. Les cercles 2 et 3 présentent ce que la Commission européenne appelle désormais les industries créatives : le design, l’architecture et la publicité d’une part et, d’autre part, les industries connexes. La délimitation de ces dernières constituant le cercle 3 est indiquée comme plus floue, car elles appartiennent aussi à d’autres sous-secteurs. Les activités citées sont les fabricants de matériels d’enregistrement et de lecture et les opérateurs de réseaux, reliés au secteur des technologies de l’information et de la communication.

Le cœur indiqué représente, en réalité, les origines anciennes de l’économie du document, on pourrait dire sa préhistoire. Les productions ont bien aussi les caractéristiques d’un document et notamment sa fonction de transmission ou de preuve, mais elles restent limitées au stade du prototype : l’œuvre d’art, le spectacle, le monument ou l’archive. Il s’agit en quelque sorte d’une activité protodocumentaire.

Il est une activité ici placée dans le patrimoine qu’il faut pourtant déplacer pour rendre compte correctement de l’économie du document. Suite à la diffusion du livre à grande échelle, puis des revues et des journaux, les bibliothèques quittent, en effet, ces prémices artisanaux et aléatoires pour se multiplier en inventant progressivement la bibliothéconomie, c'est-à-dire une organisation rationnelle, on pourrait dire industrielle, d’un service d’accès aux documents. Il faut donc les retirer du cœur ou des origines, du moins pour celles dont la mission première n’est pas la conservation, et les placer dans la rubrique suivante qui réunit les activités industrielles, le cercle 1.

Plusieurs corrections ou ajustements doivent être effectuées dans ce premier cercle. La musique, tout d’abord, est mise comme une catégorie générale dans les industries culturelles. Cela se justifie en économie de la culture par la cohérence, la complémentarité des différentes activités musicales et leur articulation. Mais, d’un point de vue documentaire, les concerts, la musique vivante relève du spectacle, c'est-à-dire de la catégorie précédente, tandis que la musique enregistrée, qui est directement de l’information consignée donc bel et bien un objet documentaire, participe clairement à la catégorie industrielle. Celle-ci, de plus, comprend aussi les bases de données qui sont exclues dans le tableau de la Commission. Enfin le plus problématique est que les nouveaux industriels du web-média sont absents de ce premier cercle, à part les jeux vidéos : ni les portails, ni les moteurs, ni les réseaux sociaux ne sont mentionnés. Pourtant ils jouent un rôle crucial aujourd’hui pour l’économie du document, déstabilisant les industries traditionnelles. Ajoutons-les donc dans cette rubrique sous l’appellation de web-média. L’ensemble de cette rubrique est nommée par les experts de la Commission européenne « industries culturelles ». J’en ai modifié les contours, il faut donc en changer le nom. Conformément à notre propos, je les baptiserai « industries de la mémoire ».

Dans le deuxième cercle, seule parmi les éléments initiaux la publicité concerne l’économie du document. Mais son importance relève moins de sa créativité que de l’ouverture d’un second marché, celui des annonceurs ou plus précisément la construction d’un marché bi-face comme nous l’avons vu au chapitre précédent. La publicité relève donc aussi des industries de la mémoire, mais d’une façon décalée. Son activité est parallèle et articulée à celle de la presse, de la radio-télévision et, depuis peu, du web-média.

La notion de secteur créatif ne fait pas directement sens pour l‘économie du document qui se fonde sur le l'information consignée. Par contre, d’autres activités ne relevant pas directement des industries de la mémoire reposent sur une création, manipulation, distribution de documents. L’éducation transmet des savoirs par l’intermédiaire de professeurs, mais aussi d’une intense activité documentaire. Les administrations, privées et publiques, fonctionnent avec des documents. Tout une série de professions, notaires, avocats, agents, sont là pour rédiger et certifier l’authenticité de documents, agissant comme tiers parties. Ces trois domaines se sont transformés avec l’arrivée des moyens légers de production et reproduction documentaires, machine à écrire, reprographie, photocopieuses. Ils explosent aujourd’hui avec la bureautique et les facilités offertes par le traitement, les mémoires et les réseaux numériques. Ils forment un secteur que l’on appelle de plus en plus la gestion des connaissances, plus connu sous sa dénomination anglaise : le knowledge managment. L’économie de ce secteur est difficile à circonscrire et mesurer.

Le troisième et dernier cercle enfin est succinctement évoqué, comme « industries associées » dans le rapport de la Commission européenne. Il agrège les fabricants de matériels, de logiciels et les opérateurs de télécommunication et comprend un « etc. » qui laisse la porte grande ouverte. Il est indiqué en remarque qu’il s’agit notamment du secteur des technologies de l’information et de la communication. Pour l’économie des documents, ces acteurs sont essentiels car ce sont eux qui de plus en plus supportent, mettent en forme les documents et les rendent accessibles. Mais leur dynamique dépasse très largement ce rattachement car ils concernent aussi d’autres activités et s’adressent à d’autres marchés comme le e-business, le e-commerce, ou simplement la bureautique et le téléphone.

Toutes ces remarques permettent maintenant de présenter les contours de l'économie du document sur un tableau qui s’inspire du tableau précédent en l’amendant et le simplifiant.

Economie-du-document.png

jeudi 02 septembre 2010

La fin de la récré

Continuons les lectures estivales. Le rédacteur en chef de Wired a le sens de la formule et de l'air du temps. Il sait capter les idées, les présenter et mettre en valeur l'essentiel. Un vrai pédagogue avec le péché mignon du professeur, un zeste de démagogie ici par exemple dans le schéma introductif quelque peu trompeur (voir sa critique sur Boingboing ici).

Chris Anderson et Michael Wolff, “The Web Is Dead. Long Live the Internet,” Septembre 2010, ici.

« Le web est mort, vive l'internet » donc. L'article a été beaucoup commenté en anglais, peu encore en français (sur OWNI ici). Mais c'est juste la rentrée, cela va venir.

L'article est en deux colonnes parallèles. Chacune écrite par un auteur présente la même thèse, mais d'une perspective différente, Anderson du point de vue de l'internaute à la recherche de simplicité, Wolff du point de vue des entrepreneurs à la recherche de contrôle et profit. La thèse n'est pas vraiment nouvelle et n'étonnera pas les lecteurs de ce blogue. Il s'agit de dire que le média internet est arrivé à maturité et que le web (c'est à dire l'accès par un navigateur) n'en est qu'une des applications, dont la rentabilité n'est pas toujours au rendez-vous. Dès lors d'autres joueurs, comme Apple, Amazon ou Facebook développent d'autres services qui rencontrent le succès par leur simplicité d'utilisation, notamment sur les appareils mobiles.

On peut discuter de l'opportunité de la distinction faite entre web et internet dans l'article. Mais j'ai eu souvent l'occasion de répéter ici que le web était dans l'enfance, une enfance pas si différente de celle des médias qui l'ont précédé notamment dans son caractère libertaire, pour ne pas acquiescer au constat général même s'il est un peu forcé pour les besoins de la démonstration. Mais, une fois constat fait, il reste à comprendre quelles sont les logiques du média qui s'installe. Ses prédécesseurs ont construit des modèles robustes. Quel sera celui du petit dernier ? Pour construire un modèle, il faut qu'entrent en résonance l'organisation de la technique (un choix dans les possibles), la satisfaction du social (un choix dans les usages) et une pérennité économique (un marché ou un support public). Pour le web, c'est le troisième qui est encore incertain.

J'ai déjà essayé de rendre compte de l'articulation de ces modèles (court, long) et de décrypter les ressorts des stratégies des principales firmes sur le web (). Mais il y a encore du boulot..

Actu du 7 oct 2010

Pour un résumé des débats américains, voir le billet de F. Pisani qui ne m'a pas vraiment convaincu :

“Le web n’est pas mort, l’internet ne va pas bien/1 - Transnets - Blog LeMonde.fr,” ici.

et la suite :

“Le web n’est pas mort, l’internet ne va pas bien/2 - Transnets - Blog LeMonde.fr,” .

- page 37 de 144 -