Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

Mot-clé - 314. REINGENIERIES DOCUMENTAIRES ; Renouveau ; L’inversion du flux

Fil des billets

jeudi 22 mars 2012

L'inversion du rapport au savoir à l'école

A lire et à faire lire absolument pour comprendre l'inversion du rapport au savoir sur le Web dès le lycée :

Comment j'ai pourri le web, 21 mars 2012, la vie moderne.

25-03-2012

Pour un contrepoint parmi d'autres :

Pourritures pédagogiques, Contrebande, 23 mars 2012.

26-03-2012

Petite remarque : l'écho qu'a rencontré cette histoire et les débats passionnés qu'elle a susités soulignent le hiatus qui s'est installé entre les "penseurs de l'école" et les "penseurs du web", souvent aussi péremptoires les uns que les autres et sans beaucoup d'écoute. Peut-être qu'un peu de modestie serait bienvenue.

L'école doit être un lieu d'émancipation où il est important d'apprendre aux élèves à penser par eux-mêmes et à citer leurs sources. L'erreur serait de croire que le Web pourrait la remplacer. Mais le web peut être très utile pour favoriser cette émancipation, il est même incontournable comme lieu principal aujourd'hui de récolte des informations, à condition de comprendre comment le savoir s'y construit. Et il s'y construit de façon sensiblement différente du savoir traditionnellement enseigné à l'école.

C'est pourquoi j'ai apprécié cette petite expérience.

dimanche 12 février 2012

Le Web sous tension (2)

Voici enfin la nouvelle version du Web sous tension de Roger II Pédauque !

L'écriture collective du texte de Roger II a pris du retard. Le temps de la coordination entre les membres du groupe initial et celui de la maturation de la réflexion est très éloigné de la réactivité de l'internet.

Voici comment s'est déroulé le processus. Dans une première étape, les auteurs des différentes parties ont intégré les commentaires du texte initial et celui-ci a été largement remanié. Puis, constatant que cette nouvelle version ne répondait pas à notre attente, nous nous sommes réunis au cours d'un séminaire de deux jours, nous répartissant la critique du texte. Il y a été décidé de publier une nouvelle version du texte en deux temps :

  1. Tout d'abord un résumé soulignant l'essentiel de l'enjeu sur le ton d'un manifeste, c'est ce résumé qui est aujourd'hui mis en ligne et soumis à la critique.
  2. Ensuite, certaines parties, amendées et corrigées du texte initial serviront de développements et d'illustrations des propos du résumé. Le texte, alors complet, sera publié courant avril.

Nous avons aussi prévu une suite, sous une forme différente, intégrant toutes ces réflexions.

Je crois que cela valait de coup de prendre son temps... Le temps est justement la principale tension du Web que Roger II a fait ressortir. Le nouveau texte est là :

Et pour un accès direct, c'est ici.

mercredi 30 mars 2011

La redocumentarisation en quatre images

Pour avancer dans les réflexions sur la redocumentarisation et la théorie du document dans la continuité du travail collectif sur Roger II, voici quatre images et quelques réflexions. Tous les commentaires et critiques sont bienvenues, j'avance sur un terrain encore à défricher.

Documentarisation

La première image est issue du livre testament de P. Otlet, premier théoricien de la documentation, et date de 1934 :

Otlet-1934.jpg

Les quatre premières lignes veulent présenter la construction des documents. À partir de l’univers, se forment les représentations grâce aux intelligences humaines particulières qui ensuite s’organisent et se confrontent dans la dynamique de la science et sont consignées dans des livres eux-mêmes réunis dans les bibliothèques.

Les trois lignes suivantes présentent les principaux éléments de l’ordre documentaire nouveau selon P. Otlet. Il s’agit d’abord de rédiger des notices bibliographiques et de les réunir dans un répertoire bibliographique universel. L’ensemble de ces fiches réunies dans les meubles à tiroirs a constitué le catalogue de la bibliothèque jusqu’à l’arrivée de l’informatisation à la fin des années soixante-dix. Il s’agit d’abord de l’outil de repérage des documents dans une collection de bibliothèque. La notice bibliographique est donc un substitut du document qui le remplace avantageusement dans le système documentaire du fait de son formalisme, aujourd’hui nous dirions qu’il s’agit de ses métadonnées. Le système documentaire est piloté par des catalogues normalisés et reliés entre eux. Pour P. Otlet, il doit même être centralisé dans un répertoire universel. L’auteur suggère un instrument supplémentaire, l’Encyclopédie, constituée d’une série de dossiers de synthèse sur tous les sujets constituant le savoir humain, réalisés et actualisés par les documentalistes à partir des documents existants et diffusables à la demande. Dernier élément essentiel à l’ordre documentaire : la classification. La classification joue pour P. Otlet un rôle central, organisant et reliant l’ensemble des instruments.

Ce modèle systématise et justifie le rôle de la bibliothèque qui l'appliquera et le perfectionnera jusqu'à aujourd'hui. Il sépare clairement la production du livre de la documentarisation qui vient ensuite.

Redocumentarisation

La seconde image est celle du «cake» du Web sémantique.

Web-semantique-2007.jpg

Dans le schéma de P. Otlet, on trouvait tout en haut les auteurs qui pensaient le monde, le représentaient en concepts grâce à la science et le consignaient dans des documents. Le schéma du W3C met à leur place des utilisateurs qui, plutôt que représenter le monde, vont reconstruire selon leurs besoins des réponses à leurs questions à partir des ressources documentaires existantes. On pourrait dire en raccourci le monde n’est plus représenté par un travail scientifique préalable, mais chacun se représente le monde à partir de données récoltées préalablement. On pourrait discuter longtemps de la pertinence épistémologique de l’une ou l’autre posture. Là n’est pas mon propos, je voulais simplement souligner que d’un point de vue documentaire celles-ci sont inversées : l’une part des producteurs de documents et classe ces derniers ; l’autre part des lecteurs qui reconstruisent les documents à partir de ressources classées.

Les trois dimensions

De plus sans discuter les détails d’un schéma qui n’est pour ses auteurs même qu’illustratif, on peut remarquer que l’on retrouve dans la succession des couches les trois dimensions du document . Déjà présentées pour le livre ainsi :

3-dimensions-document.jpg

Les couches les plus basses (URL/URI, XML, RDF) concernent les adresses et les formats des ressources, c’est à dire le repérage par la forme. Les couches intermédiaires (SPARQL, OWL, RDFS, RIF) s’occupent de la recherche, de l’indexation, de la sémantique, de la représentation des connaissances, c’est à dire un traitement à partir du contenu, du texte. Enfin les couches supérieures supportent des règles sociales (Unifying logic, Proof, Trust), celles-là même qui supportent la fonction du document, transmission et preuve. J’ai donc découpé le « cake » en tranche que j’ai redistribué sur les trois dimensions du document. Cette présentation, comparée à celle que j’avais présenté pour le livre souligne l’ampleur de la réingénierie documentaire. Précédemment nous trouvions une représentation du livre sur chacun des sommets du triangle, même si la différence de perspective soulignait les différences de dimensions. Cette fois, le document n’apparait plus qu’au centre, comme un navigateur qui le reconstruira à la demande de l’internaute. On pourrait dire que le système documentaire a réintégré la construction du document. La notion « parenthèse Gutenberg » prend alors une tout autre ampleur. L’imprimerie avait sorti la production documentaire des bibliothèques, des infrastructures épistémiques de l’époque. Le numérique réintègre la production documentaire dans l’infrastructure épistémique contemporaine : le web.

WS-dimensions-document.jpg

Cette représentation triangulaire a la vertu supplémentaire de casser l’empilement et sa lecture linéaire en montrant notamment les liaisons fortes qui existent entre les formats et les adresses et la confiance et la preuve.

lundi 06 avril 2009

La messe des données

Une façon d'enrichir le cours sur l'économie des documents est de prendre quelques évènements significatifs de l'actualité et de les passer au prisme des notions développées. J'ai l'ambition de permettre le décryptage des mouvements qui agitent le monde documentaire. Un repérage critique à l'avantage d'en faire la démonstration ou, inversement, de repérer des failles à réparer.

Pour éviter de trop longs développements, je coderai les références au cours de la façon suivante : SxDyA08, x étant le numéro de la séquence, y le numéro de la diapositive, A08 signifie qu'il s'agit de la version de l'automne 08. Par exemple, S1D7A08 fait référence à la diapositive 7 «Pilier2. Le prototype» que l'on trouve dans la séquence 1 du cours de l'automne 08. Pour la retrouver et écouter son commentaire, il suffira de suivre le lien qui conduit à la partie du diaporama concernée et de se rendre à la diapositive en question par son numéro : S1D7A08. Il est probable qu'avec le temps les liens vont se casser, mais d'ici là j'aurai peut-être trouvé une formule plus simple.

Illustration de la Séquence 1 : Particularités économiques du document publié

Commençons donc par la séquence 1 sur les particularités économiques du document avec un document emblématique : le discours de Tim Berners-Lee au congrès TED pour Technology, Entertainment, Design en février 2009 (le discours est sous-titré en français).

L'argumentaire de TBL pour «libérer les données» s'appuie clairement sur les particularités économiques de l'information : la non destruction qui permet à tous de se resservir des mêmes données sans les altérer ; le prototype, les données ne sont produites qu'une fois pour être partagées ; la plasticité qui permet de construire de nouvelles informations par la combinaison et le calcul des anciennes ; l'interprétation qui autorise l'utilisation des mêmes données à des fins diverses ; la résonance par les effets de réseau (S1D6,7,8,9,12A08).

Mais il en laisse de côté deux, et cet oubli n'est pas sans signification : l'expérience et l'attention (S1D10,11A08). En réalité , l'économie marchande de l'information est construite sur ces deux particularités là qui sont synonymes de rareté. C'est parce que l'on ne connait pas un document avant de l'avoir lu que l'on peut le vendre. C'est parce que l'attention est limitée que l'on peut la capter au profit d'annonceurs intéressés (S1D13A08).

Le discours de TBL est donc un discours d'économie publique. Cela est particulièrement flagrant dans les exemples qu'il prend : données gouvernementales, données scientifiques, Wikipédia. Mais cela peut être trompeur et ambigu quand il évoque les données privées, les traces de navigation ou encore les réseaux sociaux. Prenons l'exemple de Google qui s'est construit sur l'architecture de l'ancien Web, celui que TBL appelle le «Web des documents». Google a fait sa fortune en «libérant les documents», mais en enchaînant les données. C'est parce Google garde les données brutes, tout particulièrement celles sur les pratiques de navigation, mais aussi celles par exemple sur la géolocalisation, qu'il peut construire son marché de l'attention en détruisant celui des anciens médias. Il est tout à fait intéressant de voir que le déplacement du verrouillage était suggéré, il y a 10 ans dans le manuel de Shapiro et Varian (S1D16A08), Hal Varian qui est aujourd'hui Chief economist chez Google.

Quelques mots, enfin, sur la forme du discours qui est en cohérence avec les constatations précédentes, TBL semble avoir adopté le style du prêche Hi-Tech californien, dont Steve Jobs est la star inégalable (voir ici, l'introduction du iPhone) et qui n'est pas sans rappeler celui des pasteurs baptistes (p. ex ici), à la différence près que pour les gourous Hi-Tech, il n'y a pas d'enfer. La motivation est le bien de l'humanité sans la peur de la damnation. Nous sommes dans le «bien public» dans tous les sens du terme.

Cette forme n'est pas anodine, il s'agit de faire partager une utopie quasi-religieuse, ici une communion, au sens propre, des données, qu'il faut libérer pour sauver le monde. Je le dis en souriant mais sans vraie ironie. P. Flichy (, S2D41A08), parmi d'autres, a montré combien l'imaginaire était important pour l'innovation et combien il était présent dans le développement de l'internet.

Et après tout, le bien de l'humanité n'est pas une mauvaise motivation, optimiste mais peut-être angélique puisqu'elle gomme des volets importants du développement du numérique et des réseaux : les limites qui permettent justement la construction du marché, et aussi qui favorisent sa partie noire, obscure qui explose, elle aussi, le contrôle, la manipulation, l'escroquerie, le vol, le détournement, le mensonge, etc.

Par ailleurs, il y aurait bien des choses à dire sur le fait que TBL n'évoque pas le Web sémantique du moins dans ce prêche où le mot n'est pas prononcé. Passer du Web sémantique au Web des données n'est pas innocent. J'y reviendrai peut-être à l'occasion quand j'en serai à la révision de la séquence sur la redocumentatisation (ici).

Actu du 7 janvier 2010

Voir aussi l'importance de l'accessibilité des données dans cet article du NYT :

John Markoff, “A Deluge of Data Shapes a New Era in Computing,” The New York Times, Décembre 15, 2009, sec. Science, ici.

Actu du 12 mars 2010

Un an plus tard, TBL récidive avec, cette fois une démonstration par l'exemple d'utilisations, notamment sur des cartes, des données en accès libre ici.

samedi 13 septembre 2008

La science de l'information perdue dans les nuages..

Les professionnels du document ou les chercheurs en sciences de l'information me paraissent bien silencieux (sauf pour dénoncer les appétits mercantiles) sur la question qui agite beaucoup les informaticiens, les professionnels du Web, les promoteurs du Web sémantique et aussi, bien sûr, les industriels de l'internet : le Cloud computing. Un exemple, parmi bien d'autres, le passage du bureau physique au bureau dans les nuages évoqué par H. Guillaud à propos d'un article de Nova Spivack :

Hubert Guillaud, “Le Webtop : le Desktop organisé par le web,” Internet Actu, Septembre 12, 2008, ici.

Nova Spivack, “The Future of the Desktop,” ReadWriteWeb, Août 18, 2008, .

Nova Spivack propose une nouvelle organisation du bureau, adaptée à notre mobilité et à l'évolution du Web. Dans son argumentaire, il se sert de l'image du bibliothécaire comme d'un repoussoir. Extrait (trad JMS) :

Il faut basculer de l'image du bibliothécaire à celui de l'opérateur boursier. Dans le monde du PC, nous étions obnubilés par la nécessité de gérer nos informations sur nos ordinateurs - nous nous conduisions comme des bibliothécaires. Engranger les choses était notre souci, et les trouver était aussi difficile. Mais aujourd'hui, garder l'information n'est vraiment pas le problème : Google a rendu la recherche si puissante et omniprésente que beaucoup d'utilisateurs ne prennent plus la peine de garder quoi que ce soit - il le recherche de nouveau au besoin. Le problème du bibliothécaire a été dépassé par la force brute de la recherche à l'échelle du Web. Au moins pour le moment.

À sa place, nous devons résoudre un problème différent - celui de filtrer ce qui est réellement important et pertinent maintenant et dans un futur proche. Dans les limites de notre temps et de notre attention, nous devons prendre soin à ce que nous recherchons vraiment et ce à quoi nous devons porter notre attention. C'est l'état d'esprit de l'opérateur boursier. S'il se trompe dans son pari, il peut perdre des ressources précieuses, s'il a raison, alors il peut trouver un filon avant le reste du monde et gagner des avantages monnayables à avoir été le premier. Les opérateurs boursiers privilégient la découverte et surveillent les tendances. C'est une orientation et une activité très différente de celle d'un bibliothécaire, et c'est vers cela que nous allons.

Sans contester l'intérêt évident des propositions de N Spivack pour les développement de l'outil, on peut être affligé d'une telle méconnaissance des professions documentaires et donc de la sous-utilisation de leur apport. En 1988 il y a vingt ans donc (!) par exemple, François Jakobiak publiait un livre qui ne disait pas autre chose :

François Jakobiak, Maîtriser l'information critique, Paris : Les Editions d'organisation, 1988.- (Collection Systèmes d'information et de documentation), critique BBF ici.

Par ailleurs, N Spivack insiste sur la gestion du temps documentaire, la présentant là encore comme une rupture par rapport aux pratiques anciennes.

Comme notre vie numérique a évolué de nos vieux bureaux démodés à nos environnements web centrés sur les navigateurs, nous allons passer d’une organisation spatiale de l’information (répertoires, dossiers, bureaux…) à une organisation temporelle (flux, lignes de temps, microblogs, …).

Il ne s'agit pourtant que d'une dimension essentielle de l'archivistique, en particulier l'archivistique québécoise qui se préoccupe des documents courants et les gère à partir de calendriers.

Mais, il ne faut sans doute pas accabler l'auteur, les responsables de cette méconnaissance sont plutôt à rechercher du côté des professionnels de l'information eux-mêmes qui devraient être plus pro-actifs. Visiblement on a besoin d'eux. Sans doute la redocumentarisation en cours bouscule bien des pratiques, mais il me semble que les fondamentaux ne changent guère.

- page 1 de 2