Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

lundi 19 septembre 2011

Document et protodocument

Il semble que la théorie du document commence à agiter un peu la blogosphère (ici ou ). Il paraît alors utile de se mettre d'accord parce qu'on entend par « document ». C'est une discussion ancienne, qui je crois peut être maintenant tranchée. J'y consacre tout un chapitre dans le livre à venir, mais pour alimenter dès à présent les discussions qui s'amorcent, voici quelques éléments de définition.

Inspirée de Bruno Bachimont, qui dans un cours récent à l'EBSI tente de préciser les conséquences de la bascule du document vers le numérique, une première définition du document pourrait être la suivante : Un document est une trace permettant d’interpréter un évènement passé à partir d’un contrat de lecture. Nous retrouvons bien les trois dimensions, matérielle avec la trace (vu), intellectuelle avec l’interprétation (lu), mémorielle avec l’évènement passé (su), ainsi que la nécessaire construction sociale avec le contrat.

La notion de trace permet d’élargir la définition du document à toutes sortes d’objets comme l’avait proposé Suzanne Briet dans les années 50. Une étoile dans le ciel, une antilope, pour reprendre ses exemples, peuvent être des documents pourvu qu’elles soient les témoins d’un savoir inscrit dans un système documentaire. Ainsi les documents sont très divers, depuis les contrats, factures, bulletins de paie, bordereaux, circulaires, lois et règlements, cartes d’identité, permis variés, jusqu’aux romans, albums, films, photos d’actualité en passant par les pièces archéologiques, les données scientifiques, les articles de revues, les objets muséaux et aussi les cartes de visite, les faire-parts, les petites annonces, les affiches publicitaires et l’on pourrait naturellement prolonger indéfiniment cette liste à la Prévert. L’interprétation de chacun passe par le régime documentaire auquel est rattachée la trace. Celui-ci peut être très varié, juridique, fictionnel, scientifique, coutumier, amical, etc. Pour interpréter un document correctement, il est nécessaire d’avoir assimilé les clés d’entrée de ces régimes. Enfin, la référence à un évènement passé ne signifie pas nécessairement la relation de cet évènement, mais bien que le document fait le lien entre quelque chose qui s’est déroulé dans le passé dont il est la trace et aujourd’hui. La trace peut être fortuite, un indice, ou construite, un texte.

Le document est une façon de retrouver notre passé et, nécessairement, de le reconstruire en fonction de notre présent pour orienter notre futur. Ce billet que vous consultez est un document, il est la trace de l’analyse que j’ai construite à un moment donné et que vous réinterprétez par rapport à votre présent, à partir de nos habitudes partagées de l’écriture-lecture d’un billet de blogue. Son objectif est d'esquisser une définition du document utile pour nous orienter à l'avenir sur ces questions.

Mais cette première définition ne permet pas de rendre compte d’une qualité essentielle du document ordinaire qui autorise sa mise en système : sa reproductibilité, sa plasticité, son traitement. Sans doute n’importe quel objet peut devenir un document, mais il reste alors unique. C’est en quelque sorte un prototype documentaire, disons un protodocument. Le document ordinaire est un texte, une représentation formelle de ce prototype sur un support maniable. Si le protodocument est déjà d’ordre textuel, il pourra être directement la matrice du document, comme dans le cas de la copie des scribes ou de l’imprimé. Dans le cas contraire, des textes viendront documenter le protodocument, jusqu’à parfois le remplacer, depuis les notices jusqu’aux enregistrements analogiques. Le numérique a démultiplié ces possibilités manupulatoires, c'est l'essentiel de sa force.

La définition du célèbre bibliothécaire indien Shiyali Ramamrita Ranganathan insiste, elle, sur ses qualités manipulatoires : un document est une micro-pensée enregistrée (embodied micro thought) sur papier ou sur un autre support, qui permet une manipulation physique facile, un transport dans l’espace et une préservation dans le temps (cité par Buckland, trad JMS). Mais cette définition a le défaut inverse d’oublier les protodocuments et ne rend pas compte de la valeur sociale du processus documentaire. Nous pouvons alors articuler les deux définitions : Un protodocument est une trace permettant d’interpréter un évènement passé à partir d’un contrat de lecture. Un document est la représentation d’un protodocument sur un support, pour une manipulation physique facile, un transport dans l’espace et une préservation dans le temps.

Si l’on poursuit le raisonnement, la multiplication des documents et des genres dans toutes sortes de registres et leur transformation témoignent d’une relation fiévreuse à notre passé, une sorte d’interrogation existentielle sur notre présent face à un futur angoissant dont les termes se renouvellent sous nos yeux. Mieux ou pire, le numérique par ses capacités calculatoires permet de reconstruire des documents à la demande et nous donne l'illusion d'avoir toutes les réponses à nos questions avant même qu'elles ne soient posées, comme si notre futur était un destin déjà inscrit dans les machines.

samedi 17 septembre 2011

Dutronc et la théorie du document

Les artistes sont visionnaires, ils sentent les choses avant tout le monde. C'est pour cela que l'on a besoin d'eux et de Jacques Dutronc en particulier qui dans ses chansons a souvent perçu les bascules de l'air du temps. En 1967, il se moque des intellectuels, un an avant que la spontanéïté envahisse (provisoirement) la rue.

Plus de quarante ans plus tard, sa chanson mérite d'être réécoutée à l'époque des lectures industrielles, de Google qui nous rendrait idiot et de la théorie du document, elle prend un nouveau relief. Un petit bol d'air et un peu d'autodérision.

Paroles de la chanson.

mercredi 07 septembre 2011

La matrice du néodocument

Extrait d'un billet publié au printemps ici :

Précédemment nous trouvions une représentation du livre sur chacun des sommets du triangle, même si la différence de perspective soulignait les différences de dimensions. Cette fois, le document n’apparait plus qu’au centre, comme un navigateur qui le reconstruira à la demande de l’internaute. On pourrait dire que le système documentaire a réintégré la construction du document. La notion « parenthèse Gutenberg » prend alors une tout autre ampleur. L’imprimerie avait sorti la production documentaire des bibliothèques, des infrastructures épistémiques de l’époque. Le numérique réintègre la production documentaire dans l’infrastructure épistémique contemporaine : le web.

WS-dimensions-document.jpg

Il y aurait une thèse à écrire sur l'émergence et l'évolution du navigateur. En attendant qu'un étudiant futé s'y mette, voici une superbe infographie aussi intéressante par ce qu'elle présente que parce qu'elle cache. L'évolution du web, réalisée par une équipe de développeurs de Google Chrome. L'objectif est évidemment de montrer que le dernier né des navigateurs est celui qui s'appuie sur les technologies les plus performantes parce que les plus actuelles.

L'infographie a l'avantage de résumer l'évolution des navigateurs et des langages, méthodes et logiciels qui les portent. Depuis l’ancêtre Mosaïc, qui a posé le concept, seuls six navigateurs se sont imposés, dont cinq sont encore en fonction. Les dernières tendances montreraient une montée de Chrome au détriment d'Explorer, toujours leader, et surtout de Firefox. Le navigateur est le principal instrument de la constitution du néodocument du nouveau millénaire, sa matrice.

Quelles leçons tirer de ce graphique ? En voici quelques-unes sans prétendre du tout épuiser le sujet :

  • Le très petit nombre d'alternatives et l'énorme succès de quelques-unes souligne l'importance de la normalisation de fait. Le néodocument remplace de plus en plus les anciens documents qui règlent notre vie en société et il a naturellement a envahi notre quotidien et suppose un contrat de lecture pour être repéré, décrypté et éventuellement transmis. Il nous serait insupportable d'avoir à apprendre plusieurs contrats de lecture. Passer d'un navigateur à un autre, aux fonctionnalités pourtant très proches est souvent agaçant, sans compter que nous devons aussi apprendre à gérer d'autres services concurrents (messageries, applications des mobiles, etc.).
  • Tous les navigateurs sont gratuits, et pourtant, ils sont le fruit d'un intense travail de recherche-développement, d'ajustements et d'intégration de fonctionnalités continues. Cette gratuité est significative. On paye sa connexion, mais on n'imagine pas payer la matrice du néodocument.
  • La difficulté du navigateur Opéra, un des plus anciens et, on le voit bien sur l'animation, un des plus innovants, souligne l'importance d'un écosystème pour le développement du néodocument. Explorer, Safari et tout récemment Chrome profitent de leur inclusion de fait dans le système documentaire de l'internaute, par la bureautique, le design ou la recherche. Firefox se place dans une position d'alternative libre, mais était de fait soutenu par Google. L'arrivée de Chrome le fragilise.
  • L'inclusion progressive des services au navigateur mériterait d'être étudiée de près. Depuis le multimédia, la dynamique, l'interactif, le partage, etc., elle marque l'évolution de la typographie numérique, du texte et de la fonction de transmission, les trois dimensions du néodocument.

jeudi 28 juillet 2011

Histoires de mots (3) et théorie du document

Voilà un billet qui pourrait intéresser mes collègues français des sciences de l'information et de la communication. Je me suis interrogé sur les termes du langage courant qui pouvait rendre compte le plus clairement des trois dimensions du document et sur leur usage. Il me semble que les trois termes sont les suivants :

  • « Document » lui-même pour la forme, le vu
  • « Information » pour le texte ou le contenu, le lu
  • « Média » pour la relation ou la transmission, le su

Maintenant regardons l'évolution de leur occurrence dans le corpus français des livres numérisés par Google, grâce à N-Gram (un rapide sondage aléatoire semble montrer que la très grande majorité des monographies comprenant ces mots sont des bulletins, des études et des revues). Voici le résultat pour les mots au pluriel (l'addition du singulier creuse encore la tendance, mais complique le graphique).

Ngram-documents-informations-medias.jpg

J'avais déjà noté la montée du terme « document » au 19e. Il est intéressant de constater que le terme « information » ne décolle vraiment qu'après la seconde guerre mondiale, tandis que celui de « média » ne démarre que dans les années 80.

Tout se passe comme si, selon cet indicateur, la prise en compte dans le langage écrit, ou leur révélation comme phénomène analysable, des trois dimensions s'était faite de façon progressive. La traduction de Pour comprendre les médias de McLuhan date de 1968, l'édition de La société du spectacle de Debord de 1967.

mardi 05 avril 2011

La redocumentarisation (du journalisme) en deux citations

Après les quatre images du billet précédent, voici deux citations pour illustrer la redocumentarisation. Il s'agit de montrer l'inversion de la perspective du rapport à la vérité qui s'est opéré entre le début du 20e et celui du millénaire en prenant l'exemple du journalisme. Comme précédemment les commentaires sont bienvenus.

La première citation m'a déjà servi dans un précédent billet. Elle est tirée du livre de P. Starr The Creation of The Media (trad JMS) :

Lippmann {en 1920} exhortait les journalistes à être plus «objectifs», un mot qui venait d'apparaître pour décrire le journalisme. Les critiques aujourd'hui dénoncent l'objectivité comme une idéologie professionnelle, mais il est important de comprendre les pratiques professionnelles que Lippmann voulait faire adopter aux journalistes. Il voulait que les journalistes s'inspirent de la science en développant un «sens de la preuve» et en reconnaissant franchement les limites de l'information disponible : il les exhortait de démonter les idées reçues et les abstractions et de refuser de laisser de côté des nouvelles ou de mettre la morale ou n'importe quelle autre cause avant la véracité. Ce que Lippmann demandait avant tout aux journalistes était la responsabilité (accountability). p.396

La seconde citation est tirée d'un entretien sur RSLN avec Michael Cross du Guardian, un des plus avancés dans le journalisme de données :

(..) Que va t-il se passer si les données sont mal comprises et interprétées ? J’ai peur que nous ne puissions pas y faire grand chose et qu’il faille faire avec.

Dans le même temps, plus les données sont disponibles, plus il y a de chances pour que les gens en parlent, les analysent, les croisent : la discussion offre une chance de réinterpréter les données de manière efficace et fiable, même si elles sont peut-être utilisées pour servir un certain agenda.

Les données sont accessibles et, avec la puissance du web, nous pouvons faire en sorte que l’interprétation la plus fiable se retrouve mise en avant.

Reprenons les mots clés de l'une et l'autre citations sur un tableau pour les mettre en perspective. 1920 correspond à l'organisation systématique des systèmes documentaires qui a pour modèle la science positive. 2010 correspond à la transformation de notre rapport au document sur un tout autre modèle de rapport à la vérité. Le tableau montre l'écho de ce mouvement dans les pratiques journalistiques.

Redocumentarisation-journalisme.jpg

- page 4 de 14 -