Hervé Le Crosnier dans le commentaire d'un billet récent me reproche d'avoir détourné la notion de protodocument telle qu'initiée par Pédauque. Je plaide (presque) coupable, pour la bonne cause. Mais le commentaire de Hervé et le rebond de Jean-Daniel Zeller qui le suit ouvre, à mon avis, d'autres questions, non sur le(proto)document mais plutôt sur le (néo)document qui nait sous nos yeux et au sujet duquel l'analyse reste encore bien faible.

Je reprends les propos de Hervé (en italiques) suivis de mes réponses :

D'après ma lecture de Pédauque, j'avais une autre vision du "protodocument". Non pas le prototype qui sera soumis au processus industriel de la duplication, mais un ensemble informel de "sources" (un terme utilisé par les historiens et les éditeurs de classiques, curieusement absent de ton texte), regroupés par un(e) "auteur(e)" (i.e. une entité responsable de la création du document, si l'on reprend la formule abstraite de définition du Dublin Core... qui peut donc être machinique, créative-personnelle, ou anonyme, notamment "par excès d'auteurs", comme dans Wikipédia) en vue de produire un "document" (une trace "intentionnelle" portant mémoire d'un événement ou de son interprétation). Tu proposes ici une autre définition (en tout cas différente de celle que j'avais compris/interprété), qui me semble peu opérationnelle.

Oui, j'ai peut-être employé le terme protodocument dans un sens (légèrement) différent de celui de Pédauque. Le terme est apparu dans le 3ème texte de Pédauque qui distinguait les proto-documents (collection de matériels documentaires, plus ou moins cohérents et organisés) du document (entité transmissible et socialement instituée).

Mais non, le terme ne se réduit pas dans mon esprit à la notion de prototype nécessairement reproduit industriellement. Bien des protodocuments, dans le sens que je suggère, ne seront pas reproduits. Les sources d'un historien, comme les tessons d'un archéologue, sont bien pour ces derniers des protodocuments, c'est à dire des entités uniques qu'ils sont capables de «lire» car ils ont acquis les compétences nécessaires à cet effet, intégré le contrat de lecture commun à leur spécialité. Le protodocument est ici le document de S. Briet, celui qui fait preuve. Dès lors, mon acception est surtout plus précise et plus claire que celle de Pédauque qui laisse largement place à l'interprétation.

J'ai compris dans cette notion aussi la première épreuve d'un texte car elle est bien aussi la preuve de la production de son auteur.

Mon premier objectif était de comprendre et non d'être opérationnel. Néanmoins, cette distinction éclaire, par exemple, la proximité et la différence entre l'archivistique et la muséologie, d'un côté, qui s'occupent de protodocuments et la bibliothéconomie, de l'autre, qui privilégie les documents et donc tous les outils associés aux uns et aux autres.

Les FRBR (Functional Requirements for Bibliographic Records) distinguent une frontière qui ne vaut pas forcément pour une définition globale, mais qui semble opérationnelle dans le monde des "documents édités" : il y aurait d'un côté les travaux "intellectuels" de création du document (ce qui au passage signifie que les bibliothèques ne considère comme tels, i.e. comme méritant l'insertion dans un catalogue de bibliothèque, que les "lus" qui relèvent d'une production "intellectuelle"), dans laquelle on distinguerait les "œuvres" (en général l'original) et ses "expressions" (par exemple les diverses traductions)... et de l'autre côté les "incarnations" de ce travail intellectuel dans des "manifestations", éventuellement multiples ("items").

On trouvera ici et une bonne présentation des FRBR. Les FRBR marquent en fait, mais de façon partielle en mettant en avant la notion d’œuvre et celle de manifestation, la différence entre les dimensions du document (Vu, lu, su), et non celle entre un protodocument et un document. Ces derniers ont bien toujours les trois dimensions.

Oui les bibliothèques mettent plutôt l'accent dans leur modèle sur le «lu», le contenu, du fait de l'utilisation de la non-rivalité de l’œuvre, c'est-à-dire des possibilités de partage des documents. C'est ce que j'ai tenté de montrer dans le dernier numéro du Documentaliste ou à Marseille récemment.

La tendance à confondre traces/protodocuments (i.e. recueil organisé de traces ou de sources, ou encore de "témoins") et "documents" (relevant d'une "décision" auctoriale, fut-elle machinique et algorithmique) ne me semble pas porteuse. Notamment quand on regarde les effets du côté du "su" : quels sont les droits (y compris le droit d'appartenir au Domaine public) associés à de tels "documents" sans "intention" ? Comment va-t-on leur associer un "droit moral", surtout si'l est "inaliénable" ? N'est-ce pas trop dangereux pour l'avenir tant du domaine public que du partage "volontaire" de la connaissance ? (..)

Il ne s'agit pas de confondre traces et protodocuments. Si toute trace, comme tout objet, peut devenir un protodocument, toutes les traces et tous les objets ne sont pas des protodocuments. Au contraire, rares sont celles et ceux qui ont acquis ce statut. Pour cela il faut bien, en effet, qu'il y ait eu une intention, c'est à dire un auteur ou un «inventeur» qui ait intégré la trace ou l'objet dans un système documentaire par un contrat de lecture lui donnant une signification pour une communauté. Donc la question du droit moral ou du domaine public n'est pas différente de celle qui est débattue aujourd'hui.

Il me semble néanmoins que les réactions de Hervé comme de Jean-Daniel soulignent d'une autre difficulté de plus en plus manifeste avec les développements du web (web 2.0 et web des données) et que ne lève en effet pas la distinction entre protodocument et document.

En réalité nous sommes de plus en plus confrontés à des néodocuments construits à la volée à partir de sources diverses et visant à répondre à nos requêtes ou même à les prévenir grâce aux calculs réalisés sur les traces que nous laissons. Dans ce nouveau régime documentaire, l'intention, l'auteur ou l'inventeur est le lecteur lui-même. Il gagne en efficacité et surtout en dépenses cognitives, du moins c'est l'objectif, mais il est pris dans un processus qui lui échappe et dont il ne peut mesurer les termes car il lui reste opaque.

Une version radicale de ce mouvement vers des néodocuments est présentée par le rapport sur les produits de données signalé et commenté récemment par Hubert Guillaud.

Dans cet horizon, les protodocuments sont réduits à des unités documentaires, les données, réunies en bases de données. Il s'agit bien ici de traces intentionnellement collectées et réunies selon un protocole qui s'apparente à un contrat de lecture permettant de les interpréter en croisant les bases entre elles. Mais les documents s'effacent progressivement pour un pilotage de services censés répondre à nos besoins sans dépense cognitive de notre part. L'exemple le plus parlant est peut-être celui de la carte géographique pour piloter une automobile. Celle-ci est remplacée d'abord par un GPS qui calcule la position et les itinéraires en temps réel et l'affiche sur un écran, puis par une voiture automatique capable de se rendre toute seule d'un point A à un point B, en tenant compte du trafic.

Intégrer un processus complexe et donc effacer les documents qui le décrivait n'est pas nouveau, c'est le propre même d'une machine. La différence est qu'aujourd'hui, la machine est une machine documentaire, c'est à dire une machine qui s'appuie directement sur des protodocuments qu'elle lit et interprète toute seule pour engager l'avenir. Il y a là matière à réflexions.

Actu du 12 octobre

À lire absolument le billet de A-M Chabin et la discussion qui le suit sur la traduction de record en français, russe, espagnol, allemand, roumain. Une superbe discussion sur la notion de document d'archive. Traductibilité, 10 oct 2011