Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

Mot-clé - 235. LES MUTATIONS DU DOCUMENT ; Les trois dimensions ; Définition du document

Fil des billets

jeudi 23 août 2012

Vu, lu, su et UX

Tout comme j'avais été interpelé par cette affirmation de la designer Jannet Murray (ici) :

J'ai deux éclairages sur ce qu'est un média que je peux présenter brièvement ici : le premier est que tout média est composé de trois parties : l'inscription, la transmission et la représentation ; le second est que le paradigme le plus productif pour le designer pour penser un média est, de mon point de vue, celui de l'attention captée (focused attention).

Je retrouve dans cette lumineuse présentation de l'architecture de l'information de Matthieu Mingasson à ParisWeb 2010 (repéré grâce à F. Cavazza) un schéma familier.

M._Mingasson-ParisWeb-2010_2_.jpg

En effet, on y retrouve les éléments de la théorie du document (présentation courte, medium, longue) : la forme (vu, design), le texte ou le fond (lu, contenu) et le medium ou la fonction (su, technologie). Nuance tout de même, ici la triade est orientée vers un objectif qui unifie les trois facettes, tandis que dans la théorie du document, il s'agit d'un contrat de lecture. En réalité, la temporalité est simplement différente. La présentation de M. Mingasson présente une méthode pour construire un site web avec une finalité immédiate. Le contrat de lecture est bien alors entièrement compris dans l'objectif. Si l'on raisonne sur un temps plus long, le site devient alors un document dont l'objectif initial peut se diluer, mais son usage est toujours dépendant de la validité d'un contrat de lecture.

C'est aussi l'occasion pour moi de rappeler que les inscriptions pour le colloque international sur l'architecture de l'information sont ouvertes (ici)

vendredi 24 février 2012

Vu, Lu, Su par le design

Janet Murray, professeur design à Georgia Tech, vient de publier aux Presses du MIT un important livre sur le design du numérique : Inventing the Medium: Principals of Interaction Design as a Cultural Practice ici. Elle tient aussi un blog qui accompagne et actualise le livre (). On peut lire enfin un long et passionnant entretien avec H. Jenkins ().

Je retiens entre autres ceci dans l'entretien (trad JMS) :

J'ai deux éclairages sur ce qu'est un média que je peux présenter brièvement ici : le premier est que tout média est composé de trois parties : l'inscription, la transmission et la représentation ; le second est que le paradigme le plus productif pour le designer pour penser un média est, de mon point de vue, celui de l'attention captée (focused attention).

On retrouve ainsi sous sa plume les trois facettes Vu (inscription), Lu (représentation) et Su (transmission), ainsi que l'insistance sur l'économie de l'attention. Je suis heureux de constater cette convergence de la réflexion sur le design des médias avec mes propres réflexions, ce qui me conforte dans l'insistance sur la notion d'architecture de l'information.

Voici comment J. Murray décline sur le numérique les trois principes sur son blog (trad JMS) :

  • Toutes choses faites de bits et de codes informatiques relèvent d'un seul média, le média numérique avec ses affordances originales.
  • Concevoir un élément quelconque dans ce nouveau médium relève d'un effort collectif plus large consistant à construire du sens au travers de l'invention et de l'affinement de conventions du média numérique.
  • En élargissant les conventions de construction du sens qui composent la culture humaine, nous élargissons notre capacité à comprendre le monde et à entrer en relation avec les autres.

On y retrouve aussi la notion de contrat de lecture.

mardi 04 octobre 2011

Protodocument, document et néodocument

Hervé Le Crosnier dans le commentaire d'un billet récent me reproche d'avoir détourné la notion de protodocument telle qu'initiée par Pédauque. Je plaide (presque) coupable, pour la bonne cause. Mais le commentaire de Hervé et le rebond de Jean-Daniel Zeller qui le suit ouvre, à mon avis, d'autres questions, non sur le(proto)document mais plutôt sur le (néo)document qui nait sous nos yeux et au sujet duquel l'analyse reste encore bien faible.

Je reprends les propos de Hervé (en italiques) suivis de mes réponses :

D'après ma lecture de Pédauque, j'avais une autre vision du "protodocument". Non pas le prototype qui sera soumis au processus industriel de la duplication, mais un ensemble informel de "sources" (un terme utilisé par les historiens et les éditeurs de classiques, curieusement absent de ton texte), regroupés par un(e) "auteur(e)" (i.e. une entité responsable de la création du document, si l'on reprend la formule abstraite de définition du Dublin Core... qui peut donc être machinique, créative-personnelle, ou anonyme, notamment "par excès d'auteurs", comme dans Wikipédia) en vue de produire un "document" (une trace "intentionnelle" portant mémoire d'un événement ou de son interprétation). Tu proposes ici une autre définition (en tout cas différente de celle que j'avais compris/interprété), qui me semble peu opérationnelle.

Oui, j'ai peut-être employé le terme protodocument dans un sens (légèrement) différent de celui de Pédauque. Le terme est apparu dans le 3ème texte de Pédauque qui distinguait les proto-documents (collection de matériels documentaires, plus ou moins cohérents et organisés) du document (entité transmissible et socialement instituée).

Mais non, le terme ne se réduit pas dans mon esprit à la notion de prototype nécessairement reproduit industriellement. Bien des protodocuments, dans le sens que je suggère, ne seront pas reproduits. Les sources d'un historien, comme les tessons d'un archéologue, sont bien pour ces derniers des protodocuments, c'est à dire des entités uniques qu'ils sont capables de «lire» car ils ont acquis les compétences nécessaires à cet effet, intégré le contrat de lecture commun à leur spécialité. Le protodocument est ici le document de S. Briet, celui qui fait preuve. Dès lors, mon acception est surtout plus précise et plus claire que celle de Pédauque qui laisse largement place à l'interprétation.

J'ai compris dans cette notion aussi la première épreuve d'un texte car elle est bien aussi la preuve de la production de son auteur.

Mon premier objectif était de comprendre et non d'être opérationnel. Néanmoins, cette distinction éclaire, par exemple, la proximité et la différence entre l'archivistique et la muséologie, d'un côté, qui s'occupent de protodocuments et la bibliothéconomie, de l'autre, qui privilégie les documents et donc tous les outils associés aux uns et aux autres.

Les FRBR (Functional Requirements for Bibliographic Records) distinguent une frontière qui ne vaut pas forcément pour une définition globale, mais qui semble opérationnelle dans le monde des "documents édités" : il y aurait d'un côté les travaux "intellectuels" de création du document (ce qui au passage signifie que les bibliothèques ne considère comme tels, i.e. comme méritant l'insertion dans un catalogue de bibliothèque, que les "lus" qui relèvent d'une production "intellectuelle"), dans laquelle on distinguerait les "œuvres" (en général l'original) et ses "expressions" (par exemple les diverses traductions)... et de l'autre côté les "incarnations" de ce travail intellectuel dans des "manifestations", éventuellement multiples ("items").

On trouvera ici et une bonne présentation des FRBR. Les FRBR marquent en fait, mais de façon partielle en mettant en avant la notion d’œuvre et celle de manifestation, la différence entre les dimensions du document (Vu, lu, su), et non celle entre un protodocument et un document. Ces derniers ont bien toujours les trois dimensions.

Oui les bibliothèques mettent plutôt l'accent dans leur modèle sur le «lu», le contenu, du fait de l'utilisation de la non-rivalité de l’œuvre, c'est-à-dire des possibilités de partage des documents. C'est ce que j'ai tenté de montrer dans le dernier numéro du Documentaliste ou à Marseille récemment.

La tendance à confondre traces/protodocuments (i.e. recueil organisé de traces ou de sources, ou encore de "témoins") et "documents" (relevant d'une "décision" auctoriale, fut-elle machinique et algorithmique) ne me semble pas porteuse. Notamment quand on regarde les effets du côté du "su" : quels sont les droits (y compris le droit d'appartenir au Domaine public) associés à de tels "documents" sans "intention" ? Comment va-t-on leur associer un "droit moral", surtout si'l est "inaliénable" ? N'est-ce pas trop dangereux pour l'avenir tant du domaine public que du partage "volontaire" de la connaissance ? (..)

Il ne s'agit pas de confondre traces et protodocuments. Si toute trace, comme tout objet, peut devenir un protodocument, toutes les traces et tous les objets ne sont pas des protodocuments. Au contraire, rares sont celles et ceux qui ont acquis ce statut. Pour cela il faut bien, en effet, qu'il y ait eu une intention, c'est à dire un auteur ou un «inventeur» qui ait intégré la trace ou l'objet dans un système documentaire par un contrat de lecture lui donnant une signification pour une communauté. Donc la question du droit moral ou du domaine public n'est pas différente de celle qui est débattue aujourd'hui.

Il me semble néanmoins que les réactions de Hervé comme de Jean-Daniel soulignent d'une autre difficulté de plus en plus manifeste avec les développements du web (web 2.0 et web des données) et que ne lève en effet pas la distinction entre protodocument et document.

En réalité nous sommes de plus en plus confrontés à des néodocuments construits à la volée à partir de sources diverses et visant à répondre à nos requêtes ou même à les prévenir grâce aux calculs réalisés sur les traces que nous laissons. Dans ce nouveau régime documentaire, l'intention, l'auteur ou l'inventeur est le lecteur lui-même. Il gagne en efficacité et surtout en dépenses cognitives, du moins c'est l'objectif, mais il est pris dans un processus qui lui échappe et dont il ne peut mesurer les termes car il lui reste opaque.

Une version radicale de ce mouvement vers des néodocuments est présentée par le rapport sur les produits de données signalé et commenté récemment par Hubert Guillaud.

Dans cet horizon, les protodocuments sont réduits à des unités documentaires, les données, réunies en bases de données. Il s'agit bien ici de traces intentionnellement collectées et réunies selon un protocole qui s'apparente à un contrat de lecture permettant de les interpréter en croisant les bases entre elles. Mais les documents s'effacent progressivement pour un pilotage de services censés répondre à nos besoins sans dépense cognitive de notre part. L'exemple le plus parlant est peut-être celui de la carte géographique pour piloter une automobile. Celle-ci est remplacée d'abord par un GPS qui calcule la position et les itinéraires en temps réel et l'affiche sur un écran, puis par une voiture automatique capable de se rendre toute seule d'un point A à un point B, en tenant compte du trafic.

Intégrer un processus complexe et donc effacer les documents qui le décrivait n'est pas nouveau, c'est le propre même d'une machine. La différence est qu'aujourd'hui, la machine est une machine documentaire, c'est à dire une machine qui s'appuie directement sur des protodocuments qu'elle lit et interprète toute seule pour engager l'avenir. Il y a là matière à réflexions.

Actu du 12 octobre

À lire absolument le billet de A-M Chabin et la discussion qui le suit sur la traduction de record en français, russe, espagnol, allemand, roumain. Une superbe discussion sur la notion de document d'archive. Traductibilité, 10 oct 2011

lundi 19 septembre 2011

Document et protodocument

Il semble que la théorie du document commence à agiter un peu la blogosphère (ici ou ). Il paraît alors utile de se mettre d'accord parce qu'on entend par « document ». C'est une discussion ancienne, qui je crois peut être maintenant tranchée. J'y consacre tout un chapitre dans le livre à venir, mais pour alimenter dès à présent les discussions qui s'amorcent, voici quelques éléments de définition.

Inspirée de Bruno Bachimont, qui dans un cours récent à l'EBSI tente de préciser les conséquences de la bascule du document vers le numérique, une première définition du document pourrait être la suivante : Un document est une trace permettant d’interpréter un évènement passé à partir d’un contrat de lecture. Nous retrouvons bien les trois dimensions, matérielle avec la trace (vu), intellectuelle avec l’interprétation (lu), mémorielle avec l’évènement passé (su), ainsi que la nécessaire construction sociale avec le contrat.

La notion de trace permet d’élargir la définition du document à toutes sortes d’objets comme l’avait proposé Suzanne Briet dans les années 50. Une étoile dans le ciel, une antilope, pour reprendre ses exemples, peuvent être des documents pourvu qu’elles soient les témoins d’un savoir inscrit dans un système documentaire. Ainsi les documents sont très divers, depuis les contrats, factures, bulletins de paie, bordereaux, circulaires, lois et règlements, cartes d’identité, permis variés, jusqu’aux romans, albums, films, photos d’actualité en passant par les pièces archéologiques, les données scientifiques, les articles de revues, les objets muséaux et aussi les cartes de visite, les faire-parts, les petites annonces, les affiches publicitaires et l’on pourrait naturellement prolonger indéfiniment cette liste à la Prévert. L’interprétation de chacun passe par le régime documentaire auquel est rattachée la trace. Celui-ci peut être très varié, juridique, fictionnel, scientifique, coutumier, amical, etc. Pour interpréter un document correctement, il est nécessaire d’avoir assimilé les clés d’entrée de ces régimes. Enfin, la référence à un évènement passé ne signifie pas nécessairement la relation de cet évènement, mais bien que le document fait le lien entre quelque chose qui s’est déroulé dans le passé dont il est la trace et aujourd’hui. La trace peut être fortuite, un indice, ou construite, un texte.

Le document est une façon de retrouver notre passé et, nécessairement, de le reconstruire en fonction de notre présent pour orienter notre futur. Ce billet que vous consultez est un document, il est la trace de l’analyse que j’ai construite à un moment donné et que vous réinterprétez par rapport à votre présent, à partir de nos habitudes partagées de l’écriture-lecture d’un billet de blogue. Son objectif est d'esquisser une définition du document utile pour nous orienter à l'avenir sur ces questions.

Mais cette première définition ne permet pas de rendre compte d’une qualité essentielle du document ordinaire qui autorise sa mise en système : sa reproductibilité, sa plasticité, son traitement. Sans doute n’importe quel objet peut devenir un document, mais il reste alors unique. C’est en quelque sorte un prototype documentaire, disons un protodocument. Le document ordinaire est un texte, une représentation formelle de ce prototype sur un support maniable. Si le protodocument est déjà d’ordre textuel, il pourra être directement la matrice du document, comme dans le cas de la copie des scribes ou de l’imprimé. Dans le cas contraire, des textes viendront documenter le protodocument, jusqu’à parfois le remplacer, depuis les notices jusqu’aux enregistrements analogiques. Le numérique a démultiplié ces possibilités manupulatoires, c'est l'essentiel de sa force.

La définition du célèbre bibliothécaire indien Shiyali Ramamrita Ranganathan insiste, elle, sur ses qualités manipulatoires : un document est une micro-pensée enregistrée (embodied micro thought) sur papier ou sur un autre support, qui permet une manipulation physique facile, un transport dans l’espace et une préservation dans le temps (cité par Buckland, trad JMS). Mais cette définition a le défaut inverse d’oublier les protodocuments et ne rend pas compte de la valeur sociale du processus documentaire. Nous pouvons alors articuler les deux définitions : Un protodocument est une trace permettant d’interpréter un évènement passé à partir d’un contrat de lecture. Un document est la représentation d’un protodocument sur un support, pour une manipulation physique facile, un transport dans l’espace et une préservation dans le temps.

Si l’on poursuit le raisonnement, la multiplication des documents et des genres dans toutes sortes de registres et leur transformation témoignent d’une relation fiévreuse à notre passé, une sorte d’interrogation existentielle sur notre présent face à un futur angoissant dont les termes se renouvellent sous nos yeux. Mieux ou pire, le numérique par ses capacités calculatoires permet de reconstruire des documents à la demande et nous donne l'illusion d'avoir toutes les réponses à nos questions avant même qu'elles ne soient posées, comme si notre futur était un destin déjà inscrit dans les machines.

mercredi 15 septembre 2010

Théories du document

À la lecture de l'actualité, générale ou celle des Digital Humanities, je me disais que décidément on manquait d'une meilleure compréhension de la notion de document. Niels Lund a fait avec une collègue une excellente recension des théories à ce sujet dans laquelle il insiste sur l'originalité des apports francophones. Paradoxalement ceux-là paraissent bien méconnus au Québec ou dans l'Hexagone. Cela n'est pas nouveau. P. Otlet ou S. Briet ont été « redécouverts » par un professeur de Berkeley M. Buckland et la dernière rééditée en anglais, mais jamais en français..

Niels Windfeld Lund et Roswitha Skare, “Document Theory,” dans Encyclopedia of Library and Information Sciences, Third Edition, vol. 1, 1 vol., 2010, 1632-1639. (ici sur abonnement)

Voici la traduction du résumé de l'article :

Cet article donne une vue d'ensemble du développement historique des réflexions théoriques sur le document et de la formulation des théories du document. Partant de son prédécesseur latin documentum et des pratiques de la bureaucratie des États européens depuis le dix-septième siècle, le premier intérêt pour une théorie du document a été professionnel et se repère au début du vingtième siècle avec les noms de Paul Otlet et Suzanne Briet. Tandis que la notion de document et de documentation a été bien établie vers 1930, elle a été remplacée par celle d'information après la seconde guerre mondiale, au moins chez les anglophones. Néanmoins, à la même époque, une autre sorte de théorie du document a vu le jour, une théorie critique où l'on retrouve les noms de Michel Foucault, Harold Garfinkel et Dorothy E. Smith. Tandis que la théorie du document « professionnelle » développée par Paul Otlet et les autres insistait sur les connaissances plus ou moins contenus dans les documents et sur la façon dont quelque chose pouvait devenir document, la théorie générale développée par les théoriciens critiques comme Michel Foucault se préoccupait plus de ce qu'était et faisait un document. Depuis les années quatre-vingt-dix, on observe un renouveau de l'intérêt pour la notion de document et de documentation toujours à l'intérieur des sciences de l'information et des bibliothèques, avec des auteurs comme Michael Buckland, Ronald Day, and Bernd Frohmann. Ensemble avec un accent mis sur le document numérique, des théoriciens du document en Amérique du nord, en Scandinavie et en France ont souligné la complexité d'une théorie du document et la nécessité d'approches complémentaires articulant les dimensions physiques, sociales et culturelles pour comprendre ce qu'ils sont et ce qu'ils font.

Et voici en complément, quelques éléments de mon cru sur cette question, puisant largement dans l'article ci-dessus et dans les réflexions du RTP-DOC (ici) :

Pour la plupart des textes réglementaires ou des normes, le document est un objet (matériel ou électronique) sur lequel est consignée une information, en anglais on dira un record, un enregistrement. L’objet a une forme et l’information est un texte, au sens large c'est-à-dire aussi bien de l’écrit que de l’image ou du son représentés par des symboles. De ces premières définitions, il faut surtout retenir le terme « consigné ». Les sciences de l’information se sont construites autour de cette notion d’enregistrement, sans toujours bien le concevoir. Quand on y parle d’information il s’agit implicitement d’une information consignée.

Mais ces définitions officielles, aussi opérationnelles soient-elles pour régler bien des situations, restent à la surface des choses. Un document ne se réduit pas à sa forme et son contenu, sinon tout écrit en serait un. Dire qu'un écrit est document, c'est lui donner un statut, une fonction particulière. Plus précisément, un document a deux fonctions complémentaires qui se sont affirmées au cours des siècles avec la mise en place de procédures spécifiques : transmettre et prouver. La fonction principale du document est donc mémorielle : on enregistre une information sur un objet pour pouvoir la transmettre ou s’y référer. L’ensemble du système documentaire est en quelque sorte notre mémoire externe pour paraphraser M. Serres (ici).

Le RTP-DOC, au cours d’une réflexion collective, a proposé une représentation tri-dimensionnelle pour rendre compte de ces différentes facettes : forme, contenu ou texte et médium (ici). Les deux premières dimensions sont les plus communément indiquées, la troisième, le médium, renvoie à sa fonction sociale. En voici un petit résumé rapide que j’ai un peu adapté.

La première dimension du document, celle de la forme, est anthropologique. Il s’agit du rapport de notre corps et de nos sens à l’objet document, quelle que soit sa forme ou son support. Elle se traduit par l’équation Document = Support + inscription. L’inscription doit être lisible, c'est-à-dire déchiffrable. L’exemple le plus traditionnel est le livre imprimé. Pour bien des documents aujourd’hui, notamment les documents numériques, cette dimension passe par un appareillage spécial pour permettre leur lecture, et leur forme variera suivant le terminal de lecture. Cette dimension privilégie le repérage, le document doit pouvoir être vu.

La seconde dimension est intellectuelle. Il s’agit du rapport de notre cerveau et de ses capacités de raisonnement au contenu du document, au texte donc, quelle que soit la façon dont il est représenté. Elle se traduit par l’équation Document = Code + représentation. La représentation est préjugée être fidèlement rendue par le code, ce qui suppose donc qu’elle soit transposable et qu’elle existe préalablement. Si l’on reprend l’exemple de notre livre imprimé, l’accent cette fois est mis sur le texte, sur son sens sans se préoccuper de son support. La productivité du code informatique autorise une manipulation inédite des documents sous forme numérique, jusqu’à parfois les faire apparaître à la demande. Cette fois il ne suffit plus de repérer, cette dimension met en avant la signification, le document doit pouvoir être compris ou lu.

La troisième dimension est sociale. Il s’agit du rapport de notre humanité, de notre position dans une société, à la fonction du document, à sa capacité de médiation donc, quelle que soit sa forme ou son contenu. Elle se traduit par l’équation Document = Mémoire + transaction. Nous retrouvons alors les fonctions de transmission et de preuve. Dans le cas du livre imprimé, cette transmission passe par l’acte de lecture qui fait que l’information présentée est interprétée par le lecteur qui l’assimile. Le lecteur est transformé par l’information qui a été mise en mémoire sur le livre. Une fois de plus le numérique, cette fois principalement par la capacité des réseaux, modifie considérablement le rapport au temps et à l’espace, à la lecture au sens large et par la même sinon la fonction documentaire, du moins à la place du document dans le social. Cette dernière dimension insiste donc sur la fonction du document, la capacité de son contenu à être assimilé en dépassant le cercle intime et la barrière du temps, autrement à être su. 3-dimensions-document.jpg Chacune de ces dimensions a sa propre logique qui ne réduit pas aux autres et pourtant aucune n’est complètement indépendante des deux autres, et un document doit intégrer et coordonner les trois. Ses modalités anthropologiques (lisibilité-perception, forme-signe), intellectuelles (intelligibilité-assimilation, texte-contenu) et sociales (sociabilité-intégration, médium-relation) doivent non seulement être efficientes prises chacune séparément, mais encore être cohérentes entre elles.

Pour chacune de ces dimensions, les professions traditionnelles du document, archivistes, bibliothécaires et documentalistes, ont développé des outils adaptés : les classifications pour repérer les documents, l’indexation pour rendre compte du contenu et retrouver l’information, la conservation et les services d’accès pour les partager. Le numérique a fait surgir chaque fois des questions nouvelles qui ont été analysées et traitées par des expertises différentes, aussi bien en informatique que dans les sciences humaines et sociales.

J'ai souvent appliqué, sur ce blogue et ailleurs, cette grille de lecture pour analyser les développements actuels et leurs hésitations. Elle me parait tout à fait éclairante. Qu'est-ce que le web, sinon de l'information consignée et donc un système documentaire ?

- page 1 de 2