Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

mercredi 11 janvier 2012

Le papier est un terminal comme un autre

Début 2012, on est loin des prédictions apocalyptiques de Pierre-Marie de Biasi sur l'explosion de la demande de papier et plus encore de leur contraire sur le bureau sans papier (wkp). La consommation de papier graphique a fortement augmenté jusqu'aux années 2000 et aurait plutôt tendance à stagner et reculer ces toutes dernières années, mais il est difficile de dire s'il s'agit du résultat immédiat de la crise (qui réduit les échanges, et donc les documents) ou de l'effet à retardement du numérique (dont les effets sur les pratiques sont plus lents que l'implantation des systèmes), sans doute une combinaison des deux.

Un observateur attentif, Jacques de Rotalier, note que sur les prévisions mondiales 2010-2015 globalement, les zones développées devraient voir leur consommation diminuer légèrement (-1,5%) tandis que celle des zones émergentes devrait augmenter de 4 à 5%. La fusion de ces chiffres donnerait un supplément de consommation mondiale de 2,5 à 3% l’an : on est loin du développement exponentiel du numérique !. On ne dispose pas encore des chiffres pour 2011, mais en France la production de papier à usage graphique a diminué de 3,9% sur les dix premiers mois de l'année, d'après le recueil mensuel de la COPACEL. J'actualiserai les chiffres quand ils seront connus. En résumé la consommation de papier graphique reste en chiffres absolus très forte, même si elle a tendance à se tasser ces dernières années, notamment à cause de la réduction du papier journal.

Actualisation, conférence de presse de la COPACEL (signalée par J de Rotalier, merci à lui)

Donsommation-papier-France.jpg

Consommation-papier-France-2.bmp

La problématique courante qui tend à faire du numérique un substitut au papier est ambigüe. En réalité, la question est moins celle du numérique que de l'affichage ou de la sortie, de l'artefact qui autorise la lecture, du support sur lequel s'affichent les signes, qui bascule selon les usages et les opportunités entre l'écran ou le papier imprimé. Pour bien analyser les positions respectives de l'un et de l'autre, il faut admettre qu'il ne s'agit plus aujourd'hui que de deux modalités complémentaires, éventuellement concurrentes, d'affichage de documents tous numériques. On peut, pour commencer, visionner cette petite vidéo qui m'a donné l'idée de ce billet :

Hello Little Printer, available 2012 from BERG on Vimeo.

Repéré par H. Bienvault

Il y a plus de formats différents de papier imprimé correspondant à des usages différents que de types d'écran. Délà le codex du livre n'est pas celui du journal, l'un et l'autre, se déclinant en diverses familles selon le genre ou la régularité des publications. Mais le codex n'est pas, non plus, la seule forme possible pour des documents imprimés. La feuille simple connait aussi divers formats depuis l'affiche jusqu'au Post-it en passant par la liste de course et surtout l'explosion de la feuille A4, sortie d'imprimante, agrafée ou non. La vidéo nous montre que les imprimantes ne sont pas, non plus, condamnées à ce seul format et que les messages instantanés peuvent aussi se distribuer sur papier, y compris à distance.

Ce qui est sûr, c'est qu'aujourd'hui les documents, quels que soient leur format et leur modalité d'affichages sont tous à l'origine numériques, à de rares exceptions près. Sachant que l'écran et le papier restent privilégiés la question devient : quel est le support le plus opportun pour un usage donné ? Entre l'écran et le papier, chacun à ses avantages. Sans prétendre faire le tour de la question, on peut remarquer déjà des avantages contrastés entre l'un et l'autre selon trois critères de base : la permanence, la portabilité et la lecture. Je les ai résumés sur un petit tableau.

Papier-vs-ecran.png

Le papier imprimé l'emporte sur l'écran sur la permanence à court terme, tout simplement parce qu'il ne risque pas de s'effacer contrairement à l'écran, c'est cet avantage qui est mis en avant dans la vidéo. Mais à moyen terme, l'écran l'emporte car le papier est encombrant et devient vite difficile à retrouver, tandis que les serveurs gardent en permanence l'accessibilité immédiate des documents sur écran. Nul ne connait à long terme la possibilité de réafficher un document sur écran, tandis que le papier a fait ses preuves pour la conservation, pour peu que l'on prenne les bonnes mesures.

Un document individuel est en général plus facile à transporter sur papier, pourvu qu'il ne soit pas trop volumineux. Inversement, dès que le nombre de documents s'accroit, l'écran qui facilite l'ubiquité reprend l'avantage.

Enfin les modalités de lecture ont des avantages aussi contrastés dans les deux cas. Le feuilletage est plus simple sur papier, car il autorise la vue simultanée des feuilles sans trop d'encombrement de l'espace. Par contre s'il s'agit de naviguer d'un document à l'autre de façon plus ou moins aléatoire et d'y exécuter des traitements, l'écran est plus performant.

Sans doute on pourrait discuter ces affirmations et proposer d'autres critères. Je voulais juste ici suggérer des pistes de raisonnement. Celles-ci me permettent de compléter par une ligne mon tableau des différents modèles de publication déjà présenté dans un précédent billet. Je n'ai pas le temps de commenter. Ce sera pour une autre fois. Mais j'attire votre attention sur le critère de l'espace et du temps pour expliquer aussi bien les différents formats papiers (y compris l'impossibilité de rendre compte directement du flot) que les formats d'écran.

Le papier et les cinq modèles d'industries de la mémoire

lundi 17 octobre 2011

«Record» et «data»

Pour poursuivre la réflexion amorcée dans le précédent billet, voici une interrogation sur le corpus anglophone de N-Gram des mots record et records.

N-Gram_Records-Record.jpg

On peut faire plusieurs constats :

  • Le mot est nettement plus utilisé dans la littérature anglophone que « document » dans la littérature francophone en 1800, sans doute à cause de la différence de culture juridique des deux mondes.
  • Au cours du 19e document rattrape record et les deux mots ont une fréquence comparable, chacun dans leur bassin linguistique.(document est beaucoup moins usité dans le monde anglophone).
  • Enfin, on aperçoit nettement l'arrivée de l'enregistrement sonore et visuel à partir de 1900.

Maintenant pour ajouter à la perplexité de Jean-Daniel, voici ce que cela donne lorsqu'on ajoute le mot data :

N-Gram-records-record-data.jpg

Le mot n'apparait qu'au début du 20e pour exploser après la seconde guerre mondiale, et il s'impose immédiatement dans la littérature, montrant à quel point l'informatique occupe brutalement nos écrits, du moins ceux récoltés par les bibliothèques, sinon nos pensées. Juste avec ce paramètre indirect, on subodore qu'il n'est pas anodin de passer du « web des documents » au « web des données »

jeudi 13 octobre 2011

« Record », document, information, données

Ce billet m'a été inspiré par celui très stimulant de Marie-Anne Chabin sur la difficulté de traduction de l'anglais record en français et de la discussion nourrie qu'il a suscité. Le débat a tourné principalement autour de la validité de l'équivalence entre record et document, décliné en plusieurs langues, russe, espagnol, allemand, roumain...

En réalité, le débat entre archivistes avait une vocation opérationnelle immédiate et essentielle : comment nommer les objets que l'on manipule pour bien se faire comprendre et lever les ambiguïtés. Dans ce contexte, il a toute sa légitimité. Mais vu de l'extérieur de ce monde il prend une tournure différente et est révélateur d'autres questions.

Le postulat de départ est que l'anglais record a une signification précise de « document probant », illustrée par la différence entre la liste de course et le ticket de caisse qui valide l'acte d'achat. Si l'on se réfère à l'''Oxford Dictionnary'', on retrouve bien cet accent mis d'abord sur la preuve (même s'il faut ajouter l'élargissement à toutes formes d'enregistrement, comme le disque).

Il est intéressant de constater qu'il a donné en français le « record sportif » : Empr. à l'angl. record « enregistrement, document écrit (pour conserver un témoignage) » (av. 1300 ds NED), d'où « fait exceptionnel (notamment un exploit sportif) digne d'être enregistré » (1883, ibid.), de l'a. fr. recort, record (v. recors). (ATILF).

Mais l'aller et retour entre les deux langues est plus ancien. Voilà ce que nous dit sur l'étymologie du mot l'Oxford Dictionnary : Middle English: from Old French record 'remembrance', from recorder 'bring to remembrance', from Latin recordari 'remember', based on cor, cord- 'heart'. The noun was earliest used in law to denote the fact of being written down as evidence. The verb originally meant ‘narrate orally or in writing’, also ‘repeat so as to commit to memory’

On peut comparer cette étymologie avec celle du mot « document ». Voilà ce que nous dit l'ATILF à ce sujet : Empr. au lat. class. documentum « enseignement », b. lat. « acte écrit qui sert de témoignage, preuve », dér. de docere « enseigner, informer ». Le même article signale comme première signification : Enseignement, oral ou écrit, transmis par une personne.

Ainsi selon leur étymologie, le « record » anglais et le « document » français ont quasiment la même signification, mais proviennent de deux mots latins différents : le premier fait référence à la mémoire et la preuve, le second à la transmission et la leçon.

J'ai déjà eu l'occasion de montrer que la popularisation du mot « document » s'est accomplie au XIXe siècle, très vraisemblablement sous la poussée de la révolution scientifique qui avait besoin d'artefacts qui confondent justement ces deux fonctions. La preuve est une leçon pour l'avancement de la science et mémoire et transmission vont de pair. Le mot à partir de ce moment a pris un sens plus large et de plus en plus vague, qui après la seconde guerre mondiale a été de plus en plus remplacé par le polymorphe « information », privilégiant toujours la transmission plutôt que la mémoire.

Le record anglais n'a guère trouvé que dans les techniques d'enregistrement du son et de l'image, apparues à la fin du XIXe, l'occasion d'élargir ses horizons. Ainsi, mis à part le disque et la bande magnétique, le record a gardé son sens précis attaché à la preuve qui sied aux archivistes.

Aujourd'hui avec le numérique et la relation différente à la vérité qui l'accompagne, d'autres notions émergent en phase avec les capacités de calcul comme ressources (resources) puis surtout données (data), directement traduites de l'anglais par les échanges entre informaticiens. Ces mots ne sont pas anodins non plus. Ils font référence à des entités déjà existantes, déposées, neutres, sans plus de relations avec les fonctions de mémoire et preuve, ni transmission et leçon. Il y a là matière à réflexion.

Actu du 7 décembre 2011

Voir aussi la discussion sur « document d'ativité » sur la page GSI de Linked'in

mardi 04 octobre 2011

Protodocument, document et néodocument

Hervé Le Crosnier dans le commentaire d'un billet récent me reproche d'avoir détourné la notion de protodocument telle qu'initiée par Pédauque. Je plaide (presque) coupable, pour la bonne cause. Mais le commentaire de Hervé et le rebond de Jean-Daniel Zeller qui le suit ouvre, à mon avis, d'autres questions, non sur le(proto)document mais plutôt sur le (néo)document qui nait sous nos yeux et au sujet duquel l'analyse reste encore bien faible.

Je reprends les propos de Hervé (en italiques) suivis de mes réponses :

D'après ma lecture de Pédauque, j'avais une autre vision du "protodocument". Non pas le prototype qui sera soumis au processus industriel de la duplication, mais un ensemble informel de "sources" (un terme utilisé par les historiens et les éditeurs de classiques, curieusement absent de ton texte), regroupés par un(e) "auteur(e)" (i.e. une entité responsable de la création du document, si l'on reprend la formule abstraite de définition du Dublin Core... qui peut donc être machinique, créative-personnelle, ou anonyme, notamment "par excès d'auteurs", comme dans Wikipédia) en vue de produire un "document" (une trace "intentionnelle" portant mémoire d'un événement ou de son interprétation). Tu proposes ici une autre définition (en tout cas différente de celle que j'avais compris/interprété), qui me semble peu opérationnelle.

Oui, j'ai peut-être employé le terme protodocument dans un sens (légèrement) différent de celui de Pédauque. Le terme est apparu dans le 3ème texte de Pédauque qui distinguait les proto-documents (collection de matériels documentaires, plus ou moins cohérents et organisés) du document (entité transmissible et socialement instituée).

Mais non, le terme ne se réduit pas dans mon esprit à la notion de prototype nécessairement reproduit industriellement. Bien des protodocuments, dans le sens que je suggère, ne seront pas reproduits. Les sources d'un historien, comme les tessons d'un archéologue, sont bien pour ces derniers des protodocuments, c'est à dire des entités uniques qu'ils sont capables de «lire» car ils ont acquis les compétences nécessaires à cet effet, intégré le contrat de lecture commun à leur spécialité. Le protodocument est ici le document de S. Briet, celui qui fait preuve. Dès lors, mon acception est surtout plus précise et plus claire que celle de Pédauque qui laisse largement place à l'interprétation.

J'ai compris dans cette notion aussi la première épreuve d'un texte car elle est bien aussi la preuve de la production de son auteur.

Mon premier objectif était de comprendre et non d'être opérationnel. Néanmoins, cette distinction éclaire, par exemple, la proximité et la différence entre l'archivistique et la muséologie, d'un côté, qui s'occupent de protodocuments et la bibliothéconomie, de l'autre, qui privilégie les documents et donc tous les outils associés aux uns et aux autres.

Les FRBR (Functional Requirements for Bibliographic Records) distinguent une frontière qui ne vaut pas forcément pour une définition globale, mais qui semble opérationnelle dans le monde des "documents édités" : il y aurait d'un côté les travaux "intellectuels" de création du document (ce qui au passage signifie que les bibliothèques ne considère comme tels, i.e. comme méritant l'insertion dans un catalogue de bibliothèque, que les "lus" qui relèvent d'une production "intellectuelle"), dans laquelle on distinguerait les "œuvres" (en général l'original) et ses "expressions" (par exemple les diverses traductions)... et de l'autre côté les "incarnations" de ce travail intellectuel dans des "manifestations", éventuellement multiples ("items").

On trouvera ici et une bonne présentation des FRBR. Les FRBR marquent en fait, mais de façon partielle en mettant en avant la notion d’œuvre et celle de manifestation, la différence entre les dimensions du document (Vu, lu, su), et non celle entre un protodocument et un document. Ces derniers ont bien toujours les trois dimensions.

Oui les bibliothèques mettent plutôt l'accent dans leur modèle sur le «lu», le contenu, du fait de l'utilisation de la non-rivalité de l’œuvre, c'est-à-dire des possibilités de partage des documents. C'est ce que j'ai tenté de montrer dans le dernier numéro du Documentaliste ou à Marseille récemment.

La tendance à confondre traces/protodocuments (i.e. recueil organisé de traces ou de sources, ou encore de "témoins") et "documents" (relevant d'une "décision" auctoriale, fut-elle machinique et algorithmique) ne me semble pas porteuse. Notamment quand on regarde les effets du côté du "su" : quels sont les droits (y compris le droit d'appartenir au Domaine public) associés à de tels "documents" sans "intention" ? Comment va-t-on leur associer un "droit moral", surtout si'l est "inaliénable" ? N'est-ce pas trop dangereux pour l'avenir tant du domaine public que du partage "volontaire" de la connaissance ? (..)

Il ne s'agit pas de confondre traces et protodocuments. Si toute trace, comme tout objet, peut devenir un protodocument, toutes les traces et tous les objets ne sont pas des protodocuments. Au contraire, rares sont celles et ceux qui ont acquis ce statut. Pour cela il faut bien, en effet, qu'il y ait eu une intention, c'est à dire un auteur ou un «inventeur» qui ait intégré la trace ou l'objet dans un système documentaire par un contrat de lecture lui donnant une signification pour une communauté. Donc la question du droit moral ou du domaine public n'est pas différente de celle qui est débattue aujourd'hui.

Il me semble néanmoins que les réactions de Hervé comme de Jean-Daniel soulignent d'une autre difficulté de plus en plus manifeste avec les développements du web (web 2.0 et web des données) et que ne lève en effet pas la distinction entre protodocument et document.

En réalité nous sommes de plus en plus confrontés à des néodocuments construits à la volée à partir de sources diverses et visant à répondre à nos requêtes ou même à les prévenir grâce aux calculs réalisés sur les traces que nous laissons. Dans ce nouveau régime documentaire, l'intention, l'auteur ou l'inventeur est le lecteur lui-même. Il gagne en efficacité et surtout en dépenses cognitives, du moins c'est l'objectif, mais il est pris dans un processus qui lui échappe et dont il ne peut mesurer les termes car il lui reste opaque.

Une version radicale de ce mouvement vers des néodocuments est présentée par le rapport sur les produits de données signalé et commenté récemment par Hubert Guillaud.

Dans cet horizon, les protodocuments sont réduits à des unités documentaires, les données, réunies en bases de données. Il s'agit bien ici de traces intentionnellement collectées et réunies selon un protocole qui s'apparente à un contrat de lecture permettant de les interpréter en croisant les bases entre elles. Mais les documents s'effacent progressivement pour un pilotage de services censés répondre à nos besoins sans dépense cognitive de notre part. L'exemple le plus parlant est peut-être celui de la carte géographique pour piloter une automobile. Celle-ci est remplacée d'abord par un GPS qui calcule la position et les itinéraires en temps réel et l'affiche sur un écran, puis par une voiture automatique capable de se rendre toute seule d'un point A à un point B, en tenant compte du trafic.

Intégrer un processus complexe et donc effacer les documents qui le décrivait n'est pas nouveau, c'est le propre même d'une machine. La différence est qu'aujourd'hui, la machine est une machine documentaire, c'est à dire une machine qui s'appuie directement sur des protodocuments qu'elle lit et interprète toute seule pour engager l'avenir. Il y a là matière à réflexions.

Actu du 12 octobre

À lire absolument le billet de A-M Chabin et la discussion qui le suit sur la traduction de record en français, russe, espagnol, allemand, roumain. Une superbe discussion sur la notion de document d'archive. Traductibilité, 10 oct 2011

lundi 26 septembre 2011

Vu enfermé, lu décontenancé (Biennale de Lyon)

Dédicace spéciale à Pauline. Petite promenade documentaire à la Biennale de Lyon.

Les œuvres d'art sont des protodocuments et peuvent être analysées à partir des trois dimensions (vu, lu, su). Il est possible même que la valeur artistique d'une œuvre vienne justement de la subversion des places respectives des trois dimensions. Quoi qu'il en soit certains artistes utilisent, plus ou moins consciemment, directement cette grille pour construire leur œuvre. À la Biennale de l'art contemporain de Lyon, deux œuvres, en contraste radical, illustrent chacune à leur manière combien le jeu entre les dimensions peut être stimulant et dérangeant.

Le premier Robert Kusmirowski présente une œuvre monumentale. Au premier niveau du lieu d'exposition on ne voit qu'un mur sinistre surmonté de barbelés délimitant un espace circulaire inaccessible. Le niveau supérieur offre une vue plongeante au-dessus du mur et voilà ce que l'on découvre :

Robert_Kusmirowski-Biennale_Lyon_2011.jpg

Tout dans les couleurs, dans l'organisation des lieux, dans les objets, bibliothèques monumentales, livres, machines crasseuses, bidons, casiers de typographes, renvoie à une organisation documentaire mi-XIXe à mi-XXe avec la suggestion d'un scénario sinistre d'incinération de livres.. On brule les objets (vu), on interdit la transmission (su) par la circularité du mur et le contenu (lu) est absent, déchiré, éparpillé sur le sol. L'ensemble de l’œuvre est construite sur la primauté de la première dimension qui, enfermée et détruite interdit le déploiement des deux autres. Par ailleurs, c'est bien parce que la scène renvoie à un décor familier et qu'elle est exposée à la Biennale que je peux en suggérer une interprétation. En tant qu’œuvre, il s'agit d'un protodocument articulant bien les trois dimensions.

La seconde œuvre, due à Dominique Petitgand, est minimaliste : À la merci (At the mercy). Dans une pièce nue, il n'y a qu'un haut-parleur et un écran de télévision. Dans le haut-parleur une voix de petit garçon lit des mots que répète à sa suite un adulte. L'ensemble forme une longue phrase française qu'il est impossible de comprendre à cause du caractère haché de la lecture ânonnée. Sur l'écran défile les mêmes mots, mais en anglais, que l'on comprend avec un minimum de compétence de cette langue et grâce à la traduction sonore, mais qui sonnent différemment. Les mots les plus longs sont coupés en deux, aussi bien à l'oral qu'à l'écrit, mais nécessairement sur des prononciations différentes, accentuant le caractère déconcertant de l'exercice de lecture. Ici l'accent est mis à l'évidence sur le «lu», perturbé par la triple forme (vu) constituée des deux voix et de l'image des mots redondantes et embrouillantes, car on lit aussi avec les sons (S Dehaene). Le «su» est alors bloqué. Mais, par ailleurs, comme dans l'exemple précédent l'ensemble forme un joli et émouvant poème dont les trois dimensions sont articulées dans un protodocument.

- page 3 de 14 -