Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

vendredi 07 décembre 2012

Métadonnées et raison numérique

Les métadonnées sont attachées à un document pour le représenter dans un langage calculable. Juste une petite réflexion pour ne pas l'oublier, suite à une discussion avec Benoit Habert et les étudiants du master Archinfo sur la notion de métadonnées. Benoit attire mon attention sur cette citation :

Calculer suppose … essentiellement les trois conditions suivantes : 1) Opérer sur des objets symboliques, en conformité à des règles préétablies. 2) Diriger une procédure vers un résultat, prédéterminé dans sa forme mais non dans son contenu. 3) Posséder des critères de succès ou d'échec de la procédure. Gilles Gaston Granger Sciences et réalités Odile Jacob 2001 Paris, p.75

Voilà qui nous renvoie aussi bien à T Berners-Lee et P. Otlet (ici) qu'à la "raison computationnelle" de B. Bachimont, que je préfère appeler raison numérique pour effacer un anglicisme superflu. ()

mardi 06 novembre 2012

La redocumentarisation en 50 diapos

Beaucoup à dire sur ce diaporama de Mary Meeker de mai dernier, mais ce sera pour le cours. Pour ce billet, je retiens déjà une merveilleuse illustration de la redocumentarisation (baptisée de façon imprécise par l'auteur re-Imagination) sur 50 diapositives. La première et la dernière :

Mary-Meeker-1.jpgMary-Meeker-2.jpg

En passant, entre autres, par :

Mary-Meeker-4.jpg Mary-Meeker-5.jpg

L'ensemble est là (diapos 33 à 84) :

KPCB Internet Trends 2012

jeudi 23 août 2012

Vu, lu, su et UX

Tout comme j'avais été interpelé par cette affirmation de la designer Jannet Murray (ici) :

J'ai deux éclairages sur ce qu'est un média que je peux présenter brièvement ici : le premier est que tout média est composé de trois parties : l'inscription, la transmission et la représentation ; le second est que le paradigme le plus productif pour le designer pour penser un média est, de mon point de vue, celui de l'attention captée (focused attention).

Je retrouve dans cette lumineuse présentation de l'architecture de l'information de Matthieu Mingasson à ParisWeb 2010 (repéré grâce à F. Cavazza) un schéma familier.

M._Mingasson-ParisWeb-2010_2_.jpg

En effet, on y retrouve les éléments de la théorie du document (présentation courte, medium, longue) : la forme (vu, design), le texte ou le fond (lu, contenu) et le medium ou la fonction (su, technologie). Nuance tout de même, ici la triade est orientée vers un objectif qui unifie les trois facettes, tandis que dans la théorie du document, il s'agit d'un contrat de lecture. En réalité, la temporalité est simplement différente. La présentation de M. Mingasson présente une méthode pour construire un site web avec une finalité immédiate. Le contrat de lecture est bien alors entièrement compris dans l'objectif. Si l'on raisonne sur un temps plus long, le site devient alors un document dont l'objectif initial peut se diluer, mais son usage est toujours dépendant de la validité d'un contrat de lecture.

C'est aussi l'occasion pour moi de rappeler que les inscriptions pour le colloque international sur l'architecture de l'information sont ouvertes (ici)

mardi 10 avril 2012

Singulière "data"

Il est parfois des lectures intrigantes et stimulantes. Data is a singular noun est une de celles à marquer d'un tag blanc. Norman Gray, un astronome de l'université de Glasgow, nous propose une balade dans l'histoire du mot data, en anglais. En chemin, il nous fait découvrir des perspectives inattendues qui, de plus, devrait nous interroger, nous Français, sur des malentendus inconscients dus à une traduction impossible.

En résumé l'auteur démontre que le mot data, s'est paradoxalement imposé en anglais comme un nom au singulier et non au pluriel, comme pourrait le laisser croire une traduction littérale du latin. Il s'apparente à l'hypothèse d'un problème d'algèbre : "étant donnée telle situation, démontrer que...". L'usage du mot latin singulier datum a pratiquement disparu en anglais au 19e siècle (au même moment que documens en français, tiens, tiens..). Et c'est dans les années 60 que l'ambiguïté entre le singulier et le pluriel de data s'estompe. Extrait de la conclusion (trad JMS) :

Le mot duquel "data" est prétendument le pluriel a tout simplement disparu. Cela veut dire deux choses. Tout d'abord, il a créé un espace linguistique dans lequel "data" a sa place, il n'y a pas d'ambiguïté à utiliser "data" comme un mot au singulier. Ensuite et principalement, si "datum" a effectivement disparu, cela signifie que "data" ne peut être simplement son pluriel. Privé d'ancrage, il s'est éloigné de ce simple sens dérivé pour un sens en soi distinct et indépendant. Il a alors construit des règles d'usage pour lui-même, sans être entravé par son passé latin.

Data ne signifie plus juste une (foutu) datum après une autre. "Data" au vingtième siècle renvoie à une masse d'informations brutes (mass of raw information), que nous mesurons plutôt que nous comptons, et c'est aussi vrai maintenant que cela l'était au moment où le mot a fait ses débuts, en 1646. Cette acception universelle de data comme mesurable plutôt que comptable met sans ambiguïté le mot dans la même catégorie grammaticale que le "charbon", le "blé" ou le "minerai", qui est celle des noms de masse ou d'agrégat. Comme tel, il est toujours et inévitablement grammaticalement singulier. Nous ne saurions demander : ‘how many wheat do you have?’ (Quel nombre de blé avez-vous ?) ou dire ‘the ore are in the train’ (le minerai sont dans le train) si nous voulons être perçu comme des locuteurs anglais compétents. De la même manière et dans la même mesure, nous ne pouvons demander ‘how many data do you have?’ (quel nombre de data avez-vous ?) ou dire ‘the data are in the file’ (la data sont dans le fichier) sans faire une erreur grammaticale.

Beaucoup de choses à méditer, suite à cette découverte pour moi, par exemple :

  • la confusion entre mesurer et compter explique peut être bien des malentendus sur la mesure de l'information sur le web (p ex ici),
  • En français, nous ne faisons pas une différence aussi nette entre les deux verbes (combien traduit aussi bien how many que how much) et la traduction obligatoire du singulier anglais data par le pluriel français données (ajouté au fait qu'en anglais l'article the est invariable), réintroduit la confusion qui s'était effacée et est sans doute la source d'autres malentendus,
  • le Web of data, Web de données, raisonne sur des données discrètes et joue sur l'ambiguïté sans le dire. D'une certaine façon, l'anglais réintroduit en contrebande le sémantique qui n'apparaît pas dans le français alors qu'à l'inverse le français l'avait inclus dans informatique, contrairement à l'anglais computing...
  • Pour les promoteurs du Web de données, ces dernières jouent peut-être, inconsciemment ou non, le même rôle que les hypothèses dans un problème d'algèbre, et se rapportent à une certaine conception du monde qu'il faudrait peut-être mieux décrypter avant qu'elle nous envahisse.

mercredi 14 mars 2012

Le document à l'Académie (dictionnaire)

Mon collègue de l'ENS-Lyon, Jean-Philippe Magué (merci à lui), vient d'attirer mon attention sur l'évolution de la définition du mot document dans les différentes éditions du dictionnaire de l'Académie française depuis l'origine. Voilà le résultat qu'il a compilé :

  • 1ère édition (1694) : Enseignement. Vieux Documents. anciens documents. titres & documents. Ce mot vieillit.
  • 2ème édition (1718) : Terme de pratique. titres, preuves par escrit. enseignement. Vieux documents. anciens documents. titres et documents.
  • 3ème édition (1740) : Terme de Pratique. Titres, preuves par écrit, enseignement. Vieux Documens. anciens documens. titres & documens.
  • 4ème édition (1762) : Terme de Pratique. Titres, preuves par écrit, enseignement. Vieux documens. Anciens documens. Titres & documens.
  • 5ème édition (1798) : Terme de Pratique. Titres, preuves par écrit, enseignement. Vieux documens. Anciens documens. Titres & documens.
  • 6ème édition (1835) : Terme de Pratique. Titres, preuves par écrit, renseignement. Vieux documents. Anciens documents. Titres & documents. Un document précieux. Recueillir les documents qui peuvent servir à la composition d'une histoire.
  • 7ème édition (1878) : Titres, preuves par écrit, renseignement. Vieux documents. Anciens documents. Titres et documents. Un document précieux. Recueillir les documents qui peuvent servir à la composition d'une histoire.
  • 8ème édition (1932) : Titre, pièce écrite qui sert de preuve ou de renseignement. Titres et documents. Un document précieux. Réunir des documents en vue d'un travail, d'un livre d'histoire.
  • 9ème édition (1992) : XIIIe siècle. Emprunté du latin documentum, « exemple, modèle », « enseignement, ce qui sert à instruire », puis « acte écrit qui sert de témoignage, preuve ».
    • 1. Écrit ou, par ext., tout objet pouvant apporter un renseignement, établir ou infirmer un fait. Réunir des documents en vue d'un exposé. Document original. Document officiel. Document administratif. Documents photographiques. Ce sont là de précieux documents. Classer des documents. DROIT. Écrit ou objet susceptible de contribuer à établir la vérité au cours d'une instruction judiciaire ou d'un procès. Voici le dossier avec tous les documents. Des documents accablants. Un document établissant l'innocence de l'inculpé.
    • 2. COMMERCE. Pièce, titre accompagnant une marchandise en cours de transport et permettant son identification.

(On trouvera tous les liens sur Wikipédia. Pour la 2ème édition, seule le tome 2 est numérisé pour une raison que j'ignore. Si un des lecteurs de la BNF peut jeter un oeil sur la micro-fiche et compléter en commentaire... Complété, cf. commentaire)

Nos immortels ont écrit ainsi une petite histoire du mot qui vient compléter celle déjà notée. On constate qu'au 17ème siècle ils étaient prêts à l'enterrer, mais qu'il résiste. Ce n'est qu'à partir du 19ème que sa définition commence à s'élargir, pour brutalement prendre une vraie importance dans la dernière édition.

Et, consécration !, aujourd'hui le dictionnaire lui-même est devenu officiellement document puisque La matière du quatrième tome est publiée en fascicules dans les « Documents administratifs » du Journal officiel, au fur et à mesure de l'avancement des travaux. (ici).

La prégnance récente de la notion est ainsi confirmée ainsi que son importance actuelle. Le document est devenu essentiel à la régulation de nos sociétés. Il paraît alors difficile d'imaginer qu'il se dilue dans un Web qui ne serait plus que de données.

- page 1 de 13