Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

Mot-clé - 213. LES MUTATIONS DU DOCUMENT ; Petite histoire du mot ; ... aux documents de la révolution scientifique

Fil des billets

mercredi 14 mars 2012

Le document à l'Académie (dictionnaire)

Mon collègue de l'ENS-Lyon, Jean-Philippe Magué (merci à lui), vient d'attirer mon attention sur l'évolution de la définition du mot document dans les différentes éditions du dictionnaire de l'Académie française depuis l'origine. Voilà le résultat qu'il a compilé :

  • 1ère édition (1694) : Enseignement. Vieux Documents. anciens documents. titres & documents. Ce mot vieillit.
  • 2ème édition (1718) : Terme de pratique. titres, preuves par escrit. enseignement. Vieux documents. anciens documents. titres et documents.
  • 3ème édition (1740) : Terme de Pratique. Titres, preuves par écrit, enseignement. Vieux Documens. anciens documens. titres & documens.
  • 4ème édition (1762) : Terme de Pratique. Titres, preuves par écrit, enseignement. Vieux documens. Anciens documens. Titres & documens.
  • 5ème édition (1798) : Terme de Pratique. Titres, preuves par écrit, enseignement. Vieux documens. Anciens documens. Titres & documens.
  • 6ème édition (1835) : Terme de Pratique. Titres, preuves par écrit, renseignement. Vieux documents. Anciens documents. Titres & documents. Un document précieux. Recueillir les documents qui peuvent servir à la composition d'une histoire.
  • 7ème édition (1878) : Titres, preuves par écrit, renseignement. Vieux documents. Anciens documents. Titres et documents. Un document précieux. Recueillir les documents qui peuvent servir à la composition d'une histoire.
  • 8ème édition (1932) : Titre, pièce écrite qui sert de preuve ou de renseignement. Titres et documents. Un document précieux. Réunir des documents en vue d'un travail, d'un livre d'histoire.
  • 9ème édition (1992) : XIIIe siècle. Emprunté du latin documentum, « exemple, modèle », « enseignement, ce qui sert à instruire », puis « acte écrit qui sert de témoignage, preuve ».
    • 1. Écrit ou, par ext., tout objet pouvant apporter un renseignement, établir ou infirmer un fait. Réunir des documents en vue d'un exposé. Document original. Document officiel. Document administratif. Documents photographiques. Ce sont là de précieux documents. Classer des documents. DROIT. Écrit ou objet susceptible de contribuer à établir la vérité au cours d'une instruction judiciaire ou d'un procès. Voici le dossier avec tous les documents. Des documents accablants. Un document établissant l'innocence de l'inculpé.
    • 2. COMMERCE. Pièce, titre accompagnant une marchandise en cours de transport et permettant son identification.

(On trouvera tous les liens sur Wikipédia. Pour la 2ème édition, seule le tome 2 est numérisé pour une raison que j'ignore. Si un des lecteurs de la BNF peut jeter un oeil sur la micro-fiche et compléter en commentaire... Complété, cf. commentaire)

Nos immortels ont écrit ainsi une petite histoire du mot qui vient compléter celle déjà notée. On constate qu'au 17ème siècle ils étaient prêts à l'enterrer, mais qu'il résiste. Ce n'est qu'à partir du 19ème que sa définition commence à s'élargir, pour brutalement prendre une vraie importance dans la dernière édition.

Et, consécration !, aujourd'hui le dictionnaire lui-même est devenu officiellement document puisque La matière du quatrième tome est publiée en fascicules dans les « Documents administratifs » du Journal officiel, au fur et à mesure de l'avancement des travaux. (ici).

La prégnance récente de la notion est ainsi confirmée ainsi que son importance actuelle. Le document est devenu essentiel à la régulation de nos sociétés. Il paraît alors difficile d'imaginer qu'il se dilue dans un Web qui ne serait plus que de données.

lundi 17 octobre 2011

«Record» et «data»

Pour poursuivre la réflexion amorcée dans le précédent billet, voici une interrogation sur le corpus anglophone de N-Gram des mots record et records.

N-Gram_Records-Record.jpg

On peut faire plusieurs constats :

  • Le mot est nettement plus utilisé dans la littérature anglophone que « document » dans la littérature francophone en 1800, sans doute à cause de la différence de culture juridique des deux mondes.
  • Au cours du 19e document rattrape record et les deux mots ont une fréquence comparable, chacun dans leur bassin linguistique.(document est beaucoup moins usité dans le monde anglophone).
  • Enfin, on aperçoit nettement l'arrivée de l'enregistrement sonore et visuel à partir de 1900.

Maintenant pour ajouter à la perplexité de Jean-Daniel, voici ce que cela donne lorsqu'on ajoute le mot data :

N-Gram-records-record-data.jpg

Le mot n'apparait qu'au début du 20e pour exploser après la seconde guerre mondiale, et il s'impose immédiatement dans la littérature, montrant à quel point l'informatique occupe brutalement nos écrits, du moins ceux récoltés par les bibliothèques, sinon nos pensées. Juste avec ce paramètre indirect, on subodore qu'il n'est pas anodin de passer du « web des documents » au « web des données »

jeudi 13 octobre 2011

« Record », document, information, données

Ce billet m'a été inspiré par celui très stimulant de Marie-Anne Chabin sur la difficulté de traduction de l'anglais record en français et de la discussion nourrie qu'il a suscité. Le débat a tourné principalement autour de la validité de l'équivalence entre record et document, décliné en plusieurs langues, russe, espagnol, allemand, roumain...

En réalité, le débat entre archivistes avait une vocation opérationnelle immédiate et essentielle : comment nommer les objets que l'on manipule pour bien se faire comprendre et lever les ambiguïtés. Dans ce contexte, il a toute sa légitimité. Mais vu de l'extérieur de ce monde il prend une tournure différente et est révélateur d'autres questions.

Le postulat de départ est que l'anglais record a une signification précise de « document probant », illustrée par la différence entre la liste de course et le ticket de caisse qui valide l'acte d'achat. Si l'on se réfère à l'''Oxford Dictionnary'', on retrouve bien cet accent mis d'abord sur la preuve (même s'il faut ajouter l'élargissement à toutes formes d'enregistrement, comme le disque).

Il est intéressant de constater qu'il a donné en français le « record sportif » : Empr. à l'angl. record « enregistrement, document écrit (pour conserver un témoignage) » (av. 1300 ds NED), d'où « fait exceptionnel (notamment un exploit sportif) digne d'être enregistré » (1883, ibid.), de l'a. fr. recort, record (v. recors). (ATILF).

Mais l'aller et retour entre les deux langues est plus ancien. Voilà ce que nous dit sur l'étymologie du mot l'Oxford Dictionnary : Middle English: from Old French record 'remembrance', from recorder 'bring to remembrance', from Latin recordari 'remember', based on cor, cord- 'heart'. The noun was earliest used in law to denote the fact of being written down as evidence. The verb originally meant ‘narrate orally or in writing’, also ‘repeat so as to commit to memory’

On peut comparer cette étymologie avec celle du mot « document ». Voilà ce que nous dit l'ATILF à ce sujet : Empr. au lat. class. documentum « enseignement », b. lat. « acte écrit qui sert de témoignage, preuve », dér. de docere « enseigner, informer ». Le même article signale comme première signification : Enseignement, oral ou écrit, transmis par une personne.

Ainsi selon leur étymologie, le « record » anglais et le « document » français ont quasiment la même signification, mais proviennent de deux mots latins différents : le premier fait référence à la mémoire et la preuve, le second à la transmission et la leçon.

J'ai déjà eu l'occasion de montrer que la popularisation du mot « document » s'est accomplie au XIXe siècle, très vraisemblablement sous la poussée de la révolution scientifique qui avait besoin d'artefacts qui confondent justement ces deux fonctions. La preuve est une leçon pour l'avancement de la science et mémoire et transmission vont de pair. Le mot à partir de ce moment a pris un sens plus large et de plus en plus vague, qui après la seconde guerre mondiale a été de plus en plus remplacé par le polymorphe « information », privilégiant toujours la transmission plutôt que la mémoire.

Le record anglais n'a guère trouvé que dans les techniques d'enregistrement du son et de l'image, apparues à la fin du XIXe, l'occasion d'élargir ses horizons. Ainsi, mis à part le disque et la bande magnétique, le record a gardé son sens précis attaché à la preuve qui sied aux archivistes.

Aujourd'hui avec le numérique et la relation différente à la vérité qui l'accompagne, d'autres notions émergent en phase avec les capacités de calcul comme ressources (resources) puis surtout données (data), directement traduites de l'anglais par les échanges entre informaticiens. Ces mots ne sont pas anodins non plus. Ils font référence à des entités déjà existantes, déposées, neutres, sans plus de relations avec les fonctions de mémoire et preuve, ni transmission et leçon. Il y a là matière à réflexion.

Actu du 7 décembre 2011

Voir aussi la discussion sur « document d'ativité » sur la page GSI de Linked'in

jeudi 28 juillet 2011

Histoires de mots (3) et théorie du document

Voilà un billet qui pourrait intéresser mes collègues français des sciences de l'information et de la communication. Je me suis interrogé sur les termes du langage courant qui pouvait rendre compte le plus clairement des trois dimensions du document et sur leur usage. Il me semble que les trois termes sont les suivants :

  • « Document » lui-même pour la forme, le vu
  • « Information » pour le texte ou le contenu, le lu
  • « Média » pour la relation ou la transmission, le su

Maintenant regardons l'évolution de leur occurrence dans le corpus français des livres numérisés par Google, grâce à N-Gram (un rapide sondage aléatoire semble montrer que la très grande majorité des monographies comprenant ces mots sont des bulletins, des études et des revues). Voici le résultat pour les mots au pluriel (l'addition du singulier creuse encore la tendance, mais complique le graphique).

Ngram-documents-informations-medias.jpg

J'avais déjà noté la montée du terme « document » au 19e. Il est intéressant de constater que le terme « information » ne décolle vraiment qu'après la seconde guerre mondiale, tandis que celui de « média » ne démarre que dans les années 80.

Tout se passe comme si, selon cet indicateur, la prise en compte dans le langage écrit, ou leur révélation comme phénomène analysable, des trois dimensions s'était faite de façon progressive. La traduction de Pour comprendre les médias de McLuhan date de 1968, l'édition de La société du spectacle de Debord de 1967.

mardi 04 janvier 2011

Document, information, une histoire de mots

On le sait Google a mis à la disposition des chercheurs la base des textes les livres qu'il a numérisés, ce qui donne le plus grand corpus linguistique de tous les temps, 500 milliards de mots et 4% des livres publiés sur terre, et fait rêver les linguistes (ici et). Je ne suis pas linguiste, mais pour les béotiens comme moi, la firme a mis en ligne un étonnant petit outil, baptisé NGram, permettant de représenter l'évolution des occurrences de mots dans le temps. Sans bouger de mon fauteuil, voici donc quelques leçons que j'en ai déjà en tiré sur les sujets de ce blogue.

Document

On considère généralement que le mot «document» est apparu en Français en 1214 dans la Vie de S Grégoire par le frère Anger (ici). J'ai quelques doutes là dessus, peut-être bientôt du nouveau sur ce blogue, mais en attendant, le NGram nous montre clairement l'évolution quantitative de son utilisation dans les livres, en français, puis en anglais depuis 1800.

Ngram-document-fr-4-01-2011.jpg

Ngram-document-eng-04-01-2011.jpg

Que constate-t-on ? L'utilisation du mot en français ne décolle que vers 1820 pour augmenter régulièrement jusqu'au tournant du siècle où elle arrive à un palier. Puis elle repart brutalement vers les années cinquante sans défaillance. Le démarrage du mot anglais est antérieur, sa croissance est d'abord plus lente, mais elle augmente brusquement vers les années soixante pour finir au même niveau que le mot français avant de chuter, semble-t-il, au début des années 2000. L'interprétation de ces courbes reste à faire, sans doute en relation avec la place du document dans l'organisation sociale, mais les tendances sont trop nettes pour qu'elles ne soient significatives.

Information

La notion d'information a progressivement remplacé celle de document chez nombre de professionnels, écoles et chercheurs du domaine à partir des années soixante-dix. Il était donc intéressant de comparer son histoire à celle du précédent.

Ngram-doc-info-04-01-2011.jpg

Ngram-doc-info-eng-04-01-2011.jpg

Information était plus utilisée que document en français au début du 19e, sans doute dans un usage courant. Document la dépasse vers 1830. À partir des débuts du 20e l'utilisation du mot s'accélère progressivement pour décoller à la seconde guerre mondiale, sans doute en lien avec le rôle croissant des médias. On observe un palier à partir des années 70 puis un nouveau décollage dans les années 90 et enfin une chute pour la première fois au début du millénaire. L'évolution du mot anglais montre une différence quantitative importante, avec un démarrage au niveau où le mot français termine son envol et donc une fin proportionnellement quatre fois plus haut.

Là encore, l'interprétation reste à faire, mais on peut déjà en tirer deux leçons claires. L'utilisation du mot information parait plus corrélée à l'évolution des médias qu'à celle des professionnels du même nom qui devraient peut-être y réfléchir. Par ailleurs, les mots français et anglais ne présentent peut-être pas la même signification, à moins que la place de l'information soit considérablement différente dans l'une et l'autre culture.

Données

J'ai ajouté aussi une troisième variable puisqu'aujourd'hui la mode n'est plus à l'information, mais aux données.

Ngram-inf-doc-don-04-01-2011.jpg

Ngram-inf-doc-data-04-01-2011.jpg

La hauteur de la courbe dans le diagramme français doit tenir compte de la polysémie du mot. «Données» est aussi le participe passé féminin pluriel de «donner». Mais le parallélisme des courbes données et information après la seconde guerre mondiale est assez remarquable dans les deux langues.

Bibliothèque - documentation

Pour terminer, j'ai comparé les mots «bibliothèque» et «documentation».

Ngram-bib-doc-fr-04-01-2011.jpg

Ces courbes sont celles qui m'ont le plus étonné, et je dois dire réjoui. L'utilisation du mot bibliothèque se maintient largement sur deux siècles, malgré tous les bouleversement que son environnement a connu, même si cela reste à un niveau modeste. Je serai curieux de comprendre la nature des pics que l'on peut observer. Sans surprise, le mot «documentation» apparait au début du 20e. Il connait son apogée vers 1960 et chute ensuite brutalement. Là encore les mots «bibliothèque» et «documentation» ont un usage pluriel. On le trouve aussi bien l'un pour des étagères ou des bibliothèques privées et l'autre dans «centre de documentation» dans «une documentation» ou encore dans «la documentation de quelque chose». Malgré cela, leur usage subit une variation très nette.

- page 1 de 2