Pour poursuivre la réflexion amorcée dans le précédent billet, voici une interrogation sur le corpus anglophone de N-Gram des mots record et records.

N-Gram_Records-Record.jpg

On peut faire plusieurs constats :

  • Le mot est nettement plus utilisé dans la littérature anglophone que « document » dans la littérature francophone en 1800, sans doute à cause de la différence de culture juridique des deux mondes.
  • Au cours du 19e document rattrape record et les deux mots ont une fréquence comparable, chacun dans leur bassin linguistique.(document est beaucoup moins usité dans le monde anglophone).
  • Enfin, on aperçoit nettement l'arrivée de l'enregistrement sonore et visuel à partir de 1900.

Maintenant pour ajouter à la perplexité de Jean-Daniel, voici ce que cela donne lorsqu'on ajoute le mot data :

N-Gram-records-record-data.jpg

Le mot n'apparait qu'au début du 20e pour exploser après la seconde guerre mondiale, et il s'impose immédiatement dans la littérature, montrant à quel point l'informatique occupe brutalement nos écrits, du moins ceux récoltés par les bibliothèques, sinon nos pensées. Juste avec ce paramètre indirect, on subodore qu'il n'est pas anodin de passer du « web des documents » au « web des données »