Pour avancer dans les réflexions sur la redocumentarisation et la théorie du document dans la continuité du travail collectif sur Roger II, voici quatre images et quelques réflexions. Tous les commentaires et critiques sont bienvenues, j'avance sur un terrain encore à défricher.

Documentarisation

La première image est issue du livre testament de P. Otlet, premier théoricien de la documentation, et date de 1934 :

Otlet-1934.jpg

Les quatre premières lignes veulent présenter la construction des documents. À partir de l’univers, se forment les représentations grâce aux intelligences humaines particulières qui ensuite s’organisent et se confrontent dans la dynamique de la science et sont consignées dans des livres eux-mêmes réunis dans les bibliothèques.

Les trois lignes suivantes présentent les principaux éléments de l’ordre documentaire nouveau selon P. Otlet. Il s’agit d’abord de rédiger des notices bibliographiques et de les réunir dans un répertoire bibliographique universel. L’ensemble de ces fiches réunies dans les meubles à tiroirs a constitué le catalogue de la bibliothèque jusqu’à l’arrivée de l’informatisation à la fin des années soixante-dix. Il s’agit d’abord de l’outil de repérage des documents dans une collection de bibliothèque. La notice bibliographique est donc un substitut du document qui le remplace avantageusement dans le système documentaire du fait de son formalisme, aujourd’hui nous dirions qu’il s’agit de ses métadonnées. Le système documentaire est piloté par des catalogues normalisés et reliés entre eux. Pour P. Otlet, il doit même être centralisé dans un répertoire universel. L’auteur suggère un instrument supplémentaire, l’Encyclopédie, constituée d’une série de dossiers de synthèse sur tous les sujets constituant le savoir humain, réalisés et actualisés par les documentalistes à partir des documents existants et diffusables à la demande. Dernier élément essentiel à l’ordre documentaire : la classification. La classification joue pour P. Otlet un rôle central, organisant et reliant l’ensemble des instruments.

Ce modèle systématise et justifie le rôle de la bibliothèque qui l'appliquera et le perfectionnera jusqu'à aujourd'hui. Il sépare clairement la production du livre de la documentarisation qui vient ensuite.

Redocumentarisation

La seconde image est celle du «cake» du Web sémantique.

Web-semantique-2007.jpg

Dans le schéma de P. Otlet, on trouvait tout en haut les auteurs qui pensaient le monde, le représentaient en concepts grâce à la science et le consignaient dans des documents. Le schéma du W3C met à leur place des utilisateurs qui, plutôt que représenter le monde, vont reconstruire selon leurs besoins des réponses à leurs questions à partir des ressources documentaires existantes. On pourrait dire en raccourci le monde n’est plus représenté par un travail scientifique préalable, mais chacun se représente le monde à partir de données récoltées préalablement. On pourrait discuter longtemps de la pertinence épistémologique de l’une ou l’autre posture. Là n’est pas mon propos, je voulais simplement souligner que d’un point de vue documentaire celles-ci sont inversées : l’une part des producteurs de documents et classe ces derniers ; l’autre part des lecteurs qui reconstruisent les documents à partir de ressources classées.

Les trois dimensions

De plus sans discuter les détails d’un schéma qui n’est pour ses auteurs même qu’illustratif, on peut remarquer que l’on retrouve dans la succession des couches les trois dimensions du document . Déjà présentées pour le livre ainsi :

3-dimensions-document.jpg

Les couches les plus basses (URL/URI, XML, RDF) concernent les adresses et les formats des ressources, c’est à dire le repérage par la forme. Les couches intermédiaires (SPARQL, OWL, RDFS, RIF) s’occupent de la recherche, de l’indexation, de la sémantique, de la représentation des connaissances, c’est à dire un traitement à partir du contenu, du texte. Enfin les couches supérieures supportent des règles sociales (Unifying logic, Proof, Trust), celles-là même qui supportent la fonction du document, transmission et preuve. J’ai donc découpé le « cake » en tranche que j’ai redistribué sur les trois dimensions du document. Cette présentation, comparée à celle que j’avais présenté pour le livre souligne l’ampleur de la réingénierie documentaire. Précédemment nous trouvions une représentation du livre sur chacun des sommets du triangle, même si la différence de perspective soulignait les différences de dimensions. Cette fois, le document n’apparait plus qu’au centre, comme un navigateur qui le reconstruira à la demande de l’internaute. On pourrait dire que le système documentaire a réintégré la construction du document. La notion « parenthèse Gutenberg » prend alors une tout autre ampleur. L’imprimerie avait sorti la production documentaire des bibliothèques, des infrastructures épistémiques de l’époque. Le numérique réintègre la production documentaire dans l’infrastructure épistémique contemporaine : le web.

WS-dimensions-document.jpg

Cette représentation triangulaire a la vertu supplémentaire de casser l’empilement et sa lecture linéaire en montrant notamment les liaisons fortes qui existent entre les formats et les adresses et la confiance et la preuve.