Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

vendredi 28 septembre 2007

Roger et le graphe social

De brillantes synthèses et analyses ont été produites récemment en Français sur la question très discutée du graphe social lancée par le fondateur de FaceBook. Elles sont à lire, relire et à méditer :

  • Comprendre le graphe social par H. Gillaud sur InternetActu. Html
  • Ce que l'on sait des réseaux sociaux par Olivier Ertzscheid. Html 1 et 2
  • Actu du 29 sept Fragments de recherche sur FaceBook par M. Lessard. Html

J'ajouterai une remarque inspirée (encore..) de Roger, même si à l'époque on ne parlait pas encore de graphe social.: c'est aussi, et peut-être surtout, une question documentaire.

Roger T. Pédauque, Document et modernités, 16 Mars 2006. Html

Extraits :

L’imprimé serait directement associé à la première modernisation, celle qui a permis l’esprit scientifique, la rupture avec les traditions de l’Ancien régime, l’expérimentation et sa validation à travers des comptes-rendus détaillés comme critère de la scientificité, celle aussi qui débouche progressivement sur la reconnaissance des autorités et en même temps des auteurs et des États-nations. Une bonne part des relations dans les sociétés dites « modernes » sont fondées sur et cimentées par la stabilité du document papier et sa reproductibilité industrielle à l’identique (effet de série) ou encore sa permanence sécurisant les contrats, les règles et les identités. Plus encore, cette modernité est à mettre en relation avec une certaine façon d’écrire et de penser dans la linéarité et l’argumentation. Ainsi, il y a toujours eu un étroit rapport entre l’ordonnancement des idées et une certaine conception de l’espace non pas simplement scriptural mais aussi topographique. La classification du savoir en différents domaines, par exemple, selon les schémas classiques de l’encyclopédisme s’appuie sur une représentation de l’espace inspirée elle-même des arts de la mémoire. L’encyclopédisme utilise métaphoriquement les mots de champ, domaine, aire, qui sont en rapport avec la segmentation de l’espace et qui ont trouvé dans la feuille, le codex, les collections de volumes reliés des technologies propres à les représenter.

La seconde modernisation introduirait un effet retour sur cette prétention à la maîtrise qui caractérisait la première car les conséquences ne peuvent plus être repoussées au-delà de nos générations. La prétention à la totalisation du savoir et au triomphe des autorités scientifiques seraient battues en brèche : la seconde modernisation introduit l’exigence d’une réflexivité, d’un savoir qui se déclare lui-même et qui se contrôle en connaissant ses limites et ses conditions de production. Ainsi le modèle politique change (cf. le principe de précaution) mais aussi, pour ce qui nous concerne ici, les politiques documentaires. Le numérique introduit de façon massive et inédite à cette échelle la réflexivité sur notre propre activité documentaire. La documentation générale de nos activités, y compris les plus triviales, constitue désormais une seconde nature, qui correspond bien à cette seconde modernisation.

Le professionnalisme dans quelque domaine que ce soit, se juge à la capacité de réflexivité sur sa propre activité, sur la capacité à la déclarer, à l’expliciter, à la transmettre, à la tracer, toutes choses qui font émerger une énorme activité documentaire. Selon cette proposition, la rupture avec la première modernisation est importante. C’est aussi une sorte de retour à un régime d’auteur pré-moderne, où l’on ne se souciait guère de l’authenticité des écrits et qui permettait à tout un chacun de reproduire en déformant à volonté les textes supposés les plus intangibles.

Or, cette exigence est directement concomitante des outils numériques permettant de générer, de suivre, de traiter, de calculer tous les éléments composant les sources du processus documentaire. Plus que sur le document, il convient de mettre l’accent sur la documentarisation généralisée de nos activités, de notre vie sociale. Les contributions, facilitées par la dissémination et la convivialité des outils numériques, ne sont plus réservées à quelques uns, mais que ce soit dans l’atelier pour les remontées des défauts ou dans les blogs, chacun est tenu de produire et même souvent d’indexer l’information qu’auparavant seuls quelques professionnels pouvaient générer et mettre en forme.

(..)

Une hypothèse pourrait être que le développement d’une condition post-moderne, en concurrence avec la normalité moderne, est précisément rendue possible par la facilité matérielle donnée à chacun de constituer de manière autonome des collections de documents en gérant, grâce à la numérisation et internet, le passage de ces collections entre les trois contextes de médiations notés. Cette gestion permettrait aux acteurs de dessiner les contours de leur identité dans la dimension individuelle, collective et sociale de manière plus autonome et interactive qu’auparavant, leur rendant accès à une localisation redéfinie géographiquement par les réseaux. Inversement, elle permet de rendre visible, par la mise en réseau de mémoires personnelles, de nouvelles socialités et de nouvelle géographies d’imaginaires collectifs au travers de traits communs partagés ou reliés. Le développement des outils portables (téléphone, iPod, ebooks, etc.), l’augmentation explosive de leur capacité de mémoire, accroit encore les facilités fonctionnelles à la disposition des individus et décloisonne les espaces de communication en favorisant le nomadisme.

Pourtant, il nous paraîtrait bien imprudent d’en conclure que la migration généralisée des populations conduit, d’une part, à une société documentarisée sans contrôle des États ou des acteurs commerciaux et, d’autre part, à un recul des marges par une intégration sociale nouvelle des migrants au travers du renouvellement de leurs partages documentaires. Les frontières et les marchés sont aussi en voie de « migration » et sujets à une redocumentarisation où la traçabilité des individus par l’enregistrement de leurs transactions électroniques sur des banques de données remplace le contrôle par l’échange de papiers, d’identité, administratifs, monnaie, contrat ou facture. Et la marginalité se déplace elle-aussi vers ceux qui n’ont pas ou plus de possibilités d’accès aux réseaux (adresse électronique, carte magnétique, portable, code secret, etc.).

Le numérique favorise à la fois l’autonomie et le contrôle social. Il ne fait qu’accuser des tendances déjà à l’œuvre.

mercredi 26 septembre 2007

Le collectionneur, l'assureur et le médiateur

Un entretien d'un historien du livre J-Y Mollier publié par la revue française Télérama (n° 3006 - 25 Août 2007, Html) a beaucoup été commenté sur les biblioblogues et surtout sur la liste Biblio-fr (archives de la liste). Le point qui a cristallisé le débat et agacé nombre de bibliothécaires est l'inquiétude de l'historien face au « désherbage » (élagage en bon québécois, c'est à dire l'élimination des documents les moins demandés afin de faciliter la gestion des collections). Sans revenir précisément sur les arguments, je voudrais faire ici remarquer que souvent les incompréhensions viennent de confusions sur la notion de collection et de document, qui peuvent s'éclairer par un point de vue plus économique.

Trois valeurs différentes, au moins, d'une collection se croisent dans les arguments que j'ai pu lire. Elles méritent d'être distinguées : une valeur de collectionneur, une valeur d'assurance et une valeur de médiateur. Ceux qui suivent ce blogue y retrouveront les trois dimensions du document (forme/texte/médium, voir ce billet).

Le collectionneur

Pour un historien du livre, le livre est d'abord un objet, un monument plus qu'un document pourrait-on dire. Le livre doit être conservé parce qu'il existe tout simplement. C'est à l'évidence la valeur prônée par J.-Y. Mollier. C'est nécessairement la valeur qui justifie les bibliothèques à vocation patrimoniale.

Mais c'est aussi celle du collectionneur dont il ne faut pas négliger l'importance dans l'histoire des bibliothèques. Le collectionneur garde des objets auxquels il accorde une valeur affective. Bien des collectionneurs ont dans l'histoire été l'instrument du sauvetage de patrimoines documentaires importants. Nombre d'entre eux ont participé à l'enrichissement des bibliothèques. Aujourd'hui encore, les collectionneurs jouent un rôle non négligeable. Il serait peu responsable de croire que le patrimoine ne perdure que par une action administrative planifiée. Les initiatives individuelles y jouent un grand rôle.

L'économie du collectionneur est spéculative. Il garde parce que, à tort ou à raison, il pense que les objets conservés vont gagner en valeur en vieillissant, mais c'est un pari. C'est le même modèle que celui du marché de l'Art, même si évidemment nombre de collectionneurs n'ont pas de motivation mercantile.

Dans cette perspective, les bibliothèques qui n'ont pas vocation patrimoniale n'auraient pas de raison de garder des documents anciens, qui ne sont plus demandés. Pourtant, dans leur histoire particulière, elles peuvent avoir intérêt au contraire à se spécialiser sur tel ou tel fonds spécifique qui les différenciera d'une autre bibliothèque, à la façon un collectionneur : cela leur donne une identité, les rattache à leur histoire et, qui sait, pourrait bien être hautement rentable à l'avenir. Tout ici est question de subjectivité et d'envie, car il est évidemment trop coûteux et contreproductif de tout garder.

L'assureur

Les scientifiques en général sont allergiques au désherbage, mais souvent pour une raison différente de celle de l'historien ou du collectionneur. L'inquiétude ici vient du fait qu'un document très peu demandé peut-être à l'origine d'une avancée scientifique plus importante que ceux connus de tous, justement parce qu'il a été négligé auparavant.

Le raisonnement se rapproche ici de celui de l'assurance. On paye une police d'assurance non pas parce que l'on souhaite avoir un accident, ni même pour ne pas en avoir, mais pour le cas où on en aurait. De même on garde un document peu demandé au cas où il puisse apporter dans l'avenir une valeur bien supérieure au cout de sa conservation. Mais personne n'est en mesure de garantir cette valeur, tout comme les mensualités de l'assurance seront dépensées sans contrepartie si aucun accident ne se produit.

Il est impossible pour une bibliothèque, ici une bibliothèque scientifique, de tout garder, même si c'était la tradition en Amérique du nord pour les grandes bibliothèques de recherche. Mais le critère de la demande du document, appliqué souvent mécaniquement par les bibliothécaires, est peu pertinent. La seule façon de s'en tirer, me semble-t-il, est de se servir des outils d'évaluation des chercheurs eux-mêmes : l'expertise des pairs, la scientométrie. Tout comme, dans l'assurance, le calcul des mensualités se réalise à partir d'outils statistiques.

Néanmoins, ici ce n'est pas l'objet qui est important, mais son contenu. Dès lors la numérisation change la donne car l'accessibilité ne se fait plus dans un lieu, mais sur un réseau et, dans cette perspective, tout récemment l'ARL vient de retirer de ses critères d'évaluation la taille des collections. Il y a là tout un champ nouveau qui s'ouvre car dans le même temps le numérique conduit au stockage inconsidéré.

Le médiateur

Une grande part des bibliothécaires, qui ont réagi à l'article cité plus haut, ont souligné que le désherbage était indispensable pour pouvoir mettre en valeur les livres les plus demandés et répondre aux attentes du public sans être étouffé par l'ampleur des collections et de leur gestion.

Cette réaction peut se traduire économiquement comme une volonté de réduire les coûts de transaction. C'est un peu comme dans un marché où l'on aurait retiré le vecteur de la monnaie. Il est naturel que cette façon de raisonner se retrouve dans les bibliothèques où l'affluence est forte, bibliothèques publiques, bibliothèques de premier cycle universitaire. L'objectif est de maximiser la relation de médiation.

Ici l'outil classique des bibliothécaires : la fréquence de demande des documents a toute sa pertinence. Mais j'espère avoir convaincu que les deux précédentes dimensions ne devaient pas non plus être négligées.

dimanche 23 septembre 2007

Bibliothéconomie, archivistique et bases de données

N. Morin signale et commente (billet) un article important de D-Lib Magazine :

Anna Gold, Cyberinfrastructure, Data, and Libraries, D-Lib Magazine, Sept/Oct 2007,Vol 13 N 9/10, Part 1, Html, Part 2 Html

Extrait de la conclusion de l'article (trad JMS) :

Une fois que les bibliothèques et les bibliothécaires auront compris l'intérêt d'intégrer la gestion des données dans leurs services et objectifs, et qu'ils seront convaincus de la valeur qu'ils peuvent amener sur la table, ils devront investir du temps pour développer de nouvelles compétences et pour franchir les barrières culturelles. Une fois qu'ils auront construit des collaborations nouvelles avec les chercheurs et les gestionnaires de données, les bibliothèques et les bibliothécaires feront vraiment de la gestion des données une partie fondamentale du patrimoine scientifique.

La gestion documentaire des bases de données est, à vrai dire, une illustration nouvelle du croisement des fonctions bibliothéconomique et archivistique, souvent évoquées ici. Marc Lebel a déjà abordé du point de vue archivistique la question de la conservation des bases de données (Pdf).

Et si T. Berners-Lee avait été Chinois..

.. la face du Web aurait peut-être été changée ? En tous cas, la structure du Web sémantique, si l'on suit le raisonnement de L. Floridi (Billet, repéré par M. Lessard, merci à lui).

Extrait du billet (trad JMS) :

Il y a uns grande différence entre une langue indo-européenne (comme l'anglais) et le chinois. : la première est une langue qui privilégie plus le sujet, la seconde fait partie de celles qui mettent plutôt en avant le thème. (note)

En simplifiant beaucoup, dans un cas (sujet privilégié) on préfèrera les phrases comme « Marie aime la pizza » avec un sujet, un prédicat et un objet ; dans l'autre (thème privilégié), on préfèrera des phrases comme « pour se nourrir, Marie préfère la pizza », avec un thème et un commentaire approprié.

Cela ne vous rappelle rien ? Permettez-moi une autre simplification : les langues indo-européennes pensent comme le Web sémantique, le chinois comme le Web 2.0.

Dans un cas, le point essentiel est d'avoir une URI et une relation à trois pôles du type « X est Y », comme la bonne vieille philosophie grecque. C'est le fondement de toute ontologie.

Dans l'autre, vous définissez un thème et vous le taggez.

Je ne suis pas expert, mais j'aimerais bien avoir l'avis des amis du Rtp-Doc sur cette question (et je vais de ce doigt leur poser la question sur la liste). Si l'on pousse le raisonnement, on pourrait en conclure, en effet, que le Web sémantique est bridé par une structure trop marqué par son origine langagière. Ce serait une victime de ce que les historiens des techniques appellent à la suite de J. Perriault « l'effet diligence » (Wkp), la technicité du Web sémantique reprenant mécaniquement celle des langues indo-européennes. À vrai dire, la critique du WS développée dans le second texte de Roger, sans reprendre précisément cet argumentaire, ne me paraît pas si éloignée.


Actu du 28 sept 2007

On peut toujours compter sur ses amis.. voir les commentaires. J'ai intégré ci-dessous la contribution importante de Monique Slodzian, linguiste renommée, responsable du Centre de recherche en ingéniérie multilingue (prés) qu'elle m'a autorisé à reproduire ci-dessous :

Les langues pensent comme ceci ou comme cela….Voilà bien une thèse jugée problématique depuis près de deux siècles. On rappellera quelques faits.

D’abord, cette manière de concevoir les langues dans leurs rapports supposés à la connaissance relève d’un logicisme orthodoxe qu’on pourrait croire dépassé et qui postule :

  • La possibilité de discerner la signification d’une phrase directement et immédiatement en la réduisant à des éléments logiques;
  • L’existence d’un langage formel permettant de comparer et de paramétrer la valeur gnoséologique des langues en soi.

Il s’agit d’une philosophie linguistique, qui ne tient aucun compte de l’interlocution et, plus généralement, du fait que le sens se construit dans des productions discursives écrites ou orales convoquant toutes les dimensions du langage (morphologie, syntaxe, lexique, prosodie…). Déclarer que le chinois met davantage en valeur le thème que le sujet procède d’une vision réductrice de la langue et croire qu’il y aurait un mode de pensée chinois qui déterminerait des catégories conceptuelles susceptibles de modeler le Web sémantique est simplement naïf.

En effet, le raisonnement de L. Floridi incorpore tacitement des arguments inspirés d’une vision romantique du « génie de la langue », tirés superficiellement des travaux de Humboldt (thèse sur l’influence des formes grammaticales sur le développement des idées). Le programme de Humboldt sur l’étude comparée des langues (1820) entend bien fonder les principes de la classification des langues. Cependant, une controverse fameuse avec le sinologue Rémusat, conduit Humboldt à réviser sa position sur la supériorité cognitive des langues flexionnelles (notamment indo-européennes) par rapport aux langues dépourvues de formes grammaticales comme le chinois (la seule position des mots y marque les fonctions grammaticales). L’argument imparable du sinologue est que le supposé handicap de l’absence de formes grammaticales n’a pas empêché le chinois d’offrir l’une des plus puissantes littératures du monde. Se rendant à l’évidence, Humboldt en conclut que le contexte et les relations entre les mots jouent un rôle déterminant. S’il continue d’opposer le sanskrit et les langues flexionnelles au chinois, le cas du chinois le conduira à théoriser le rôle de l’interprétation et non à postuler des propriétés intrinsèques à telle ou telle famille de langue. Humboldt se garde bien de réifier en catégories absolues les spécificités morphosyntaxiques de la langue. La perspicacité de Humboldt paraît d’autant plus remarquable si l’on songe au mythe encore répandu du chinois comme langue idéale en raison de la supposée référentialité des idéogrammes et de la simplicité de sa grammaire.

Comme linguiste, il ne lui échappait pas qu’il fallait bien distinguer entre écriture, langue et parole. La leçon vaut toujours : si les caractères chinois sont des graphèmes constitués historiquement comme des signes moins arbitraires que les écritures alphabétiques, dans la production de la parole, ils jouent un rôle similaire aux signes de toute langue, qui imposent un lien indissoluble entre son et sens. De sorte que polysémie et homophonie y sont aussi inhérents qu’aux autres types de langues.

En l’occurrence, la dichotomie sujet/thème a été largement étudiée par la linguistique de l’énonciation dont elle relève et qui concerne toutes les langues, y compris indo-européeennes. Le « schéma actanciel » de Tesnière constitue, par exemple, une théorisation possible du rapport sujet/thème à partir de la position des actants dans les langues flexionnelles et sans cas. La syntaxe structurale considère que donner une information sur un événement à l’aide d’actants (sujet, objet, temps, lieu…) implique une activité conceptuelle, avec des idées de procès, de participants actif et non-actif du procès, de circonstance de l’action, etc., qui valent pour toutes les langues, mais qui, en eux-mêmes, n’autorisent pas à tirer des conclusions sur « la » sémantique d’une langue particulière.

Le raisonnement de L. Floridi paraît donc à la fois réducteur et anachronique. S’il n’y a pas de lien mécanique entre formes linguistiques et mode de pensée, pourquoi faudrait-il fonder dans cette dualité une quelconque logique du Web?

Sans doute, ces remarques sont importantes et relativisent le propos initial. Mais, ne peut-on penser que les promoteurs du WS ont simplement raisonné par analogie ? Cela ne présuppose pas un point de vue juste sur la réalité de la langue, mais simplement une reproduction mécanique de sa structure apparente.

jeudi 20 septembre 2007

La rentabilité par les archives ?

La décision récente du New York Times de donner accès gratuitement à ses archives a été énormément commentée sur le Web. Voir pour une bonne synthèse et analyse le billet de D. Durand, par exemple.

Tous les analystes ont souligné le passage du payant au gratuit et donc la recherche du marché publicitaire. Ma remarque sera un peu décalée pour souligner que le grand changement ici est plutôt dans le service : dans la mise en avant des archives. Celles-ci ne sont plus un appoint, décalé et payant, mais un élément d'un service global. La distribution des requêtes se fera selon une loi de puissance (longue traîne), comme dans les bibliothèques, et on peut en effet imaginer une rentabilisation publicitaire du service, bien différente de la publicité dans la presse qui attache une annonce à un article. De plus, la masse et les liens croisés qui vont se construire devraient permettre de retrouver le NYT en position intéressante sur les moteurs. Ainsi le NYT bascule d'un modèle de média à un autre. Cela parait plus cohérent que la bataille précédente dont j'ai montré dans un billet récent qu'elle paraissait bien mal partie pour la presse.

Enfin en ouvrant cet accès le NYT est conforme à la montée de « l'archithèque » (selon le néologisme peu respectueux de l'étymologie mais à mon avis parlant proposé dans un vieux billet), c'est à dire un croisement de bibliothéconomie et de l'archivistique.

- page 92 de 144 -