Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

jeudi 07 septembre 2006

Paul Otlet et Suzanne Briet

Il faut se réjouir de l'annonce d'un livre sur Paul Otlet, même s'il faut le lire avant de le juger. Depuis des décennies en effet celui-ci, comme par ailleurs Suzanne Briet "Madame Documentation" ont été oubliés des francophones et ce sont des américains, tout spécialement M. Buckland ou R. Day qui les ont republiés et commentés. Ainsi, on peut trouver en ligne la traduction anglaise de Qu'est-ce que la documentation ?, où l'on trouve l'exemple mille fois cité de l'antilope comme document, mais personnellement je n'ai pas trouvé le texte français, même pas dans Gallica !

Alors je reproduis ici l'offre de souscription :

lundi 04 septembre 2006

Rêves d'archithèque

Ma proposition de nommer « archithécaires » les professionnels du document numérique a suscité sur différentes listes, blogs ou dans les commentaires du billet initial des réactions diverses.

Mon propos en réalité est moins d'imposer ce nom particulier que de souligner la naissance d'un nouveau modèle de média, comme en leur temps sont nées la radiodiffusion ou la télévision, qui n'avaient évidemment pas de nom auparavant, et de remarquer que les savoirs professionnels du document s'y trouvent en bonne place, avec d'autres venus d'autres horizons. Aussi ce terme, que je trouve personnellement sonner bien (bien mieux que l'ambiguë « bibliothèque numérique »), a la vertu de placer ceux-ci clairement au centre, mais je suis ouvert à toute autre proposition. Pour conforter celui-là en attendant, le plus simple est de préciser ce que pourrait être une « archithèque ».

Celle-ci existe déjà partiellement à petite échelle dans de nombreuses bibliothèques ou centres d'archives ayant intégré une dimension numérique et elle se construit sous nos yeux à très grande échelle dans des batailles commerciales et industrielles impressionnantes qui mettent aux prises Google, Yahoo!, Microsoft et bien d'autres.

Je voudrais ici pousser le raisonnement en rêvant d'une archithèque idéale, au risque de me tromper. Mais en des périodes de ruptures comme celle que nous vivons, les rêves ont une grande importance. C'est aussi à partir d'eux que l'on s'oriente, faute de trouver dans la réalité, passée et présente, les balises suffisantes pour se repérer.

La mission d'une archithèque est de gérer le patrimoine informationnel numérique de la communauté qu'elle sert et qui lui fournit ses moyens. Ainsi il peut exister toutes sortes d'archithèques, comme il y a toutes sortes de bibliothèques ou de centres d'archives, car il y a toutes sortes de couple information/communauté. Il est très important de noter la relation à une communauté particulière. Celle-ci peut être petite ou très grande (comme un pays par exemple ou des communautés linguistiques entières). Son économie peut-être publique (payée par l'État dans l'une de ses composante), institutionnelle (payée par la communauté particulière ou ses représentants) ou marchande (payée par les annonceurs). Mais comme elle repose sur l'exploitation de la longue traîne un marché direct est peu envisageable (voir le troisième texte de Roger, p. 24-25)

Son organisation comprend trois niveaux : le fonds, l'empreinte et la navigation. En voici quelques éléments sans prétendre tout embrasser ni être pertinent sur tout :

Le fonds Celui-ci est constitué de tous les documents et données du patrimoine de la communauté, que ceux-ci soient accessibles à tous les membres ou non (pourvu qu'ils dépassent une documentation personnelle). Une archithèque en effet n'est pas limitée par la taille de ses magasins ou le coût de gestion des documents physiques. Ce fonds provient à la fois des productions de la communauté (ex dépots institutionnels), des collections et bases de données pour lesquelles on aura acquis une license ou encore de tous les documents ou données repérés sur le Web et pertinents pour la profession. Il est alimenté par le patrimoine documentaire initial et les membres de la communauté, par les négociations avec les détenteurs de droits et par la veille sur le Web. Il est géré avec un calendrier de conservation qui permet notamment d'ouvrir et de fermer les droits aux différentes catégories d'utilisateurs, internes et externes à la communauté. Dans la mesure du possible l'ensemble de ces documents et données sera conservé sous forme de copie-cache, y compris les documents dont on ne dispose pas des droits. En effet, d'une part il est essentiel de disposer à tout moment et rapidement des textes afin de pouvoir y faire tourner tous les outils de traitement possible sans difficulté ni retard, d'autre part la très grande volatilité du Web rend incertaines les constructions pérennes et enfin il est nécessaire de rendre interopérables des ressources venant d'horizons divers. Mais, bien entendu, ces copies caches ne sont là que pour les traitements internes et la conservation. L'usager a accès à l'adresse normale du document.

L'empreinte V. Tesnière et N. Lesquins précisent dans un article du BBF sur la bibliothèque numérique européenne : L’analyse des attentes et des plus-values par rapport à l’existant conduit à la définition d’une bibliothèque numérique comme un ensemble organisé de contenus en ligne sélectionnés et non comme un entrepôt. Si l’on admet qu’un individu, un groupe ou même un pays sont aussi définis par les documents qu’ils produisent, consultent ou réunissent, ces réflexions pourraient déboucher sur l’idée d’une « empreinte cognitive numérique », produite par les traces documentaires, qu’il s’agisse des documents eux-mêmes ou des métadonnées, des ontologies ou encore des traces laissées par l’activité du lecteur, y compris les tags. Les possibilités de calcul de l’outil permettent d’envisager dans cette orientation des développements inédits dont certains sont ponctuellement déjà mis en œuvre par les industriels du domaine (moteurs, libraires en ligne..). Cette idée ouvrirait largement les perspectives des institutions documentaires traditionnelles, bibliothèques et archives, ébranlées par les multiples développements du numérique. Leur vocation première est bien de mettre en relation les communautés qu’elles servent avec les documents qui leur sont utiles et leurs outils principaux sont bien l’organisation, la gestion et l’exploitation de ces traces : catalogue, inventaire, plan de classement, collection, statistiques de consultation, etc. Mieux, elles disposent déjà, par leur expérience dans les institutions traditionnelles de collections d’autorité, c'est-à-dire des documents recueillis, classés et conservés pour les besoins de la communauté qu’elles servent. Un traitement automatique de ces collections, croisé avec les traces de l’activité des usagers fournirait un corpus de données de départ qui pourrait ensuite s’affiner par itérations successives. On voit tout l’intérêt de ce repérage. Une fois cette empreinte numérique récoltée, il sera possible de retourner le processus et d’en faire un outil de repérage ou de traitement pour de nouveaux documents ou de nouvelles données, qui, puisqu’ils sont homologues à la collection initiale, devraient être utiles pour la communauté.

La navigation L'archithèque propose une série d'outils aux membres de la communauté desservie pour naviguer, lire, dans les trois sens rappelés par P. Schweitzer (v. son commentaire de ce billet), mais aussi pour effectuer tout calcul et traitement sur les documents et informations proposés par l'archithèque, et enfin des outils bureautiques pour gérer sa propre bibliothèque personnelle et faciliter les relations entre son espace privé et l'espace communautaire.

jeudi 31 août 2006

Qu'est-ce qu'un livre (2) ?

D'autres références sur la question pour les gourmets, sans avoir le temps de rédiger un vrai billet :

Le Livre de Michel Melot d'abord. Érudit, passionnant et passionné, plaisant, discutable dans ses partis-pris anthropologiques parfois contradictoire dans son assimilation ou non du livre à sa forme Codex.

Le plus ancien livre imprimé encore conservé. Extraordinaire et émouvant et parfaitement mis en scène par la British Library. De quoi méditer sur la forme (rouleau), sur la transcription (numérique), sur la notion de texte (chinois, traduction anglaise écrite et orale..).

Un vrai cours en ligne sur les débuts de l'imprimerie en Europe par Interbibly et une merveille pour les yeux.

Et pour méditer sur la notion de livre, je n'ai rien trouvé de mieux que la série de bandes dessinées de Franck Giroud Le décalogue. Tout y est dit ou suggéré dans une saga qui traverse les siècles et dont le héros principal est un livre.

mardi 29 août 2006

Livre(s) : un pour tous, tous pour un

L'actualité rebondit autour de la numérisation des livres et de leur accès en ligne. Citons, parmi d'autres :

- l'annonce de la stratégie de la Communauté européenne sur une bibliothèque numérique (qui dépasse d'ailleurs l'écrit pour s'ouvrir à l'audiovisuel). Communiqué, rapport.

- une question qui commence à travailler les professionnels et experts du domaine, avec un prochain colloque pour des premières réponses : que faire avec un million de livres accessibles en ligne ? Et un très instructif article pour le comptage :

Roger C. Schonfeld, Brian F. Lavoie, Books without Boundaries: A Brief Tour of the System-wide Print Book Collection Journal of Electronic Publishing Summer 2006

- l'annonce par Google de la diffusion gratuite de livres du domaine public, numérisés à partir des fonds de bibliothèques et l'indignation d'O Erstzcheid.

Nous ouvrons sans doute le troisième chapitre de la redocumentarisation du livre, après celui des pionniers (à commencer par le projet Gutenberg et, en France, Gallica), puis celui de l'arrivée des projets industriels de numérisation et les polémiques qui l'ont accompagnée, nous abordons logiquement aujourd'hui l'interrogation sur les modes de diffusion et le positionnement des acteurs concernés.

Quelques remarques rapides sur ce chapitre qui s'écrit devant nous :

- il faut mettre en parallèle les développements de la stratégie de Google avec les propositions de la Communauté européenne qui à l'origine sont d'ailleurs une réaction à celle-là. De plus, on peut trouver dans l'histoire économique de la télévision des éléments pour décrypter l'actualité du livre numérisé. Les uns et les autres proposent en fait une nouvelle déclinaison de la distribution du livre, payée dans un cas par la publicité, dans l'autre par la puissance publique. Nous avons eu le même processus pour les films, passés dès ses débuts à la télévision privée (USA) ou publique (Europe). Pour le moment, nous n'en sommes qu'aux livres du domaine public, il est vraisemblable que pour les autres la question des droits d'auteurs se règlera progressivement avec un achat de droits de diffusion. Mais pour cela, il faut que la démonstration d'une rentabilité soit faite, que les structures et mentalités s'adaptent. Cela prendra du temps. De ce point de vue, les bibliothèques sont comparables à des télévisions locales. Sans doute, elles ont fait preuve de naïveté devant l'ogre Google, mais la question est plus de savoir si elles peuvent constituer un réseau national ou international public dans ce domaine que celle de leur légèreté pour construire une stratégie locale. Là aussi, même si elles ont une longue expérience de coopération et si des organismes comme OCLC montrent la voie, on peut penser qu'il faudra du temps.

- Un livre est et restera un objet individuel clos. C'est le principe même d'une information éditée. Sans doute, mettre en relation des millions de livres ouvre des perspectives inédites (le mot est approprié). Néanmoins, il ne faut pas confondre ces connections avec la constitution d'un seul texte qui représenterait le savoir de l'humanité. Cette remarque, alliée aux capacités de traitement de la langue, a d'importante conséquences : d'une part, celui qui détient des textes édités détient des textes validés ce qui est bien différent du tout venant du Web pour toutes sortes d'opérations (depuis la traduction, jusqu'aux services de question/réponse). Il y a là un trou béant aussi bien du côté juridique de la propriété intellectuelle qui ne protège pas l'exploitation de cette valeur ajoutée (peut-on interdire le traitement sur un livre acheté ?), que du côté économique (comment mesurer la valeur de cette validation ?). D'autre part, la notion de collections (d'objets individuels reliés par un ou plusieurs éléments communs) adaptées à tel ou tel besoin, à telle ou telle communauté garde toute sa pertinence, mais il s'agit de collections virtuelles dont la matérialisation se trouvent dans les métadonnées construites automatiquement et manuellement.

samedi 26 août 2006

Modèles de média, Web et publicité

Une étude de D. Targy intitulée Les médias face à l'Internet, Stratégies de développement et business models performants pour la presse, la radio et la télévision, vient de paraître. Elle est trop chère pour un universitaire (présentation) , mais l'auteur est interviewé par Libération' du 25-08-2006, entretien commenté par ailleurs par E Parody.

Extraits de l'entretien : «Yahoo ou MSN ont pris la place des groupes de presse» Libération, Christophe ALIX, 25 août 2006

''Pourquoi ces grands médias ne trouvent-ils pas un modèle économique efficace en ligne ? La grande faiblesse, c'est l'étroitesse du marché publicitaire en ligne. Les recettes générées par l'e-pub restent très peu élevées en raison du coût très modique des campagnes en ligne, bien moins chères qu'à l'époque de la bulle Internet. Si cette publicité très bon marché fait l'affaire des annonceurs, c'est en revanche la disette pour les médias ! En France, les sites de médias toutes catégories confondues, plus les nouveaux venus comme Aufeminin.com, ont généré un chiffre d'affaires en ligne d'à peine 150 millions d'euros en 2005. C'est moins de 1 % du total des 16,5 milliards d'euros de recettes dégagées en 2005 par les médias français et nos projections à l'horizon 2010 montrent que cette contribution de l'Internet restera très limitée : 375 millions d'euros, 3 % du total ! D'où la difficulté à faire de l'Internet une véritable source de revenus... On dit qu'à l'échelle européenne, 70 à 80 % des investissements publicitaires en ligne sont captés par un tout petit nombre d'acteurs. (..)

L'autre caractéristique du marché, c'est que ce gâteau publicitaire est largement concentré autour d'une poignée d'acteurs, ceux que j'appelle les sites «routeurs», les grands portails qui captent la plus grosse part de l'audience. Ces Google, Yahoo ou MSN sont les nouveaux géants des médias à l'ère numérique, les «hubs», ou carrefours de la distribution de l'information en ligne. Ils ont pris la place qu'auraient peut-être pu occuper les grands médias s'ils avaient réagi plus tôt et ce sont les seuls, grâce à leur audience massive, capables de générer de forts revenus publicitaires.''

Extraits de la présentation :

''Dans la configuration concurrentielle du Web, les médias qui se positionnent comme des éditeurs de portails de contenus, ne sont pas en position favorable pour capturer la valeur. Les portails routeurs (Google, Yahoo ainsi que les portails de fournisseurs d’accès à Internet), que l’étude PRECEPTA assimile à des « hubs de news et d’audience » (HNA), sont les véritables maîtres du jeu sur Internet. Non seulement, leur rôle de distributeur d’audience leur permet de prélever une part substantielle de la valeur créée au sein de la filière, mais leur stratégie de développement constitue une véritable menace pour les portails de contenus. En produisant leurs propres flux d’information, et en jouant la carte de l’exclusivité, les HNA se présentent de plus en plus comme de redoutables concurrents des médias en ligne. (..)

les travaux menés (..) à partir de cas réels ont permis de dégager sept modèles types de développement, en fonction des modèles éditoriaux et économiques choisis, de la distanciation de l’offre par rapport aux supports traditionnels et des objectifs poursuivis :

  1. L’abstention
  2. Le site alibi
  3. Le site compagnon recruteur
  4. Le site compagnon relais
  5. Le modèle de l’extension
  6. La redéfinition globale de l’offre ou la stratégie bi-médias
  7. La diversification de proximité.''

Extrait du commentaire d'E. Parody :

Contrairement à ce que laisse entendre le titre de l’article de Liberation, je doute de la capacité à long terme des portails à s’approprier durablement le marché des médias d’information. MSN en France tient son succés essentiellement à son populaire Messenger, Yahoo a entrepris une stratégie orientée vers le grand public façon TF1 qui le conduit à investir sur le sport, les loisirs et les services pratiques tandis que les contenus d’information et d’actualité n’ont pratiquement pas évolués depuis plusieurs années. Difficile dans ce cas de servir les besoins d’un lectorat exigeant en matière de contenus ciblés.

Mon commentaire : Ces informations et analyses intéressantes me paraissent confirmer une évolution différente des conclusions tirées par les experts qui, sous réserve d'une lecture de l'étude complète, sous-estiment la réalité du média Web. Celui-ci est construit sur une montée de la servicialisation, il s'agit d'un modèle différent et non une déclinaison du modèle antérieur des médias. Pour celui-ci l'avantage concurrentiel est la capacité de calcul, qui se manifeste aussi dans l'organisation du marché publicitaire (Adwords, Adsense). Rappelons-nous que, déjà aux temps héroïques du Minitel, celui-ci n'avait décollé que lorsque le journal Les dernières nouvelles d'Alsace avait ouvert un service de messagerie. Et la suite du développement du minitel préfigurait déjà les tendances explosives d'aujourd'hui. Voir, par exemple l'article de P. Pajon dans le numéro la revue Réseaux sur Dix ans de videotex.Cette analyse montre clairement que la question n'est pas la gratuité, mais la forme du média.

- page 132 de 144 -