Livre(s) : un pour tous, tous pour un
Par Jean-Michel Salaun le mardi 29 août 2006, 03:26 - Édition - Lien permanent
L'actualité rebondit autour de la numérisation des livres et de leur accès en ligne. Citons, parmi d'autres :
- l'annonce de la stratégie de la Communauté européenne sur une bibliothèque numérique (qui dépasse d'ailleurs l'écrit pour s'ouvrir à l'audiovisuel). Communiqué, rapport.
- une question qui commence à travailler les professionnels et experts du domaine, avec un prochain colloque pour des premières réponses : que faire avec un million de livres accessibles en ligne ? Et un très instructif article pour le comptage :
Roger C. Schonfeld, Brian F. Lavoie, Books without Boundaries: A Brief Tour of the System-wide Print Book Collection Journal of Electronic Publishing Summer 2006
- l'annonce par Google de la diffusion gratuite de livres du domaine public, numérisés à partir des fonds de bibliothèques et l'indignation d'O Erstzcheid.
Nous ouvrons sans doute le troisième chapitre de la redocumentarisation du livre, après celui des pionniers (à commencer par le projet Gutenberg et, en France, Gallica), puis celui de l'arrivée des projets industriels de numérisation et les polémiques qui l'ont accompagnée, nous abordons logiquement aujourd'hui l'interrogation sur les modes de diffusion et le positionnement des acteurs concernés.
Quelques remarques rapides sur ce chapitre qui s'écrit devant nous :
- il faut mettre en parallèle les développements de la stratégie de Google avec les propositions de la Communauté européenne qui à l'origine sont d'ailleurs une réaction à celle-là. De plus, on peut trouver dans l'histoire économique de la télévision des éléments pour décrypter l'actualité du livre numérisé. Les uns et les autres proposent en fait une nouvelle déclinaison de la distribution du livre, payée dans un cas par la publicité, dans l'autre par la puissance publique. Nous avons eu le même processus pour les films, passés dès ses débuts à la télévision privée (USA) ou publique (Europe). Pour le moment, nous n'en sommes qu'aux livres du domaine public, il est vraisemblable que pour les autres la question des droits d'auteurs se règlera progressivement avec un achat de droits de diffusion. Mais pour cela, il faut que la démonstration d'une rentabilité soit faite, que les structures et mentalités s'adaptent. Cela prendra du temps. De ce point de vue, les bibliothèques sont comparables à des télévisions locales. Sans doute, elles ont fait preuve de naïveté devant l'ogre Google, mais la question est plus de savoir si elles peuvent constituer un réseau national ou international public dans ce domaine que celle de leur légèreté pour construire une stratégie locale. Là aussi, même si elles ont une longue expérience de coopération et si des organismes comme OCLC montrent la voie, on peut penser qu'il faudra du temps.
- Un livre est et restera un objet individuel clos. C'est le principe même d'une information éditée. Sans doute, mettre en relation des millions de livres ouvre des perspectives inédites (le mot est approprié). Néanmoins, il ne faut pas confondre ces connections avec la constitution d'un seul texte qui représenterait le savoir de l'humanité. Cette remarque, alliée aux capacités de traitement de la langue, a d'importante conséquences : d'une part, celui qui détient des textes édités détient des textes validés ce qui est bien différent du tout venant du Web pour toutes sortes d'opérations (depuis la traduction, jusqu'aux services de question/réponse). Il y a là un trou béant aussi bien du côté juridique de la propriété intellectuelle qui ne protège pas l'exploitation de cette valeur ajoutée (peut-on interdire le traitement sur un livre acheté ?), que du côté économique (comment mesurer la valeur de cette validation ?). D'autre part, la notion de collections (d'objets individuels reliés par un ou plusieurs éléments communs) adaptées à tel ou tel besoin, à telle ou telle communauté garde toute sa pertinence, mais il s'agit de collections virtuelles dont la matérialisation se trouvent dans les métadonnées construites automatiquement et manuellement.
Commentaires
Bonjour Jean-Michel,
Pour l'apprroche des modèles économiques, ne perdons pas de vue trop vite le service réellement mis en place. Google n'a jamais prétendu construire une bibliothèque numérique* mais un service de recherche de livres s'appuyant la fouille en texte intégral des collections imprimées. La valeur qu'il en tirera sera d'autant meilleure que le service fourni sera techniquement efficace et utile pour l'usager, in fine. Mais pour l'heure, la performance du service comme aide au repérage d'un livre imprimé est loin d'être démontrée -- j'avais signalé déjà l'anecdote de la démo de Google lors du débat à la BPI l'an dernier : la fonction a fait remonter un livre dont les mots clés étaient contenus... dans le titre.
Service incident au premier, non-dit mais bien réel : l'usage de mots clés comme moyen de feuilleter efficacement un livre et d'en faire une consultation ultra-rapide au moyen d'un index automatique. Du point de vue de l'usage, ce service de 'lecture augmentée' d'un livre est très éloigné du premier service de repérage au sein de la collection.
Troisième service, le deuxième incident : la lecture en long et le téléchargement intégral des oeuvres du domaine public. Là seulement, Google est une bibliothèque numérique.
Il me semble assez évident, mais peut-être me trompé-je, que ces 3 services peuvent être des supports de valorisation très différents pour la firme. On est face à une forte complexité puisqu'un même service industriel de numérisation (scan robotisé + OCR à la volée) et un même jeu d'algorithmes produisent 3 utilités très différentes pour l'usagers ou pour les institutions partenaires. Bref, il me semble qu'on est assez loin de la relative simplicité des rapports entre télévision et cinéma par exemple, même si ton analogie aide à comprendre les manoeuvres en cours et leurs enjeux.
pierre schweitzer
* : cela dit, une bibliothèque est aussi, grâce à Dewey, aux thésaurus et aux catalogues, un 'service de recherche de livres' mais c'est bien là-dessus que se fait la compétition et non pas sur la collection elle-même. Les Fables d'Esope ne valent pas tant par leur énième exemplaire numérique entreposé chez Google que par l'enrichissement et la performance de leurs moyens d'accès.