Google Book et la BnF
Par Jean-Michel Salaun le vendredi 18 septembre 2009, 19:33 - Bibliothèques - Lien permanent
Alain Pierrot (qu'il soit remercié) m'a fait parvenir le rapport d'audit de l'Inspection générale des finances en France, commandé conjointement par le Ministère du budget, des comptes publics et de la fonction public et le Ministère de la culture et de la communication, et rendu en janvier 2009. On pourra trouver ici. Nul doute qu'il sera abondamment commenté. Voir déjà À la Toison d'or (là)
J'apprécie beaucoup les rapports de l'Igf qui fournissent de nombreuses informations et montrent toujours un grand souci du bien public.. et bien entendu des deniers de l'État. Celui-là est un modèle du genre. Il montre clairement les défis d'économie publique auxquels la BnF est confrontée en analysant aussi bien la valeur des collections, le climat social interne, la gestion du patrimoine immobilier, le développement de la bibliothèque numérique, la relance de la fréquentation, insistant chaque fois sur la mission de service public de la bibliothèque nationale. C'est un joli cas d'école qui me servira à coup sûr à l'avenir comme étude de cas pour la mise en pratique de la méthode d'analyse stratégique qui conclut le cours sur l'économie du document (là).
Mais pour s'en tenir à une actualité chaude, voici les passages qui concernent les discussions entre la BnF et Google.
Extrait du rapport p.13-14 :
Le développement du numérique constitue ainsi un enjeu stratégique pour l’avenir de la bibliothèque, qui aura un impact sur l’ensemble de ses métiers. Il suppose donc de définir une structure cible d’emplois et de compétences à moyen terme et d’actualiser en conséquence la cartographie des métiers de la BnF, afin d’y intégrer son impact transversal. Pour autant, la stratégie de numérisation de la BnF, à vocation encyclopédique par sa volumétrie et ses critères de sélection, apparaît aujourd’hui peu adaptée dans le contexte de développement très rapide de la bibliothèque numérique du moteur de recherche Google. Alors même que ce dernier a déjà numérisé 7 millions d’ouvrages et compte au moins doubler ce chiffre dans les années à venir, la BnF est entrée dans une logique de numérisation « productiviste », qui la conduit à procéder à une sélection avant tout négative fondée sur la simple élimination des ouvrages impropres à la numérisation de masse, selon des critères essentiellement physiques et non en fonction de choix raisonnés de valorisation patrimoniale. En outre, le passage à une numérisation de masse depuis l’an dernier pose d’importants problèmes d’organisation interne à la bibliothèque, qui ne parvient pas à tenir le rythme prévu, alors même qu’un nombre important d’agents (plus de 60 ETP) est mobilisé à cet effet.
Or la BnF ne pourra pas concurrencer Google par le nombre, puisque sa bibliothèque numérique atteindra au mieux la taille du seul fonds ancien de la bibliothèque municipale de Lyon, que Google s’est engagé à numériser dans les années à venir, ce qui représente 5 % du nombre d’ouvrages disponibles sur Google Book Search. De surcroît, cette politique conduit la BnF à négliger la numérisation des collections de presse (malgré un plan spécifique, qui n’aura couvert que 2 % des collections de presse de la bibliothèque sur sept ans d’ici 2012) et de l’audiovisuel, supports pourtant éminemment fragiles7 et dont la consultation en ligne correspond à une attente forte du public.
2. La BnF doit passer d’une logique quantitative à une logique plus qualitative et partenariale, davantage tournée vers les urgences et les attentes du public
La bibliothèque devrait donc chercher à se différencier davantage par la qualité de sa bibliothèque numérique et l’accompagnement éditorial qu’elle peut proposer, à la différence de Google. La sortie d’une logique de masse permettrait en effet à la fois de renforcer la diversité documentaire de Gallica, de remédier aux dysfonctionnements induits par la logique actuelle de flux tendus et de libérer des crédits pour les réallouer à un nombre plus restreint d’ouvrages, mais mieux choisis et présentant une qualité de numérisation accrue.
Dès lors, il apparaît nécessaire de renforcer la logique de sélection qualitative, en ciblant davantage la numérisation sur les pièces les plus précieuses et distinctives de la BnF (ouvrages de la réserve, collections spécialisées), ainsi que sur les collections les plus demandées et/ou les supports les plus menacés, en particulier l’audiovisuel et la presse. Une telle évolution suppose entre autres d’étendre l’éligibilité des projets financés par les crédits du centre national du livre à l’ensemble des supports de la BnF, afin de renforcer la pertinence de la numérisation et de l’orienter en priorité vers les supports les plus fragiles et/ou les plus demandés.
Note 7 À titre d’illustration de cette fragilité, la BnF estime que 90 % des articles de presse relatifs à l’affaire Dreyfus ne sont plus immédiatement communicables au public du fait de leur état de dégradation.
Extrait de la réponse du président de la BNF sur ce point (p.11-12) :
S'agissant d'une possibilité d'ouvrir des discussions avec Google sur la numérisation d'une partie des collections de la BnF, il convient de rappeler que les contacts avec la firme californienne, comme avec Microsoft, ont été réguliers et pourraient connaître de nouveaux développements.
Il y a lieu également de souligner que le projet Google Book Search et Gallica ne sont pas concurrents mais complémentaires. Alors que le premier vise à constituer un gigantesque réservoir de données, Gallica entend développer une véritable bibliothèque, reposant sur une organisation du savoir, une diversité des fonds numérisés et une éditorialisation des contenus.
Microsoft s'étant retiré, une éventuelle coopération avec Google ne pourrait s'inscrire que dans le cadre suivant :
- porter uniquement sur les œuvres du domaine public, compte tenu des différends opposant Google aux éditeurs, non encore réglés par le projet d'accord intervenu aux États-Unis :
- venir en complément des programmes de numérisation de massa financés par le CNL, quitte à réorienter ces derniers, de manière à ne pas se placer dans une situation de dépendance ;
- limiter les restrictions d'accès éventuelles aux seuls acteurs commerciaux, de manière à préserver Europeana et le réseau des bibliothèques numériques francophones.
Dans ce cadre, la BnF pourrait confier à Google la numérisation de la collection des doubles naguère conservée à Versailles et aujourd'hui stockée sur le site François-Mitterrand, ce qui aurait l'avantage de ne pas interférer avec le fonctionnement des départements puisque ces ouvrages ne sont pas communiqués, ainsi qu'une partie des microfilms de la presse du XXIème siècle.
En échange, Google serait prêt à confier à la BnF, en vue de leur intégration dans Gallica, les fichiers des ouvrages du domaine public de langue française déjà numérisés dans les bibliothèques américaines partenaires mais aussi de ceux qui seraient numérisés en Europe, par exemple, à la Bibliothèque municipale de Lyon.
Si tel était le cas, les programmes de numérisation de masse financés par le CNL (actuellement 100 000 documents par an jusqu'en 2010) pourraient voir leur voilure ajustée par la suite en ce qui concerne les collections de la BnF et pourraient s'ouvrir beaucoup plus largement aux autres bibliothèques françaises dans le cadre du futur schéma national numérique.
La stratégie à moyen terme pourrait donc être la suivante :
- numérisation de masse des monographies et des périodiques de la BnF et de ses pôles associés financée par les crédits CNL et, de manière complémentaire, par Google,
- numérisation d'envergure de la presse, pour laquelle un financement pérenne reste à trouver,
- numérisation méthodique des collections uniques ou rares de la BnF (livres rares, manuscrits, estampes...) financée sur fonds propres de l'établissement ou sur subvention spécifique (y compris le CNL pour la réserve des livres rares).
Relevons rapidement plusieurs point :
- De façon anecdotique, on peut sourire à voir le président de la BnF se comporter en Ministre de la culture et définir une politique nationale de numérisation. Plus encore à constater que la BnF récupèrerait des collections numérisées d'autres bibliothèques, américaines ou française (Lyon) via une firme privée (Google) sans même qu'il soit envisagé, ni obligatoire, de demander leur consentement.
- Le processus de numérisation des collections comprend clairement aujourd'hui deux logiques : une industrielle, une manufacturière (plutôt qu'artisanale car on vise malgré tout les grands nombres). Savoir si ces deux logiques sont compatibles reste une question ouverte. L'expérience malheureuse de l'augmentation des cadences à la BnF montre en tous cas que les bibliothèques ne sont pas armées pour l'industriel. La BM de Lyon a fait le pari que Google saura faire du manufacturier en lui confiant ses collections précieuses. La BnF parait tentée de suivre la même voie.
- Le financement public (ou la volonté publique) parait insuffisant(e) pour financer y compris les collections patrimoniales et ceci dans tous les pays. Le recours à Google dans ce contexte est peut-être inéluctable. Cette situation est exceptionnelle, due à la réussite insolente de la firme et à son cash-flow. Il est probable qu'elle ne se reproduise pas. Comme par définition la numérisation du patrimoine est aussi exceptionnelle et ne devrait pas en principe se reproduire, il y a là un effet d'aubaine fort.
- Mais la stratégie de la firme est de viser l'industriel, c'est un peu comme une troisième édition du livre après l'originale puis le livre de poche. Et c'est un des enjeux de la discussion de la firme avec les éditeurs-auteurs aux US : Google renouera-t-il avec le métier d'imprimeur-libraire en réimprimant des livres à la carte ou les diffusant sous format numérique qui plus est en position de monopole sur certains créneaux (livres épuisés) ? Il est ironique que des bibliothèques aient été les involontaires complices de l'opération. Il serait juste qu'elles obtiennent en retour quelques compensations ou que soit clairement confié à Google une mission de service public comprenant des devoirs.
- L'idée selon laquelle Google viserait à faire un vaste entrepôt de données alors que les bibliothèques seraient préoccupées de collection confond deux raisonnements : l'architecture informatique sera toujours au plus bas niveau un entrepôt de données et l'organisation des informations se trouve sur une couche supérieure. Rien n'empêche Google d'organiser, s'il le souhaite, des collections ou les bibliothèques de se servir des mêmes données pour le même objectif. Qui sait ce qui se passera demain ?
- L'autre intérêt de la firme est de constituer un immense corpus de texte édité sur lequel il pourra et peut déjà faire tourner ses outils de traitement de la langue et de traçage des lecteurs. Sur ce point, la stratégie est plutôt défensive : occuper le terrain pour capter les internautes que commercialement offensive (pas ou peu de publicité contextuelle).
- Tout cela me conforte encore dans la présentation des modèles de média sous forme de pentagone. Goggle Book s'est installé entre le modèle de la bibliothèque en récupérant ses collections et celui de la radio-TV par une logique de flux. Et elle cherche à se diversifier en se positionnant sur le modèle éditorial en bousculant ses acteurs. Voilà de quoi actualiser la séance correspondante du cours (là) pour un superbe exemple.
Actu du 12 oct 2009
Sergey Brin, “A Library to Last Forever,” The New York Times, Octobre 9, 2009, sec. Opinion ici.
Commentaires
Bonjour,
beaucoup d'actualités autour de Google et du livre ces jours-ci !
http://www.livreshebdo.fr/numerique...
http://www.livreshebdo.fr/politique...
http://www.livreshebdo.fr/numerique...
Hervé
Oui Hervé.
Et une actualité qui doit tout particulièrement alerter Xerox, non ?
Sais pas si ce billet pourra vous intéresser, mais bon...
http://lescalier.wordpress.com/2009...
Merci Maraudeur pour le lien.
Les commentaires du billet sont vertigineux au sens propre.