Les signatures de Google avec des bibliothèques pour la numérisation de livres se poursuivent à grande vitesse dans le cadre du programme Google Book Search. La dernière annoncée marque un changement d'échelle puisqu'il s'agit d'un consortium de douze universités de recherche du Middle-West des US.

Ainsi il me semble maintenant que la messe est dite et que le Web-média, au moins pour la partie livres numérisés, s'organise dans un partenariat privé-public, avec d'un côté quelques très gros joueurs (presque exclusivement Google et Microsoft, et sur un registre différent Amazon) et, de l'autre, un grand nombre de grosses bibliothèques agissant plutôt en ordre dispersé. Reste à connaitre les engagements et responsabilités des uns et des autres.

Cette nouvelle a inspiré une série de réflexions, proches de ce point de vue, au très compétent responsable de la recherche d'OCLC Lorcan Dempsey qu'il a consigné dans un billet au titre révélateur : Systemic change: CIC and Google. J'en ai traduit cet extrait.

Pour moi, l'annonce du CIC déplace la discussion sur la numérisation de masse à un autre niveau. Le partenariat de Google avec les bibliothèques a paru une initiative intéressante. Mais il est maintenant probable que nous allons vers un changement systémique dans la façon de nous engager sur certaines catégories de matériaux. Cela à son tour a pour conséquence de nous obliger à réfléchir à la façon dont les ressources de la bibliothèque sont organisées globalement. Cela concerne notamment :

  • Trouvaille, découverte, fourniture. Cette initiative met en valeur le changement de dynamique de la découverte et de la fourniture dans un environnement réticulaire. Comme les gens ont une expérience de découverte plus riche, il devient plus important pour les bibliothèques de révéler dans ces environnement ce dont elles disposent et d'offrir des services complets intégrés. Une bibliothèque voudra qu'un utilisateur de Google Book Search connaisse ce qui est disponible dans sa propre institution. Bien sûr, Google fait actuellement le lien vers la bibliothèque, mais il doit devenir plus intuitif.
  • Collection commune. À mesure que le nombre de matériaux numérisés augmente, une réflexion plus forte doit être menée sur une approche collective de la gestion des collections : depuis l'accès, le développement, la gestion de l'inventaire et la conservation future. On le repère déjà dans les discussions qui s'amorcent sur les entrepôt extérieurs au site ou encore l'utilisation des espaces de la bibliothèque. Dans les prochaines années, je crois que nous aurons des initiatives collectives importantes dans ces directions.
  • Droit d'auteur, copyright. Ces questions sont bien connues et discutées. Pour les bibliothèques, et d'autres aussi, il est important de pouvoir repérer effectivement le statut de la propriété intellectuelle d'un objet aux différentes étapes de son cycle de vie. Nous ne pouvons encore le faire, pas efficacement, et certainement pas de façon automatisée et rendu accessible à partir d'une base de données interrogeable facilement pour une vérification. Plusieurs initiatives sont en cours, parmi elles celle d'OCLC qui explore la faisabilité d'un registre de droits.
  • Gestion des connaissances. Les bibliothèques, les centres d'archive, les musées et bien d'autres font d'important investissements dans la structuration des données sous forme de taxonomies, liste d'autorité, etc. La valeur de ces ressources doit être exploitée sur le Web. Tandis que Google affine son approche sur le texte, ou que d'autres sont capables de lancer des calculs sur les ressources, il y a alors une occasion intéressante de voir comment celles-ci pourraient être utilisées pour repérer les identités (nom de personnes, de lieux, etc.) dans une grosse masse de textes et comment ces outils pourraient eux-mêmes être améliorés par ces processus.
  • Conservation. Les bibliothèques et les organisations comparables ont exercé collectivement une responsabilité vis à vis des documents scientifiques et culturels. Elles ont préservé les matériaux rares. Elles ont aussi géré un large éventail de produits publiés. Et pour la plupart avec des conséquences négligeables sur le circuit de distribution des documents imprimés. Un grand nombre de copies ont préservé l'ensemble. Bien sûr, le numérique change aussi cette dynamique. Nous devons donc aussi réfléchir à la conservation des copies numériques produites. Mais cela souligne aussi des questions sur la gestion publique des documents imprimés et sur la dispersion des responsabilités dans ce domaine. Et des problèmes intéressants surgissent aussi sur la qualité, la couverture, la spécificité, etc. que nous attendons de la numérisation des imprimés, qui devraient nous occuper encore quelques temps.