H. Guillaud s'émerveille (ici) à juste titre du moins pour l'exemple qu'il donne sur l'interface et le contenu de Google Book Search. Mais, étant narcissique comme tout blogueur qui se respecte, j'ai essayé avec mon nom.. et j'ai eu quelques surprises qui ont refroidi mon enthousiasme.

L'intérêt en effet de travailler sur soi-même est de pouvoir faire une comparaison avec la connaissance fine que l'on a de sa propre production. Ma bibliographie basique d'enseignant-chercheur comprend à la rubrique «Livre» 27 items. Il s'agit de livres dont je suis auteur, co-auteur ou seulement auteur d'un chapitre ou encore que j'ai dirigé.

La requête «jean-michel salaün» amène 34 titres à 18h le 6 février 2008 et 32 à 22h (je ne sais combien vous en aurez, c'est ). Parmi ces derniers, il y en a 10 dont je suis effectivement auteur au sens du paragraphe précédent, 4 où je suis cité (dont un dont j'ai fait la préface). A`ceux-là s'ajoutent 1 revue que j'ai co-dirigée, 1 mémoire d'étudiant que j'ai dirigé, 1 vieux polycopié d'un cours, pourquoi ceux-là ? mystère. Tous sauf un, qui propose un affichage d'extraits (c'est à dire quelques lignes lisibles) ne sont que des éléments bibliographiques vraisemblablement tirés de Worlcat. Le reste n'est que bruit d'homonymes et, curieusement, quelques pages numérisées de Livre-Hebdo.

La requête «jean-michel salaun», sans le tréma, amène 55 titres à 18h (54 à 22h20, c'est ), un peu de bruit, pratiquement aucun dont je suis l'auteur mais surtout beaucoup de citations dans des livres dans diverses langues dont j'ignorais jusqu'ici l'existence et dont 18 proposent un aperçu limité, c'est à dire quelques pages.

Conclusion : Je peux comprendre et excuser le bruit, on n'attend pas d'un moteur un tri parfait. Je comprends un peu moins le silence, mais, bon, le catalogage des bibliothécaires n'est pas non plus sans défaut. Je veux bien comprendre aussi qu'un seul livre soit numérisé, il faut du temps au temps, d'autant que ce n'est pas le plus mauvais ;-), mais j'ai un peu de mal à accepter qu'il ne soit pas accessible en texte intégral alors qu'il est depuis fort longtemps épuisé.

Mais ce qui me parait peu admissible, c'est le mélange des genres entre fiches de catalogue, livres numérisés, auteurs, citations, etc. Pour Google, le Web n'est qu'un vaste texte où tout se mélange. Cela se comprend pour le Web ordinaire, c'est difficile à admettre pour des documents inclus dans un ordre documentaire aussi structuré que celui des livres. Encore moins quand les bibliothécaires prêtent aussi complaisamment leurs outils. Que fait OCLC dans ce bic-à-brac ? Qu'a-t-il à y gagner ?

Sans doute les bibliothèques peuvent faire ainsi numériser leurs livres à faible coût. Mais le lecteur gagne-t-il quelque chose ? Pour ce qui concerne mon exemple en tous cas les seules informations que je n'aurais pas trouvées dans WorldCat sont les citations de mon nom, mais à part une minuscule satisfaction personnelle, elles n'apportent rien, car à ce niveau d'imprécision on ne peut en tirer de leçon. À vouloir jouer la rapidité à tout prix et la quantité, j'ai le sentiment que l'on ajoute surtout au bordel ambiant..

Sans doute l'exemple donné par H. Guillaud est différent.. sauf qu'il s'agit là d'un éditeur qui a choisi de donner un large accès à ses publications, autrement dit une exception.