Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

mercredi 06 février 2008

Google Book Search, les frustrations d'un narcisse

H. Guillaud s'émerveille (ici) à juste titre du moins pour l'exemple qu'il donne sur l'interface et le contenu de Google Book Search. Mais, étant narcissique comme tout blogueur qui se respecte, j'ai essayé avec mon nom.. et j'ai eu quelques surprises qui ont refroidi mon enthousiasme.

L'intérêt en effet de travailler sur soi-même est de pouvoir faire une comparaison avec la connaissance fine que l'on a de sa propre production. Ma bibliographie basique d'enseignant-chercheur comprend à la rubrique «Livre» 27 items. Il s'agit de livres dont je suis auteur, co-auteur ou seulement auteur d'un chapitre ou encore que j'ai dirigé.

La requête «jean-michel salaün» amène 34 titres à 18h le 6 février 2008 et 32 à 22h (je ne sais combien vous en aurez, c'est ). Parmi ces derniers, il y en a 10 dont je suis effectivement auteur au sens du paragraphe précédent, 4 où je suis cité (dont un dont j'ai fait la préface). A`ceux-là s'ajoutent 1 revue que j'ai co-dirigée, 1 mémoire d'étudiant que j'ai dirigé, 1 vieux polycopié d'un cours, pourquoi ceux-là ? mystère. Tous sauf un, qui propose un affichage d'extraits (c'est à dire quelques lignes lisibles) ne sont que des éléments bibliographiques vraisemblablement tirés de Worlcat. Le reste n'est que bruit d'homonymes et, curieusement, quelques pages numérisées de Livre-Hebdo.

La requête «jean-michel salaun», sans le tréma, amène 55 titres à 18h (54 à 22h20, c'est ), un peu de bruit, pratiquement aucun dont je suis l'auteur mais surtout beaucoup de citations dans des livres dans diverses langues dont j'ignorais jusqu'ici l'existence et dont 18 proposent un aperçu limité, c'est à dire quelques pages.

Conclusion : Je peux comprendre et excuser le bruit, on n'attend pas d'un moteur un tri parfait. Je comprends un peu moins le silence, mais, bon, le catalogage des bibliothécaires n'est pas non plus sans défaut. Je veux bien comprendre aussi qu'un seul livre soit numérisé, il faut du temps au temps, d'autant que ce n'est pas le plus mauvais ;-), mais j'ai un peu de mal à accepter qu'il ne soit pas accessible en texte intégral alors qu'il est depuis fort longtemps épuisé.

Mais ce qui me parait peu admissible, c'est le mélange des genres entre fiches de catalogue, livres numérisés, auteurs, citations, etc. Pour Google, le Web n'est qu'un vaste texte où tout se mélange. Cela se comprend pour le Web ordinaire, c'est difficile à admettre pour des documents inclus dans un ordre documentaire aussi structuré que celui des livres. Encore moins quand les bibliothécaires prêtent aussi complaisamment leurs outils. Que fait OCLC dans ce bic-à-brac ? Qu'a-t-il à y gagner ?

Sans doute les bibliothèques peuvent faire ainsi numériser leurs livres à faible coût. Mais le lecteur gagne-t-il quelque chose ? Pour ce qui concerne mon exemple en tous cas les seules informations que je n'aurais pas trouvées dans WorldCat sont les citations de mon nom, mais à part une minuscule satisfaction personnelle, elles n'apportent rien, car à ce niveau d'imprécision on ne peut en tirer de leçon. À vouloir jouer la rapidité à tout prix et la quantité, j'ai le sentiment que l'on ajoute surtout au bordel ambiant..

Sans doute l'exemple donné par H. Guillaud est différent.. sauf qu'il s'agit là d'un éditeur qui a choisi de donner un large accès à ses publications, autrement dit une exception.

samedi 06 octobre 2007

Google, le ciseau

Bien des analystes voient dans Google l'incarnation du Big brother orwellien, nous manipulant grâce à la connaissance de nos comportements qu'il accumule dans ses gigantesques bases de données. Je ne suis pas très convaincu par ces dénonciations qui ignorent la réalité de l'économie de la firme. Elle n'a vraiment pas vraiment besoin de cela. L'omniprésence de Google est pourtant réellement dangereuse, mais le danger est ailleurs.

Techcrunch vient de faire un calcul intéressant (ici). Il montre que Google contrôle près de 40% de toute la publicité en ligne aux US. De plus, je cite : le taux de croissance de Google est largement supérieur à celui de la publicité en ligne toute entière; 45,7% contre 26,5 % seulement. Un commentateur du billet ajoute : Sachant que les investissements publicitaires sur internet croissent 3 à 4 plus que sur les autres médias, Google sera dès l’année prochaine le plus gros médias au US en terme de CA pub… et probablement dans le monde car il est un des rares médias à être présent partout!

Par ailleurs nous savons déjà que Google est un des piliers de l'industrie du fair use (ici). Son influence accélère considérablement la mise en ligne gratuite de contenus sur le web qui justifie et optimise l'usage du moteur.

Ainsi le développement explosif de la firme agit sur les autres médias en pesant sur leurs revenus comme un ciseau dont chaque lame serait un de leurs deux marchés : il décourage l'acte d'achat de leurs lecteurs, auditeurs ou spectateurs et il accapare les revenus de leurs annonceurs. C'est une illustration de l'antagonisme des logiques économiques de la diffusion et de l'accès (ici et ) ?

Le vrai danger est là : l'assèchement des revenus des industries de contenu. Sans doute, il y a beaucoup à redire sur ces dernières, mais elles restent tout de même un des piliers de nos démocraties et de la richesse de nos arts et de notre culture. Le moment n'est plus loin, me semble-t-il, où il faudra que les États s'interrogent sur les conséquences de la puissance de Google.


Actu du 10-10-2007

Scot Karp dans un billet intitulé : The New Media Consolidation développe une idée complémentaire. Extrait (trad JMS) :

Google est la seule VRAIE réussite commerciale dans les médias de ces dernières années - peut-être de ce siècle - parce qu'il a trouvé comment consolider et monétiser le web en ENTIER, en captant l'attention des consommateurs de médias qui recherchaient le contenu d'autres acteurs - et ils ont même élargi la monétisation par le réseau Adsense aux sites où va cette attention.


Actu du 14-10-2007

Toujours dans le même sens, cet article du New York Time :

As Its Stock Tops $600, Google Faces Growing Risks, STEVE LOHR, October 13, 2007. Html

Repéré par F. Pisani


Actu du 15-10-2007

Et encore les chiffres et la concentration du marché publicitaire annoncé par Reuter :

Ad dollars flood Web, but will they go far enough? By Paul Thomasch Fri Oct 12. Html.

Repéré par D. Durand qui le commente.

vendredi 14 septembre 2007

Google est un média de masse

"Il faut, d'une part, limiter la collecte des données à des fins précises. Il faut également que cette collecte s'opère dans la transparence pour l'utilisateur et que ce dernier garde le contrôle des informations collectées qui le concernent. Enfin, il est nécessaire que ces informations soient conservées dans de bonnes conditions de sécurité."

Qui tient ce discours ? Peter Fleischer, responsable de la gestion des données privées de Google au cours de la conférence Ethique et droits de l'homme dans la société de l'information de l'Unesco qui se tient à Strasbourg en ce moment. Le tout est rapporté par Le Monde dans un article publié aujourd'hui :

Google plaide pour une harmonisation des règles de protection des données personnelles, Stéphane Foucard, Le Monde 14.09.07 Html

Voilà de quoi nuancer quelques critiques anti-googleliennes un peu simples sur les risques totalitaires de la stratégie de la firme. Le journaliste explique cette demande par le caractère international de l'implantation de la firme et de la diversité des législations qui le fragilise. Sans doute l'explication est juste.

Mais je ne saurai le suivre quand il trouve l'attitude paradoxale, indiquant que : Le modèle économique de Google est, en effet, fondé sur la publicité ciblée, qui implique de connaître le plus finement possible chaque utilisateur. En réalité, la publicité ciblée de Google est réalisée à partir des requêtes qui sont agrégées par mots clés et non précisément sur les utilisateurs. La nuance est d'importance. Il ne s'agit pas contrairement à ce que l'on dit souvent de one-to-one, mais bien d'un média de masse dont la distribution est simplement différente des modèles précédents. Sans cela, le marché publicitaire ne pourrait se construire. C'est justement la difficulté que rencontre les dits réseaux sociaux pour se valoriser (voir ici et ).

mercredi 23 mai 2007

"Je" les intéresse

H. Le Crosnier signale sur la liste RTP-DOC un article du Financial Times éclairant sur la stratégie de Google.

Google’s goal: to organise your daily life, By Caroline Daniel and Maija Palmer, Published: May 22 2007 21:08

Extraits :

“The goal is to enable Google users to be able to ask the question such as ‘What shall I do tomorrow?’ and ‘What job shall I take?’ ”

The race to accumulate the most comprehensive database of individual information has become the new battleground for search engines as it will allow the industry to offer far more personalised advertisements. These are the holy grail for the search industry, as such advertising would command higher rates. (..)

Mr Schmidt told journalists in London: “We cannot even answer the most basic questions because we don’t know enough about you. That is the most important aspect of Google’s expansion.” (..)

Earlier this year, however, Google bowed to concerns from privacy activists in the US and Europe, by agreeing to limit the amount of time it keeps information about the internet searches made by its users to two years.

Voilà sans doute de quoi alimenter les inquiétudes d'Olivier sur le nouveau service de recherche universel de Google. Mais à vrai dire, il ne s'agit simplement que d'une avancée supplémentaire dans la mise en place de l'économie du Web-média dont j'ai montré la logique, pour le moment antagonique à celle des médias de diffusion.

L'oubli et l'anonymat

Plutôt que de dénoncer vainement un mouvement naturel de l'économie (post-)moderne, peut-être pourrait-on relever que la mise en place de plus en plus évidente de ce volet de l'économie de l'attention ouvre des voies nouvelles aux métiers traditionnels de la documentation : ceux d'archiviste et de bibliothécaire par la gestion de l'oubli et la préservation de l'anonymat, à condition bien sûr d'en prendre pleinement la mesure et de savoir imposer leur choix.

Les archivistes sont les maîtres de l'oubli. Ils décident ce qui doit être gardé et pour combien de temps (calendrier de conservation). Un papier récent signalé par InternetActu, montre que certains font déjà de l'archivistique, comme monsieur Jourdain faisait de la prose.. sans le savoir.

Useful Void: The Art of Forgetting in the Age of Ubiquitous Computing, By Viktor Mayer-Schoenberger Working Paper Number:RWP07-022, Submitted: 24/04/2007

Résumé :

As humans we have the capacity to remember – and to forget. For millennia remembering was hard, and forgetting easy. By default, we would forget. Digital technology has inverted this. Today, with affordable storage, effortless retrieval and global access remembering has become the default, for us individually and for society as a whole. We store our digital photos irrespective of whether they are good or not - because even choosing which to throw away is too time-consuming, and keep different versions of the documents we work on, just in case we ever need to go back to an earlier one. Google saves every search query, and millions of video surveillance cameras retain our movements. In this article I analyze this shift and link it to technological innovation and information economics. Then I suggest why we may want to worry about the shift, and call for what I term data ecology. In contrast to others I do not call for comprehensive new laws or constitutional adjudication. Instead I propose a simple rule that reinstates the default of forgetting our societies have experienced for millennia, and I show how a combination of law and technology can achieve this shift.

Par ailleurs, les bibliothécaires américains, dans leur combat contre le Patriot Act, on montré combien la notion d'anonymat dans la lecture était importante. Voir par exemple la présentation de Ph. Cantié dans le BBF. Sans doute, la perspective de Google est plus soft, commerciale, moins brutale et moins directement politique, néanmoins il me parait essentiel que les individus puissent trouver encore des lieux de culture et de connaissance où leurs comportements ne soient pas orientés par une logique marchande.

lundi 19 mars 2007

Quand Microsoft verrouille l'accès à Google

Repéré par Dany Bouchard merci à lui.

Décidément les relations se tendent autour des enjeux financiers du Web. Après les polémiques et procès entre industries de contenu et moteurs ou tenant du libre, voici une nouvelle bataille du côté des entreprises de logiciels. Dans le Devoir de ce jour, un article présente une pratique particulièrement agressive de Microsoft contre Google.

Le principe est simple. Microsoft propose à ses entreprises clientes de brider l'accès à Google afin de favoriser son propre moteur. Extraits de l'article :

Technologies - Quand Google ne répond plus, Bruno Guglielminetti, Le Devoir, Édition du lundi 19 mars 2007

Chaque fois qu'un employé de l'entreprise choisit de faire une recherche à l'aide de l'outil de recherche de Microsoft, celle-ci obtient des crédits. Des crédits qui peuvent aller de deux dollars à dix dollars américains par poste de travail et qui peuvent être utilisés pour de la formation ou des produits de Microsoft. À ce montant, il faut également ajouter un crédit de 25 000 $ à l'adhésion au programme. (..)

Mais, dans les faits, c'est probablement un des gestes stratégiques les plus importants que l'éditeur a fait depuis longtemps et surtout, à moyen terme, un des plus payants. Car en utilisant à la base ces partenaires d'affaires, qui utilisent depuis longtemps l'environnement Windows, Microsoft pourra faire changer les habitudes de comportement des grandes entreprises dans un premier temps et celles de leurs employés dans un second. Au bout du compte, il n'en coûtera à Microsoft qu'une petite partie des centaines de milliers de dollars qui sont investis chaque année par ces grandes entreprises pour optimiser leur usage des outils Windows.

- page 8 de 11 -