Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

lundi 14 août 2006

Actu de Google Book Search

Quelques nouvelles du projet de numérisation des livres de Google, de son origine et de la controverse juridique. Anecdotique, mais intéressant :

Search Me? Google Wants to Digitize Every Book. Publishers Say Read the Fine Print First. By Bob Thompson Washington Post Staff Writer Sunday, August 13, 2006; D01

Pour donner le ton, un extrait de la rencontre entre le responsable de la bibliothèque de Standford et des responsables de Google :

"It was a very short conversation," Keller says. "Basically they said, 'What do you think about digitizing every book in the library?' And we said, 'Yay!' "

vendredi 04 août 2006

Google et Baidu, monopole, concurrence et modèle

Inutile d'en rajouter sur le cercle économique vertueux dans lequel s'est installé Google. Il ne manque pas de Blogs pour en repérer les moindres symptômes. Pour s'en tenir aux français, je dois rendre hommage à Affordance, Adscriptor, media & tech, ou encore Abondance, qui nourrissent abondamment mes réflexions.

Juste deux demarques du dernier pour amorcer le questionnement de ce billet. Olivier Andrieu a fait une projection, artificielle mais impressionnante, à partir des données fournies régulièrement par le baromètre du Xiti

Il s'agit du trafic généré par les outils de recherche sur le Web francophone. Ainsi, selon O. Andrieu, si Google poursuivait la croissance amorcée l'année dernière, il atteindrait le monopole de la recherche sur l'Internet en francophonie en octobre de l'année prochaine.. soit demain. Conséquence inéluctable, l'auteur dans son dernier billet cite déjà sept grands noms oubliés de l'histoire pourtant récente du domaine. L'actualité peut nous rendre pessimiste sur quelques autres..

Mais ce qui est valable dans le monde francophone, l'est moins dans le monde anglophone où Google domine, mais n'écrase pas encore, et surtout ne l'est pas du tout en Chine.

Rappelons pour commencer que la croissance de l'Internet en Chine est à l'image de celle du pays, explosive. Selon le China Internet Network Information Center (CNNIC), au 30 juin 2006 les internautes chinois ayant navigué au moins une heure par semaine étaient 123 millions (contre 2,25 en décembre 2000, date des premières statistiques).

Le CNNIC a réalisé une intéressante enquète sur la répartition de la recherche en ligne (diapos) à Pékin, Shanghai et Guangzhou. Voici les résultats pour Pékin :

Baidu, moteur chinois monté sur le modèle de Google par de jeunes entrepreneurs ayant étudié aux USA, arrive largement en tête. L'ordre se confirme, de façon légèrement moins affirmée, pour les deux autres villes.

Les résultats financiers de Baidu (communiqué, rapports complets), même s'ils sont (encore) beaucoup plus modestes, n'ont rien à envier en terme de croissance à ceux de Google. Pour le deuxième trimestre de 2006, le chiffre d'affaires a augmenté de 174,9% par rapport à la même époque l'année dernière (24 millions de $), et le bénéfice de 385,2% (7,3 millions) !

L'enquête du CNNIC a affiné l'analyse. Les principaux résultats montrent que le téléchargement de MP3 est le principal facteur du succès de Baidu. Les principaux utilisateurs de Baidu sont étudiants, tout spécialement de premier cycle comme le montre cette autre diapo :

L'échec relatif de Google en Chine peut être attribué, selon des analystes, à la popularité de Baidu dans la « génération du cool » (generation of cool), un positionnement que ne renierait pas une firme californienne !

Tirons déjà deux leçons de ces informations :

1) Google et Baidu, au delà de leur concurrence, sont organisés selon la même structure, le même type d'offres, le même modèle d'affaires. On s'en convaincra facilement en consultant sa page Produits de Baidu. Ainsi, il semble que se confirmer que ce qui se déroule sous nos yeux est bien la naissance d'un nouveau modèle de média et non simplement l'histoire particulière d'une firme, si extraordinaire soit-elle. Nous trouvons en Chine un duopole, en francophonie un monopole et en anglophonie une firme dominante et quelques challengers, structure mutatis mutandis pas si éloignée de la relation de télévision et territoire. Ainsi, parmi d'autres dimensions qu'il faudrait mieux étudier, les tentatives de contrôle de l'État chinois ou celles de l'État américain, parfois aussi assez hypocrites, ou encore la réaction plus épidermique de J.-N. Jeanneney, tout comme les réactions qu'elles ont suscitées, doivent être analysées à cette aune. Aucun État ne peut se désintéresser du développement des médias sur son territoire.

2) Pour les moteurs, la structure de la langue, et surtout celle de l'écriture sont déterminantes. La vraie muraille de Chine c'est son écriture, qui unifie le pays et le protège des influences étrangères. Citons la page de présentation de Baidu :

Baidu chose a poetic Chinese name because it wants the world to remember its heritage. As a native speaker of the Chinese language and a talented engineer, Baidu focuses on what it knows best - Chinese language search. Applying avant-garde technology to the world's most ancient and complex language is as challenging as it is exciting. At least people here at Baidu think so. As having diligently disclosed in the Prospectus of our recent Initial Public Offering, we believe there are at least 38 ways of saying "I" in Chinese. It is important that we master all the ways of addressing oneself in Chinese because our users depend on us to address every one of their daily queries. And trust us, pin pointing queries in the Chinese language is an art rather than a science.

Les moteurs étant construits sur le calcul appliqué à la langue, il est naturel que cette dimension soit première. Mais la remarque a d'importantes conséquences économiques. Les performances de son algorithme et surtout sa puissance de calcul ont donné à Google un avantage concurrentiel dans tous les territoires où l'alphabet romain et la syntaxe langagière ne sont pas trop différents de l'anglais. Mieux, la taille des marchés non anglophones, si elle est trop petite, rend difficile le développement d'une concurrence. C'est sans doute la raison principale de son monopole sur la francophonie. On peut en déduire aussi, compte tenu de l'ampleur des populations concernées, qu'il serait envisageable de voir se développer quelques challengers sur le bassin hispanique ou lusophone (comme il en persiste en anglophonie) et, plus vraisemblablement, un concurrent dans le monde arabe ou du côté de l'Inde.

jeudi 29 juin 2006

L'illusion de l'immatériel

Le vocabulaire est parfois trompeur. En français, on dit « informatique », « ordinateur ». On marque ainsi les qualités informationnelles et classificatoires de ces méthodes et outils. En anglais, on préfère « computer science », « computer » , renvoyant aux origines calculatoires de l'outil.

On oublie alors souvent en France que Google est, peut-être avant tout, un centre de calcul qui est interrogé par des calculateurs (nos ordinateurs personnels). Or les calculateurs sont des machines du « hard ». Le New York Times a révélé que la firme était en train de bâtir un nouveau centre dans l'Oregon. Microsoft et Yahoo! construisent le leur de leur côté, mais dans cette course Google est loin devant. Il aurait 450.000 serveurs connectés sur 25 lieux différents. L'objectif est, bien sûr, la vitesse de calcul et l'ampleur des services couverts.

Ainsi Didier Durand rapporte que le balayage complet du Web par Google vient de passer récemment à deux ou trois jours. Ou encore Jean-Marie Le Ray annonce le prochain lancement, parmi d'autres services, d'un traducteur de 3e génération, basé sur les calculs statistiques.

Du point de vue économique la stratégie est claire, comme l'indique le NYT, monter les barrières à l'entrée :

"Google wants to raise the barriers to entry by competitors by making the baseline service very expensive," said Brian Reid, a former Google executive who is now director of engineering at the Internet Systems Consortium in Redwood City, Calif.

Aussi ma conclusion sera inverse de celle de D. Durand sur le même sujet. Partant d'un calcul sur les bénéfices et le chiffre d'affaires, il indique :

..cela veut dire que la puissance financière d'une entreprise du monde de l'information (en tout cas!) n'est finalement plus le résultat de son infrastructure matérielle mais du logiciel qu'elle y installe (et dans la matière grise qui l'a élaboré!)

Peut-être le résultat financier, mais pas la puissance : le logiciel et la matière grise sont plus volatils que les machines, qui assurent la puissance et la suprématie de la firme. Aussi, il me semble que l'on a tort de trop exagérer les différences entre ces entreprises et les bonnes vieilles firmes capitalistiques.

Ces éléments peuvent faire douter de la réussite économique d'un Quaero qui paraît avoir négligé cette dimension du problème.

samedi 17 juin 2006

Solidités et fragilités de l'économie des moteurs

Quelques informations ou études récentes peuvent être mises en écho pour s'interroger sur l'économie future des moteurs :

- J.-M. Le Ray signale et traduit un intéressant billet de Vinny Lingham intitulé The Future of Search Engines ?

- Chris Amstrong met en parallèle deux études convergentes, l'une du JISC, l'autre d'OCLC qui montrent que les étudiants préfèrent massivement les moteurs à toutes les autres ressources documentaires proposées par les bibliothèques.

- Yahoo! s'allie avec eBay et élargie ainsi considérablement sa force de frappe commerciale et, par ailleurs, lance en France, après l'Australie, le Canada, l'Inde, le Royaume-Uni, les US, où il est devenu un véritable phénomène, son système de Questions/Réponses, basé sur l'entraide des internautes.

Quelques remarques contradictoires inspirées par ces nouvelles :

1) Si l'économie des moteurs reste basée sur la publicité, il lui faudra trouver une mesure consensuelle de son marché pour se consolider. C'est, à mon avis, l'enjeu principal des remarques de V. Lingham, qui propose une solution alternative au nombre de clics. Compte tenu de l'ampleur de la montée du marché publicitaire sur le Web, le débat est de taille. Il est vraisemblable qu'il faille un tiers extérieur pour construire cette mesure, car chaque acteur a tendance à la tordre à son profit et la confiance indispensable pour l'organisation d'un marché ne peut alors s'intaller durablement. Si cette hypothèse est juste, alors le système des enchères sur Google ne serait qu'un moment de l'économie du Web, illustrant une position hégémonique sur un marché non stabilisé plus qu'un modèle d'affaire durable.

2) Dans le domaine documentaire, la place prise par les moteurs en quelques années est très impressionnante. Il ne faut pas sousestimer l'inertie d'une telle tendance. L'influence du Web 2.0 (Blogs, fil RSS, tags etc.) est peut-être ici bien moins importante que ne le croient les observateurs du Web, fascinés à juste titre (mais en même temps aveuglés) par l'efficacité des outils qu'ils utilisent eux-mêmes. La loi du moindre effort conduit l'étudiant à l'outil le plus simple et le plus connu. L'objectif n'est pas le meilleur résultat mais le meilleur rapport résultat acceptable/énergie dépensée. Pour le domaine documentaire qui n'engage pas de transaction monétaire de l'utilisateur, les places prises seront difficiles à modifier.

3) Néanmoins, la fin du PageRank, prophétisée dans le billet de V. Lingham, peut-être aussi mise en écho avec le nouveau service proposé par Yahoo! qui semble inspiré de Wikipédia dont le succès foudroyant dans le domaine documentaire ne doit pas non plus être sousestimé.

mercredi 31 mai 2006

Les moteurs réduisent-ils le Web ?

Voici un papier fondamental pour mieux comprendre le darwinisme documentaire et par conséquent l'économie du document. Une conclusion pour nous dont Roger avait déjà eu l'intuition : les moteurs relèvent plus de la bibliothéconomie que de l'édition.

The egalitarian effect of search engines Authors: Santo Fortunato, Alessandro Flammini, Filippo Menczer, Alessandro Vespignani

Comments: 9 pages, 8 figures, 2 appendices Subj-class: Computers and Society; Information Retrieval; Physics and Society ACM-class: H.3.3; H.3.4; H.3.5; H.5.4; K.4.m

Search engines have become key media for our scientific, economic, and social activities by enabling people to access information on the Web in spite of its size and complexity. On the down side, search engines bias the traffic of users according to their page-ranking strategies, and some have argued that they create a vicious cycle that amplifies the dominance of established and already popular sites. We show that, contrary to these prior claims and our own intuition, the use of search engines actually has an egalitarian effect. We reconcile theoretical arguments with empirical evidence showing that the combination of retrieval by search engines and search behavior by users mitigates the attraction of popular pages, directing more traffic toward less popular sites, even in comparison to what would be expected from users randomly surfing the Web.

Voir aussi des mêmes un billet résumant la problématique et les résultats.

Repéré par J. Battelle

Actu 23-11-2006 : un résumé en français

- page 10 de 11 -