Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

vendredi 11 avril 2008

Une explication de la popularité de Google

Voilà un article qui risque d'intéresser du monde, depuis ceux qui travaillent sur le traitement automatique de la langue jusqu'à ceux qui analysent les avantages concurrentiels en passant par les professionnels de la redocumentarisation ;-).

The Retrieval Effectiveness of Web Search Engines: Considering Results Descriptions, Dirk Lewandowski, Pre-print d'un article à paraître dans Journal of Documentation, Pdf, repéré par Marc Duval ici.

Il s'agit d'une étude classique des performances de différents moteurs en Allemagne à partir de la pertinence des résultats notés par un groupe de testeurs. Au final, les deux principaux moteurs, Yahoo! et Google arrivent pratiquement à égalité pour la pertinence des résultats. Mais, extrait de la conclusion (trad JMS) :

Alors pourquoi les internautes préfèrent Google ? Il peut y avoir de nombreuses raisons, mais nous pensons par cette enquête pouvoir en ajouter une, jusqu'ici négligée : la description des résultats. Là, il y a une différence considérable entre Google et Yahoo!. Google propose de loin le plus grand nombre (et le plus grand ratio) de descriptions pertinentes. Pourtant, il est intéressant de remarquer que Google n'utilise pas des outils vraiment différents de ses concurrents (tous les moteurs utilisent KWIC, pour la plupart des situations), mais il semble que l'identification des parties pertinentes du document utilisées pour la description fonctionne mieux pour ce moteur.

Microsoft-Yahoo!-Google, deux analyses

Je n'ai pas commenté la tentative de rachat de Yahoo! par Microsoft. L'échéance approchant les initiatives se multiplient et il se joue une partie de poker menteur dont on ne pourra décrypter les tenants et aboutissants qu'après coup. Je continuerai donc de m'abstenir.

Néanmoins c'est aussi l'occasion d'analyses qui prennent un peu de recul. J'ai retenu ces deux là :

  • Google, Yahoo et Microsoft à la recherche d’un modèle économique, Mouvements tectoniques sur la Toile, Hervé Le Crosnier, Le Monde Diplomatique, mars 2008, ici

Il expose clairement les deux logiques publicitaires, celle de la diffusion et celle de l'accès, même s'il n'utilise pas ce vocabulaire.

  • Un mariage risqué, suite, Olivier Ezratty, Opinion Libre, 13 février 2008,

Les succès et les échecs de Microsoft par à mon avis un des meilleurs analystes francophones de l'économie industrielle numérique.

dimanche 06 avril 2008

Google est-il un «vrai» média ?

Oui et non.

Tout d'abord, je dois avouer que la question m'a été soufflée par cette inquiétude d'un référenceur, citée dans un billet de Neteco :

« C'est la vraie question et c'est celle qui fait peur à l'industrie toute entière. Google n'est plus neutre dans ses résultats de recherche et se transforme en un vrai média qui veut garder l'internaute plus longtemps sur ses pages »

La recherche universelle de Google va t’elle changer les règles du référencement ?, Jérôme Bouteiller, Neteco, 4 Avril 2008. ici

L'inquiétude est fondée et l'évolution de la structure du chiffre d'affaires de Google, éclairante sur ce point, m'avait déjà fait répondre oui à la question première (voir ). Néanmoins cette réponse est incomplète, car, j'ai affirmé, par ailleurs (), que la logique économique des médias classiques orientée vers la diffusion était antagonique à celle du Web-média, dont Google est le plus beau fleuron.

En réalité, je crois que l'on peut maintenant avoir une meilleure vue d'ensemble. Deux arguments supplémentaires permettent de mieux comprendre.

1. Diffusion et accès s'équilibrent

Source : Impact des campagnes marketing on line sur les visites des sites web, XITIMonitor, 2 avril 2008 ici, repéré par le billet de Neteco.

Si l'on croit cette étude, les internautes arriveraient sur un site à part égale au travers d'un moteur de recherche ou d'un accès direct (par l'URL), chacun des chemins représentant 1/3 environ. Ensuite pour moins de la moitié des précédents, on trouve deux autres chemins : les liens d'autres sites, soit ce que certains appellent l'écologie du Web qu'il convient donc de relativiser ; les liens sponsorisés, dominés par Google qui contrôlerait 83% de ce trafic. Le reste étant marginal.

D'une façon un peu grossière, on peut en conclure en additionnant les chiffres que le trafic du Web est généré par une logique de diffusion ou d'accès, à parts strictement égales (45,8%). En effet, les internautes qui se rendent directement sur un site ou passent par un autre pour y arriver ont un comportement de lecteur de média classique, piloté par la diffusion. Tandis que ceux qui s'adressent à un moteur sont dans une logique de Web-média, telle qu'elle est entendue ici pilotée par la recherche d'information.

Il convient évidemment de prendre ces chiffres avec prudence. Mon propos vise simplement à montrer qu'il s'effectue progressivement un partage entre les deux logiques de navigation, sans chercher à le chiffrer précisément.

2. Bannières et mot-clés se complètent

Mais la structure du chiffre d'affaires de Google sera en 2008 sensiblement différente de celle des années précédentes, non que la publicité y tiendra moins de place, mais parce que la firme a depuis absorbé un gros joueur Doubleclick. Comme le montre très clairement D. Durand, jusqu'ici Google s'adressait à un marché publicitaire de longue traîne, caractéristique d'une logique d'accès dont les demandes sont très éclatées. C'est son génie d'avoir su innover et y appliquer son savoir faire par la vente de mots clés. Doubleclic, à l'inverse, se positionne dans la publicité classique, celle des bannières, celle des médias de diffusion.

On peut alors s'interroger sur les motivations de Google dans ce rachat. J'en vois au moins deux en suivant D. Durand : la première est de dominer le marché de la régie publicitaire sur le Web, ce qui peut relativiser l'inquiétude de la citation ouvrant ce billet (Google est autant aujourd'hui une régie qu'un média) mais creuser celle d'une position monopoliste dans le domaine ; la seconde, plus intéressante pour le raisonnement tenu ici, est la nécessité pour la firme de ne pas tarir la création de contenu et donc de laisser la place à une rentabilisation de contenu pour les principaux médias classiques en dynamisant le marché publicitaire.

Google (via Doubleclick) domine maintenant tous les segments de la publicité online, Didier Durand, Média & Tech, 3 avril 2008, ici.

Ainsi progressivement le Web-média affirme sa place dans le pentagone. Les rôles se redistribuent en partie, les recettes se récoltent et se partagent différemment. Et l'antagonisme entre les deux logiques d'accès et de diffusion s'atténue. Une des conséquences est la réalisation de forts gains de productivité, soit par stratégie (Google «rationalise» Doubleclic), soit sous la contrainte (réorganisation des journaux).

mercredi 05 mars 2008

Le trésor de Google

Hal Varian, ancien professeur d'économie à l'école de sciences de l'information de Berkeley et aujourd'hui Chief economist chez Google a régigé un billet éclairant sur le Blogue officiel de la société, non par les informations qu'il apporte, mais par la clarté du propos. En quelques paragraphes, il brosse une histoire américaine limpide des travaux sur les requètes, pour conclure sur les développements actuels de Google et insister sur l'importance de la collecte des données sur le comportement des utilisateurs. Pour comprendre l'enjeu, il faut se rappeler que les débats sur les données privées sont nourris aux US et que l'UE doit se prononcer justement sur cette question.

Varian Hal, Why data matters, 3/04/2008, Html

Extrait (Trad JMS, avec l'aide de Google, particulièrement performant sur ce texte ;-) :

Au fil des années, Google a continué à investir dans de meilleures fonctionnalités de recherche. Nos experts de la recherche d'information ont ajouté plus de 200 nouveaux critères aux algorithmes qui déterminent la pertinence des sites Web pour la requête d'un utilisateur.

Alors, d'où proviennent donc ces 200 critères supplémentaires ? Quelle est la prochaine étape de la recherche ? Et que nous devons faire pour trouver des informations encore plus pertinentes en ligne ?

Nous ne cessons d'expérimenter notre algorithme, le réglons et le précisons sur une base hebdomadaire pour améliorer la pertinence et l'utilité des résultats pour nos utilisateurs.

Mais pour trouver de nouvelles techniques de classement et évaluer si les utilisateurs trouvent leur bonheur, nous devons stocker et analyser les logs recherche. (Visionnez notre vidéo pour voir exactement quelles données nous conservons dans nos logs.) Sur quels résultats les gens cliquent-ils ? Quelle est le changement de leur comportement lorsque nous changeons des éléments de notre algorithme ? En utilisant des données des logs, nous pouvons comparer la façon dont nous vous faisons trouver l'information utile aujourd'hui par rapport à la façon dont nous le faisions il y a un an. Si nous ne gardons pas un historique, nous ne pouvons évaluer nos progrès et proposer des améliorations.

Pour choisir un exemple simple : le correcteur orthographique de Google est basée sur notre analyse des recherches de l'utilisateur compilées à partir de nos logs - et pas sur un dictionnaire. De même, nous avons eu beaucoup de succès en utilisant des requêtes de données pour améliorer nos informations sur les lieux géographiques, ce qui nous permet de fournir une meilleure recherche locale.

Repéré par D. Durand

mardi 12 février 2008

Google est un média

Je confirme une affirmation déjà souvent proclamée ici avec un argument financier. Juste en comparant quelques chiffres des comptes de Google des années 2005, 2006, 2007, on peut voir se construire petit à petit, en effet, l'économie d'un média autonome.

Je passe sur la croissance globale, impressionnante, même si la bourse en réclame toujours plus. Mais deux séries de chiffres sont très significatives :

  • La troisième ligne. La publicité fait toujours la quasi-totalité du revenu de la firme et il est peu probable que cela change maintenant. Les analystes qui comparent Microsoft et Google, comparent en réalité des firmes qui sont sur des marchés séparés, même si la seconde voudrait bien profiter de celui de la première. Autrement dit, Microsoft cherche à se diversifier, mais Google cherche, lui, à consolider sa position dominante de média.
  • La première ligne. On voit très clairement le centrage progressif sur l'activité interne, qui passe de 55 à 64%. Ainsi l'hyperactivité de Google ne doit pas faire illusion, elle est centripète. Le mariage de Adwords et du moteur est le coeur de l'activité. Le premier revend l'attention construite par le second. L'un et l'autre fonctionnent sur le même modèle : un calcul statistique entre les mots et les hits.

Sources informations financières de Google : Google Announces Fourth Quarter And Fiscal Year 2006 Results (ici) ; Google Announces Fourth Quarter And Fiscal Year 2007 Results ()

- page 7 de 11 -