Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

vendredi 11 avril 2008

Une explication de la popularité de Google

Voilà un article qui risque d'intéresser du monde, depuis ceux qui travaillent sur le traitement automatique de la langue jusqu'à ceux qui analysent les avantages concurrentiels en passant par les professionnels de la redocumentarisation ;-).

The Retrieval Effectiveness of Web Search Engines: Considering Results Descriptions, Dirk Lewandowski, Pre-print d'un article à paraître dans Journal of Documentation, Pdf, repéré par Marc Duval ici.

Il s'agit d'une étude classique des performances de différents moteurs en Allemagne à partir de la pertinence des résultats notés par un groupe de testeurs. Au final, les deux principaux moteurs, Yahoo! et Google arrivent pratiquement à égalité pour la pertinence des résultats. Mais, extrait de la conclusion (trad JMS) :

Alors pourquoi les internautes préfèrent Google ? Il peut y avoir de nombreuses raisons, mais nous pensons par cette enquête pouvoir en ajouter une, jusqu'ici négligée : la description des résultats. Là, il y a une différence considérable entre Google et Yahoo!. Google propose de loin le plus grand nombre (et le plus grand ratio) de descriptions pertinentes. Pourtant, il est intéressant de remarquer que Google n'utilise pas des outils vraiment différents de ses concurrents (tous les moteurs utilisent KWIC, pour la plupart des situations), mais il semble que l'identification des parties pertinentes du document utilisées pour la description fonctionne mieux pour ce moteur.

Microsoft-Yahoo!-Google, deux analyses

Je n'ai pas commenté la tentative de rachat de Yahoo! par Microsoft. L'échéance approchant les initiatives se multiplient et il se joue une partie de poker menteur dont on ne pourra décrypter les tenants et aboutissants qu'après coup. Je continuerai donc de m'abstenir.

Néanmoins c'est aussi l'occasion d'analyses qui prennent un peu de recul. J'ai retenu ces deux là :

  • Google, Yahoo et Microsoft à la recherche d’un modèle économique, Mouvements tectoniques sur la Toile, Hervé Le Crosnier, Le Monde Diplomatique, mars 2008, ici

Il expose clairement les deux logiques publicitaires, celle de la diffusion et celle de l'accès, même s'il n'utilise pas ce vocabulaire.

  • Un mariage risqué, suite, Olivier Ezratty, Opinion Libre, 13 février 2008,

Les succès et les échecs de Microsoft par à mon avis un des meilleurs analystes francophones de l'économie industrielle numérique.

dimanche 06 avril 2008

Google est-il un «vrai» média ?

Oui et non.

Tout d'abord, je dois avouer que la question m'a été soufflée par cette inquiétude d'un référenceur, citée dans un billet de Neteco :

« C'est la vraie question et c'est celle qui fait peur à l'industrie toute entière. Google n'est plus neutre dans ses résultats de recherche et se transforme en un vrai média qui veut garder l'internaute plus longtemps sur ses pages »

La recherche universelle de Google va t’elle changer les règles du référencement ?, Jérôme Bouteiller, Neteco, 4 Avril 2008. ici

L'inquiétude est fondée et l'évolution de la structure du chiffre d'affaires de Google, éclairante sur ce point, m'avait déjà fait répondre oui à la question première (voir ). Néanmoins cette réponse est incomplète, car, j'ai affirmé, par ailleurs (), que la logique économique des médias classiques orientée vers la diffusion était antagonique à celle du Web-média, dont Google est le plus beau fleuron.

En réalité, je crois que l'on peut maintenant avoir une meilleure vue d'ensemble. Deux arguments supplémentaires permettent de mieux comprendre.

1. Diffusion et accès s'équilibrent

Source : Impact des campagnes marketing on line sur les visites des sites web, XITIMonitor, 2 avril 2008 ici, repéré par le billet de Neteco.

Si l'on croit cette étude, les internautes arriveraient sur un site à part égale au travers d'un moteur de recherche ou d'un accès direct (par l'URL), chacun des chemins représentant 1/3 environ. Ensuite pour moins de la moitié des précédents, on trouve deux autres chemins : les liens d'autres sites, soit ce que certains appellent l'écologie du Web qu'il convient donc de relativiser ; les liens sponsorisés, dominés par Google qui contrôlerait 83% de ce trafic. Le reste étant marginal.

D'une façon un peu grossière, on peut en conclure en additionnant les chiffres que le trafic du Web est généré par une logique de diffusion ou d'accès, à parts strictement égales (45,8%). En effet, les internautes qui se rendent directement sur un site ou passent par un autre pour y arriver ont un comportement de lecteur de média classique, piloté par la diffusion. Tandis que ceux qui s'adressent à un moteur sont dans une logique de Web-média, telle qu'elle est entendue ici pilotée par la recherche d'information.

Il convient évidemment de prendre ces chiffres avec prudence. Mon propos vise simplement à montrer qu'il s'effectue progressivement un partage entre les deux logiques de navigation, sans chercher à le chiffrer précisément.

2. Bannières et mot-clés se complètent

Mais la structure du chiffre d'affaires de Google sera en 2008 sensiblement différente de celle des années précédentes, non que la publicité y tiendra moins de place, mais parce que la firme a depuis absorbé un gros joueur Doubleclick. Comme le montre très clairement D. Durand, jusqu'ici Google s'adressait à un marché publicitaire de longue traîne, caractéristique d'une logique d'accès dont les demandes sont très éclatées. C'est son génie d'avoir su innover et y appliquer son savoir faire par la vente de mots clés. Doubleclic, à l'inverse, se positionne dans la publicité classique, celle des bannières, celle des médias de diffusion.

On peut alors s'interroger sur les motivations de Google dans ce rachat. J'en vois au moins deux en suivant D. Durand : la première est de dominer le marché de la régie publicitaire sur le Web, ce qui peut relativiser l'inquiétude de la citation ouvrant ce billet (Google est autant aujourd'hui une régie qu'un média) mais creuser celle d'une position monopoliste dans le domaine ; la seconde, plus intéressante pour le raisonnement tenu ici, est la nécessité pour la firme de ne pas tarir la création de contenu et donc de laisser la place à une rentabilisation de contenu pour les principaux médias classiques en dynamisant le marché publicitaire.

Google (via Doubleclick) domine maintenant tous les segments de la publicité online, Didier Durand, Média & Tech, 3 avril 2008, ici.

Ainsi progressivement le Web-média affirme sa place dans le pentagone. Les rôles se redistribuent en partie, les recettes se récoltent et se partagent différemment. Et l'antagonisme entre les deux logiques d'accès et de diffusion s'atténue. Une des conséquences est la réalisation de forts gains de productivité, soit par stratégie (Google «rationalise» Doubleclic), soit sous la contrainte (réorganisation des journaux).

samedi 05 avril 2008

Commentaires et anti-spam

Plusieurs personnes se sont récemment étonnées de ne pas voir apparaitre leur commentaire à la suite d'un de mes billets. Il ne s'agissait pas en l'occurrence d'une modération, même si cela peut arriver.

Je reçois en ce moment près d'une centaine de pages de titres de spam par jour dans l'anti-spam des commentaires.. et je ne peux plus matériellement vérifier si il y a eu des erreurs. J'essaie de tenir un filtrage sur les mots non pénalisant, mais parfois le problème est ailleurs. C'est l'adresse IP de l'expéditeur qui est filtrée quelque part en amont. Et là je n'ai même plus la main.

Si vous avez envoyé récemment un commentaire, s'il n'est pas apparu et que vous en gardez un double ou un souvenir. Repostez-le avec une copie sur mon courriel en parallèle (mon patronyme complet avec umontreal.ca). Je pourrai ainsi vérifier et corriger le cas échéant.

Actu du 10 avril Brrr..

Un million de PC robots pour 100 milliards de spam, Vincent, Clubic, 10 Avril 2008, ici, repéré par A. D'Alayer.

vendredi 04 avril 2008

La Référence

Les étudiants de l'EBSI viennent de publier le nouveau numéro de leur journal La Référence. Il est disponible localement sous format papier, mais aussi en ligne sur un site entièrement rénové, maintenant sous SPIP (ici).

L'occasion de se tenir au courant des derniers évènements d'une école, qui bouge au même rythme que son environnement donc très vite, et un bon exemple de l'intérêt des outils documentaires classiques pour la navigation interne et l'interactivité, sans tape-à-l'oeil inutile.

- page 75 de 144 -