Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

Recherche - attention

vendredi 22 avril 2011

Bulle, pub et maths

Virginie Clayssen attire l'attention sur cet article dont elle traduit quelques extraits (ici). Il mérite vraiment lecture :

Ashlee Vance, « This Tech Bubble Is Different », BusinessWeek: Online Magazine, avril 14, 2011, ici.

Voici la traduction de quelques autres parties, en rapport avec les préoccupations de ce blogue :

En réalité, certaines bulles font du bien, même si elles se terminent mal. Dans les années 80, la croissance de Microsoft, Compaq et Intel a fait entrer les microordinateurs dans des millions d'entreprises et de domiciles, et les stocks de ces sociétés ont augmenté. La technologie a trébuché à la fin des années 80 et la Silicon Valley est restée avec nombre de microprocesseurs à bas prix et des théories pour les employer. Le boom des dot.com a gonflé avec la surévaluation de tout ce qui était lié au web.. Puis la correction est arrivée au début des années 2000, faisant s'évaporer sans doute 6 milliards de dollars chez les actionnaires. Mais ce cycle là a aussi laissé derrière lui une infrastructure pour l'internet qui a bénéficié aux entreprises et aux consommateurs.

Cette fois, l'accent est mis sur les moyens plus précis pour vendre. (..) « Chaque génération de gens intelligents va où est l'argent, aujourd'hui c'est la génération de la publicité » dit Steve Perlman un entrepreneur de la Silicon Valley. (..)

Alors si cette bulle est construite sur la capacité à amener les clients à acheter, que restera-t-il quand elle va éclater ? (..)

« Ma crainte est que la Silicon Valley ne ressemble maintenant à Hollywood », dit Glenn Kelman, directeur exécutif d'une société de courtage immobilier en ligne Redfin, après avoir été programmeur pendant vingt ans. « Un business tourné vers le divertissement à la recherche du succès rapide qui n'augmente pas fondamentalement la compétitivité de l'Amérique. » (..)

Les génies en math ont rejoint les as des logiciels dans les équipes. On les appelait les «Quants» à Wall Street, ce sont les «Wants» dans le business des réseaux sociaux.

Les opérations de ciblages ressemblent beaucoup à ce que les Quants faisaient à Wall Street. Un système Want pourrait par exemple observer ce que quelqu'un cherche sur Google, ce qu'il écrit sur Gmail, et les sites qu'il visite. « Vous récupérez ces données et puis construisez un système d'aide à la décision très rapide à partir de leur historique à orientation commerciale » dit Will Price, président de Flite un service de publicité en ligne. « Vous devez faire tous ces calculs avant le chargement de la page ».(..)

Personne ne prétend que le haut du panier, FaceBook ou Google, ne soit menacé si la bulle éclate. Mais pour le niveau en dessous ou celui d'encore en dessous, où on trouve nombre de start-ups qui s'accumulent dans toutes les niches possibles des réseaux sociaux et de la publicité, le destin de ces sociétés est aléatoire.(..)

En 1986, Microsoft, Oracle et Sun Microsystems ont été déclarées. Compaq a mis quatre ans à être classée dans le top des 500 de Fortune, la croissance la plus rapide de toute l'histoire. Chacune de ces sociétés a connu des haut et des bas, mais toutes ont construit des technologies qui ont engendré d'autres technologies. Et aujourd'hui ? Groupon, avec ses coupons envoyés aux gens par courriel, pourrait bien devenir la société à la croissance la plus rapide de tous les temps. Son chiffre d'affaires pourrait atteindre 4 milliards de $ cette année, 750 millions de plus que l'année dernière, et sa valorisation est de 25 milliards de $. Son héritage technologique est le mignon courriel.(..)

Groupon est une société qui propose des achats groupés pour faire baisser les prix (wkp). L'article souligne néanmoins que certains à la Silicon Valley tentent de construire des outils de traitement de données (sur l'ADN, sur le climat) à d'autres fins.

Eric Schadt, directeur scientifique de Pacific Biosciences, fabricant de machines pour séquencer le génome, prétend que les nouvelles découvertes sur les médicaments et les remèdes contre le cancer dépendent de ces outils d'analyse. Les sociétés qui utilisent les outils de Pacific Biosciences produiront des montagnes d'informations chaque jour pendant qu'ils séquenceront de plus en plus de gens. Leur objectif : cartographier les interactions complexes entre les gènes, les organes et les autres systèmes du corps et faire ressortir des questions sur les conséquences des interactions sur la santé et sur les remèdes. (..)

Actu du 9 juin 2012

Sur les ambiguïtés de l'introducton en bourse de Groupon : 1

« Groupon: la face cachée d’une croissance record », L’Expansion, juin 3, 2011, ici.

lundi 18 avril 2011

La bibliothèque, média du temps long

Robert Darnton vient de publier un nouvel article dans lequel il dénonce cinq mythes au sujet de l'âge de l'information. Voici la traduction du quatrième :

«Les bibliothèques sont périmées». Partout dans le pays (USA) les bibliothécaires signalent qu'ils n'ont jamais eu autant de public. À Harvard, notre salle de lecture est pleine. Les gens s'entassent dans les 85 antennes du réseau public de bibliothèques de New-York. Les bibliothèques fournissent comme toujours des livres, des vidéos et d'autres documents mais elles remplissent aussi d'autres fonctions : l'accès à l'information pour les petites entreprises, l'aide aux devoirs et autres activités après l'école pour les enfants, les informations pour les offres d'emploi pour les chômeurs (la disparition des petites annonces d'emploi dans les journaux imprimés ont rendu l'accès en ligne par la bibliothèque crucial pour les chômeurs). Les bibliothécaires répondent aux besoins de leurs usagers de nombreuses façons inédites jusqu'ici, par exemple en les guidant dans la jungle du cyberespace jusqu'aux matériaux numériques pertinents et fiables. Les bibliothèques n'ont jamais été des entrepôts de livres. Tout en continuant à fournir des livres, elles seront à l'avenir des centres nerveux pour la communication de l'information numérique aussi bien à l'échelle du quartier que sur les campus universitaires.

Cela m'a rappelé un chapitre sur l'économie des bibliothèques que j'ai écris pour un manuel à paraître cet automne sur l'économie du patrimoine. Voici un cours extrait du début :

«Si l’histoire des bibliothèques ne se confond pas avec celle de l’humanité, elle est néanmoins très longue, bien plus longue que celle des médias classiques, parallèle à celle de l’accumulation et de la transmission des connaissances depuis qu’elles sont consignées sur un support grâce à l’écriture. On trouve les premières traces de bibliothèques dans l’Antiquité dès le début de la construction des civilisations et parallèle à celle des empires en Assyrie, en Égypte, en Grèce, en Chine. Chaque fois, elles furent un lieu de conservation des documents tout autant qu’un lieu de leur production, par la copie des exemplaires, nécessitée par la fragilité des supports qu’il fallait renouveler, et par la volonté de diffuser les documents.

Beaucoup plus tard vers les 12e et 13e siècles pour la Corée et la Chine et le milieu du 15e siècle pour l’Europe, l’invention de l’imprimerie à caractères mobiles a entraîné l’externalisation de la reproduction matérielle des documents qui a quitté alors le giron des bibliothèques pour devenir une des premières industries des temps modernes. Une activité économiquement autonome de production et diffusion des livres s’est organisée progressivement à partir tout d’abord des imprimeurs-libraires. Puis vers la fin du 18e siècle, l’économie commerciale du livre s’est construite autour de la figure de l’éditeur telle que nous la connaissons aujourd’hui (Mollier, 2003).

L’éditeur a pris progressivement une place dominante dans le processus de production-diffusion de l’objet livre, et les bibliothèques ont alors perdu leur monopole sur l’ensemble de la filière. La production intellectuelle du livre et des connaissances en général n’a pas pour autant échappé complètement aux bibliothèques qui sont restées un lieu familier pour les lettrés. Écrivains, professeurs, chercheurs, étudiants les fréquentent pour préparer leurs travaux et construire leurs œuvres.

Par la suite, l’émergence de nouveaux médias et de nouvelles indus-tries culturelles, la presse populaire au 19e siècle, les disques et la radio au début du 20e, la télévision et la vidéo venant après le cinéma ont élargi l’éventail de l’information et de la distraction pour le public. La place du livre s’est relativisée, mais chaque fois que cela était possible les bibliothèques ont intégré les nouveaux supports dans leurs collections sans modifier leur modèle, ni réduire leur rôle. Parallèlement au développement explosif d’autres médias, l’édition de livres imprimés d’abord, puis la presse, et ensuite la radio ou la télévision, la bibliothèque a bien maintenu son organisation, l’a développée par touches successives, a continué de la perfectionner, a accompagné et parfois devancé la gestion et la diffusion des connaissances dans les sociétés. Il faut ici faire une distinction entre les médias d’information enregistrées comme l’édition en général qui manipule des supports (livre, presse, disques) et les médias de communication qui distribuent du signal (radio, télévision). La production des premiers est intégrée directement dans les bibliothèques, celle des seconds ne peut l’être que dans la mesure où un enregistrement est effectué. Aujourd’hui le web qui mélange les deux modalités pose des questions inédites au modèle de la bibliothèque. L’évolution des bibliothèques, comme celle des centres d’archives et les musées, est en réalité parallèle à celle des sociétés et de leur rapport aux connaissances enregistrées, participant à la croissance économique. Certains (Hedstrom & King, 2006) parlent à leurs sujets d’ « infrastructures épistémiques » (Epistemics Infrastuctures), c’est-à-dire d’institutions facilitant l’organisation des connaissances.

Dans une société où les connaissances circulent de plus en plus vite, cette force tranquille a un avantage. Média le plus ancien, c’est aussi celui où l’on peut s’abstraire du cycle trop rapide des médias modernes qui tend à écraser les informations par leur renouvellement et à perdre l’attention du lecteur dans une surabondance. Le flot des médias contemporains est trop puissant, trop abondant pour autoriser un filtrage efficace. On va aussi à la bibliothèque pour y retrouver dans le calme des documents que les autres médias détruisent ou noient dans le renouvellement insatiable de leur production ou on utilise les services d’un bibliothécaire ou d’un documentaliste pour retrouver les informations utiles perdues dans le chaos général. Ainsi la bibliothèque est-elle le média du temps long s’adaptant à l’évolution des sociétés et tempérant la précipitation des médias plus jeunes, plus tempétueux et plus éphémères. Cette qualité, loin de rendre son économie obsolète est au contraire aujourd’hui un levier sur lequel la bibliothèque peut s’appuyer pour s’adapter aux défis nouveaux du numérique. »

mercredi 09 mars 2011

Les trois économies du ebook

Je ne dirai jamais assez combien je suis redevable de la veille effectuée par Jose Afonso Furtado (ici). La majorité des billets de ce blogue sur l'actualité du numérique sont sans doute issus de son repérage. Merci donc à lui ! Dans la moisson d'hier, deux articles ont attiré mon attention car ils illustrent les dilemmes de l'industrie du livre dans son passage au numérique et expliquent sa résistance (pour la résistance du livre imprimé, voir aussi ici et ). Ils seront ici le prétexte pour avancer encore d'un petit pas dans l'analyse de l'économie du e-book, sans prétendre tout régler, les commentaires sont bienvenus.

“Ebooks: durability is a feature, not a bug | Technology | guardian.co.uk,” Mars 8, 2011, ici.

Morris Rosenthal, “Is Google Books Destroying Publisher Website Visibility?,” Self Publishing 2.0, Mars 8, 2011, .

Dans le premier article, l'éditorialiste, Cory Doctorw (par ailleurs responsable du blogue Boing Boing) s'insurge contre la prétention de HarperCollins à vendre aux bibliothèques des copies de livres numériques qui s'autodétruiraient au bout de 26 consultations. Il conclut (trad JMS) : Celui qui croit que cela pourrait arriver n'a jamais passé un peu de temps avec un bibliothécaire.

Dans le second billet, un petit éditeur numérique constate que son site devient invisible dans les recherches par Google, au profit principalement de Google-Books qui détient une copie de ses livres.

Pour bien interpréter toutes ces interrogations et hésitations dont nous n'avons ici que deux anecdotes parmi beaucoup, beaucoup d'autres, il faut revenir à la théorie du document (ici) que j'ai traduit en termes économiques pour l'exemple du livre dans le tableau ci-dessous :

Les_3_economies_du_livre.png

Un livre, quelque soit son format, a comme tout document trois dimensions indissociables, présentées sur le tableau en trois lignes. Et à chacune de ses dimensions est associée une économie qui privilégie un élément de valeur concurremment aux deux autres. Mais, il faut toujours avoir en mémoire que privilégier une dimension n'efface pas les deux autres qu'il faudra impérativement prendre en compte.

Si l'on raisonne par rapport à l'objet, la forme première ligne du tableau, alors nous sommes devant une marchandise ordinaire, même si elle a des caractéristiques originales, et une économie classique de vente de biens rivaux. L'édition s'est construite sur cette dimension. Elle a résolu le problème des deux autres dimensions d'une part par le droit de propriété intellectuelle (réduisant la non-rivalité de la deuxième dimension) et la saisonnalité des publications (pour gérer le temps de la troisième).

Maintenant si l'on raisonne par rapport au texte, nous sommes devant un bien non-rival. Seule une économie publique, collective peut se construire. Ce fut, et c'est encore, le domaine des bibliothèques qui mutualisent l'accès aux textes. Cette économie a réduit les difficultés liées aux deux autres dimensions par d'une part la réunion d'exemplaire (ici des prototypes) en un seul lieu et d'autre part les prêts ou consultations limitées dans le temps pour permettre le partage pour une collectivité donnée et limitée.

Concernant la troisième dimension, celle de la lecture, nous retombons dans une économie de biens (ou plutôt de services) rivaux, puisque l'attention du lecteur est limitée. Le livre imprimé gérant un temps long, n'était que peu concernée sinon du fait de la concurrence des autres médias sur le temps de loisir et donc de l'érosion lente de la lecture de livre. L'économie de l'attention a été exploitée à partir de la mise en place des médias modernes, presse d'abord, puis radio-télévision qui ont géré l'espace temps de «lecture» pour pouvoir le vendre à des annonceurs. Les choses ont changé sur le web qui est fondé sur une économie de l'attention à partir de l'activité de lecture elle-même (voir ici) et autorise aussi la diffusion de livres.

Beaucoup considèrent que le ebook, comme d'ailleurs l'ensemble des médias numériques, privilégierait la seconde dimension. Mais cette position suppose alors une économie publique ou au moins collective peu vraisemblable à l'échelle du web, sauf à refermer des écosystèmes sur des collectivités particulières capables de l'entretenir.

Les deux anecdotes citées en introduction illustrent les tâtonnements pour trouver d'autres voies. HarperCollins tente de décliner la première dimension sur les bibliothèques, ce qui est clairement absurde. La seule voie réaliste pour l'articulation entre l'édition numérique et les bibliothèques parait celle de la license sans restriction d'accès qui préserve le caractère de bien commun du livre à l'intérieur de la communauté desservie sans épuiser le marché pour l'éditeur à l'extérieur. Quant au positionnement des éditeurs par rapport à Google, il faut comprendre que ce dernier tend progressivement à accaparer l'économie de l'attention à son seul profit (ici). Google est un média qui devra bien un jour rémunérer les producteurs.. mais le plus tard et le moins possible.

dimanche 27 février 2011

Le web-média entre radio-tv et bibliothèque

Décidément, la musique continue d'ouvrir la voie à l'affirmation du modèle du web-média (avec d'ailleurs la publication scientifique pour d'autres raisons).

OWNI a eu la bonne idée de signaler et traduire un billet de Evolver.fm : Free Music Can Pay As Well As Paid Music, Says YouTube (article original trad OWNI ici). L'argumentaire principal, interprété à ma façon, est qu'on ne peut comparer les mesures du modèle éditorial avec celles issues de l'économie de l'attention. Dans le premier cas, on mesure un achat que le client peut consommer à loisir. Dans le second cas, on mesure la consommation, c'est à dire le nombre de fois que l'amateur va écouter un morceau de musique pour vendre son attention à un annonceur. Il s'agit de mesures fondamentalement différentes : une personne pourra écouter de nombreuses fois un morceau acheté ; inversement une personne n'achètera pas forcément un morceau, s'il n'est pas gratuit.

Les dirigeants de YouTube indiquent qu'un vrai business est en train de s'installer pour la musique gratuite. Faute de chiffres précis et indiscutables, il faut rester prudent. La baisse des revenus de la vente de CDs est encore très loin de être compensée par celle du numérique (). L'insolente santé de Apple montre que la position est encore solide (ici et ). Et il y a longtemps que Google cherche vainement à rentabiliser YouTube ().

Mais leurs remarques sont une claire illustration du positionnement du web dans le business des médias entre la radio-télévision et la bibliothèque que j'ai essayé de décrire sous forme d'un pentagone (court, long). De la radio-tv il reprend l'économie de l'attention, de la bibliothèque, la collection et le service d'accès.

vendredi 18 février 2011

Le côté obscur des requêtes sur les moteurs

Paulette Bernhard a attiré mon attention sur un récent article du NYT, merci à elle.

David Segal, “Search Optimization and Its Dirty Little Secrets,” The New York Times, Février 12, 2011, rub. Business Day, ici.

L'article conte l'histoire d'une manipulation pas très propre des résultats de recherche de Google à des fins commerciales. La technique est connue et il existe même des professionnels spécialisés dans le domaine, les référenceurs ou SEO (pour Search engine optimization) qui jouent au chat et à la souris avec les moteurs pour placer au mieux leurs sites clients dans les pages de résultats de recherche. Mais l'ampleur de la manipulation, la méthode employée et la réaction de Google méritent en effet qu'on s'arrête à cette histoire.

Pendant quelques mois et donc pendant la période des fêtes, lorsque l'on tapait dresses, bedding ou area rugs (carpettes) ou encore “skinny jeans”, “home decor”, “comforter sets” (couettes),“furniture” et des douzaine d'autres mots ou phrases, y compris des marques comme Samsonite le même site sortait numero 1 ou dans les tous premiers : JC Penney une chaîne de magasins pour la famille implantés partout aux US, 1100 magasins, 17,8 Mds $ de CA.

Il y a en moyenne pour les US 11,1 millions de requêtes mensuelles sur dresses, si l'on considère que 34% cliquent sur la première réponse (ici), cela signifie que JC Penney a attiré ainsi 3,8 millions de visiteurs sur son site chaque mois, rien qu'avec ce seul mot.

Bien entendu, ces résultats sont la conséquence de techniques d'optimisation du PageRank du site, qui, si elles ne sont pas illégales, relèvent d'une manipulation peu conforme à la netétiquette. « Quelqu'un » a tout simplement payé pour que des milliers de sites pointent vers JC Penney et augmentent ainsi ses chances d'être bien classé par le moteur. L'enquêteur NYT a repéré, par exemple, 2015 pages de sites les plus divers contenant des liens sur “casual dresses” , “evening dresses” “little black dress” ou “cocktail dress” dirigeant vers le site JC Penney. Beaucoup de ces sites ne sont même pas actifs, juste des réservoirs de liens. Mais l'opération est gagnant-gagnant. Le journaliste a pu retrouver un responsable de site qui lui a indiqué qu'il gagne environ 150$ par mois, il ajoute : Je n'ai rien à faire, les annonces sont juste là et si quelqu'un clique dessus, je fais de l'argent. Il héberge 403 liens, tous placés par une régie (TNX).

Le plus surprenant, mais bien intéressant, est qu'il semble que Google ne se soit aperçu de rien avant d'être alerté par le NYT. Ils ont alors rétrogradé JC Penney à la main (!). Contrairement à ce qui s'était passé pour BMW, aucune autre sanction ne parait envisagée. Mais JP Penney fait aussi partie des meilleurs clients de Google avec un budget publicitaire mensuel de 2,46 million de $.

Il y a ainsi un côté obscur de la recherche sur le web où des « chapeaux noirs » (black hats) organisent en sous-main un commerce lucratif de liens. On n'est pas loin de pratiques mafieuses. Cet article permet de lever un coin du voile de cette économie souterraine proche de celle des spammeurs. Il montre aussi qu'il faudrait un jour (bientôt) introduire une déontologie pour séparer les intérêts commerciaux des intérêts informationnels de ce nouveau média.

Pour une bonne analyse du phénomène et en particulier les pratiques des chapeaux blancs, gris et noirs et les difficultés de régulation voir :

Trusting (and Verifying) Online Intermediaries' Policing, Frank Pasquale ici

Actu du 21 fév 2011

Voir aussi sur le sujet les interrogations d'Olivier Andrieu, une référence pour les SEO français, Abondance (ici), lire aussi les commentaires.

Actu du 27 févr 2011

Décidément le pb semble ardu. Google annonce un grand ménage et un changement dans son algorithme ici

Actu du 29 fev 2011

Ça n'a pas traîné ici

Ou le lendemain cet article de Libé qui fait le point ()

Actu du 13 mars 2011

Après l'UE, la commission antitrust du Congrès américain a mis la question à son ordre du jour. Communiqué ici.

Partie sur Google :

Competition in Online Markets/Internet Search Issues

Access to the wealth of information and e-commerce on the Internet is essential for consumers and business alike. As the Internet continues to grow in importance to the national economy, businesses and consumers, the Subcommittee will strive to ensure that this sector remains competitive, that Internet search is fair to its users and customers, advertisers have sufficient choices, and that consumers’ privacy is guarded. In recent years, the dominance over Internet search of the world’s largest search engine, Google, has increased and Google has increasingly sought to acquire e-commerce sites in myriad businesses. In this regard, we will closely examine allegations raised by e-commerce websites that compete with Google that they are being treated unfairly in search ranking, and in their ability to purchase search advertising. We also will continue to closely examine the impact of further acquisitions in this sector.

- page 8 de 27 -