Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

Recherche - web média

vendredi 22 mai 2009

Pourquoi un livre

Introduction aux sciences de l'information

Les professeurs de l'EBSI ont donc rédigé un livre intitulé « Introduction aux sciences de l'information » qui sortira au Québec fin août 2009 et en France aux éditions La Découverte en janvier 2010. J'aurai l'occasion dans un futur billet de présenter son contenu. Mais je voudrais d'abord répondre à une question : Pourquoi un livre ? On lit souvent que le livre perdurera peut-être pour les romans ou la fiction, mais que, à l'évidence, sa condamnation est déjà effective pour les documentaires et encore plus pour les manuels. Voilà pourtant qu'une école en sciences de l'information, pas vraiment réputée pour être traditionaliste, publie un livre en papier, et cela à l'occasion de la révision de son programme de maîtrise qui insiste sur l'importance des technologies numériques ! Est-ce un accident ? Un dernier sursaut du vieux monde, éphémère et bientôt oublié ?

Les lecteurs fidèles de ce blogue savent déjà que je ne suis pas très convaincu par les discours sur la disparition prochaine du livre (voir p ex ici ou entre autres). Même à l'université, les arguments en faveur du livre ne manquent pas, sans réduire les avantages indéniables du numérique. Si ceci est utile et séduisant, il serait bien stupide pour autant de se priver des atouts déjà avérés de cela.

J'ai résumé ma réponse à la question en quatre arguments.

Un objet transitionnel

Pour des étudiants qui entrent dans un nouveau programme d'une discipline encore peu connue, disposer d'un objet de reconnaissance n'est pas anodin. Certes on peut penser à un tee-shirt, un sac ou un calendrier, mais avec un livre la symbolique est autrement plus forte et surtout plus immédiatement opérationnelle. Il s'agit des bases du savoir commun, inscrites sur un même objet que tous peuvent s'approprier. C'est au sens propre un objet transitionnel qui permet à l'étudiant de découvrir une culture professionnelle sans s'effrayer grâce à un objet qu'il peut s'approprier dans tous les sens du terme.

Sans doute un micro-ordinateur, un iPhone, une tablette, un ebook est un objet et en même temps une porte ouverte sur le monde. Mais la porte est trop largement ouverte pour être efficace et rassurante. Ce type d'objets, sauf à le brider mais alors lui faire violence, est autant un instrument de découverte que d'évasion. Le livre force l'attention sur son sujet, sans pour autant l'enfermer définitivement puisqu'il contient nombre de références.

Un savoir stable

Le savoir contenu dans le livre ne disparait pas, au sens premier, physique du terme : les mots restent imprimés sur la page. Ce point est crucial pour le domaine concerné. L'introduction du livre s'intitule « Permanence et changements ». Pour comprendre les changements d'aujourd'hui et la place que doivent y prendre les professionnels de l'information, il est indispensable de connaitre les fondements de leurs savoirs. Ceux-ci ne datent pas d'hier. Ils se sont forgés progressivement et ne s'effacent pas en un clic. Sans doute aujourd'hui bien de leurs facettes sont ébranlées, mais pour comprendre il est indispensable d'avoir assimilé les bases.

Les dispositifs numériques ont ici pourtant un avantage considérable sur le papier puisqu'ils permettent les ajustements, la richesse d'une intelligence collective en mouvement, les ramifications, les catalyses de la diversité des savoirs. Je ne nie pas cet avantage, bien au contraire je suis persuadé que la pédagogie doit l'utiliser à plein. Mais disposer d'un livre n'implique pas de tourner le dos au réseau, et avoir assimilé un livre de base dans son domaine est un sérieux atout pour une navigation assurée et enrichissante.

L'esprit critique n'est pas une génération spontanée. D'une part, il demande un raisonnement fondé sur des racines solides et stables, et le livre parait l'outil le plus approprié pour les maintenir. D'autre part, il est plus tentant d'éviter l'analyse critique et passant d'une page Web à l'autre, mais plus formateur de devoir comprendre un texte rétif qui ne disparaît pas d'une page imprimée.

Un projet circonscrit

Passons maintenant des lecteurs aux auteurs. Le livre a un gros avantage pour les auteurs, plus encore pour un collectif. L'objet est fini. Le projet, l'écriture a une fin aux deux sens du terme : un objectif précis et un terme.

La vertu du numérique est de relever du flux. Le flux permet beaucoup de choses, par exemple écrire un blogue ;-). Mais le terme du projet n'est pas donné d'avance. Il faut que ceux qui le mènent aient la discipline de se le donner et de s'y tenir. Et même quand ils ont cette discipline et cette organisation, les lecteurs de leur côté seront légitimement frustrés et en demanderont plus, car ils savent qu'il est possible et facile de modifier et d'ajouter des éléments.

Le contrat de lecture du livre a plusieurs millénaires. Auteurs, comme lecteurs savent à quoi s'attendre. Sans doute les auteurs n'échappent pas aux affres de la création et les délais sont rarement tenus. Néanmoins, l'aboutissement est un objet que l'auteur aura quelque émotion à tenir pour la première fois. Il sait, il voit que son travail est fini et qu'il lui échappera désormais.

Une tradition solide

Le livre dispose d'une tradition longue et solide pour sa réalisation. Editeur, correcteur, promotion etc. garantissent une qualité des contenus et de leur présentation.

Sans doute, dira-t-on ce n'est qu'une question de temps. Dans le numérique les savoirs vont s'affirmer et la qualité devenir la norme. On pourrait aussi nommer des éditeurs, et j'en connais beaucoup, qui n'ont pas le même souci de qualité des textes et des présentations.

Néanmoins la preuve n'est pas faite qu'il soit possible d'arriver dans le numérique à la qualité que l'on retrouve généralement chez les éditeurs papiers. La raison est économique. Pour le moment, ceux qui y font de l'argent ne se préoccupent que très peu de contenu. Dès lors, les efforts sont mis sur les développements des logiciels de traitement, la rapidité des flux, le design des objets et la création est issue du crowd-sourcing et du patrimoine accumulé. Il y a aussi beaucoup de richesses créées de cette façon, y compris intellectuelles. Wikipédia est une illustration spectaculaire, mais unique. Elle le restera sans doute et son modèle interdit la valorisation des auteurs.

À l'échelle d'une équipe d'auteurs comme celle des professeurs de l'EBSI, la tradition éditoriale est autrement plus efficace et permet une reconnaissance académique.

Reste que ce livre sera périmé en peu d'années. Souhaitons que d'ici là il soit épuisé. Il faudra alors prévoir une réédition revue et augmentée. Je prends le pari qu'elle sera toujours sur papier.

Actu du 18 aout 2009

Voir aussi cet intéressant plaidoyer :

Antonio Cangiano, Do programmers still buy printed books?, Zen and the Art of Programming, 15 août 2009, ici

Repéré par H. Guillaud qui en a traduit un passage

Présentation et extrait du livre ici

jeudi 23 avril 2009

Googopole à frange

Ce billet vient à la suite du précédent sur la révision de la séquence 2 du cours et plus précisément sur la nécessaire actualisation de la partie sur les marchés financiers du fait de la crise. S2 D18 à 23 08. Ces diapositives et leur commentaire sont à revoir. On trouvera ci-dessous quelques éléments pour la révision.

La notion d'oligopole à frange, indiquée dans la diapositive 23, est bien connue des économistes qui travaillent sur l'innovation. Elle signifie que quelques firmes, qui ont pris une position dominante sur un marché donné, laissent se développer dans leur frange un grand nombre de petites firmes innovantes. Ainsi le risque de l'innovation, difficile à assumer pour des entreprises ayant une position assise, est pris par d'autres. Le succès éventuel d'un plus petit sera racheté ou récupéré par les plus gros, les échecs sont nombreux mais ne mettent pas en péril les principaux acteurs de la branche. Les industries du contenu, industries de prototypes donc par nature innovantes, sont très souvent structurées ainsi. Autour des gros éditeurs, des majors de la musique ou de l'audovisuel, en passant par les grandes stations de télévision, on retrouve une multitudes de petits entrepreneurs qui n'ont d'autre choix que de prendre des risques et assurent ainsi une part de la vitalité et du renouvellement de la création. Les mécanismes financiers varient suivant les branches et surtout suivant les besoins en capitaux. Le budget de production d'un film n'est pas le même, en volume et structure, que celui d'un livre et les formes de dominations des gros sur les petits varient aussi, depuis la filialisation jusqu'à diverses formules d'articulation. Néanmoins on retrouve bien dans les industries du contenu le même type de dialectique entre une concentration de l'activité sur quelques firmes, souvent jusqu'à l'oligopole, et un foisonnement, un éclatement sur de très nombreux entrepreneurs, fragiles mais pleins d'idées.

Les industries du Web paraissent structurées suivant le même modèle, mais je voudrais suggérer dans ce billet que l'homologie n'est qu'apparente. Les relations entre l'oligopole et la frange y ont des caractéristiques originales. Celles-ci s'accusent en ces temps de crise et tout cela n'est pas sans conséquence en retour sur les industries de contenu. Je prendrai exemple principalement sur l'étude de la position hégémonique prise par Google.

Le développement de l'innovation sur le Web s'est beaucoup appuyé sur les fonds de capital-risque (venture capital), auxquels les industries de contenu, industries anciennes, ne font pas appel. Le principe de ce type d'investissement est bien expliqué dans un bulletin récent de l'ADIT (BE États-Unis 162, voir aussi TechCrunch). Ces fonds prennent un pari sur une entreprise, start-up ou jeune pousse, accompagnant sa montée en puissance jusqu'à sa mise en bourse. Il y eut un premier raté au tournant du millénaire, avec la bulle internet, comme c'est expliqué dans le cours (D20). C'est d'ailleurs à la même époque que la firme Google a pris son essor, ce qui montre bien le caractère limité et conjoncturel de la bulle d'alors.

Fondée en 1998, la firme obtient en juin 1999 25M $ de sociétés de capital-risque et fait son entrée en bourse en 2004. L'exemple est éloquent. Depuis en effet Google a pris la position hégémonique que l'on connait. Il suffit de lire la liste de ses acquisitions (wkp) pour constater que l'on est bien dans un processus d'oligopole (avec MSN, News-Corp, eBay, Amazon...) à frange. Notons que toutes les réussites concernent des sociétés qui ont développé une innovation qui a séduit un grand nombre d'internautes et un modèle d'affaires permettant de substantielles rentrées financières.

Une logique perverse

La situation a évolué récemment. Compte tenu de la crise financière actuelle dont l'origine n'est pas cette fois dans la branche numérique, le système de capital-risque est aujourd'hui grippé. Pour le numérique, la difficulté est néanmoins double : d'une part la crise financière réduit l'argent disponible (passé aux US de 30 à 10 Mds de $ en 2009) et rend aléatoire l'entrée en bourse à terme qui est pourtant l'objectif recherché ; d'autre part la valorisation des activités sur le Web a montré ses limites et donc y rend moins attrayant les investissements.

Depuis la bulle internet, il n'est pas sûr même que le débouché principal recherché par les jeunes pousses soit la bourse. Bon nombre de celles-ci souhaitent plutôt se faire racheter par ceux qui ont pris une position forte, difficile à concurrencer car nous sommes dans un processus où le gagnant prend tout (selon l'expression de Franck et Cook, amz).

Dès lors, l'objectif est moins de se rentabiliser sur un marché que de démontrer que l'application que l'on développe pourrait détruire le marché des firmes installées en détournant les internautes. C'est une version quelque peu pervertie de la fameuse création destructrice de Schumpeter (LSE). On détruit de la valeur économique, sans pour autant en construire vraiment par ailleurs. Nous sommes alors dans une logique bien différente de celle des industries du contenu où l'innovation des petites firmes fait découvrir de nouveaux auteurs, oeuvres ou thèmes qui se valorisent sur des marchés. Ici on cherche à capter l'attention des internautes, sans pour autant la revendre ou vendre l'objet de cette captation, mais juste pour menacer les plus installés donc les plus riches et récupérer un peu de leur richesse. En caricaturant, on pourrait dire qu'il s'agit d'un raisonnement mafieux. Cette économie spéculative ne peut évidemment fonctionner que si ceux que l'on menace ont les moyens financiers de se défendre. En réalité, voilà bien comment fonctionne l'économie du Web 2.0.

L'ironie du système est qu'il trouve un allié objectif chez les militants de la démocratie internet, prompts à se mobiliser pour défendre la gratuité sous toutes ses formes. Il trouve aussi un appui dans une sorte d'économie souterraine faite de nombreux petits acteurs, et même les individus, qui baissent leurs coûts de transaction et élargissent leur zône d'achalandage sans contrepartie gràce aux réseaux et aux plateformes mis à disposition.

Pour ceux qui ne seraient pas convaincus, je prendrai seulement deux exemples emblématiques : YouTube et FaceBook. Le premier a été racheté par Google 1,65 Mds de $ en 2006. Il est devenu le deuxième moteur de recherche aux US. Et pourtant, il n'arrive pas à se rentabiliser et pourrait perdre jusqu'à 470 M de $ selon de Crédit Suisse cette année (merci à D. Durand pour sa veille attentive sur ces questions). FaceBook, on le sait, est un énorme succès de fréquentation, il vient d'annoncer avoir atteint la barre de 200 millions d'utilisateurs. La firme a déjà levé pour 15 Mds de $ de capital risque et en chercherait de nouveau pour la même somme, non sans de grosses difficultés vu son absence totale de rentabilité et l'état de la bourse (TC).

Le rôle de Google

Revenons donc à Google. Pour bien comprendre son fonctionnement et la position particulière de la firme, il faut observer la structure de son chiffre d'affaires. Voici son évolution selon les derniers résultats du premier trimestre 2008 :

Chiffre d'affaires de Google 1er trim 2009 Diaporama complet ici

La première évidence bien connue des lecteurs de ce blogue est que, malgré ses tentatives de diversification, le chiffre d'affaires de Google est encore et toujours quasi exclusivement du à la publicité (98%). J'ai déjà eu l'occasion de faire remarquer (ici) combien l'évolution de sa structure signalait un recentrage progressif sur le métier originel de la firme, la recherche d'information financée principalement par adwords en vert plutôt que la régie publicitaire (adsense) en bleu. Je ne reviens pas non plus les conséquences pour les industries de contenu (par ex ici).

La baisse du chiffre d'affaires de Google début 2009 et qui semble devoir se confirmer au trimestre suivant même si elle reste relative va conduire les dirigeants à la prudence. Voir sur cette question le compte-rendu de Cnet-News (ici). La première conséquence sera d'accentuer encore la tendance précédemment citée.

Néanmoins, la firme dispose d'un énorme trésor de guerre qui l'autorise des investissements importants. Par ailleurs, compte-tenu de son succès financier, la position du titre de Google en bourse reste confortable, très supérieure à la moyenne du Nasdaq (actualiser D22).

Cours de l'action de Google vs MSN avril 2009

Dans ces conditions, il est probable que Google va accentuer encore sa domination sur le secteur en favorisant le développement d'une frange qui trouvera de moins en moins d'interlocuteurs vers qui se tourner et qui sera de plus en plus vassalisée.

La firme vient d'ailleurs de lancer son propre fond de capital risque et compterait investir 100M $ pour 2009 (BE États-Unis 161). Autre exemple, elle s'intéresse de près à Twitter, qui ne dispose lui non plus pas du moindre début d'un Business model.

Par ailleurs, Google serait "très, très heureux" d'aider Twitter ou d'autres sites Internet de "communication immédiate" à gagner de l'argent, a indiqué Eric Schmidt, en évoquant des pistes pour rentabiliser le site de micro-blogs. "Sans parler spécifiquement de Twitter", ces sites pourraient devenir "un moyen de canaliser des informations marketing", et à partir de ce moment-là, "d'accrocher des produits publicitaires", a-t-il relevé. Le Monde du 17-04-09, ici.

En complément voir l'intéressante analyse d'O. Ezratti qui montre la domination des capitaux publics dans le capital-risque en France.

Actu du 30-04 2009

Deux références complémentaires signalées par InternetActu. La première confirme en le précisant les difficultés économiques des sites de Crod Sourcing dues notamment au coût de la bande passante et à la difficulté de monétarisation :

Farhad Manjoo, La bande passante ne se trouve pas sous les sabots d'un cheval, Slate 22 avril 2009, ici

L'autre développe, à partir de l'exemple de l'iPhone, une idée complémentaire et non abordée ici, celle de l'écosystème. Une façon webilitiquement correcte de parler d'oligopole à frange, mais la domination s'y exerce différemment que dans l'analyse ci-dessus et il serait bon que j'y revienne à l'occasion :

Alexis Mons, Leçon d'économie systémique, 24 avril 2009, Groupe Reflect,.

Actu du 1-05-2009

Voir aussi dans la même logique, mais chez Amazon, le rachat de Lexcycle. Chez V Clayssen (ici et).

jeudi 16 avril 2009

Révision séquence 2 cours (0. et 1.)

La séquence 2 du cours appelle des ajustements aussi bien sur la forme que sur le fond plus importants que la précédente, même si sa logique générale et le raisonnement qui la sous-tend, exposés dans la précédente révision, me paraissent bons :

Cette séquence, comme celle qui la suivra mais d'un point de vue radicalement différent, donne une clé pour comprendre l'évolution actuelle à partir d'un éclairage issu de l'économie industrielle. Il s'agit ici principalement de souligner la domination des cycles des industries issues du contenant. Ceci implique d'abord d'avoir une idée de la nature des différents marchés, de leur ordre de grandeur, de leur régulation et de leurs dysfonctionnements éventuels. Puis, je présenterai les différentes familles techniques en soulignant leur histoire et dynamique propre, et aussi leur articulation et influences réciproques. Enfin la séquence se conclut en montrant comment nait un média, par un parallèle entre la situation actuelle du Web et la naissance de la radio dans la première partie du siècle précédent.

Pour que cela soit parfaitement clair pour l'étudiant, il manque sans doute une diapo de conclusion qui les rappellent.

La séquence comprend une introduction, intitulée Précautions et définitions et numérotée 0., puis trois parties

  1. Le partage des rémunérations
  2. Les quatre filières techniques
  3. Vers un nouveau média ?

Il serait plus simple d'intégrer l'introduction comme une partie et donc de faire quatre parties ordinaires

Le plan général est donc à conserver, mais il y a des ajustements à faire dans les sous-parties. Passons-les en revue. Dans ce billet, je ne traite que les sous-patie 0. et 1.. La suite est à venir.

0. Précautions et définitions

Il y a un problème entre l'articulation du son et des diapositives de définition. Il faudrait remettre explicitement chaque définition dans son contexte en introduisant et renvoyant aux textes d'origine fournis dans la bibliographie.

De plus il serait opportun d'ajouter une diapositive en fin de partie pour s'interroger sur la place de Google en industrie du contenant ou du contenu. La suggestion est que la firme s'appuie de plus en plus sur sa puissance informatique, symbolisée par ses centres de données (ici, et ), et qu'elle hésite entre une prestation de services et la construction d'un nouveau média, comme il est suggéré dans ce cours. L'intégration du contenant et du contenu est la marque de médias jeunes (imprimeur-libraire, imprimerie intégrée dans la presse quotidienne, réseau et société de programme en radio-TV), et la maîtrise du contenant est souvent une barrière à l'entrée pour permettre de consolider les positions dominantes, qui est cassée par la suite par voie réglementaire pour favoriser le pluralisme. Il faudrait alors séparer puissance informatique et traitement du contenu, nous n'y sommes pas encore.

Mais l'exemple de Google a le double avantage de souligner à la fois la difficulté de séparer les deux types d'industrie et en même temps de montrer l'importance de cette séparation.

1. Le partage des rémunérations

1.1 Aperçu des marchés finaux (ménages, annonceurs, entreprises)

Le problème le plus important, déjà repéré dans l'évaluation précédente est celui de l'actualisation des chiffres dans les tableaux. Une autre lacune complémentaire est de ne pas donner aux étudiants l'occasion d'aller chercher par eux-mêmes les chiffres dans les sources statistiques. Pour résoudre ces deux difficultés à la prochaine version du cours, il me semble que l'actualisation pourrait être réalisée par les étudiants eux-mêmes à partir d'un petit exercice sous forme de Quizz en leur fournissant documentation et outils nécessaires. Il pourrait s'agir d'ajouter une colonne aux tableaux (S2D9,14A08) ou de retrouver des tableaux ou diagrammes plus récents sur les mêmes données (S2D10,11,12,15,16A08). Ceci pourrait se faire à la fois en ligne et dans le fascicule PdF.

Le son d'une diapo est répété par erreur (S2D15,16A08).

Il manque une diapo de synthèse après le marché publicitaire (après S2D16A08) et une diapo de conclusion (après S2D17A08).

1.2 Aperçu des bailleurs de fonds (financiers, États)

Cette sous-partie est peut-être celle qui a le plus subie l'obsolescence de l'actualité à cause de la crise financière. Voici les corrections proposées.

  • D18, revoir la diapositive et le commentaire en ajoutant la crise actuelle
  • D19, être plus explicite en mettant un sous-titre sur la logique spéculative des industries du contenu et un autre sur la logique d'investissement des industries du contenant.
  • D20, revoir le commentaire, ajouter une diapo sur la crise actuelle.
  • D22 actualiser le graphique et en profiter pour nuancer les propos de la diapo précédente à la lumière de l'évolution de la bourse.
  • D23 à revoir en faisant ressortir d'une part la particularité de l'oligopole à frange numérique (misant sur le succès d'utilisation) et en même temps sa banalité dans les industrie du contenu. Deux diapos seront peut-être nécessaires en prenant des illustrations dans qques branches.
  • D24, supprimer la diapo, la régulation de l'État est traitée dans la séquence suivante (enlever aussi cette mention dans la présentation du plan D2).

Il serait utile d'avoir une diapo de conclusion rappelant les principales notions à mémoriser. Il serait utile aussi d'avoir un bon article de synthèse sur les conséquences de la crise financière sur les industries de contenu, à trouver dans WSJ ou FT ?

1.3 Déséquilibres Contenant/contenu

Ces trois diapositives développent une idée fondamentale, mais souvent oubliée : le contenu n'est pas le roi. Malheureusement, il est difficile de trouver des chiffres fiables récents et les tableaux des 3 diapositives datent un peu (D25 surtout). Faute d'y arriver d'ici la prochaine édition du cours, une solution serait de s'appuyer sur l'article d'A. Odlysko qui a rencontré un certain succès chez les étudiants et de leur faire chercher dans les grands annuaires (p ex ici) quelques illustrations du phénomène.

1.4 Déplacements de valeur

Cette idée mérite plus qu'une simple diapositive. Là aussi, il serait possible de construire un petit exercice en demandant quelle est la valeur détruite et construite dans telle ou telle application et en renvoyant à des billets d'actualié sur ces questions.

Remplacer la D29 par une conclusion indiquant l'idée force de chacune des 4 ss-partie et montrant comment elles s'articulent.

lundi 06 avril 2009

La messe des données

Une façon d'enrichir le cours sur l'économie des documents est de prendre quelques évènements significatifs de l'actualité et de les passer au prisme des notions développées. J'ai l'ambition de permettre le décryptage des mouvements qui agitent le monde documentaire. Un repérage critique à l'avantage d'en faire la démonstration ou, inversement, de repérer des failles à réparer.

Pour éviter de trop longs développements, je coderai les références au cours de la façon suivante : SxDyA08, x étant le numéro de la séquence, y le numéro de la diapositive, A08 signifie qu'il s'agit de la version de l'automne 08. Par exemple, S1D7A08 fait référence à la diapositive 7 «Pilier2. Le prototype» que l'on trouve dans la séquence 1 du cours de l'automne 08. Pour la retrouver et écouter son commentaire, il suffira de suivre le lien qui conduit à la partie du diaporama concernée et de se rendre à la diapositive en question par son numéro : S1D7A08. Il est probable qu'avec le temps les liens vont se casser, mais d'ici là j'aurai peut-être trouvé une formule plus simple.

Illustration de la Séquence 1 : Particularités économiques du document publié

Commençons donc par la séquence 1 sur les particularités économiques du document avec un document emblématique : le discours de Tim Berners-Lee au congrès TED pour Technology, Entertainment, Design en février 2009 (le discours est sous-titré en français).

L'argumentaire de TBL pour «libérer les données» s'appuie clairement sur les particularités économiques de l'information : la non destruction qui permet à tous de se resservir des mêmes données sans les altérer ; le prototype, les données ne sont produites qu'une fois pour être partagées ; la plasticité qui permet de construire de nouvelles informations par la combinaison et le calcul des anciennes ; l'interprétation qui autorise l'utilisation des mêmes données à des fins diverses ; la résonance par les effets de réseau (S1D6,7,8,9,12A08).

Mais il en laisse de côté deux, et cet oubli n'est pas sans signification : l'expérience et l'attention (S1D10,11A08). En réalité , l'économie marchande de l'information est construite sur ces deux particularités là qui sont synonymes de rareté. C'est parce que l'on ne connait pas un document avant de l'avoir lu que l'on peut le vendre. C'est parce que l'attention est limitée que l'on peut la capter au profit d'annonceurs intéressés (S1D13A08).

Le discours de TBL est donc un discours d'économie publique. Cela est particulièrement flagrant dans les exemples qu'il prend : données gouvernementales, données scientifiques, Wikipédia. Mais cela peut être trompeur et ambigu quand il évoque les données privées, les traces de navigation ou encore les réseaux sociaux. Prenons l'exemple de Google qui s'est construit sur l'architecture de l'ancien Web, celui que TBL appelle le «Web des documents». Google a fait sa fortune en «libérant les documents», mais en enchaînant les données. C'est parce Google garde les données brutes, tout particulièrement celles sur les pratiques de navigation, mais aussi celles par exemple sur la géolocalisation, qu'il peut construire son marché de l'attention en détruisant celui des anciens médias. Il est tout à fait intéressant de voir que le déplacement du verrouillage était suggéré, il y a 10 ans dans le manuel de Shapiro et Varian (S1D16A08), Hal Varian qui est aujourd'hui Chief economist chez Google.

Quelques mots, enfin, sur la forme du discours qui est en cohérence avec les constatations précédentes, TBL semble avoir adopté le style du prêche Hi-Tech californien, dont Steve Jobs est la star inégalable (voir ici, l'introduction du iPhone) et qui n'est pas sans rappeler celui des pasteurs baptistes (p. ex ici), à la différence près que pour les gourous Hi-Tech, il n'y a pas d'enfer. La motivation est le bien de l'humanité sans la peur de la damnation. Nous sommes dans le «bien public» dans tous les sens du terme.

Cette forme n'est pas anodine, il s'agit de faire partager une utopie quasi-religieuse, ici une communion, au sens propre, des données, qu'il faut libérer pour sauver le monde. Je le dis en souriant mais sans vraie ironie. P. Flichy (, S2D41A08), parmi d'autres, a montré combien l'imaginaire était important pour l'innovation et combien il était présent dans le développement de l'internet.

Et après tout, le bien de l'humanité n'est pas une mauvaise motivation, optimiste mais peut-être angélique puisqu'elle gomme des volets importants du développement du numérique et des réseaux : les limites qui permettent justement la construction du marché, et aussi qui favorisent sa partie noire, obscure qui explose, elle aussi, le contrôle, la manipulation, l'escroquerie, le vol, le détournement, le mensonge, etc.

Par ailleurs, il y aurait bien des choses à dire sur le fait que TBL n'évoque pas le Web sémantique du moins dans ce prêche où le mot n'est pas prononcé. Passer du Web sémantique au Web des données n'est pas innocent. J'y reviendrai peut-être à l'occasion quand j'en serai à la révision de la séquence sur la redocumentatisation (ici).

Actu du 7 janvier 2010

Voir aussi l'importance de l'accessibilité des données dans cet article du NYT :

John Markoff, “A Deluge of Data Shapes a New Era in Computing,” The New York Times, Décembre 15, 2009, sec. Science, ici.

Actu du 12 mars 2010

Un an plus tard, TBL récidive avec, cette fois une démonstration par l'exemple d'utilisations, notamment sur des cartes, des données en accès libre ici.

mardi 31 mars 2009

Reprise et précisions éditoriales

Nous arrivons au mois d'avril et le moment est venu de reprendre le fil de ce blogue pour préparer la rentrée prochaine. Avant de se mettre au travail un rappel et quelques précisions seront utiles. Chaque blogue a sa propre ligne éditoriale, plus ou moins clairement assumée. Il est préférable de la rappeler de temps en temps.

Celui-ci est inséparable du cours sur l'économie du document, donné en ligne à l'EBSI (ici pour l'édition de l'automne 2008). Il sert à la prise de notes pour la préparation du cours, d'actualisation pour ceux qui l'auraient suivi, de près ou de loin, assidument ou par intermittence et enfin d'outil pédagogique au moment de la tenue du cours. Étant librement accessible sur le web, il peut avoir bien d'autres usages que je ne maîtrise pas, mais il me paraît sage de m'en tenir à l'objectif indiqué sans chercher à l'élargir

On y trouve donc des réflexions sur la pédagogie du cours, des éléments sur son contenu au fil des lectures et de l'actualité, une révision annuelle de chaque séquence du cours, quelques nouvelles de l'EBSI. Mais on ne trouvera pas de suivi systématique des évènements, des polémiques sur des sujets chauds ou encore des allusions à ma vie personnelle, comme souvent sur ce genre de publications.

Les commentaires sont les bienvenus dans la mesure où ils enrichissent la réflexion ou le matériel sur la thématique du cours. Et je remercie ceux qui l'ont fait avec beaucoup d'à propos jusqu'ici. Vos remarques et réactions m'ont souvent fait réfléchir et avancer. Mais les commentaires sont modérés sans état d'âme. Seuls sont conservés ceux qui me paraissent utiles. J'ai une préférence marquée pour les commentaires réellement assumés par leur auteur, c'est à dire signés sans masque de carnaval. Je sais que je suis à contrecourant sur ce point de la pratique habituelle du web, mais je préfère perdre quelques contributeurs que subir la complaisance gratuite qui teinte trop souvent les réactions des anonymes ou pseudonymes.

D'une façon générale, je ne cours pas après l'audience. Celle de ce blogue tourne actuellement entre 200 et 500 lecteurs réguliers (cad venant plus de 2 fois par semaine). Étonnamment, elle n'a pas beaucoup baissé depuis qu'il est en sommeil. Cette audience me suffit largement. Je ne suis pas sûr d'être capable d'assurer un trafic par trop supérieur avec toutes les conséquences médiatiques, pas toujours sympathiques, qui en découlent.

On peut alors s'interroger sur l'intérêt de travailler ainsi dans le ciel, à la vue potentiellement de tout un chacun. L'expérience m'a confirmé que j'en retirai un fort bénéfice :

  • travailler sans se cacher oblige à un standard de qualité ;
  • le phénomène du don-contredon marche à plein auprès de la petite, toute petite en réalité, communauté spécialisée sur ce domaine, soit directement sur ce blogue, soit par les échanges en dehors du blogue, mais souvent initiés par lui ;
  • participer à l'enrichissement de la réflexion collective, fait monter le niveau général et donc les facilités comme les exigences aussi pour son propre travail. Plus la barre est haute, plus on doit s'entraîner pour sauter, mais l'entraînement collectif est plus efficace que l'individuel ;
  • la visibilité induit une promotion pour le cours, pour l'EBSI et aussi, bien sûr, pour ma personne, aussi bien chez les étudiants de l'EBSI que plus largement ;
  • accessoirement, c'est aussi une expérimentation sur le sujet même du cours. La veille aujourd'hui passe par ce genre d'outil.

- page 16 de 38 -