Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

mercredi 05 janvier 2011

Money, money (1)

J'ai sur le feu depuis un moment un billet sur les modèles d'affaires du web, sans avoir le temps de le finaliser. Il viendra à son heure. Il devait se conclure par l'absurde valorisation financière de Facebook. Mais j'ai entendu la chronique de France-Inter de Ph. Lefébure ce matin.. enfin un peu de lucidité. Conclusion du journaliste :

La publicité sur Facebook rapporte peu. Malgré tout ça, certains y croient, et la grande banque Goldman Sachs vient donc de promettre aux patrons de facebook, de trouver de nouveaux actionnaires. Mais sans passer par la bourse, une "astuce" qui doit permettre au réseau social d'éviter de rendre public ses comptes! Plus sidérant encore, le "ticket d'entrée" pour devenir actionnaire de Facebook: il faut avoir un patrimoine de plus de 7 millions de dollars, et investir au moins 1 million et demi pour en être! On n'est loin de l'esprit communautaire et du "site des amis". Pour le coup, ça ne rappelle plus la bulle internet des années 2000 mais, toute proportion gardée évidemment, Bernard Madoff qui triait sur le volet, pour apparaître plus crédible, ses futurs victimes.

Plus de précisions sur cet étonnant tour de passe-passe sur L'Atelier.

Actu du 10 janvier 2011

Voir aussi sur CNN, l'opinion de Douglas Rushkoff, qui montre comment Goldman Sachs retrouvera son investissement grâce aux commissions, même en cas de déconfiture de FaceBook : Facebook hype will fade, 7 janvier

Et pour mieux comprendre comment l'aveuglement est créé, voir cette carte, explication ici, fascinante, mais impossible à interpréter économiquement.

Actu du 12 janvier 2011

Une autre alerte d'un autre expert de la bourse ici :

Extrait :

All that may be good for top company executives and employees, but is it good for long-term investors? Are companies going to take bigger risks or less once they’ve already partially cashed out ahead of a potential I.P.O.?

Actu du 13 janvier 2011

Autre constat fascinant, l'intégration des boutons Facebook dans un des plus influents journaux US, le Washington Post ici

Voir aussi la représentation graphique de la valuation de FaceBook par TechCrunch (ici)

Actu du 14 janvier 2011

Un point de vue inverse d'Étreintes digitales ici.

Actu du 30 janvier

Spéculation : Un groupe d'actionnaires de Facebook cherche à se débarrasser de 1 milliard de dollars d'actions sur le marché secondaire, une vente qui porterait valeur de l'entreprise à plus de 70 milliards de dollars. Reuters ici

mardi 04 janvier 2011

Document, information, une histoire de mots

On le sait Google a mis à la disposition des chercheurs la base des textes les livres qu'il a numérisés, ce qui donne le plus grand corpus linguistique de tous les temps, 500 milliards de mots et 4% des livres publiés sur terre, et fait rêver les linguistes (ici et). Je ne suis pas linguiste, mais pour les béotiens comme moi, la firme a mis en ligne un étonnant petit outil, baptisé NGram, permettant de représenter l'évolution des occurrences de mots dans le temps. Sans bouger de mon fauteuil, voici donc quelques leçons que j'en ai déjà en tiré sur les sujets de ce blogue.

Document

On considère généralement que le mot «document» est apparu en Français en 1214 dans la Vie de S Grégoire par le frère Anger (ici). J'ai quelques doutes là dessus, peut-être bientôt du nouveau sur ce blogue, mais en attendant, le NGram nous montre clairement l'évolution quantitative de son utilisation dans les livres, en français, puis en anglais depuis 1800.

Ngram-document-fr-4-01-2011.jpg

Ngram-document-eng-04-01-2011.jpg

Que constate-t-on ? L'utilisation du mot en français ne décolle que vers 1820 pour augmenter régulièrement jusqu'au tournant du siècle où elle arrive à un palier. Puis elle repart brutalement vers les années cinquante sans défaillance. Le démarrage du mot anglais est antérieur, sa croissance est d'abord plus lente, mais elle augmente brusquement vers les années soixante pour finir au même niveau que le mot français avant de chuter, semble-t-il, au début des années 2000. L'interprétation de ces courbes reste à faire, sans doute en relation avec la place du document dans l'organisation sociale, mais les tendances sont trop nettes pour qu'elles ne soient significatives.

Information

La notion d'information a progressivement remplacé celle de document chez nombre de professionnels, écoles et chercheurs du domaine à partir des années soixante-dix. Il était donc intéressant de comparer son histoire à celle du précédent.

Ngram-doc-info-04-01-2011.jpg

Ngram-doc-info-eng-04-01-2011.jpg

Information était plus utilisée que document en français au début du 19e, sans doute dans un usage courant. Document la dépasse vers 1830. À partir des débuts du 20e l'utilisation du mot s'accélère progressivement pour décoller à la seconde guerre mondiale, sans doute en lien avec le rôle croissant des médias. On observe un palier à partir des années 70 puis un nouveau décollage dans les années 90 et enfin une chute pour la première fois au début du millénaire. L'évolution du mot anglais montre une différence quantitative importante, avec un démarrage au niveau où le mot français termine son envol et donc une fin proportionnellement quatre fois plus haut.

Là encore, l'interprétation reste à faire, mais on peut déjà en tirer deux leçons claires. L'utilisation du mot information parait plus corrélée à l'évolution des médias qu'à celle des professionnels du même nom qui devraient peut-être y réfléchir. Par ailleurs, les mots français et anglais ne présentent peut-être pas la même signification, à moins que la place de l'information soit considérablement différente dans l'une et l'autre culture.

Données

J'ai ajouté aussi une troisième variable puisqu'aujourd'hui la mode n'est plus à l'information, mais aux données.

Ngram-inf-doc-don-04-01-2011.jpg

Ngram-inf-doc-data-04-01-2011.jpg

La hauteur de la courbe dans le diagramme français doit tenir compte de la polysémie du mot. «Données» est aussi le participe passé féminin pluriel de «donner». Mais le parallélisme des courbes données et information après la seconde guerre mondiale est assez remarquable dans les deux langues.

Bibliothèque - documentation

Pour terminer, j'ai comparé les mots «bibliothèque» et «documentation».

Ngram-bib-doc-fr-04-01-2011.jpg

Ces courbes sont celles qui m'ont le plus étonné, et je dois dire réjoui. L'utilisation du mot bibliothèque se maintient largement sur deux siècles, malgré tous les bouleversement que son environnement a connu, même si cela reste à un niveau modeste. Je serai curieux de comprendre la nature des pics que l'on peut observer. Sans surprise, le mot «documentation» apparait au début du 20e. Il connait son apogée vers 1960 et chute ensuite brutalement. Là encore les mots «bibliothèque» et «documentation» ont un usage pluriel. On le trouve aussi bien l'un pour des étagères ou des bibliothèques privées et l'autre dans «centre de documentation» dans «une documentation» ou encore dans «la documentation de quelque chose». Malgré cela, leur usage subit une variation très nette.

mardi 21 décembre 2010

En direct de l'EBSI, 2010

Le numéro 22 de En Direct de l'EBSI, vient de sortir (ici). Une bonne occasion pour ceux qui ne connaissent pas l'école d'en découvrir quelques moments et pour les anciens de prendre des nouvelles.

Extraits pour vous donner envie de lire ces huit pages :

Vingt ans de TIC à l'EBSI

1988. Les sept micro-ordinateurs de l’EBSI sont équipés de deux lecteurs de disquettes 5¼″ de 360 Ko de capacité, et la recherche d’information dans les bases de données se nomme téléréférence. On interroge les bases de données en ligne à une vitesse de 300 bits par seconde à partir de terminaux papier reliés à des coupleurs acoustiques et l’édition des résultats de recherche à remettre à l’usager se fait par couper/coller avec une paire de ciseaux et du ruban adhésif. (..)

2010 (..) Les disquettes de 360 Ko ont cédé la place aux clés de mémoire USB de 4 à 32 Go, les livres numériques ont remplacé les CD-ROM, on cherche l’information sur Internet au moyen d’un réseau à 1 gigabit par seconde (Gbps), et la vie continue…

Lucie Carmel, responsable des laboratoires d’informatique de 1er/2e et 3e cycles

Confession d'un chargé de cours nombriliste

(..) Voyez-vous, je suis profondément nombriliste. Et comme tout nombriliste qui se respecte, je suis un réel control freak. Donnez-moi en pâture une soixantaine d’étudiants bien frais et je rayonne! Toutes ces paires d’yeux rivées sur moi alors que je leur explique les règles des RDDA! Que voulez-vous, je ne peux alors que donner le meilleur de moi-même et tenter, à coup de pirouettes et cabrioles pédagogiques, de garder leur attention fixée sur moi, moi, moi! Je ressors ainsi de la classe en ayant drainé toute leur énergie (ça explique d’ailleurs leur teint verdâtre à la sortie du cours à 22 h!). Si vous me voyez en métro le soir en retournant chez moi, vous me trouverez sur un high, le sourire aux lèvres. (..)

François Cartier, chargé de cours

Sondage auprès des diplômés de maîtrise

L’EBSI a effectué au printemps 2010 un sondage auprès des finissants de maîtrise de la promotion 2009 : 46 des 65 diplômés de 2009 ont répondu au questionnaire. Les résultats indiquent que 93,4 % des répondants avaient un emploi au moment de l’enquête, dont 41 (95,3 %) en sciences de l’information. Le nombre de postes permanents atteignait 48,8 %, tandis que 29,2 % avaient des contrats renouvelables et 22 % des contrats non renouvelables.

Pour les intéressé(e)s par la maîtrise (master), je rappelle que les demandes d'inscription démarrent le 1er janvier prochain. Il y a maintenant 120 places ouvertes chaque année, mais beaucoup plus de candidatures. Aussi est-il prudent de ne pas tarder pour envoyer son dossier. Toutes les infos sont ici.

jeudi 16 décembre 2010

Twitter, le coucou

Twitter vient de boucler une nouvelle levée de fonds de 200 millions de $. Apparemment, celle-ci s'est faite sans difficulté, il y avait même concurrence pour acquérir des parts. Tous les détails sont ici. Cet apport en capital s'est fait sur une valorisation de la société à 3,7 milliards de $, soit le triple de la précédente levée de fonds de 100 millions en septembre 2009 et, vrai ou faux, le journaliste rapporte que des propositions refusées auraient été faites sur la base d'une valorisation à 4,5 ou 5 milliards de $..

Il est vrai que la société doit gérer sa croissance. Elle est passée de 25 millions d'utilisateurs en septembre 2009 à 175 millions aujourd'hui. Il est vrai aussi que cette croissance s'appuie sur une taille qui reste modeste. Dans le même temps les effectifs sont aujourd'hui de 350 employés contre 130 autrefois.

Mais on ne trouvera nulle part de chiffre d'affaires et encore moins de bénéfice justifiant la valeur astronomique de l'entreprise affichée sur le second marché, et pour cause. De chiffre d'affaires il n'y a pas, même si comme le dit pudiquement Le Monde en conclusion de son article : Au mois d'avril, le site a décider (sic) d'intégrer à ses flux de messages des "tweets promotionnels" ("promoted tweets") qui lui apportent des recettes publicitaires. Il est très peu probable que le chiffre d'affaires ait explosé depuis, cela se saurait.

Trois interprétations de ce hiatus financier sont possibles, aucune très rassurante :

  1. La firme garde une taille modeste et pourra à terme se financer avec un chiffre d'affaires raisonnable. Mais alors les investisseurs d'aujourd'hui ont fait une très mauvaise affaire.
  2. L'investissement est purement spéculatif et relève de l'irrationnel, ce qui rappelle de très mauvais souvenirs pas si lointains comme cela a été très bien analysé par A. Odlyzko (ici commenté en fr ).
  3. La stratégie est parasitaire. Il s'agit de capter le maximum d'audience au détriment de firmes plus grosses (suivez mon regard.. G.. F.. Y.. M..). Alors ces dernières, elles-mêmes en concurrence entre elles, pourraient être tentées par un rachat. Mais d'une part, il s'agit d'une stratégie pour le moins perverse et destructrice de valeur et, d'autre part, il n'est pas sûr que ce qui a fonctionné hier (ex YouTube ici) marche encore aujourd'hui où les cartes sont plus fermement distribuées et où les enjeux se déplacent vers les industries culturelles.

Reste à comprendre pourquoi Twitter, comme son grand frère Facebook (ici), réussit à parader sur des bases financières aussi fragiles. Il y a une explication communicationnel au moins pour le premier. C'est devenu un outil important pour les relais d'opinion de tous poils. Il est naturel qu'il soit par simple effet de résonance surévalué. C'est un haut-parleur pour ceux qui crient déjà le plus fort.

Actu du 18 déc 2010

Dans le même sens Electron Libre .

Actu du 23 déc 2010

Un autre exemple de dérapage sur l'actualité, cette fois à propos Tumblr. Le titre peut laisser croire à une réussite économique :

Tumblr génère aujourd’hui plus d’argent et de pages vues que WordPress ici

Mais en réalité il ne s'agit ni de chiffre d'affaires, ni de bénéfice, simplement encore une fois d'une levée de fonds.

lundi 06 décembre 2010

De la transparence.. et des documents

Quelques remarques rapides pour accompagner le feuilleton WikiLeaks, à partir des préoccupations de ce blogue sur l'économie des documents.

P. Starr dans son livre The Creation of The Media rappelle la naissance de la notion d'objectivité dans la presse. Il cite Walter Lippman qui un des premiers en 1920 dans Liberty and The News l'a mise en avant. Extrait (trad JMS) :

Lippmann exhortait les journalistes à être plus « objectifs », un mot qui venait d'apparaître pour décrire le journalisme. Les critiques aujourd'hui dénoncent l'objectivité comme une idéologie professionnelle, mais il est important de comprendre les pratiques professionnelles que Lippmann voulait faire adopter aux journalistes. Il voulait que les journalistes s'inspirent de la science en développant un « sens de la preuve » et en reconnaissant franchement les limites de l'information disponible : il les exhortait de démonter les idées reçues et les abstractions et de refuser de laisser de côté des nouvelles ou de mettre la morale ou n'importe quelle autre cause avant la véracité. Ce que Lippmann demandait avant tout aux journalistes était la responsabilité (accountability). (..) Mais les journalistes ne pouvait pas faire tout seuls le travail indispensable ; ils avaient besoin d'experts pour organiser l'information à leur place et Lippmann suggérait la création de «observatoires politiques » - des instituts de recherche à la fois en dedans et en dehors du gouvernement - pour fournir les preuves systématiques qui pourraient servir, par exemple, pour évaluer les performances des agences gouvernementales. p.396-397

On retrouve bien des dimensions de ces fondations du journalisme moderne dans l'affaire Wikileaks, y compris dans l'évolution de la personnalité de son responsable. Mais ce que montre surtout Wikileaks est un déplacement de la notion de preuve vers l'évidence (au sens français et non anglais). On croit ce qui est publié non pas à cause d'une démonstration, mais parce que la méthode de publication des documents semble en garantir la véracité, à la fois parce qu'ils proviennent de témoins directs et qu'ils sont potentiellement visibles par tout le monde et donc vérifiables par tout un chacun. Cette évolution de l'« objectivité » vers la « transparence », avec les mêmes limites théoriques et la même efficacité pratique de l'une et l'autre utopie, est parfaitement en cohérence avec l'architecture anarchique et l'économie décalée du web et ses conséquences sur la transformation des médias. Les mêmes forces sont à l'œuvre dans la transformation de la science en e-science ou encore dans les débats sur la vie privée autour des réseaux sociaux.

Sans doute, ce succès est à mettre en résonance avec l'évolution même de nos sociétés dites post-modernes et leur rapport avec la vérité (sur ce point, voir Roger (ici et) : La seconde modernisation introduirait un effet de retour sur cette prétention à la maîtrise qui caractérisait la première car les conséquences ne peuvent plus être repoussées au-delà de nos générations. La prétention à la totalisation du savoir et au triomphe des autorités scientifiques seraient battues en brèche : la seconde modernisation introduit l'exigence d'une réflexivité, d'un savoir qui se déclare lui-même et qui se contrôle en connaissant ses limites et ses conditions de production. p.161

Néanmoins dans l'histoire de WikiLeaks la théorie du document permet de voir les limites de cette nouvelle idéologie. Même si les documents sont pour une part en accès libre, leur décryptage, c'est à dire leur accessibilité intellectuelle (lu), passe par cinq des journaux les plus prestigieux des États-Unis et d'Europe (ici). Et ainsi les données brutes, triées, mises en contexte et publiées par les journaux prennent le statut d'information journalistique avec toute la confiance attachée à ce statut (su). C'est la responsabilité journalistique (accountability), telle que définie dans les années vingt du siècle dernier qui l'a emporté.

L'erreur du raisonnement serait de croire que l'on transforme un ordre documentaire à partir d'une simple mise en accès (vu). L'abandon de la mise en ligne sans tri préalable des données brutes qui était pourtant le dogme initial du site () souligne a fortiori la prégnance d'un ordre documentaire pour la diffusion de documents d'archives d'institution.

Le passage de l'objectivité à la transparence modifie aussi les responsabilités d'une autre profession qui doit s'adapter très vite à la nouvelle donne du web. Il n'y a pas eu, en effet, d'enquête journalistique dans cette affaire, simplement la consultation par des journalistes de documents qui leur ont été proposés spontanément. On peut parier qu'à l'avenir la fonction archivistique, avec ses différents attributs va s'en trouver considérablement renforcée, pour le meilleur et pour le pire.

Je rappelle que, selon le manuel, les archivistes québécois évaluent, sélectionnent, acquièrent, conservent et mettent à disposition des documents d’archives, assurant leur intégrité intellectuelle et une conservation physique responsable, pour le bénéfice des utilisateurs actuels et celui des générations futures" (Association of Canadian Archivists 1999, notre trad.) comme leurs collègues ailleurs au Canada. Toutefois, à la différence de ces derniers, les québécois entendent aussi exercer des responsabilités sur « la gestion des documents qui consiste à assurer le contrôle systématique des documents pendant leur cycle de vie. »

Paradoxalement, il semble que dans cette histoire c'est bien l'ordre documentaire traditionnel, journalistique et archivistique, qui sortira renforcé, mais l'un et l'autre devront s'adapter à une nouvelle architecture de l'accès à l'information.

Actu un peu plus tard

Parmi les très nombreux billets sur WikiLeaks, deux proches de mes préoccupations Christian Fauré et Martin Lessard.

Actu du 15 déc 2010

Sur les chgts du journalismes, voir :

David Carr, “WikiLeaks Taps Power Of the Press — The Media Equation,” The New York Times, Décembre 12, 2010, rub. Business Day / Media & Advertising, ici.

Actu du 3 mars 2011

Pile sur le sujet, un papier de Y Benkler qui commence par une citation de T Roosevelt sur le journalisme à scandale et analyse en détail l'affaire Wikileaks, montrant à la fois les tentatives d'attaque contre le service et son responsable et ses capacités de résistance et constatant qu'il s'agit d'une évolution des formes du 4e pouvoir.

A FREE IRRESPONSIBLE PRESS: WIKILEAKS AND THE BATTLE OVER THE SOUL OF THE NETWORKED FOURTH ESTATE ici

- page 33 de 144 -