Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

samedi 25 août 2007

Bien public : les requêtes des internautes

Bill Tancer de Hitwise présente dans son dernier billet une mesure qui pourrait être moins anodine qu'il n'y paraît. Il a recherché les termes qui étaient associés à discount (rabais), cheap (bon marché) et free (gratuit) dans les requêtes sur internet. La mesure a été effectuée pour la semaine du 18 août 2007 sur les données US, dont il précise que chaque agglomérat est constitué de dizaines de milliers d'items, donc statistiquement significatif.

Le résultat des dix premiers termes associés à chaque qualificatif est suffisamment tranché pour faire réfléchir :

  • Le rabais est exclusivement associé à des biens (objets matériels) et quelques services. Dans le domaine qui nous intéresse ici, il y a les CD.
  • Le bon marché est associé aux services exclusivement
  • Le gratuit est exclusivement, ou presque, associé aux documents (musique, fiction, échanges) et aux jeux.

Rappel du rapport Muet-Curien :

Alors que les technologies de l’information et de la communication devaient en principe favoriser un fonctionnement plus efficace de l’économie de marché, en rendant les transactions plus fluides et en éliminant les frottements informationnels, elles distillent en fait les ingrédients d’une économie publique. p.37.

En réalité pour les internautes au moins, cette économie publique concerne les documents. Pour le reste, il paraît bien y avoir simplement un fonctionnement plus efficace du marché.

mercredi 22 août 2007

L'oubli de l'oubli est un problème

On pouvait lire dans le journal La Presse du 17 août dernier sous le titre Frank Zampino sali sur Wikipedia :

La Ville de Montréal a déclenché hier une enquête au sujet d'une biographie de Frank Zampino vandalisée sur Wikipedia à partir d'ordinateurs liés au cabinet du maire Gérald Tremblay. Le président du comité exécutif a été qualifié de «membre présumé de la Fédération internationale tuons tous les juifs (International Kill all Jews Federation)», d'«ancien supporter nazi» et de «membre de Weight Watchers», a appris La Presse.

Il s'agit d'un des nombreux résultats du Wikiscanner qui excite beaucoup les commentateurs ces derniers jours. Mais cette histoire particulière a, à mon avis, une morale bien différente que les diverses manipulations qu'a pu révéler l'outil (voir sur le sujet, parmi de très nombreux autres, ce billet pertinent de Christophe Deschamp).

Si l'on poursuit l'article de La Presse en effet, il est indiqué que la « diffamation » en question aurait été rédigée à partir d'un ordinateur de la mairie, serait restée deux minutes dans l'article de Wikipédia en question et qu'elle aurait été corrigée à partir du même ordinateur.. sauf que, selon le principe du Wiki, l'historique est resté.. a été repéré par des petits malins grâce à Wikiscanner.. et cela a suffi à provoquer l'ire de la mairie et une accroche à sensation pour les gazettes.

On peut en rire et penser qu'au Québec le ridicule ne tue plus. La mairie de Montréal a, d'ailleurs, le 21 août diffusé un communiqué qui donne une version différente :

Le texte qui portait atteinte à l'intégrité de Frank Zampino s'est retrouvé sur le site en question vers le 23 juillet 2006. L'enquête interne de la Ville de Montréal a permis de constater qu'une personne rattachée au cabinet du maire et du comité exécutif a tenté, de sa propre initiative et en toute bonne foi, de corriger ce texte, à partir de son poste de travail. En fait, cet employé du cabinet du maire et du comité exécutif s'est efforcé, le 15 août 2006, de retirer tous les propos mensongers, offensants et dégradants qui avaient été ajoutés à la biographie du président du comité exécutif. Ces corrections ont été faites en deux temps, car l'employé en question n'avait pas remarqué toutes les inepties qui entachaient la biographie de M. Zampino sur Wikipedia.

Quel que soit le fin mot de cette histoire, imaginons un instant qu'elle se soit déroulée, non pas au pays de la tolérance et des accommodements raisonnables, mais en Lybie, au Kazakhstan ou même en Russie ou en Chine. Il est à prévoir que les conséquences auraient été bien différentes, sans doute dramatiques, pour l'employé. Peut-être même des histoires comparables ont eu lieu sans que personne n'en sache rien. Hypothèse d'école dira-t-on, les internautes dans ces pays n'ont pas accès à Wikipédia, vrai et faux, cela dépend des pays et cela ne réduit en rien le problème de fond.

Celui-ci vient d'un paradoxe de la redocumentarisation que j'ai appelé dans un billet précédent « le paradoxe de Roger » :

Le Web favorise conjointement deux mouvements opposés : le développement d'échanges spontanés (conversations) et leur fixation sur un support public, pérenne et documenté.

Ainsi nous ne savons plus oublier. La « manipulation » de deux minutes de l'employé de Montréal, respectueuse ou facétieuse, n'avait aucune signification particulière, mais les traces en ont été conservées, ont été retrouvées et sont devenues matières à gesticulations.

Le problème est sérieux, les exemples de difficultés, beaucoup plus graves que mon anecdote, abondent. On pense, bien sûr, à Borgès et sa nouvelle Funes el memorio,

Funes est mort écrasé par sa mémoire. Cette nouvelle est une métaphore de l’insomnie. (Entretien avec L. Borgès, Le Monde Diplomatique, Août 2001, Html)

..sauf qu'ici il ne s'agit pas d'un individu sombrant dans la folie, mais d'une société entière.

Des réflexions commencent à apparaître. J'ai glané celles-là :

  • Viktor Mayer-Schönberger, Useful Void: The Art of Forgetting in the Age of Ubiquitous Computing, avril 2007. Pdf
  • Jean-François Blanchette & Deborah G. Johnson, Data retention and the panoptic society: The social benefits of forgetfulness, Pdf. J.-F. Blanchette pilote un groupe de travail sur la question
  • Denis Ettighoffer, Les droits de "l'Homme Numérique" : le droit à l'oubli. Html

En réalité, il s'agit d'une question classique d'archivistique : que peut-on jeter ? À partir de quel moment ? Sauf que la valeur économique de l'archivistique repose sur les limites physiques de la mémoire institutionnelle et, justement, ce sont elles qui ont disparu. Il faut donc trouver un nouveau fondement pour la valeur de l'oubli.

samedi 18 août 2007

Cyberinfractructures : publication et appel à projets

Décidément, ça bouge très vite du côté des cyberinfrastructures pour la science :

  • Signalé par S. Harnad (merci à lui), le dernier numéro de CT Watch Quaterly (je n'ai pas encore eu le temps de lire, mais tous les bons auteurs sont là !) : The Coming Revolution in Scholarly Communications & Cyberinfrastructure, août 2007, vol 3, N 3. Html
  • Et le premier appel à projet, lancé en France par les directeurs du Très Grand Équipement ADONIS, Yannick Maignien et Benoit Habert. Il s'agit de soutenir et promouvoir les outils et systèmes innovants de valorisation et de diffusion des données de la recherche et permettre leur mutualisation et leur mise à disposition de l'ensemble de la communauté des SHS : Outils innovants de traitement numérique pour la valorisation et la diffusion des données, Word.

vendredi 17 août 2007

Petit écran à tout faire ?

J'ai déjà eu l'occasion d'en parler, les Coréens et les Japonais font tout avec leur cellulaire (téléphone mobile). Le iPhone a aussi pour vocation d'être multifonction. Un récent article du NYT insiste sur l'intérêt nouveau des médias traditionnels pour le dernier né (repéré par M. Lessard) :

Yes, the Screen Is Tiny, but the Plans Are Big, NYT, 17 juin 2007. Html

Parmi d'autres, un responsable de réseau TV, constatant que les jeunes gardaient toujours leur mobile à porter de main y affirme :

« Fondamentalement, nous avons trouvé le maillon manquant entre les différents médias, c'est le cellulaire »

Mais, il n'est pas évident que tous les contenus soient adaptés au tout petit écran, ni que toutes les cultures se l'approprient de la même façon. C'est pourquoi l'enquête réalisée à la demande d'Online Publisher Association sur les usages du cellulaire pour l'accès au contenu en ligne aux US et en Europe (Royaume-Uni, Italie, France, Espagne) est intéressante. J'en ai sélectionné les trois diapos ci-dessous.

Ce premier graphique montre que le cellulaire est complémentaire du PC et ne le remplace pas, ou pas encore, pour surfer sur le Web. Par ailleurs, il permet de pointer les contenus les plus adaptés au cellulaire, du moins pour la population enquêtée à ce moment-ci de son développement : la météo d'abord, puis le sport (les résultats sportifs) et les nouvelles locales. Les deux diapos suivantes sont aussi importantes, car elles montrent une nette différence des usages entre les US et l'Europe. Pour avoir habité des deux côtés de l'Atlantique, je ne suis pas étonné du poids de la météo du côté américain. Cette information y a, parfois, une importance vitale au sens propre. C'est beaucoup plus rare en Europe.

Le Web structuré

Repéré par Les petites cases

Voilà une série d'articles qui va faire débat, au moins chez mes anciens collègues du RTP-Doc, Michael K. Bergman a entrepris de définir et expliquer ce qu'il entend par le Web structuré (Structured Web) dont il donne la définition dans un premier billet (trad JMS) :

Le Web structuré est une collection de données-objet à l'intérieur de l'internet des documents et des bases de données qui peuvent être extraites, converties sous des formes accessibles, représentées de façon standardisées, partagées, utilisées à diverses fins, combinées, vues, analysées et qualifiées sans souci de leur forme d'origine ou de leur provenance.

(The structured Web is object-level data within Internet documents and databases that can be extracted, converted from available forms, represented in standard ways, shared, re-purposed, combined, viewed, analyzed and qualified without respect to originating form or provenance.)

Il ajoute :

Aujourd'hui, en ce moment et tout autour de nous, une transition fondamentale est en cours qui fait passer le Web d'un environnement centré sur le document à un environnement centré sur les données. Une convergence de standards, d'argumentations et des tendances déjà en place alimentent cette transition. Puisque les briques existent déjà, nous assistons à la construction de ce Web structuré à une vitesse étonnante.

Le concept de Web structuré est donc plus étroit et moins ambitieux que celui du Web Sémantique, mais il peut être réalisé avec les techonologies et connaissances d'aujourd'hui.

N'est-ce pas Roger qui a écrit, il y a déjà quatre ans maintenant, dans son premier texte :

Une évolution possible, mais non certaine, serait que les documents ainsi « rédigés » rejoignent des bases de données, centralisées ou distribuées, et que l’ensemble des fichiers s’apparente de plus en plus à un ou plusieurs vastes jeux de « legos » où des briques de différentes tailles, formes et usages seraient agencées selon des configurations très variées. Un dernier pas serait ainsi en train de se franchir : un document n'aurait de forme à proprement parler qu'à deux moments : celui de sa conception par son auteur qui devra le visualiser ou l'entendre, pour s'assurer qu'il correspond à ses choix (et encore ce n'est pas obligatoire si sa production relève du processus) et celui de sa re-construction par un lecteur. Il est peu probable que le document sera toujours identique dans l'un et l'autre cas. Une autre façon de concevoir cette évolution serait de considérer que le document est maintenant la base de données elle-même dont les différentes sorties ne seraient qu'une interprétation partielle de la richesse.

.. pour s'interroger sur la notion de texte construit dans ces conditions dans son second article et la faculté de construire des vérités partagées, ce qui est une fonction première du document, dans le troisième ? Et puisque je suis à faire la promo de Roger, je rappelle que ces textes ont été réunis sous forme de livre que l'on peut acheter ici.

Série sur le Web structuré, pour le moment trois billets conséquents :

- page 96 de 144 -