Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

mercredi 31 mai 2006

Les moteurs réduisent-ils le Web ?

Voici un papier fondamental pour mieux comprendre le darwinisme documentaire et par conséquent l'économie du document. Une conclusion pour nous dont Roger avait déjà eu l'intuition : les moteurs relèvent plus de la bibliothéconomie que de l'édition.

The egalitarian effect of search engines Authors: Santo Fortunato, Alessandro Flammini, Filippo Menczer, Alessandro Vespignani

Comments: 9 pages, 8 figures, 2 appendices Subj-class: Computers and Society; Information Retrieval; Physics and Society ACM-class: H.3.3; H.3.4; H.3.5; H.5.4; K.4.m

Search engines have become key media for our scientific, economic, and social activities by enabling people to access information on the Web in spite of its size and complexity. On the down side, search engines bias the traffic of users according to their page-ranking strategies, and some have argued that they create a vicious cycle that amplifies the dominance of established and already popular sites. We show that, contrary to these prior claims and our own intuition, the use of search engines actually has an egalitarian effect. We reconcile theoretical arguments with empirical evidence showing that the combination of retrieval by search engines and search behavior by users mitigates the attraction of popular pages, directing more traffic toward less popular sites, even in comparison to what would be expected from users randomly surfing the Web.

Voir aussi des mêmes un billet résumant la problématique et les résultats.

Repéré par J. Battelle

Actu 23-11-2006 : un résumé en français

mardi 30 mai 2006

Creuser les fondations

Juste une réflexion qu'il faudra alimenter et approfondir, du directeur de l'Ebsi découvrant une activité nouvelle : la récolte de fonds.

Comme beaucoup de Français (et comme encore aussi, semble-t-il, pas mal de Québécois), j'avais une compréhension du don philanthropique réduit à une action caritative ou à un outil de marketing. Mais, en réalité de ce côté de l'Atlantique, même si ces motivations sont aussi présentes, il s'agit surtout de bien autre chose : une redistribution des richesses dans des actions d'intérêt général insuffisamment soutenues selon le donateur, favorisée par une incitation fiscale. Autrement dit en caricaturant à peine, on pourrait dire qu'il oriente l'attribution de fonds normalement gérés par l'État en y ajoutant sa cote part. Ou dit encore autrement, il rend à la société une part des revenus qu'il a accumulé, en faisant même parfois une opération fiscale très intéressante, notamment dans le cas de transmission par héritage. Il y a aussi une différence de mentalité entre le contribuable à la française, qui confie à l'État la totale gestion des impôts recueillis, et le "tax-payer" américain soucieux de l'efficacité des sommes dépensées.

Les universités nord-américaines anglophones récoltent ainsi des sommes considérables de leurs anciens diplômés qui ont un poids décisif dans leur équilibre budgétaire. Si l'on considère que l'évolution de la démographie conduit à un vieillissement de la population et au départ à la retraite prochainement d'un grand nombre de personnes ayant accumulé souvent un patrimoine, ces ressources vont constituer dans les années à venir un poids économique conséquent et sans doute peser sur la notion de "bien public".

Ceci n'est pas sans rapport avec l'économie du document. En effet, si l'on suit le paradoxe "Muet-Curien" :

"Alors que les technologies de l’information et de la communication devaient en principe favoriser un fonctionnement plus efficace de l’économie de marché, en rendant les transactions plus fluides et en éliminant les frottements informationnels, elles distillent en fait les ingrédients d’une économie publique."

Les mécanismes indirects de financement vont, pour une part importante, faire tourner l'économie des documents, qui ont bien les caractéristiques d'un "bien public", accessible à tous une fois en ligne. De là à conclure que la philanthropie financera largement cette économie il n'y a qu'un pas.. déjà largement franchi, de façon indirecte par le rôle des universités américaines dans le développement du document numérique, mais aussi de façon directe par, par exemple, Georges Soros, son Open Society Institute et son appui au libre accès ou encore le financement de Wikimédia.

samedi 27 mai 2006

BNUE, Quaero : erreur de communication ou de casting ?

Ces derniers jours, les annonces, publications, manifestations se sont multipliés en France autour du projet de Bibliothèque numérique européenne (BNUE) et de son petit frère, le dit-moteur européen Quaero (pour les débuts de l'aventure, voir mon article). Cette accumulation, dont je ne relèverai ici qu'une petite partie, s'explique sans doute par de prochaines décisions de la Commission européenne sur le sujet. Extrait d'un communiqué de la Commission :

La Commission a l’intention de présenter une proposition de recommandation pour la mi-2006 afin de s’attaquer, en collaboration avec les États membres et le Parlement européen, aux obstacles à la numérisation et à l’accessibilité en ligne. Dans le courant de cette année, la Commission présentera aussi sa stratégie pour la création de bibliothèques numériques consacrées au contenu scientifique et universitaire. Avant la fin de l’année, une communication de la Commission sur le «contenu en ligne» traitera des questions plus vastes telles que la gestion des droits de propriété intellectuelle à l’ère numérique.

À lire les différentes interventions, il ressort d'abord que la communication autour de ces mouvements en France a été désastreuse et ensuite que les deux projets sont en fait complètement distincts et sans doute très différents de ce qu'on a pu dire.

Du côté de la BNUE "made in France", disons d'abord que JN Jeanneney, président de la BNF, propose un nouvel article dans Le Monde. Il prend date, sans doute, mais ne dit rien. Plus intéressant est le long, très long, article de Valérie Tesnière et Noémie Lesquins faisant le point sur la réflexion française. C'est sans doute une bonne synthèse pour ceux qui n'ont pas suivi la question. Personnellement, j'en retiens surtout deux leçons :

1) La volonté de poser tous les problèmes, dans toutes leurs dimensions, a le mérite de souligner leur complexité qui avait été quelque peu caricaturée auparavant. Mais elle est plus proche d'une logique administrative que d'une logique entrepreneuriale, qui suppose la prise de risque. Or le Web se nourrit d'expérimentations et de tâtonnements. Le défi pour les bibliothèques est d'assumer cette prise de risque, la BNF en est-elle capable ? Elle l'avait fait avec Gallica, les initiatives annoncées paraissent sages, trop sages pour emporter l'adhésion des internautes. On peut mettre en balance la récente mise à disposition par l'INA de 100.000 émissions, même pas citée dans l'article.

2) L'insistance martelée sur la différence entre une logique de stock, d'accumulation, qui serait celle de Google ou encore des partenaires de l'Open Content Alliance et la logique proposée par la BNF, de choix raisonné pour la numérisation, disons de collection. Ce thème, très souvent rappelé, presque comme un slogan, dans de nombreuses interventions sur le sujet me paraît présenté d'une façon réductrice. Sans doute les bibliothèques qui sont au service d'une communauté, grande ou petite, doivent mettre à sa disposition une collection raisonnée, c'est leur raison d'être. Mais il ne faut pas confondre le catalogue et le magasin. Dans le magasin, on gère un stock, en cataloguant on construit une collection. Autrement dit, le processus de numérisation est bien une constitution de stock que l'on a intérêt à partager, à mutualiser et `rendre interopérable, chaque structure se donnant les priorités qui lui semblent les plus pertinentes et, si possible, engageant un processus d'échelle industrielle. Par ailleurs, sur la base de ce stock, et à l'échelle du Web, il faut construire des collections et sans doute aussi les outils qui permettront de les rendre les plus pertinentes pour telle ou telle communauté que l'on doit desservir.

Par ailleurs, une récente table-ronde s'est tenue au Sénat français pour faire le point sur le projet Quaero, jusqu'ici présenté comme un volet complémentaire de la BNUE, le moteur permettant l'accès aux contenus en ligne. Un compte rendu est disponible ici. Didier Durand en profite pour réïtérer son scepticisme, chiffres à l'appui, sur le développement d'un moteur européen.

Mais la lecture du compte-rendu témoigne plus une communication désatreuse que d'une stratégie absurde. En réalité, Quaero apparaît plutôt comme le nom de code donné au soutien à toute une filière de R&D allant de la recherche multilingue jusqu'à la recherche sur les images en passant par la traduction automatique de l'écrit à l'oral. Pas grand chose à voir donc avec un moteur intégré sinon qu'Exalead est l'un des protagonistes. Dès lors, on peut se réjouir du soutien donné sur des thèmes en effet essentiels, on peut s'interroger sur le peu de transparence de ce processus qui a tout du "fait du prince" et pour juger les options choisies et les résultats, il faudra (encore) attendre de vraies données.

Polémique sur la visibilté de l'OA

Une violente polémique se tient entre S. Harnad et G. Eysenbach à propos des citations des articles en libre accès. L'affaire est partie d'une étude du second qui confirme le fait que les articles en accès libre sont plus cités (v. par ailleurs la bibliographie faites par l'Open citation project sur le sujet) et surtout d'un éditorial de PLoS qui insinuait que les articles des revues en libre accès ("gold journals") étaient plus cités que les articles archivés par les auteurs des revues en accès limité ("green journals").

Au-delà de la violence des propos et du caractère anecdotique des relations entre chercheurs, il y a plusieurs leçons à tirer pour l'économie du document :

1) Les conflits d'intérêts ne sont pas absents du monde des archives ouvertes, qui se définit comme un monde ouvert. Ils sont politiques (au nom de l'intérêt général de la science), ou même politiciens (confusion entre les positions personnelles ou de groupes et l'intérêt général). Ils se règlent par un argumentaire scientifique ou se voulant tel, mais en réalité la passion est sensible à chaque ligne. Les scientifiques sont mis en abîme dans cette affaire (ils se regardent travailler et analysent leur propres pratiques avec leurs propres outils) et leurs egos sont forts. C'est un peu comme lorsque les médias enquêtent sur les médias.

2) La notion de publication se précise et ce n'est pas trop tôt. La publication n'est pas la mise en publicité, ni la validation (révision par les pairs), mais aussi la promotion de l'accès ou, disons, la mise en visibilité. Dans ce processus, le rôle des revues, comme instrument de marketing, n'est pas négligeable et souvent mal compris par les scientifiques qui ne pensent qu'au facteur d'impact. Inversement, le "darwinisme" documentaire (voir Roger) joue maintenant à plein sur le Web et Dorothea Salo a raison de noter que les revues sont moins utiles pour les chercheurs confirmés (sauf sans doute ceux qui visent le prix Nobel ;-) que les archives. Ils n'ont besoin pas de reconnaissance (dans les deux sens : réputation et repérage), par contre la fluidité et la vitesse des échanges leur importent plus. Leur collège invisible fonctionne à plein.

3) Il reste une certaine confusion, justement sur les techniques Web de mise en visibilité /OA. Si un site ou une page sont d'autant plus visibles qu'ils sont consultés ou pointés, alors il y a clairement concurrence et non complémentarité entre archives et revues en ligne. En effet par exemple, un auteur de réputation qui met son article sur une archive ouverte va augmenter le pagerank de celle-ci au détriment de celui du site de la revue où il est publié. Sauf erreur de ma part, ces questions là n'ont pas été étudiées.

Sources P. Suber, Marlène

vendredi 26 mai 2006

Accord Dell Google : articulation du soft et du hard

Google vient de passer un accord de 1Mds de $ avec Dell. Il s'agit de mettre par défaut les produits de Google sur les machines Dell, notamment la Google Bar. Comme le fait remarquer J. Battelle un tel accord éloigne Google de l'esprit de ses origines dont l'essence était de faire grimper au rideau un fan club (dont JB est un des principaux piliers) par ses innovations décoiffantes. La stratégie ici est celle de Microsoft : l'entrainement par le moindre effort. Tristan Nitot (de Mozilla Europe) est bien placé pour l'analyser. Extrait de son billet :

''En substance, les fabricants de PC sont dans une industrie où la guerre des prix fait rage. Pour tous les composants du PC (processeur, carte graphique, mémoire, Chipset, carte-mère, boitier...), il y a concurrence, sauf dans l'un des plus coûteux : le système d'exploitation, Microsoft ayant le monopole dans ce domaine.

Donc, se fâcher avec Microsoft, c'est risquer de se trouver non-compétitif en terme de prix... et donc de ne plus vendre du tout ! Aussi, seuls les très gros constructeurs sont à même de prendre le risque d'un bras de fer avec Redmond, et le milliard de dollars semble être le prix qui répond à la question de Google à Dell : "Combien faut-il vous donner pour que vous puissiez prendre le risque de secouer votre relation avec Microsoft ?"''

Il calcule que le ticket d'entrée serait de 10$ par machine pour 3 ans, valeur de la barrière à l'entrée construite par Micosoft. Peu de firmes sont capables de la sauter. Cet épisode doit être rapproché des logiques diverses de verrouillage par la technologie (DRM) qui sont une des caractéristiques de l'économie du numérique.

- page 138 de 144 -