Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

Recherche - attention

mercredi 03 octobre 2007

Partage de veille

Nicolas Morin, un des (sinon le) premiers biblioblogueurs français, nous propose (billet) un film d'amateur pour illustrer comment faire de la veille comme un pro sur les biblioblogs. Il y présente la façon dont il suit 120 blogs spécialisés à l'aide de deux (ou trois en comptant Firefox) outils simples. Le film en soi est une démonstration étonnante de la capacité, efficacité et simplicité, de partage du Web. Et, cerise sur le gateau, il offre même l'ensemble de ses fils RSS (ici).

Olivier Ertzscheid, autre pionnier de la communauté qui a depuis longtemps repéré (voir ) la transformation de la veille par les blogs, signale (ici) les cours de la School of Information de Berkeley, notamment celui-ci : i141: Search Engines: Technology, Society, and Business. On trouve l'accès à l'ensemble des cours ici.

Moi qui suis d'une génération à l'attention un peu émoussée, je n'utilise que des fils RSS dans un dossier du marque-pages de Firefox et je fais confiance aux jeunes pour me guider..

lundi 01 octobre 2007

Marché des revues scientifiques : plus ça change..

Une intéressante étude sur le marché des revues scientifiques, techniques et médicales vient d'être publiée par un consultant britannique :

David Mort, Online information drives growth, Research Information, August/September 2007, Html

Elle se passe de commentaire. Extraits (trad JMS) :

Tandis que nombre des secteurs de l'information et de l'édition, notamment ceux qui dépendent largement de la publicité, ont connu des hauts et des bas dans les ventes et les bénéfices dans ces cinq ou six dernières années, les principaux joueurs de l'information scientifique (STM) en Europe ont présenté, année après année, leur bénéfice à deux chiffres, la plupart du temps en croissance. (..)

Elsevier continue de dominer et atteint une marge de bénéfice d'exploitation de 30% en 2006. Il est suivi par Informa qui présente une marge de 26% pour sa division scientifique et académique. (..)

Comme l'année dernière, le segment de la santé concentre l'attention des plus gros joueurs et contribue à la majeure partie de la croissance des ventes. Dans l'année financière 2006, par exemple, les ventes de produits et services pour la santé se sont accrues de près de 13% chez Elsevier et 12% chez Informa, à comparer avec une croissance de juste 4% pour l'ensemble des ventes chez l'un et l'autre. (..)

Cependant, tandis que le marché de l'information scientifique arrive à maturité et que les acteurs traditionnels du marché des requêtes rencontrent une sévère concurrence du côté des géants de la recherche comme Google (Google Scholar), les acteurs dominants se tournent vers des solutions de gestion de documents et de contenu, et des dispositifs à valeur ajoutée comme la fouille de textes ou les outils d'analyse pour acquérir un avantage concurrentiel. (..)

Une autre tendance qui s'est poursuivie est la numérisation. Plus d'offreurs parmi les principaux ont démarré des programmes pour numériser l'ensemble des archives de leurs revues. (..)

Le prix des revues ne montre aucun signe de stabilisation. (..)

Le débat sur le libre accès se poursuit et, en 2006, de nombreux gros éditeurs traditionnels ont admis le rôle du libre accès en autorisant à la fois le modèle du lecteur payant (modèle traditionnel) et celui de l'auteur-payant (modèle du libre accès) pour quelques revues « hybrides ». (..)

En février 2007, la Commission Européenne a présenté sa très attendue politique sur le libre accès en Europe, mais a renoncé à demander une obligation pour le libre accès. (..)

Tant que ces tendances continuent, IRN Researchs prévoit une croissance des ventes de 10% pour le marché de l'information scientifique en ligne en 2007, tout comme en 2006. En d'autres mots, on peut s'attendre à un bénéfice à deux chiffres pour la plupart des principaux acteurs pour encore une autre année.

Repéré par Pintiniblog

mardi 11 septembre 2007

Création du Web-média destructrice de la presse

L'avenir de la presse continue de susciter bien des inquiétudes des deux côtés de l'Atlantique. Ce n'est pas nouveau et P. Lozeau les avait synthétisées ce printemps pour ce blogue dans un billet. Nous savons aussi qu'il faut nuancer sérieusement l'analyse (voir ici), si l'on raisonne à l'échelle de la planète. Mais le mouvement s'accélère et les observateurs multiplient les analyses.

Parmi les nombreuses alertes récentes, il faut de nouveau saluer du côté francophone la veille, fine intelligente et constante, d'E. Parody, partiale mais toujours documentée et analytique. Depuis la rentrée, trois billets au moins rencontrent directement les préoccupations de ce blogue :

  • Le risque induit par le préférence de Google-news pour les dépêches d'agence (ici)
  • La chute des effectifs des journaux (ici)
  • La difficile adaptation du modèle économique de la presse aux flux RSS (ici)

Sans revenir en détail sur ces points, je voudrais les mettre dans la perspective d'une analyse en modèles (voir ici pour la présentation des modèles) à partir de deux constats, tirés de deux publications récentes : le nouveau modèle du Web-média s'installe sans ménagement pour les anciens ; l'ancien modèle de la presse a une forte inertie.

L'insoutenable légèreté du Web-média

Un rapport récent de chercheurs de Harvard, au titre évocateur inspiré de Schumpeter (voir explication sur Wikipédia), fournit quelques indications sur l'évolution de l'audience des sites d'information :

Thomas E. Patterson, John F. Kennedy, Creative Destruction: An Exploratory Look at News on the Internet, Report from the Joan Shorenstein Center on the Press, Politics and Public Policy, Août 2007 Pdf

L'audience de 160 sites d'information a été suivie pendant un an. Extrait du résumé (trad JMS) :

Les sites des journaux nationaux au titre reconnu sont en croissance, tandis que ceux de beaucoup de journaux locaux ne le sont pas. Les sites des réseaux de télévision reconnus voient aussi croître leur traffic, tout comme ceux des stations locales de télévision et de radio. Cependant, les sites dépendant des organisations traditionnelles de nouvelles croissent moins vite que ceux des principaux diffuseurs de nouvelles non-traditionnels, comprenant les agrégateurs, les blogueurs, les moteurs de recherche et les offreurs de service.

Ainsi selon que l'on retienne les deux premières phrases ou la dernière, le verre serait à moité plein ou à moitié vide et on pourrait conclure à un relatif optimisme pour les médias traditionnels les plus reconnus à condition de rester vigilant. Cette conclusion est malheureusement erronée. La croissance de l'audience des médias traditionnels ne signifie pas une croissance parallèle de leurs rentrées publicitaires. La publicité a tendance à creuser les écarts, allant naturellement vers le média le plus porteur, c'est à dire vers celui auquel est attaché l'image la plus positive.

Mais il y a bien plus : les deux modèles sont antagoniques et, au moins jusqu'à qu'il soit stabilisé, le succès sur le marché de l'attention du plus jeune se fait au détriment de l'autre. Je n'y reviens pas, je l'ai déjà largement expliqué (ici) et les remarques d'E. Parody le soulignent assez, en montrant toute la difficulté à rendre compatible les deux modèles.

Pire encore : L'antagonisme ne se manifeste pas seulement sur les parts du marché publicitaire, mais aussi sur la structure du média lui-même. Je ne prendrai que l'exemple de Google-news. On oublie souvent que ce service ne rapporte rien directement à son promoteur. Il n'y pas, pour le moment, de publicité sur ce service. Là encore, l'analyse par modèles est éclairante.

Pour Google-news, la firme mère s'est inspirée du modèle de la bibliothéconomie pour la structure médiatique du service et pour sa régulation : une revue (ou «panorama» selon le terme consacré en documentation) de presse ; le fair-use même si celui-ci a rencontré quelques oppositions selon la position des acteurs et la législation particulière des pays. Cette inspiration était intéressante : en effet, il n'y a pas de concurrence commerciale de ce côté, puisque le modèle bibliothéconomique n'est pas financé par le marché. Cette position d'homologie n'est donc tenable pour Google-news qu'à condition de ne pas rentrer sur le marché publicitaire.

Par ailleurs, la firme rompt avec ce modèle primitif grâce à la performance de ses outils automatiques. La structure de coûts du service n'a rien à voir avec celle, très lourde, de la bibliothéconomie. Mieux encore Google-news paraît concrétiser un vieux rêve de complémentarité entre le modèle bibliothéconomique et celui de la presse, puisqu'il oriente l'audience vers les encarts publicitaires des sites d'information cette dernière. Ainsi, Google-news s'est assuré, malgré quelques réticences, une relative neutralité du côté de la presse.

On peut alors se poser la question de l'intérêt pour Google de monter un service qui lui coute de l'argent et favorise les rentrées financières de ses concurrents sur le marché publicitaire. Pour y répondre, il faut considérer que le modèle du Web-média n'est pas encore stabilisé et prendre très au sérieux la mention Béta qui est faite sur la page du service.

À court terme, il s'agit d'occuper le terrain afin de monter les barrières à l'entrée pour d'autres acteurs intéressés sur les services de recherche d'informations. Tout ce qui fragilise les concurrents rapporte indirectement à Google, puisqu'il est, par ailleurs et de très loin, leader du marché publicitaire sur le Web. À moyen terme néanmoins, Google-news pourrait être prisonnier de sa réussite et devra rémunérer certains contenus, ceux qui viennent de professionnels, sinon il tarira ses sources les plus fiables. On en voit les prémisses dans les négociations avec les agences de presse. Ceci impliquera aussi une rentabilisation directe du service et donc vraisemblablement l'entrée de la publicité dans le service. Mais en attendant, plus il fragilise les producteurs aujourd'hui, meilleure demain sera sa position pour négocier.

En réalité, la limite de l'exercice pourrait être le succès de la firme Google elle-même. Elle ne peut-être un modèle de média à un seul acteur. Et il est à prévoir que les réactions se feront de plus en plus vive, dénonçant le monopole, à l'instar de celles particulièrement virulentes d'O. Ertzscheid (voir, parmi d'autres, celle-là).

Le poids du Quotidien

Cette stratégie est d'autant plus payante que le modèle de la presse a une forte inertie, tout particulièrement pour la presse quotidienne. J.-M. Charon, qui reste son meilleur analyste francophone, le montre clairement dans un article récent :

Charon Jean-Marie, L'économie de l'information, Structures et stratégies des groupes de presse, p.73-78. in Information, médias et internet, Cahiers Français n°338, mai - juin 2007, La Documentation française, sommaire *

Je cite :

En presse écrite le rythme quotidien constitue une différence de nature, imposant à un journal de collecter, traiter, mettre en forme, le plus souvent imprimer, voire distribuer lui-même l'information. C'est dire que la presse quotidienne se caractérise par des entreprises plus lourdes, regroupant de nombreux employés et cadres, notamment commerciaux, ainsi que des ouvriers et techniciens de fabrication.

Une telle structure est sans doute un gage d'indépendance, éditoriale et économique, en période de vaches grasses, mais c'est une source de rigidités quand vient la disette. Et, pour la presse quotidienne dans le monde occidental, il semble que nous soyons entrés dans ce cycle. On peut donc y prévoir encore de forts mouvements de concentration et de rationalisation. Dès lors, la voie est dégagée pour les nouveaux entrants du Web-média.

J'ajoute pour conclure que le raisonnement en modèles est éclairant pour décrypter les relations difficiles entre la presse et le Web-média, mais il l'est tout autant pour les autres modèles de médias (bibliothèque, édition, radio-télévision), bien entendu en le déclinant selon les spécificités de chacun.

-* Curieux numéro d'une revue, justement réputée, sur les relations de la presse et de l'internet où le mot Google n'est, sauf lecture trop rapide de ma part, jamais écrit, où aucune Url n'est citée dans les références. Bref, une résurgence de l'ancien monde dont je ne sauverais personnellement que l'article en question. Sévère peut-être, mais l'enjeu, comme voudrais le montrer ce billet, est lourd.

mardi 14 août 2007

Roger et la trahison de Google Books

Inheritance and loss? A brief survey of Google Books by Paul Duguid First Monday, volume 12, number 8 (August 2007). Html

Un article sur la qualité de la numérisation de livres chez Google qui mérite attention, non pour ses constatations : la qualité est mauvaise, c'est bien connu et documenté, mais pour la conclusion. Extrait (trad JMS) :

Le Google Books Project est surement un programme important, sur plus d'un point même inestimable. C'est aussi, comme la preuve en a été brièvement administrée ici, un programme hautement problématique. Comptant sur la puissance de ses outils de recherche, Google a négligé des métadonnées élémentaires, comme le numéro de volume. La qualité de la numérisation (et donc on peut supposer celle de la recherche) est parfois totalement inadéquate. Les éditions proposées (à la recherche ou à la vente) sont, au mieux, regrettables. Étonnamment, cela me laisse penser que les techniciens de Google ont une vision plus romantique du livre que les bibliothécaires. Google Books considèrent les livres comme un entrepôt de sagesse à exploiter avec de nouveaux outils. Ils ne voient pas ce que les bibliothécaires savent : Les livres peuvent être des choses obtuses, obstinés et même odieuses. En général, ils ne se résignent pas à entrer sur une étagère standardisée, un scanner standardisé ou une ontologie standardisée. On ne peut non plus surmonter leurs contraintes en grattant le texte ou en développant des algorithmes. Sans doute ces stratégies sont utiles, mais en essayant de laisser de côté des contraintes vraiment simples (comme les volumes) ces stratégies sous-estiment le fait que les rigidités des livres sont en même temps des ressources qui précisent comment les auteurs et les éditeurs ont cherché à créer le contenu, le sens et la signification que Google cherche aujourd'hui à libérer. Même avec les meilleures technologies de recherche et de numérisation à sa disposition, il est imprudent d'ignorer les éléments livresque d'un livre. D'une façon plus générale, un transfert des artéfacts de communication complexes entre les générations de technologies est sûrement problématique et non automatique.

Finalement, considérant la transmission comme une assurance qualité, la question de la qualité dans le programme bibliothèque de Google Book nous rappelle que les formes nouvelles sont toujours susceptibles de parricide, détruisant dans le processus les ressources dont elles espèrent hériter. Cela reste problématique, par exemple, pour Google News. Dans leur offre gratuite d'actualités, cela risque de miner le flot entrant des sources sur la qualité desquelles Google News compte pour vivre. Cela est aussi vrai, à une moindre mesure, pour Google Books. Google compte ici sur l'assurance qualité des grandes bibliothèques qui collaborent au projet. Les bibliothèques de Harvard et de Standford ne voient pas leur réputation renforcées par la qualité douteuse de Tristram Shandy (note JMS :livre ayant servi à la démonstration de l'auteur), marquée à leur nom dans la base de données de Google. Et Tristram Shandy n'est pas le seul. Pour chaque page mal numérisée ou chaque livre mal catalogué, Google ternit non seulement sa propre réputation sur la qualité et la sophistication de sa technologie, mais aussi celle des institutions qui se sont alliées avec lui.(..)

Voilà des affirmations qui alimenteront sûrement les débats entre partisans et adversaires du projet.


Actu du 10-09-2008

Un des débats les plus intéressants a eu lieu sur le liste des historiens du livre SHARP-L entre P. Duguid et P. Leary, auteur de l'article Googling the Victorians (pdf) qui montre a contrario combien l'outil est utile pour les historiens. Le débat a été reproduit par P. Brandley dans un billet sur O'Reilly Radar sous le titre The Google exchange.


Mon intérêt est ailleurs, sur le fond de la question posée qui rappelle les réflexions de Roger et prennent ici une dimension économique que je n'avais pas encore perçue.

Le premier texte de Roger a fait ressortir trois dimensions indissociables pour définir un document que je traduirais aujourd'hui ainsi :

  • Anthropologique : Forme (Document = Support + Inscription)
  • Intellectuelle :Texte (Document = Code + représentation)
  • Sociale : Médium (Document = Mémoire + transaction)

ou sous forme d'un schéma :

La remarque de P. Duguid revient à dire que la transposition par Google d'un livre sous format numérique n'a pris en compte (et mal) que la dimension du texte, en s'appuyant sur sa valeur sociale construite par les bibliothèques et en oubliant la forme. On pourrait dire aussi qu'un livre ancien et prenant une valeur patrimoniale réduit l'importance du texte au profit de la forme ce qu'a oublié Google, spécialiste du traitement linguistique.

Une autre facette du problème est soulevée par l'auteur celui de la fidélité de la transposition qui pose la question de la très difficile définition du texte. Celle-ci est traité cette fois dans le deuxième texte de Roger, qui se demande notamment comment définir les invariants documentaires à préserver dans une transposition de forme.

Le plus intéressant donc, pour moi, dans l'article de P. Duguid est de constater que les réflexions de Roger trouvent ici un écho pratique doublé enjeu économique. Ces difficultés ont, en effet d'après l'auteur, des conséquences sur la valeur de l'objet créé et en retour sur celle de la source.

mardi 12 juin 2007

Postes à l'EBSI

Actu du 14 juin 2007 : les postes sont affichés sur le site de la Faculté des Arts et des Sciences de l'Université de Montréal.

Deux postes de professeur(e)s-adjoints devraient être prochainement affichés sur le site l'EBSI sur les profils suivants :

  1. Enseignement aux trois (3) cycles, recherche et encadrement d’étudiants en recherche et diffusion de l’information (imprimée et numérique), incluant un ou plusieurs des domaines suivants : référence, sources et ressources d’information (générales et spécialisées), outils de recherche, besoins d’information et comportements informationnels, formation à l’utilisation de l’information.
  2. Enseignement aux trois (3) cycles, recherche et encadrement d’étudiants en sciences de l’information, en particulier dans les domaines liés à la gestion de l’information ou l’utilisation de l’information dans les organisations. La professeure ou le professeur sera aussi responsable du projet pilote de coopération avec la Haute École en Gestion de Genève/Information Documentaire pour une formation internationale de deuxième cycle en gestion des institutions documentaires.

EXIGENCES: Doctorat (Ph.D.) en sciences de l’information ou dans une discipline connexe. Aptitudes démontrées pour l’enseignement et pour la recherche. Excellente connaissance du français. Pour le second : Une expérience en gestion de programme d’enseignement sera un atout.

Attention, je devance de quelques jours une décision probable mais pas certaine, car je passe prochainement en France et s'il y a des candidats de l'Hexagone intéressés, il est préférable de prendre rdv un peu à l'avance. Je serai à Lyon pour un séminaire à l'ENSSIB le 27 juin et le 28 au matin, à Paris pour un autre au CNAM le 29 juin et encore à Grenoble le 30 dans la journée. Il sera possible de trouver un petit moment pour discuter avec les intéressés éventuels. Ceux-ci peuvent m'envoyer un courriel ou laisser un commentaire sur ce billet, que je ne modérerai pas bien sûr ;-). Ceci avant le milieu de la semaine prochaine..

- page 22 de 27 -