Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

vendredi 22 septembre 2006

Journaux contre Google-News : métier, code, rémunération et territoire

Dans le feuilleton à rebondissements multiples de la mise en place progressive d'un nouveau modèle de média et de son articulation avec les anciens, un épisode particulièrement éclairant vient de se produire en Belgique. Google s'est fait condamner, suite à une plainte des éditeurs de journaux belges, pour avoir intégré les dits journaux dans son service "Google-News" sans leur autorisation.

Parmi les très nombreux commentaires, j'ai retenu pour leur contraste une analyse très française dans un billet d'E. Parody (du groupe Les Échos), que l'on pourra mettre en résonance avec celle de D. Sullivan, très "états-unienne".

Voici un extrait du jugement, qui concerne l'analyse de l'expert mandaté par le tribunal (le jugement doit être affiché pendant une vingtaine de jours sur le site Google.be, E. Parody a eu la bonne idée d'en faire une copie, a-t-il demandé l'autorisation à Google ? ;-)) :

Le rapport d’expertise (..) conclut que « Google News est à considérer comme un portail d’information et non un moteur de recherche. »; Qu’il relève que le service Google News se qualifie lui-même comme un site d’information en ligne, en ces termes « Cette diversité de perspective et d’approche est unique parmi les sites d’information en ligne et nous considérons comme une tâche essentielle de vous aider à rester informés sur les sujets qui vous importent le plus. »; Attendu qu’il relève que le site est alimenté à l’aide des informations puisées dans la presse, ce qu’il a mis en évidence en procédant à de nombreux tests à partir de sites d’information de différents quotidiens francophones belges ; Attendu que ces recherches l’ont notamment conduit à mettre en évidence que, lorsqu’un article est toujours en ligne sur le site de l’éditeur belge, Google renvoie directement, via le mécanisme d’hyperliens profonds, vers la page ou se trouve l’article mais que, dès que cet article n’est plus présent sur le site de l’éditeur de presse belge, il est possible d’en obtenir le contenu via l’hyperlien « en cache » qui renvoie vers le contenu de l’article que Google a enregistré dans la mémoire « cache » qui se trouve dans la gigantesque base de données que Google maintient dans son énorme parc de serveurs ; Attendu enfin qu’il se déduit du rapport de l’expert que :

  • le mode de fonctionnement actuel de Google News fait perdre aux éditeurs de presse quotidienne le contrôle de leurs sites web et de leur contenu (voir à ce sujet les tests menés par l’expert qui montrent les effets d’un retrait d’article, pages 42 à 67 du rapport) ;
  • l’utilisation de Google News contourne les messages publicitaires des éditeurs lesquels tirent une partie importante de leurs revenus de ces insertions publicitaires (pages 13 à 18, 108 à 119 du rapport) ;
  • l’utilisation de Google News court-circuite de nombreux autres éléments comme les mentions relatives à l’éditeur, les mentions relatives à la protection des droits d’auteur et aux usages autorisés ou non des données, des liens vers d’autres rubriques (par ex. les dossiers thématiques constitués par les éditeurs, pages 108 à 119 du rapport);
  • l’utilisation du « cache » de Google d’une part permet de contourner l’enregistrement demandé par l’éditeur et d’éluder le paiement de l’article de presse (voit le cas du Soir en ligne décrit par l’expert en pages 35 à 38), d’autre part stocke, en vue de sa rediffusion, l’entièreté de l’article (dans l’état où Il se trouvait lors de son édition la plus récente) (pages 68 à 98-99 du rapport)

On peut lire un peu plus loin, ce passage révélateur :

Qu’il ne peut être admis par ailleurs qu’elle persiste à retirer un bénéfice élevé à l’aide, notamment, du travail intellectuel d’autrui, tout en spéculant sur les difficultés qu’éprouvent les auteurs et éditeurs de journaux dans un contexte technologique extrêmement complexe pour mettre fin à cette appropriation illégitime de leur travail ; Que l’attitude de la défenderesse est d’autant plus surprenante que dans d’autres pays, certes plus importants que la Belgique, la défenderesse s’est engagée dans des négociations avec les éditeurs de journaux pour résoudre la question du respect des droits d’auteur; Attendu qu’il résulte de l’expertise que les capacités techniques dont dispose la défenderesse, et qui sont hors de proportion avec les moyens de la presse écrite francophone d’un pays comme la Belgique, lui permettent d’adopter une attitude qui confine à l’indifférence, alors qu’elle retire un bénéfice de la diffusion sur la toile d’un contenu qui a nécessité la mise en commun de moyens rédactionnels et éditoriaux importants de la part de journalistes et d’éditeurs de journaux, dont l’activité est essentielle dans une société démocratique ;

Je ne reviens pas sur l'épisode lui-même, largement décrit dans les billets signalés. N'étant pas juriste, je ne saurais commenter le jugement sur le fond. Mais une lecture plus économique est possible de l'épisode qui révèle des malentendus instructifs. De façon très schématique, je pointerai ici quatre leçons :

1) Documentation vs publication

J'avais, il y a quelques années, montré que les sciences de l'information et celles de la communication se distinguaient par l'orientation de leur point de vue (à partir du lecteur pour les premières, de l'auteur pour les secondes). Ainsi les pratiques professionnelles observées par les premières détricotaient les montages temporels et spatiaux construits par les acteurs que privilégaient les seconds. Les panoramas de presse, qui redécoupent la structure physique, temporelle et de distribution, des journaux, en sont un bon exemple. Aujourd'hui les deux points de vues se croisent avec la montée du nouveau média issue du succès des moteurs. Et Google-news en est une superbe manifestation. Tant que les activités se déroulaient dans des espaces séparés, elles pouvaient s'articuler (même s'il a fallu pour cela de longues négociations). Maintenant qu'elles se retrouvent sur le même espace, elles sont en concurrence.

2) Code vs law.. and money

Pour paraphraser L. Lessig, nous sommes dans une superbe illustration de l'alternative entre une régulation par la loi, ou par la technique. Il aurait suffi aux éditeurs belges de signifier à Google leur refus d'apparaître, ou de mettre eux-mêmes les codes adéquats pour que la question, du moins en apparence, soit résolue. Mais, cette attitude était contraire à l'esprit de la loi sur le droit d'auteur qui stipule que c'est au diffuseur à faire la démarche auprès du détenteur de droits et non l'inverse. Les journaux ont voulu s'en tenir à ce principe.

Une des raisons est le rapport de force : Google a pour lui la force du code, qu'il maîtrise et domine ; les journaux ont la force du contenu et de leur tradition démocratique de publication. Deux modernités ici s'affrontent.

Mais le fond de l'affaire est financier. Citons le président de Google, interviewé par D. Sullivan : À cause de notre taille et de la masse d'argent dont nous disposons, Google se doit d'être plus attentif quand il lance des produits qui peuvent violer la notion que d'autres personnes ont de leurs droits. Mais aussi, franchement, nous nous trouvons attaqués en justice, et cela est couteux, cela écarte les dirigants, etc., de notre mission. Dans les cas que vous indiquez, la plupart des plaintes, de mon point de vue, relevaient d'une négociation d'affaires réalisée dans une court de justice. Et je déteste le dire, mais c'est mon opinion personnelle. Et dans la plupart des cas, un changement de notre politique ou une modification financière aurait en fait résolu nombre de questions. (trad JMS)

Google-news fonctionne d'abord parce qu'il est peut couteux une fois mis en place, la multiplication des procès pourrait sérieusement l'handicaper simplement à cause des dépenses qu'ils occasionnent.

3) Payer pour voir ou être vu

Nouvelle illustration d'une très vieille question des médias. Que rémunère-t-on : le contenu ou l'audience ? Les deux sont créateurs de valeur et dépendant comme la poule et l'oeuf. Les discussions sur ce sujet ont toujours été multiples et, en l'occurrence, il n'est pas sûr que les éditeurs belges ne se soient pas tirés une balle dans le pied en se privant d'un puissant aspirateur de trafic pour leurs sites.

C'est l'argument de Google, cité par Le Monde du 19 sept 2006 :

"Le jugement précise que nous spolions une part des ressources publicitaires de ces journaux, mais cela est inexact puisqu'il n'y a pas de publicité sur Google News, dit Mme Whetstone. La seule chose que nous faisons, c'est organiser l'information et susciter énormément de trafic vers les sites ; or la publicité qui est diffusée par ces sites est fonction de leur audience !"

L'argument doit être nuancé, comme le souligne dans Libération du lendemain, le président du Groupement des éditeurs de services en ligne : «Le problème, note Philippe Jannet, est avant tout que Google, en proposant des alertes gratuites aux internautes, est en train de se constituer, sur notre dos, une énorme base de données de marketing direct.»

En réalité, la question est sans doute plus globale encore. Google-news n'a pas de modèle d'affaires à proprement parler. Il s'insère dans une stratégie beaucoup plus large de captage d'audience d'un côté et de position centrale d'accès de l'autre dont la clé est la capacité de calcul sur les contenus et les traces. Ainsi l'alternative traditionnelle des médias rappelée plus haut, est largement subvertie. Il se crée sous nos yeux une nouvelle valeur qui découle d'un traitement des contenus et des comportements dont on ne cerne pas encore clairement les contours. C'est cette valeur qui constitue la raison d'être économique du nouveau média. Personne, peut-être même pas Google lui-même, ne peut prédire son avenir.

4) Territoires

Le dernier point sur lequel je voudrais insister est celui du territoire. Ici le procès est clairement territorialisé et le jugement, fait référence à cette géographie. Mais Google, lui-même, s'organise de plus en plus clairement par rapport aux territoires par les Url. Cette caractéristique est particulièrement sensible sur un service comme Google-news, où l'actualité récoltée est sensiblement différente suivant les pays, même de même tradition linguistique. Les journaux français dans cette affaire ont une position ambigüe. E. Parody signale une augmentation du trafic des Échos de 5% en provenance de Google.be depuis la fermeture des sites belges..

Il faudrait mieux réfléchir à cette question géopolitique que j'ai déjà plusieurs fois pointée. L'économie des médias traditionnels est inscrite dans le territoire. Les moteurs et les services qu'ils s'adjoignent ont paru s'en affranchir. L'avenir dira si c'est une de leurs caractéristiques où s'il s'agit juste d'une modalité temporaire.

Mais le plus étonnant dans cette affaire, c'est que personne ne paraît dénoncer la menace la plus forte, même si sans doute tout le monde y pense : la position écrasante de Google.

mardi 29 août 2006

Livre(s) : un pour tous, tous pour un

L'actualité rebondit autour de la numérisation des livres et de leur accès en ligne. Citons, parmi d'autres :

- l'annonce de la stratégie de la Communauté européenne sur une bibliothèque numérique (qui dépasse d'ailleurs l'écrit pour s'ouvrir à l'audiovisuel). Communiqué, rapport.

- une question qui commence à travailler les professionnels et experts du domaine, avec un prochain colloque pour des premières réponses : que faire avec un million de livres accessibles en ligne ? Et un très instructif article pour le comptage :

Roger C. Schonfeld, Brian F. Lavoie, Books without Boundaries: A Brief Tour of the System-wide Print Book Collection Journal of Electronic Publishing Summer 2006

- l'annonce par Google de la diffusion gratuite de livres du domaine public, numérisés à partir des fonds de bibliothèques et l'indignation d'O Erstzcheid.

Nous ouvrons sans doute le troisième chapitre de la redocumentarisation du livre, après celui des pionniers (à commencer par le projet Gutenberg et, en France, Gallica), puis celui de l'arrivée des projets industriels de numérisation et les polémiques qui l'ont accompagnée, nous abordons logiquement aujourd'hui l'interrogation sur les modes de diffusion et le positionnement des acteurs concernés.

Quelques remarques rapides sur ce chapitre qui s'écrit devant nous :

- il faut mettre en parallèle les développements de la stratégie de Google avec les propositions de la Communauté européenne qui à l'origine sont d'ailleurs une réaction à celle-là. De plus, on peut trouver dans l'histoire économique de la télévision des éléments pour décrypter l'actualité du livre numérisé. Les uns et les autres proposent en fait une nouvelle déclinaison de la distribution du livre, payée dans un cas par la publicité, dans l'autre par la puissance publique. Nous avons eu le même processus pour les films, passés dès ses débuts à la télévision privée (USA) ou publique (Europe). Pour le moment, nous n'en sommes qu'aux livres du domaine public, il est vraisemblable que pour les autres la question des droits d'auteurs se règlera progressivement avec un achat de droits de diffusion. Mais pour cela, il faut que la démonstration d'une rentabilité soit faite, que les structures et mentalités s'adaptent. Cela prendra du temps. De ce point de vue, les bibliothèques sont comparables à des télévisions locales. Sans doute, elles ont fait preuve de naïveté devant l'ogre Google, mais la question est plus de savoir si elles peuvent constituer un réseau national ou international public dans ce domaine que celle de leur légèreté pour construire une stratégie locale. Là aussi, même si elles ont une longue expérience de coopération et si des organismes comme OCLC montrent la voie, on peut penser qu'il faudra du temps.

- Un livre est et restera un objet individuel clos. C'est le principe même d'une information éditée. Sans doute, mettre en relation des millions de livres ouvre des perspectives inédites (le mot est approprié). Néanmoins, il ne faut pas confondre ces connections avec la constitution d'un seul texte qui représenterait le savoir de l'humanité. Cette remarque, alliée aux capacités de traitement de la langue, a d'importante conséquences : d'une part, celui qui détient des textes édités détient des textes validés ce qui est bien différent du tout venant du Web pour toutes sortes d'opérations (depuis la traduction, jusqu'aux services de question/réponse). Il y a là un trou béant aussi bien du côté juridique de la propriété intellectuelle qui ne protège pas l'exploitation de cette valeur ajoutée (peut-on interdire le traitement sur un livre acheté ?), que du côté économique (comment mesurer la valeur de cette validation ?). D'autre part, la notion de collections (d'objets individuels reliés par un ou plusieurs éléments communs) adaptées à tel ou tel besoin, à telle ou telle communauté garde toute sa pertinence, mais il s'agit de collections virtuelles dont la matérialisation se trouvent dans les métadonnées construites automatiquement et manuellement.

dimanche 20 août 2006

US/UE, interrogation sur les revenus de l'édition en ligne

La Commission européenne a lancé une consultation en septembre 2005 sur le secteur de l'édition en Europe (présentation de l'ensemble de la démarche, document de travail de la Commission de 31 pages + annexes, consultation avec 35 réactions). Même si bien des éléments sont des confirmations plus que des nouveautés pour qui connait le secteur, il s'agit d'un matériau très utile pour un chercheur notamment grâce aux chiffres fournis. À l'évidence les thèses de demain ne ressembleront plus à celles de ma jeunesse !

Extrait du résumé de la présentation :

''Le secteur de l'édition tel qu'il est défini par la Commission dans son document de travail comprend quatre secteurs :

  • Journaux (37% de la production)
  • Magazines et revues (32%)
  • Livres (25%)
  • Annuaires et bases de données (6%)

Les médias en ligne, malgré leur importance croissante, ne font pas partie de la réglementation de la Commission dans le domaine de l'édition.

Voici en quelques chiffres ce que représente le secteur de l'édition :

  • 0,5% du PIB
  • 121 milliards d'euros de production annuelle
  • une valeur ajoutée de 43 milliards d'euros dans la seule Europe des 15
  • 750 000 emplois dont 64 000 dans les maisons d'édition et 50 000 dans d'autres entreprises, des PME pour la plupart.

Ces chiffres, aussi élevés qu'ils puissent paraître, sont en baisse constante, et ce essentiellement en raison d'habitudes changeantes et de la concurrence exercée par Internet.''

Si on creuse cette dernière affirmation, j'ai été surtout frappé par deux éléments aux conséquences opposées :

1) La différence inattendue de l'exportation comparée UE et US, due notamment au secteur des revues scientifiques. En 2002, le poids de l'exportation de biens publiés par l'UE représentait 5,077 Millions d'Euros, ce qui est cinq fois plus élevé que celle des États-Unis (p. 16 du rapport)

2) La différence des revenus de l'internet inversée : La principale part des profits réalisés grâce au contenu électronique dans le monde est faite aux Etats-Unis. Même lorsque des citoyens européens cherchent du contenu produit en Europe, ils utilisent des moteurs de recherche et non des portails d'information. Tous les moteurs de recherche les plus utilisés, comme Google, Yahoo!, MSN search et Altavista, sont situés aux Etats-Unis, et les profits qu'ils réalisent grâce à des publicités en relation au contenu sont le revenu le plus important réalisé en ligne. (extrait de la présentation)

Ces éléments peuvent nuancer ou éclairer les réflexions en cours sur les modèles d'édition, les polémiques sur les droits d'auteur et le mouvement pour le libre accès dans la science. C'est un peu comme si le vieux continent était le champion du modèle traditionnel, tandis que le nouveau voulait s'imposer par l'innovation.

Mais ce qui est vrai dans l'édition, ne l'est pas dans l'audio-visuel où, logiquement, les positions sont bien différentes.

mercredi 02 août 2006

La redocumentarisation des éditeurs scientifiques

Dans le domaine de la publication scientifique traditionnelle, les revues, une récente enquête de l’ALPSP (résumé) ne laisse aucun doute sur l’ampleur de la redocumentarisation. Ses résultats principaux, tels qu’ils figurent dans la présentation méritent d’être cités in extenso :

« - Les éditeurs continuent à rendre accessible en ligne plus de contenus, 90% des revues sont maintenant en ligne contre 75% en 2003 (note JMS : l’échantillon comprend 174 éditeurs commerciaux ou non qui publient des revues de langue anglaise).

- Le nombre de revues continue de croître. 174 éditeurs ont lancé 1.048 nouvelles revues dans les cinq années précédant 2005, soit une moyenne de 6,02 titres par éditeur, pendant qu’ils fermaient 185 titres, moyenne 1,06 chacun.

- la disponibilité en ligne des numéros anciens a cru de 5 à 91% en 1991. De nombreux éditeurs ont numérisé leur collection depuis le premier numéro ; 47 offrent l’accès libre au contenu antérieur à 1990. La continuité de l’accès suivant l’antériorité de l’abonnement est proposée par environ 60%. L’accès aux numéros antérieurs est devenu une part du produit en ligne ; 63% des éditeurs le proposent aux abonnés sans coût supplémentaire.

- Environ un cinquième des éditeurs tente des expériences avec des revues en libre accès.

- La soumission d’articles et la révision par les pairs directement en ligne ont été largement adoptées ces cinq dernières années.

- Presque tous les éditeurs offrent plus de contenus à plus de lecteurs au travers de ventes groupées et/ou de contrats avec des consortiums (JMS : de bibliothèques) ; les calculs de tarifs varient considérablement ; et de nombreux petits éditeurs sont maintenant inclus dans des regroupements multi-éditeurs comme l’ ALPSP Learned Journals Collection.

- Tous les éditeurs ont maintenant élargi les droits d’usage aux lecteurs des bibliothèques (library friendly).

- Même si la plupart des éditeurs demandent aux auteurs de céder leurs droits. La proportion de ceux qui acceptent une licence pour publier a augmenté significativement ces deux dernières années. »

L’ampleur du changement se passe de commentaire. Pourtant, il ne représente qu’une part des transformations en cours, la part la plus traditionnelle, celle qui montre l’adaptation très rapide des acteurs anciens de la publication scientifique : les éditeurs (savants ou commerciaux) et leurs clients les bibliothèques. Bien de nouveaux acteurs sont venus bouleverser les conditions de la publication de la science, et les résultats précédents ne sont peut-être qu'une réaction défensive face à ceux-là : les scientifiques eux-mêmes d’abord par le mouvement du libre accès ou des archives ouvertes ont pris en main la diffusion directe de leurs travaux ; les promoteurs de ce qu’il est convenu d’appeler aujourd’hui le Web 2.0, mélange d’internautes éclairés et d’informaticiens militants ou entreprenants, qui construisent ou proposent collectivement un savoir partagé ; des industriels enfin, et tout particulièrement les responsables des moteurs de recherche dont le succès commercial tranche radicalement avec les déconvenues financières du Web pourtant toutes récentes.

mercredi 21 juin 2006

Structure du budget de PLoS (Le prix de la publication 2)

Nature commente les difficultés financières de PLoS, signalées dans un précédent billet :

''As a US non-profit charity, PLoS must file its annual accounts to the Internal Revenue Service. Nature consulted these via GuideStar.org, a database that contains information on 1.5 million US non-profit organizations. The figures show that PLoS lost almost $1 million last year. Moreover, its total income from fees and advertising currently covers just 35% of its total costs. And although this income is increasing - from $0.75 million in 2003-04 to $0.9 million in 2004-05 - it lags far behind spending, which has soared from $1.5 million to around $5.5 million over the past three years.

To stay afloat, the firm continues to rely on the philanthropic grants that launched the project: $9 million from the Gordon and Betty Moore Foundation and $4 million from the Sandler Family Supporting Foundation, both based in San Francisco (see table image). These covered 65% of the company's operating costs last year, but are running out: at the end of last September, PLoS had assets of $3,393,265.

"We will continue to rely on philanthropic grant support for the foreseeable future," says Mark Patterson, director of publishing at PLoS's UK office in Cambridge, and "possibly always". Patterson adds that he is hopeful that the Sandler Foundation will provide more grants. "We will continue to rely on philanthropic grant support for the foreseeable future," says Mark Patterson, director of publishing at PLoS's UK office in Cambridge, and "possibly always". Patterson adds that he is hopeful that the Sandler Foundation will provide more grants....

"This demonstrates once again the fragility of the author-pays model," says David Worlock, chairman of the London-based publishing consultancy Electronic Publishing Services. (Worlock has worked with a number of publishing companies including Nature Publishing Group.) "It's a real giveaway if they are now saying that they will always need some philanthropic funding." But Patterson points out that PLoS launched most of its journals recently, and that income from these publications is only beginning to accrue. "The financial situation for this year will look quite different," he says. "I'm confident we can balance the books this year and next."''

Il est trop tôt pour des conclusions définitives sur le modèle de paiement par les auteurs. D'autant que PLoS raisonne sur un portefeuille de titres, tous très récents. Néanmoins, c'est un avertissement sérieux.

De plus Nature fournit un tableau intéressant de la répartition des revenus de PLoS :

Deux leçons à tirer de ce tableau pour nous :

- l'implication déjà notée des fondations :

- l'importance des revenus indirects. Dans d'autres pays (comme la France), l'économie des revues est largement supportée par des aides publiques ou para-publiques (CNL). Il serait intéressant d'avoir un tableau comparable. Il n'est pas évident, en effet, que la structure des revenus du modèle classique soit plus équilibrée dans de nombreux cas.

Bien des revues même ont une économie publique, si l'on tient compte de la totalité des coûts, notamment du personnel ou des locaux mis à disposition. Quelle est, par exemple, la structure du budget du Bulletin des bibliothèques de France ?

Repéré par P. Suber.

- page 14 de 15 -