Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

Mot-clé - 131. AU COMMENCEMENT - LA BIBLIOTHEQUE ; Externalisations numériques ; Collections numériques

Fil des billets

lundi 10 décembre 2012

Economie de la bibliothèque (COOPT-Enssib-3)

Après avoir repéré et assimilé les particularités économiques du document et avoir compris la logique de la mise en place de modèles économiques pérennes pour le document publié, la troisième séance du cours sur l'écologie du document sera consacrée à l'économie de la bibliothèque, logique puisque je m'adresse prioritairement à des étudiantes de l'Enssib. Elle s'articulera en deux moments : une présentation générale et une étude de cas.

Ci-dessous, on trouvera les éléments de la présentation générale qui propose deux points de vue opposés. Le premier prétend qu'il est quasi-impossible de mesurer la valeur économique d'une bibliothèque, tandis que le second présente, au contraire, quelques études qui cherchent à calculer leur "retour sur investissement".

L'étude de cas sera pour un autre billet.

L'incommensurable économie des bibliothèques

L'économie de la bibliothèque a été pendant longtemps la grande oubliée des économistes de la culture. J'ai essayé de faire le point dans le texte ci-dessous (certaines parties de ce texte ont été reprises dans le premier chapitre du livre Vu, lu, su). Comme pour les sept piliers de l'économie du document de la première séance, je vous suggère de l'annoter afin que nous avancions collectivement sur cette question.

La mesure du retour sur investissement

Récemment des études, issues du monde anglophone, ont cherché à calculer le retour sur investissement des bibliothèques. Ces études, souvent méconnues dans la francophonie, posent de bonnes questions, même si les réponses proposées ont des limites. Elles méritent d'être prises en compte et aussi d'être discutées. Là encore, les commentaires sont donc ouverts.

Pour aller plus loin, on peut suivre les références proposées en bibliographie dans les deux articles. Pour une relation avec des exemples pris dans l'actualité, cliquer sur les mots clés en haut de ce billet.

dimanche 15 janvier 2012

Amazon marie bibliothèque et autopublication

Amazon vient de se féliciter du succès de son système de prêts de livres numériques. Pour bien le comprendre, il faut d'abord rappeler le fonctionnement du service KDP Select lancé en décembre dernier. Le Kindle Direct Publishing (KDP) est le service d'autopublication d'Amazon. Extrait du communiqué à destination des auteurs francophones :

Si vous publiez vos livres en exclusivité sur la Boutique Kindle pendant au moins 90 jours, ceux dont vous contrôlez les droits de distribution aux États-Unis sont inclus automatiquement dans le programme de prêt « Kindle Owners’ Lending Library » et peuvent prétendre à une part d’un fond mensuel. Le montant de ce fond pour le mois de décembre 2011 est de 500 000 dollars américains, et le fond total pour l’année 2012 sera d’au moins 6 millions de dollars. Le « Kindle Owners’ Lending Library » est une collection de livres qui s’étend aux membres du programme Prime sur Amazon.com. Ces clients peuvent emprunter gratuitement un livre par mois, sans échéance. (..)

Votre part sera calculée sur la base d’une part du nombre d’emprunts pour tous les livres KDP inscrits au programme. Par exemple, si le fond pour le mois de décembre est de 500 000 Dollars, si votre livre a été emprunté 1 500 fois et si tous les livres participants ont cumulé 100 000 emprunts, vous recevrez pour votre livre 1,5 % (1 500/100 000 = 1,5 %), soit 7 500 Dollars, pour le mois de décembre.

Et maintenant, voilà des extraits du dernier communiqué triomphant d'Amazon sur l'expérience (trad JMS) :

Les clients ont empruntés 295.000 titres de KDP Select dans le simple mois de décembre, et KDP Select a fait monter la collection de la bibliothêque de prêt au-delà de 75.000 titres. Avec le fond de 500.000$, les auteurs de KDP ont reçus 1,70$ par prêt. (..)

KDP Select fait gagner plus d'argent aux auteurs de deux façons. Nous savions que les clients adoraient avoir les titres de KDP Select dans la bibliothèque de prêt du Kindle. Mais, nous avons été surpris de l'accroissement des ventes de ces mêmes titres, comparées à celles du reste du KDP.

Amazon lui-même gagne de l'argent de trois façons : par le pourçentage sur les Kindles vendus, par celui sur les exemplaires supplémentaires de livres vendus, par les inscriptions au programme Prime. Mais nous l'avons vu l'objectif premier d'Amazon est moins le profit immédiat que la construction d'une clientèle captive.

Bertrand Calenge, dans un commentaire récent s'exclamait : C'est sans doute la (prochaine mais déjà actuelle ?) stratégie la plus redoutable d'empiétement sur l'usage du bien commun : on verra peut-être bientôt une société commerciale offrir à une bibliothèque publique la libre disposition de son catalogue... en échange de la collecte par cette société de toutes informations sur le public et ses habitudes de lecture !

En réalité, il n'est même pas sûr qu'Amazon ait encore besoin des bibliothèques publiques pour tirer profit du bien commun. Celui-ci lui sert directement à construire sa clientèle.

Actu du 26 janvier 2012

Voir aussi : La bibliothèque d'Amazon augmenterait les ventes d'ebooks, ActuaLitté 26 janv 2012

10 sept 2012

Sur Actualitté : [ Amazon et l'auto-édition sur Kindle : un vrai succès ?| http://www.actualitte.com/acteurs-numeriques/amazon-et-l-auto-edition-sur-kindle-un-vrai-succes-36614.htm]

vendredi 07 janvier 2011

BU US : Comment économiser 2M $..

Jean-Daniel Zeller, merci à lui, m'a signalé la sortie d'un nouveau rapport de l'OCLC qui mérite en effet qu'on s'y arrête :

Constance Malpas, Cloud-sourcing Research Collections: Managing Print in the Mass-digitized Library Environment (OCLC, Janvier 2011) ici.

L'ensemble est une étude chiffrée sur la possibilité d'externaliser la fourniture de documents pour les bibliothèques universitaires américaines dans le nouveau contexte issu de Google Book et l'HathiTrust. Extraits (les passages en italiques sont une traduction directe du résumé, le reste une synthèse rapide et très schématique de mon cru) :

L'objectif du projet était d'examiner la faisabilité de l'externalisation de la gestion des livres imprimés à faible utilisation dans les bibliothèques universitaires vers des fournisseurs de services partagés, y compris les larges collections d'imprimé et les dépôts numériques.

L'hypothèse suivante a fourni un cadre global pour notre enquête :

* L'émergence d'un corpus de masse de livres numérisés doit transformer l'activité de la bibliothèque universitaire, permettant une optimisation des collections imprimées patrimoniales qui augmentera sensiblement l'efficacité des activités des bibliothèques et facilitant une réorientation des ressources de la bibliothèque vers un portefeuille de services rénovés.

L'idée des responsables de bibliothèques universitaires nord-Américaines était de combiner 1) le dépôt géant de documents numérisés, HathiTrust, mutualisation des livres numérisés des bibliothèques par Google et récupérés par celles-là 2) avec des réseaux de fournitures de documents imprimés. Le premier permet de naviguer dans les livres et de repérer des éléments, sinon toujours d'avoir accès à l'ensemble du texte du fait du copyright, le second de se procurer le document imprimé si le besoin s'en fait sentir. De là, un certain nombre de questions de recherche ont émergé :

  • Quelle est la portée du corpus de la masse de livres numérisés dans la bibliothèque numérique HathiTrust et jusqu'à quel degré recouvre-t-il les collections imprimées conservés dans les bibliothèques de recherche universitaire ?
  • Le contenu du domaine public dans la bibliothèque numérique HathiTrust fournit-il un substitut approprié pour les collections imprimées à faible utilisation des bibliothèques universitaires ?
  • Y a-t-il recouvrement suffisant entre les collections partagées d'imprimés et la Bibliothèque numérique HathiTrust pour permettre à un nombre important de bibliothèques universitaires d'optimiser et de réduire les dépenses des opérations locales des imprimés ?
  • Quels gains opérationnels pourraient être obtenus par une externalisation sélective des activités de gestion des collections ?

L’hypothèse centrale a été confirmée avec succès : il y a suffisamment de matériaux dans le HathiTrust pour recouvrir une importante (et croissante) partie de la collection de pratiquement toutes les bibliothèques universitaires aux États-Unis, et il y a un chevauchement suffisant entre les dépôts numériques et les grandes collections imprimés pour autoriser un grand nombre de bibliothèques universitaires à reconsidérer leur gestion locale des imprimés. De plus, un nombre relativement restreint de fournisseurs de documents imprimés, y compris la Bibliothèque du Congrès, est suffisant pour atteindre plus de 70% de couverture de la collection de livres numérisés, ce qui suggère que le service partagé peut ne pas reposer sur un très grand réseau. La comparaison en terme de matière montre aussi que le HathiTrust est largement représentatif des collections des bibliothèques universitaires. Les livres en SHS constituent la majeure part des ressources numérisées, ce qui pourrait favoriser des disciplines jusqu’ici sous-représentées. De plus des économies substantielles pourraient être réalisées sur les espaces et les coûts de gestion.

Les principaux obstacles relevés sont les suivants :

  • La proportion des documents dans le domaine public est faible (16% des titres en juin 2010) et représente des matériaux peu largement représentés. Aussi, il y a peu d’économie à attendre de ce côté.
  • Aucun fournisseur de document imprimé ne peut prétendre pouvoir répondre à lui seul à la demande de chaque bibliothèque. Il faut donc envisager un réseau partagé de coordonné de fournisseurs.
  • L’absence d’un service robuste de découverte et de fourniture fondé sur une réserve collective d’imprimés est un obstacle pour changer la stratégie de gestion des imprimés, particulièrement pour les titres imprimés sous copyright.

C’est notre ferme conviction, fondée sur les conclusions ci-dessus, que les bibliothèques universitaires aux États-Unis (et ailleurs) doivent réunir les ressources et la volonté nécessaires pour mettre en œuvre une stratégie de transition pour maximiser les bénéfices des années d'investissement dans les collections d'imprimés tout en reconnaissant la bascule rapide vers la fourniture et la recherche d’information en ligne. Même, et peut-être surtout, avant tout résultat juridique sur le règlement Google Book Search, les bibliothèques universitaires ont une occasion unique de reconfigurer les chaînes d'approvisionnement des imprimés pour assurer une continuité pertinente. En l'absence d'une licence claire, l'accès en ligne à la plus grande part de la littérature rétrospective numérisés sera sérieusement entravée. La demande pour les versions imprimées des livres numérisés continuera d'exister et les bibliothèques seront incitées y répondre, mais elles devront le faire de manière plus rentable. En l'absence d’éditions en ligne totalement disponibles, l'indexation en texte intégral des documents numériques sous droits d'auteur fournit un moyen de modérer et de préciser la demande pour les versions imprimées et devrait faciliter le transfert d'une partie croissante des documents vers des entrepôts rationalisés. Vu sous cet angle, des dépôts d’imprimés partagés autoriseraient un changement significatif pour orienter les ressources de la bibliothèque vers un portefeuille de services plus pertinent pour l’institution.

Les économies annuelles réalisées seraient de 500.000 $ et 2 millions $ par bibliothèque de l'Association américaine des bibliothèques de recherche (ARL) , en fonction de la solution choisie.

mercredi 20 octobre 2010

Google et les déplacements de valeur

Tout comme Apple, la firme Google vient d'annoncer d'insolents résultats financiers. J'ai repris sur un schéma, à partir de ses bilans trimestriels (disponibles ici), l'évolution de son chiffre d'affaires depuis 2005 décomposé selon les revenus de la publicité issus de ses sites propres, de ceux issus de son réseau de partenaires (Adsense) et des revenus hors publicité.

Revenus-Google.png

On observe tout d'abord la forte croissance presque continue des revenus, avec juste un décrochage fin 2008, au plus fort de la crise. L'omniprésence du poids de la publicité est aussi manifeste. Elle représente toujours aujourd'hui 97% du total des revenus. L'analyse devient moins convenue lorsque l'on observe la différence de tracé des courbes des revenus Adsense (courbe jaune) et des revenus des sites de Google (courbe rose). Partant pratiquement du même point en 2005, celles-ci divergent de plus en plus. Les revenus de Adsense ont une croissance assez régulière, de l'ordre de 15% par trimestre, tandis que ceux des sites Google s'envolent avec une sensibilité plus forte à la conjoncture économique.

Un autre schéma peut nous permettre d'approfondir :

Adsense-Google.png

Dans ce schéma, j'ai consigné les bénéfices trimestriels de Google (violet), la part du revenu de Adsense qui reste à Google, c'est-à-dire la rémunération de son activité de régie (bleu). La courbe jaune représente les sommes redistribuées aux partenaires Adsense, c'est-à-dire les sites accueillant la publicité.

La remarque précédente est confirmée puisqu'on observe une différence forte entre l'évolution du bénéfice et celle de la rémunération de la régie (d'autant que pour mesurer le bénéfice induit par la régie, il faudrait encore déduire les frais de fonctionnement de cette dernière de son revenu), la régie pesant de moins en moins dans le bénéfice général. Mais le schéma souligne aussi un autre phénomène : autant le bénéfice général subit d'importantes fluctuations, jusqu'à chuter brutalement fin 2008, autant l'activité de régie apporte à la firme un revenu stable et régulier.

Ainsi, entre les deux activités économiques principales de Google, régie publicitaire et recherche financé par la publicité, la seconde s'affirme de plus en plus au cours des années. Pour le dire autrement, Google est de plus en plus un média à part entière, un média conquérant, ambitieux, mais à l'évidence un média encore économiquement fragile, soumis à des fluctuations.

Lorsque Google intervient comme régie publicitaire, il partage ses revenus avec ses partenaires selon une logique qui ne contredit pas vraiment celle des médias anciens, même si bien des modalités sont modifiées. Mais dans le second cas, le déplacement de valeur est radical : par la recherche, Google réoriente l'attention de l'internaute en réorganisant l'ordre documentaire tout en ponctionnant à son profit le marché publicitaire.

Le média-Google s'installe entre la radio-télévision, à qui il emprunte le marché bi-face et le réseau (internautes et annonceurs) et la bibliothèque à qui il emprunte la recherche et l'organisation documentaire. Mais il opère aussi une rupture entre les savoir-faire des uns et des autres par une utilisation inédite à ce niveau du traitement de la langue. Linguistique computationnelle et lexicométrie statistique sont ses compétences de bases qu’il a appliquées sur le web en le considérant comme un vaste texte, organisé par les liens entre les documents entre eux et la demande des internautes. Ce qui prime ici est la dimension intellectuelle, celle du texte et du contenu des documents, c'est-à-dire la deuxième dimension du document ().

La rupture est alors radicale vis-à-vis de la radio-télévision. Le traitement statistique de la langue est utilisé pour organiser le marché bi-face par la vente de mots-clés, associés à la signification de la requête et donc au texte, mais dissociés des documents comme objets contrairement aux médias précédents .

La rupture est tout aussi importante vis-à-vis des bibliothèques. En se positionnant sur la dimension texte, pour capter l'attention par la recherche, il a participé à la contestation de l’ordre documentaire ancien, celui des bibliothécaires et les documentalistes, par une intense « lecture industrielle » pour reprendre l'expression d'Alain Giffard (). La capacité de chercher transversalement dans l'ensemble des textes réduit, en effet, l’importance de leur classement antérieur et, modifiant notre système de mémoire externe collectif, participe au décadrage de doxas. Il est alors naturel que, nonobstant son caractère fortement capitaliste et les ambiguïtés du nouvel ordre documentaire qu’il installe, la firme ait une certaine connivence avec les militants d’un web libertaire dont le ressort est la remise en cause de l’ordre ancien fondé sur la maîtrise de la forme des documents.

Bien des éléments pourraient être ajoutés pour conforter l’accent mis sur cette deuxième dimension : La nécessité pour la firme de disposer de l’ensemble du web en mémoire-cache ; l’utilisation du fair-use aux États-Unis pour se dispenser du copyright et corrolairement les relations difficiles avec les ayant-droits ; Google-books ; YouTube ; la distribution gratuite du système Androïd sur les téléphones portables pour concurrencer l'imprimeur-libraire Apple ; ou, tout récemment, la « recherche instantanée » qui suggère le texte de la requête au fur et à mesure de la frappe en construisant en direct un ordre documentaire à partir d’un contenu, et j'en passe beaucoup. Le meilleur symbole du cœur de métier de la firme est sa page d'accueil, pratiquement inchangée depuis le lancement de la firme (ici, lire aussi les commentaires).

Actu 22 oct 2010

Intéressantes remarques sur la concurrence Apple/Google :

“THE GOOGLE INVESTOR: Android Has No Chance In The Near-Term Against The iPad,” Business Insider, Octobre 21, 2010, ici.

Actu du 25 octobre 2010

Voir aussi le billet de F. Cavazza, qui sous-estime à mon avis le poids de la forme :

FredCavazza, Google Chrome OS = iOS + iTunes, 15 octobre 2010 ici .

Actu du 19 déc 2010

Étude approfondie de la position dominante de Google en France :

Avis du 14 décembre 2010 sur le fonctionnement concurrentiel de la publicité en ligne (Ministère de l'économie, des finances et de l'emploi), ici.

Commenté notamment par Electron libre .

mercredi 22 septembre 2010

Vie privée, bibliothèques et Google-Books

Dans une discussion récente avec Silvère Mercier (ici), je m'étonnais que les bibliothécaires francophones ne prêtent pas plus d'attention à l'anonymat de la lecture dans le monde numérique. Justement un papier vient de paraitre sur le sujet :

Elisabeth A. Jones et Joseph W. Janes, “Anonymity in a World of Digital Books: Google Books, Privacy and the Freedom to Read,” dans (présenté au Internet, Politics, Policy 2010: An Impact Assessment, Oxford Internet Institute, 2010). Pdf

À vrai dire l'article n'amène pas sur le fond d'autres arguments que ceux déjà connus (voir par ex ici). Mais il appuie son raisonnement sur un livre de Helen Bissenbaum paru en 2009 que je ne connaissais pas et qui m'a bien intéressé, du moins par sa présentation dans l'article et les extraits et commentaires que j'ai pu en lire jusqu'ici :

Helen Nissenbaum, Privacy in Context: Technology, Policy, and the Integrity of Social Life (Stanford Law Books, 2009).

Le concept clé de Nissenbaum est «l'intégrité contextuelle» (contextual integrity) qui n'est pas une définition de ce qui serait privé vs ce qui serait public, mais une construction à partir de normes informationnelles d'une situation appropriée, c'est-à-dire moralement acceptable dans un contexte donné. Les normes sont évolutives et leurs paramètres sont précisés (contextes, acteurs, attributs et principes de transmission). Enfin un cheminement par étapes est proposé pour juger de la validité d'une nouvelle intégrité contextuelle qui peut être résumé en deux phases : Les nouvelles pratiques sont-elles conformes aux normes de l'ancien contexte ? La négative ne signifie pas qu'il faille nécessairement les rejeter, tout dépend des risques encourus par rapport aux bénéfices généraux. Cette mesure en termes moraux fait l'objet de la seconde phase.

Il est facile de montrer ainsi que les pratiques de Google violent les principes de l'anonymat de la lecture édictés dans le contexte des bibliothèques publiques des États-Unis (phase 1) et les auteurs suggèrent que le nouveau contexte créé ne répond pas non plus aux considérations morales de liberté, d'autonomie et de justice. Ce deuxième point est discuté dans l'article à mon avis un peu rapidement, même si je suis d'accord avec la conclusion. La difficulté à trancher sur la deuxième phase montre peut-être la limite de la méthode de Nissenbaum. Néanmoins, il paraît difficile d'éviter un débat moral et politique lorsque l'on aborde les notions de sphères privée et publique, toutes deux indispensables à notre humanité.

Voici, pour finir un extrait d'une interview d'H Nissenbaum du 18 janvier 2010 (ici trad JMS) :

Les questions les plus urgentes soulevées par le livre sont à mon avis :

D'abord de démontrer que la distinction entre privé et public, aussi utiles qu'elles soient dans d'autres espaces de la philosophie du droit et de la politique, est une impasse complète pour conceptualiser un droit à la vie privée et pour édicter une politique. De mon point de vue, on a perdu bien trop de temps à décider si telle ou telle information, tel ou tel lieu étaient privés ou publics quand, en réalité, ce qui comptait au final était quelles contraintes devaient être imposées sur la circulation de cette information dans cet espace. Nous pourrions faire des progrès beaucoup plus rapides si nous prenions de front cette dernière question plutôt que de nous enfermer dans la première.

Ensuite de contester la définition de la vie privée comme un contrôle sur les informations qui nous concernent, qui domine le monde politique aujourd'hui, même si elle est moins répandue dans le monde académique. Le problème de cette définition est qu'elle met immédiatement la vie privée en contradiction avec d'autres valeurs, présentées comme plus pro-sociales. Si le droit de la vie privée est le droit de contrôle, alors, il doit être évidemment limité, négocié, modéré par l'intérêt général ! De plus, il n'est même pas évident que le contrôle offrira une meilleure protection au sujet. Imaginez, par exemple, que tout ce qui concerne le dossier santé d'un individu soit soumis à son consentement pour sa divulgation et mettez cet individu dans une situation où on lui offre en échange un emploi, un prêt ou un gain à la loterie.. Heureusement, la loi des États-Unis reconnait le besoin de réelles contraintes pour la circulation de l'information selon les lieux et les contextes de la vie et, bien que des critiques ont été émises sur les faiblesses de certains termes de ces lois, je crois que l'approche globale est bonne.

- page 1 de 3