Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

lundi 14 février 2011

L'impact des bibliothèques en temps de crise et de numérique

OCLC a publié un nouveau rapport sur la perception des bibliothèques qui actualise les résultats de 2005 (ici). Il est bourré d'informations, de chiffres et graphiques sur les avis et attitudes des Américains face à leur bibliothèque. La partie la plus intéressante à mon avis est l'analyse fine des perceptions des populations les plus touchées par la crise économique qui baissent leurs dépenses culturelles, mais augmentent leur fréquentation de la bibliothèque, à la fois pour leurs loisirs et pour les informations sociales qui y sont accessibles, notamment par l'accès libre à l'internet.

Voici quelques uns des résultats les plus significatifs :

  • La principale raison de l'augmentation de l'usage de la bibliothèque en 2010 est de faire des économies. Les dépenses de livres, CDs et DVDs ont baissé pour 76% de ceux pour lesquels la récession a eu un impact négatif sur le travail. La bibliothèque comble le fossé. 1/3 de cette population utilise plus la bibliothèque et 75% de ceux-là disent qu'ils empruntent maintenant des livres ou des CD plutôt que d'en acheter.
  • Les moteurs tiennent toujours le haut du pavé pour la recherche d'information. Mais les taux de satisfaction baissent pour tous les services de recherche en ligne. Le succès des moteurs ne tient pas seulement à leur rapidité mais aussi à leur fiabilité à fournir une information utile, crédible et gratuite.
  • Les réseaux sociaux concernent tous les âges.
  • Rester connecté est une priorité. Les consommateurs paient pour cela.
  • Les consommateurs d'information ont confiance dans leur capacité à trouver l'information. S'ils doutent, ils font d'autres recherches.
  • l'utilisation des services de questions à un expert a fort augmenté de 15% en 2005 à 43% en 2010. Mais les services de questions à un bibliothécaire (ask-a-librarian) n'ont pas décollé.
  • Le « livre » est plus que jamais l'image de marque de la bibliothèque. 69% le mettait en premier en 2005, 75% en 2010.
  • Pour les plus jeunes (14-17) la bibliothèque est d'abord un lieu pour lire, pour tous les autres c'est d'abord un lieu pour avoir des livres, de la vidéo et de la musique.
  • La préoccupation principale en 2005 était que les bibliothèques ajoutent du contenu, en 2010, c'est : ouvrez plus longtemps.
  • Moins de personnes recherchent de l'aide (68% en 2005, 51% en 2010).
  • La bibliothèque en ligne ne s'est pas substituée à la bibliothèque physique. Les usages de la bibliothèques ont fortement augmenté en 2010, pas les consultations des sites web de bibliothèques.
  • Seuls 17% des usagers pensent que les bibliothécaires font de la publicité pour leurs services.
  • Les usagers sont conscient de la valeur ajoutée par les bibliothécaires.

De quoi méditer, mais pas vraiment de quoi être pessimiste.

mercredi 12 janvier 2011

Arts et industries de la mémoire

Suite à mon billet précédent, Jacques Faule, merci à lui, attire mon attention sur le livre :

Mary Carruthers, Le livre de la mémoire. Une étude de la mémoire dans la culture médiévale, trad. de l’anglais par Diane Meur, Paris, Macula, 2002, 429 p. ISBN 2-86589-069-4 (critique CRMH, le livre a une réédition anglaise en 2008 entièrement révisée, extraits sur GB)

Il a raison et cela me donne aussi l'occasion de justifier mon intérêt pour l'histoire du document. Je reprends d'abord les citations soulignées par J. Faule :

Mary Carruthers soutient que la culture médiévale était fondamentalement mémorielle à un degré aussi écrasant que la culture moderne de l’Occident est documentaire (page 18). Elle insiste (page 25) : c’était une question d’éthique. Un être sans mémoire, si tant est que la chose fût possible, était un être sans caractère moral et, au sens premier, sans humanité. Et explique (page 51) : «Le grec ancien ne possédait aucun verbe signifiant proprement lire ; celui dont on se servait, anagignosco, signifie savoir de nouveau, se remémorer. Il renvoie à une procédure mnésique. De même, le verbe latin signifiant la lecture est lego, littéralement cueillir ou rassembler.»

Quand nous disons que la bibliothèque est lieu de mémoire nous le disons par métaphore. Mais les lieux de mémoire sont dans notre tête. Carruthers renverse la perspective quand elle écrit : «Il est trompeur selon moi de présenter la culture littéraire comme une version de la culture lettrée. La mémoire (au sens de pédagogie mnémonique), dit-elle, est l’objet ultime d’une éducation médiévale.»

A chacune des 400 pages du livre, la tentation est irrésistible de remplacer le mot mémoire par le mot bibliothèque car les analogies sont nombreuses et Carruthers ne s’en prive pas de multiplier les parallélismes quand elle écrit par exemple page 69 : «La mémoire n’est pas un coffre ou une boîte quelconque – elle est, plus précisément, une boîte à ranger les livres, une formidable bibliothèque portative. De fait, comme écrivait Jean de Salisbury, la mémoire est en quelque sorte une bibliothèque mentale, une gardienne sûre et fidèle de nos perceptions.» (..)

«J’ai déjà longuement traité de la bibliothèque comme image (si tenace) de la mémoire bien entraînée ; pour conclure ce chapitre, j’aimerais évoquer brièvement le parallélisme de leurs systèmes de catalogage. Le meuble dans lequel étaient conservés les livres au Moyen Age pouvait être appelé armarium, armoire, ou columna, colonne, mot qui figure dans un catalogue de bibliothèque de 1400. Les livres, dans ces arcae ou armaria médiévaux, étaient classés selon des systèmes de lettres et de chiffres utilisés parfois séparément, parfois conjointement.

En règle générale, chaque armoire portait une lettre et chaque rayon (gradus) de l’armoire, un chiffre, la numérotation partant du rayon inférieur pour permettre des ajouts ultérieurs. Parfois un chiffre subsidiaire était attribué à chaque volume pour indiquer sa place sur le gradus. L’heuristique alphabétique, dans les bibliothèques, remonte au moins à la Bibliothèque d’Alexandrie. Mais la disposition de la bibliothèque, comme je l’ai montré plus haut, reproduit la structure de la mémoire des érudits ; une des meilleures preuves de la similitude que je perçois entre ce qui est lu ou écrit dans la mémoire et ce qui l’est dans les livres, c’est que les dispositifs heuristiques servant à ordonner l’arca mémorielle aient également été appliqués à l’organisation des codices dans leurs arcae de bois.» p.182

Mary-Carruthers.bmp

Ainsi on comprend mieux pourquoi le terme «document» est resté très longtemps relié à la mémoire humaine, comme leçon ou enseignement éventuellement oral. Le livre n'est qu'un adjuvant d'une pratique, d'un exercice mémoriel.

Les choses changent à partir du 18e. La relation à la mémoire se modifie avec l'explosion des savoirs scientifiques et techniques et la montée de l'espace public médiatique. Dès lors, de nouveaux outils doivent se construire et la bibliothéconomie se perfectionne pour aboutir fin 19e au processus de documentarisation (Dewey, Otlet), l'ambition de classer tous les documents du monde, compris comme le classement des savoirs.

Boston-Public-Library-Pere-Ubu.png

Il s'agit d'une première industrialisation des outils de la mémoire par leur externalisation et, en quelque sorte, leur taylorisation. Mais nous n'en sommes encore qu'au stade de la manufacture. Chaque bibliothèque reproduit les mêmes gestes en échangeant et rationalisant les procédures.

La fin du 20e est l'occasion avec le numérique et le web d'une redocumentarisation.

Google-Data-Center-Pays-Bas-ErWin-Boogert.png

J'ai déjà eu l'occasion de beaucoup disserter là-dessus sans qu'il soit besoin d'y revenir ici, sinon pour dire que nous sommes maintenant complètement dans l'industrialisation de la mémoire avec son automatisation.

Mary Carruthers dans la préface de la nouvelle édition de son livre insiste d'ailleurs sur le caractère logique des outils des arts de la mémoire et fait une analogie avec l'ordinateur. Elle s'est entrainée à mémoriser des textes anciens et en conclut (trad JMS) :

Je faisais ainsi la démonstration de la puissance de ces dispositifs mentaux comme des outils de recherche plutôt que des outils de retenue. En réalité, il m'était facile d'imposer ces schémas sur le matériel que je connaissais déjà par cœur (en anglais du roi Jean) parce que, avec une petite révision et de la pratique, les repères fournit à ma mémoire simplement par quelques mots du texte que je savais si sûrement me ramenaient l'ensemble de la citation. Une fois démarré, le par cœur a pris le dessus et par habitude consciente produit ce dont j'avais besoin, tout à fait à la manière de la mémoire morte (ROM) d'un ordinateur. Les dispositifs mnemotechiques, comme une structure d'accès aléatoire, m'ont amenée là où je voulais aller, dans l'ordre que j'avais choisi et dans le sens que mon esprit s'était lui-même donné. p.XIII-XIV

En poussant le raisonnement de la redocumentarisation, on pourrait en conclure que les instruments de la maîtrise de l'information (information litteratie) sont les équivalents de ceux de l'art médiéval de la mémoire appliqués aux industries actuelles de la mémoire et en paraphrasant l'auteur dire : c’est une question d’éthique. Un être sans maîtrise de l'information, si tant est que la chose fût possible, est un être sans caractère moral et, au sens premier, sans humanité.

Actu du 17 mai 2011

Intéressante relation de la production et circulation des documents dans l'antiquité romaine et comparaison avec aujourd'hui par F. Cario ici.

vendredi 07 janvier 2011

BU US : Comment économiser 2M $..

Jean-Daniel Zeller, merci à lui, m'a signalé la sortie d'un nouveau rapport de l'OCLC qui mérite en effet qu'on s'y arrête :

Constance Malpas, Cloud-sourcing Research Collections: Managing Print in the Mass-digitized Library Environment (OCLC, Janvier 2011) ici.

L'ensemble est une étude chiffrée sur la possibilité d'externaliser la fourniture de documents pour les bibliothèques universitaires américaines dans le nouveau contexte issu de Google Book et l'HathiTrust. Extraits (les passages en italiques sont une traduction directe du résumé, le reste une synthèse rapide et très schématique de mon cru) :

L'objectif du projet était d'examiner la faisabilité de l'externalisation de la gestion des livres imprimés à faible utilisation dans les bibliothèques universitaires vers des fournisseurs de services partagés, y compris les larges collections d'imprimé et les dépôts numériques.

L'hypothèse suivante a fourni un cadre global pour notre enquête :

* L'émergence d'un corpus de masse de livres numérisés doit transformer l'activité de la bibliothèque universitaire, permettant une optimisation des collections imprimées patrimoniales qui augmentera sensiblement l'efficacité des activités des bibliothèques et facilitant une réorientation des ressources de la bibliothèque vers un portefeuille de services rénovés.

L'idée des responsables de bibliothèques universitaires nord-Américaines était de combiner 1) le dépôt géant de documents numérisés, HathiTrust, mutualisation des livres numérisés des bibliothèques par Google et récupérés par celles-là 2) avec des réseaux de fournitures de documents imprimés. Le premier permet de naviguer dans les livres et de repérer des éléments, sinon toujours d'avoir accès à l'ensemble du texte du fait du copyright, le second de se procurer le document imprimé si le besoin s'en fait sentir. De là, un certain nombre de questions de recherche ont émergé :

  • Quelle est la portée du corpus de la masse de livres numérisés dans la bibliothèque numérique HathiTrust et jusqu'à quel degré recouvre-t-il les collections imprimées conservés dans les bibliothèques de recherche universitaire ?
  • Le contenu du domaine public dans la bibliothèque numérique HathiTrust fournit-il un substitut approprié pour les collections imprimées à faible utilisation des bibliothèques universitaires ?
  • Y a-t-il recouvrement suffisant entre les collections partagées d'imprimés et la Bibliothèque numérique HathiTrust pour permettre à un nombre important de bibliothèques universitaires d'optimiser et de réduire les dépenses des opérations locales des imprimés ?
  • Quels gains opérationnels pourraient être obtenus par une externalisation sélective des activités de gestion des collections ?

L’hypothèse centrale a été confirmée avec succès : il y a suffisamment de matériaux dans le HathiTrust pour recouvrir une importante (et croissante) partie de la collection de pratiquement toutes les bibliothèques universitaires aux États-Unis, et il y a un chevauchement suffisant entre les dépôts numériques et les grandes collections imprimés pour autoriser un grand nombre de bibliothèques universitaires à reconsidérer leur gestion locale des imprimés. De plus, un nombre relativement restreint de fournisseurs de documents imprimés, y compris la Bibliothèque du Congrès, est suffisant pour atteindre plus de 70% de couverture de la collection de livres numérisés, ce qui suggère que le service partagé peut ne pas reposer sur un très grand réseau. La comparaison en terme de matière montre aussi que le HathiTrust est largement représentatif des collections des bibliothèques universitaires. Les livres en SHS constituent la majeure part des ressources numérisées, ce qui pourrait favoriser des disciplines jusqu’ici sous-représentées. De plus des économies substantielles pourraient être réalisées sur les espaces et les coûts de gestion.

Les principaux obstacles relevés sont les suivants :

  • La proportion des documents dans le domaine public est faible (16% des titres en juin 2010) et représente des matériaux peu largement représentés. Aussi, il y a peu d’économie à attendre de ce côté.
  • Aucun fournisseur de document imprimé ne peut prétendre pouvoir répondre à lui seul à la demande de chaque bibliothèque. Il faut donc envisager un réseau partagé de coordonné de fournisseurs.
  • L’absence d’un service robuste de découverte et de fourniture fondé sur une réserve collective d’imprimés est un obstacle pour changer la stratégie de gestion des imprimés, particulièrement pour les titres imprimés sous copyright.

C’est notre ferme conviction, fondée sur les conclusions ci-dessus, que les bibliothèques universitaires aux États-Unis (et ailleurs) doivent réunir les ressources et la volonté nécessaires pour mettre en œuvre une stratégie de transition pour maximiser les bénéfices des années d'investissement dans les collections d'imprimés tout en reconnaissant la bascule rapide vers la fourniture et la recherche d’information en ligne. Même, et peut-être surtout, avant tout résultat juridique sur le règlement Google Book Search, les bibliothèques universitaires ont une occasion unique de reconfigurer les chaînes d'approvisionnement des imprimés pour assurer une continuité pertinente. En l'absence d'une licence claire, l'accès en ligne à la plus grande part de la littérature rétrospective numérisés sera sérieusement entravée. La demande pour les versions imprimées des livres numérisés continuera d'exister et les bibliothèques seront incitées y répondre, mais elles devront le faire de manière plus rentable. En l'absence d’éditions en ligne totalement disponibles, l'indexation en texte intégral des documents numériques sous droits d'auteur fournit un moyen de modérer et de préciser la demande pour les versions imprimées et devrait faciliter le transfert d'une partie croissante des documents vers des entrepôts rationalisés. Vu sous cet angle, des dépôts d’imprimés partagés autoriseraient un changement significatif pour orienter les ressources de la bibliothèque vers un portefeuille de services plus pertinent pour l’institution.

Les économies annuelles réalisées seraient de 500.000 $ et 2 millions $ par bibliothèque de l'Association américaine des bibliothèques de recherche (ARL) , en fonction de la solution choisie.

mardi 04 janvier 2011

Document, information, une histoire de mots

On le sait Google a mis à la disposition des chercheurs la base des textes les livres qu'il a numérisés, ce qui donne le plus grand corpus linguistique de tous les temps, 500 milliards de mots et 4% des livres publiés sur terre, et fait rêver les linguistes (ici et). Je ne suis pas linguiste, mais pour les béotiens comme moi, la firme a mis en ligne un étonnant petit outil, baptisé NGram, permettant de représenter l'évolution des occurrences de mots dans le temps. Sans bouger de mon fauteuil, voici donc quelques leçons que j'en ai déjà en tiré sur les sujets de ce blogue.

Document

On considère généralement que le mot «document» est apparu en Français en 1214 dans la Vie de S Grégoire par le frère Anger (ici). J'ai quelques doutes là dessus, peut-être bientôt du nouveau sur ce blogue, mais en attendant, le NGram nous montre clairement l'évolution quantitative de son utilisation dans les livres, en français, puis en anglais depuis 1800.

Ngram-document-fr-4-01-2011.jpg

Ngram-document-eng-04-01-2011.jpg

Que constate-t-on ? L'utilisation du mot en français ne décolle que vers 1820 pour augmenter régulièrement jusqu'au tournant du siècle où elle arrive à un palier. Puis elle repart brutalement vers les années cinquante sans défaillance. Le démarrage du mot anglais est antérieur, sa croissance est d'abord plus lente, mais elle augmente brusquement vers les années soixante pour finir au même niveau que le mot français avant de chuter, semble-t-il, au début des années 2000. L'interprétation de ces courbes reste à faire, sans doute en relation avec la place du document dans l'organisation sociale, mais les tendances sont trop nettes pour qu'elles ne soient significatives.

Information

La notion d'information a progressivement remplacé celle de document chez nombre de professionnels, écoles et chercheurs du domaine à partir des années soixante-dix. Il était donc intéressant de comparer son histoire à celle du précédent.

Ngram-doc-info-04-01-2011.jpg

Ngram-doc-info-eng-04-01-2011.jpg

Information était plus utilisée que document en français au début du 19e, sans doute dans un usage courant. Document la dépasse vers 1830. À partir des débuts du 20e l'utilisation du mot s'accélère progressivement pour décoller à la seconde guerre mondiale, sans doute en lien avec le rôle croissant des médias. On observe un palier à partir des années 70 puis un nouveau décollage dans les années 90 et enfin une chute pour la première fois au début du millénaire. L'évolution du mot anglais montre une différence quantitative importante, avec un démarrage au niveau où le mot français termine son envol et donc une fin proportionnellement quatre fois plus haut.

Là encore, l'interprétation reste à faire, mais on peut déjà en tirer deux leçons claires. L'utilisation du mot information parait plus corrélée à l'évolution des médias qu'à celle des professionnels du même nom qui devraient peut-être y réfléchir. Par ailleurs, les mots français et anglais ne présentent peut-être pas la même signification, à moins que la place de l'information soit considérablement différente dans l'une et l'autre culture.

Données

J'ai ajouté aussi une troisième variable puisqu'aujourd'hui la mode n'est plus à l'information, mais aux données.

Ngram-inf-doc-don-04-01-2011.jpg

Ngram-inf-doc-data-04-01-2011.jpg

La hauteur de la courbe dans le diagramme français doit tenir compte de la polysémie du mot. «Données» est aussi le participe passé féminin pluriel de «donner». Mais le parallélisme des courbes données et information après la seconde guerre mondiale est assez remarquable dans les deux langues.

Bibliothèque - documentation

Pour terminer, j'ai comparé les mots «bibliothèque» et «documentation».

Ngram-bib-doc-fr-04-01-2011.jpg

Ces courbes sont celles qui m'ont le plus étonné, et je dois dire réjoui. L'utilisation du mot bibliothèque se maintient largement sur deux siècles, malgré tous les bouleversement que son environnement a connu, même si cela reste à un niveau modeste. Je serai curieux de comprendre la nature des pics que l'on peut observer. Sans surprise, le mot «documentation» apparait au début du 20e. Il connait son apogée vers 1960 et chute ensuite brutalement. Là encore les mots «bibliothèque» et «documentation» ont un usage pluriel. On le trouve aussi bien l'un pour des étagères ou des bibliothèques privées et l'autre dans «centre de documentation» dans «une documentation» ou encore dans «la documentation de quelque chose». Malgré cela, leur usage subit une variation très nette.

mercredi 17 novembre 2010

Rêver sa bibliothèque et réaliser ses rêves.. à Montréal

Qui a dit que les bibliothèques n'avaient plus d'avenir ? Sûrement pas un Québécois.

Après la Grande bibliothèque qui fêtait son cinquième anniversaire en avril dernier avec plus de 15 millions de visiteurs recensés (ici), après les bibliothèques publiques de Montréal qui dessinent la bibliothèque du XXIème siècle et défendent leur projet à la Mairie en septembre (), voici la direction des bibliothèques de mon université, l'Université de Montréal, qui lance une vaste consultation sur la bibliothèque idéale : après un sondage auquel 7000 personnes ont répondu, une mosaïque de questions et de suggestions sur un site web, une multitude de liens présentant les bonnes pratiques partout dans le monde, et chaque fois un forum ouvert pour recueillir les avis (ici, présentation de l'initiative ).

Je n'ose dire que Montréal est en train de devenir la capitale de la bibliothéconomie francophone, on m'accuserait de parti pris ! Je me contenterai donc de rappeler que les inscriptions à la maîtrise en sciences de l'information de l'EBSI démarrent dans un mois et demi...

- page 3 de 16 -