Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

jeudi 17 août 2006

Exploitation des données d'utilisateurs

La récente bourde d'AOL qui a mis en ligne un court moment 3 mois de données sur ses utilisateurs est une illustration inattendue de la valeur accumulée par les moteurs dans l'enregistrement des comportements des internautes. Celui-ci autorise au moins deux types de traitement :

- le repérage de profils, qui peut être exploité pour la diversification de la firme ou vendu à d'autres ;

- le repérage de comportement de recherche qui peut permettre l'amélioration du moteur lui-même.

Quoi qu'il en soit, l'histoire est édifiante et montre, pour ceux qui n'en seraient pas encore convaincus, l'importance d'une régulation publique plus ferme de cette filière. On peut être étonné du peu d'intérêt manifesté par les politiques sur cette question (sauf sous d'autres longitudes), alors qu'ils sont attentifs au moindre soubresaut des médias traditionnels. Mais le pas de côté d'AOL a réveillé le débat US sur la question.

Pour un bon compte rendu de l'épisode : l'article de ZDNET. Pour l'annonce de la nouvelle en français, TechCrunch, pour une première exploitation sauvage des données : Biologeek.

mercredi 16 août 2006

Vers des archithécaires

Même si, bien sûr, les bibliothèques traditionnelles gardent toute leur justification pour les documents traditionnels, les changements induits par le document numérique sont radicaux et profonds pour les professionnels de la documentation. Dès lors, décalquer le modèle traditionnel sur l’environnement numérique serait vain.

Pour autant, à l’instar de C. Lagoze et ses collègues (fr, eng), je crois que dans l’un et l’autre environnement, les bibliothèques sont des lieux où des personnes se rencontrent pour accéder à un savoir qu’ils partagent et qu’ils échangent. Les ressources que les bibliothèques sélectionnent et les services qu’elles offrent devraient refléter l’identité des communautés qu’elles servent. Mieux, j’affirme que c’est le fondement de leur économie. La justification du budget d’une bibliothèque est d’être au service de la communauté qui lui alloue son financement, par l’accès aux documents et aux informations qui fondent et enrichissent l’identité de celle-ci.

Les collections numériques mises en ligne par les bibliothèques le plus souvent inversent le sens traditionnel de la diffusion documentaire. Dans l’université, par exemple, la bibliothèque traditionnelle réunit des documents trouvés à l’extérieur pour les proposer à la communauté, tandis que la bibliothèque numérique, notamment par les dépôts institutionnels, récolte des documents produits par la communauté pour les proposer à l’extérieur. En réalité la bibliothèque agit comme une archive publique, c’est d’ailleurs le terme consacré : « archives ouvertes ».

Clifford Lynch ou encore Carl Lagoze proposent de ne pas s’en tenir à la collecte des simples articles, mais de l’élargir à toutes sortes d’objets numériques, y compris des bases de données, qu’il faudra rendre interopérables ouvrant largement la voie à l’e-science et à la possibilité de traitement de toutes sortes. Qu’est-ce donc sinon construire un système d’archivage pour la production scientifique et d’y appliquer une logique de Web sémantique ?

Tous ces éléments justifient l’affirmation d’un recoupement ou d’une fusion entre les savoirs bibliothéconomiques et archivistiques dans le domaine numérique. Les Français ont souvent une image d’une archivistique réduite aux documents patrimoniaux ou historiques. La conception est bien différente au Canada, pays plus jeune et dont les archives sont par force moins nombreuses. Ainsi déjà les institutions nationales de bibliothèque et d’archives ont fusionné au Canada et au Québec, préfigurant l’évolution des métiers.

Pour l’illustrer l’ampleur du changement, il serait peut-être temps d’adapter notre vocabulaire. Le terme de bibliothèque numérique me paraît inadéquat pour rendre compte du repositionnement nécessaire. Il est à la fois trop étroit, faisant référence au modèle traditionnel qui n’est plus d’actualité, et trop large car couramment utilisé comme une simple métaphore du Web tout entier.

Je proposerais volontiers le néologisme d’ « archithécaire ». Il commence comme archiviste et finit comme bibliothécaire, illustrant la fusion des métiers dans le numérique. Il renvoie à une archi-thèque, c'est-à-dire, bien au-delà d’une bibliothèque par les items concernés et par ses outils, mais reste défini sur un lieu, représentant une communauté. Enfin l’homophonie avec architecte est bienvenue.

lundi 14 août 2006

Actu de Google Book Search

Quelques nouvelles du projet de numérisation des livres de Google, de son origine et de la controverse juridique. Anecdotique, mais intéressant :

Search Me? Google Wants to Digitize Every Book. Publishers Say Read the Fine Print First. By Bob Thompson Washington Post Staff Writer Sunday, August 13, 2006; D01

Pour donner le ton, un extrait de la rencontre entre le responsable de la bibliothèque de Standford et des responsables de Google :

"It was a very short conversation," Keller says. "Basically they said, 'What do you think about digitizing every book in the library?' And we said, 'Yay!' "

Économie du don

Sans prétendre épuiser une notion encore souvent mal connue des économistes, je voudrais relever trois dimensions de l’économie du don dans un environnement documentaire non exclusives l’une de l’autre : la philanthropie (fondation), la valorisation décalée et le fortuit. Bien entendu, il faut faire aussi la part du jeu et de l’enthousiasme, mais ceux-ci n’ont qu’un temps et ne sauraient fonder une économie durable. Et on ne peut comprendre les mouvements actuels dans l'économie du document sans prendre en compte le don.

J’ai déjà évoqué le mouvement des fondations. Bien des services du Web 2.0 sont financés par des fondations, à commencer par Wikipédia, une part substantielle du mouvement du libre accès profite des mêmes ressources, comme nous l’avons vu pour PLoS. Cette économie est en train de se transformer en véritable système pour l’accès libre au document numérique, comme l’a suggéré le fondateur d’Internet-Archive, Brewster Kahle, au congrès Wikimania.

La deuxième dimension de cette économie du don est la valorisation décalée, réelle ou supposée, de l’activité générée. On consentira à travailler bénévolement pour construire de la valeur, que l’on pense, à tort ou à raison, monnayable dans d’autres sphères. C'est ainsi que certains ont justifié une logique économique pour le logiciel libre et, par extension, pour les documents en accès libre. Dans ce domaine, voir le provocateur et toujours actuel ''Libres enfants du savoir numérique''. Dans l'économie du document donc, cette motivation est aussi très présente. Ainsi bien des Blogs académiques, ou journalistiques ont pour objectif de conforter leur auteur comme expert de son domaine, de construire sa réputation et d’en faire une référence, sans passer par la régulation ordinaire de la science ou les mécanismes des médias traditionnels. Nombre d’interventions sur Wikipédia visent à orienter le propos dans le sens des intérêts de l’intervenant. Plusieurs auteurs de livres scientifiques ou techniques utilisent le Web pour tester leurs idées et récolter des réactions avant publication, ou encore des institutions favorisent la mise en ligne de conférences tenues en leur sein, pour la construction de leur notoriété et l’entretien de leur image.

Enfin la troisième dimension de l’économie du don est plus impalpable et pourtant très présente dans le Web 2.0, il s’agit du don fortuit. Les internautes mettent en ligne nombre de leurs productions, par commodité pour eux, pour ne pas les perdre, y accéder de lieux différents ou encore les partager avec leur famille ou des intimes, mais leur motivation première n’est pas toujours, loin s’en faut, de publier leurs œuvres ou de partager leur patrimoine et ils ont parfois une conscience très approximative des conséquences potentielles de l’accessibilité large donnée à leurs textes, photos, musiques ou vidéos. Daniel Kaplan a baptisé ce mouvement Entrenet et l’université d’été de la Fing lui a été consacré . L’accumulation de ces micro-informations peut produire aussi un savoir.

L’économie du don peut être l’occasion d’une exploitation commerciale, réelle ou espérée, par des firmes intéressées, c'est ainsi que le Web 2.0 est aussi pour bien des entrepreneurs une tentation forte. Celle-ci a été présentée ironiquement par Edward Bilodeau, qui a résumé ainsi sa compréhension du Web 2.0 ( trad. H. Guillaud) :

''- Les utilisateurs fournissent les données (qui deviennent la propriété du prestataire de service);

- Les utilisateurs fournissent les métadonnées (qui deviennent la propriété du prestataire de service);

- Les utilisateurs créent la valeur ajoutée (qui devient la propriété du prestataire de service);

- Les utilisateurs paient le prestataire de service pour avoir le droit d’utiliser et de manipuler la valeur ajoutée qu’ils ont contribué à créer.''

Ainsi de nombreux services se créent pour supporter la demande d’outil Web 2.0, avec comme principale finalité de générer du trafic afin d’être rachetés par un investisseur, le plus souvent un moteur de recherche, qui s’en servira pour élargir son offre d’espaces publicitaires. Certains pessimistes voient dans cette effervescence une réplique de celle qui avait gonflé la bulle financière des « start-ups » au début de ce siècle. Mais, l’époque est bien différente, aujourd’hui la preuve est faite d’une rentabilité du Web, alimentée par la publicité.

mardi 08 août 2006

La loi DAVSI promulguée et commentée

Maître Eolas commente avec sa clarté et sa rigueur habituelles la loi DAVSI qui vient d'être promulguée au Journal Officiel français après bien des péripéties juridiques. Son commentaire porte essentiellement sur les mesures techniques de protection (MTP, traduction de l'anglais Digital Right Management, DRM).

Résumé, par l'auteur, de son très long billet :

''Télécharger des MP3 illicites est une contrefaçon (La jurisprudence se fixe en ce sens depuis la cassation de l'arrêt de Montpellier) : 3 ans, 300.000 euros d'amende (art. L.335-4 du CPI, non modifié par la loi DADVSI).

Diffuser un logiciel manifestement conçu pour du téléchargement illicite est passible des mêmes peines (art. L.335-2-1 du CPI, nouveauté DADVSI). Faire la promotion d'un tel logiciel est puni des mêmes peines.Tripatouiller ses fichiers pour virer les Mesures techniques de protection = 3.750 euros d'amende.

Diffuser un logiciel le faisant automatiquement : 6 mois et 30.000 euros d'amende. Utiliser ce logiciel = Rien, sauf à ce qu'une jurisprudence facétieuse caractérise le recel. Lire des DVD sous Linux = rien.''

Actu du même le 08-08, qui nuance le dernier point, ce qui n'est pas sanctionné par la loi risque de l'être par contravention.

- page 134 de 144 -