Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

Recherche - redocumentarisation

samedi 13 septembre 2008

La science de l'information perdue dans les nuages..

Les professionnels du document ou les chercheurs en sciences de l'information me paraissent bien silencieux (sauf pour dénoncer les appétits mercantiles) sur la question qui agite beaucoup les informaticiens, les professionnels du Web, les promoteurs du Web sémantique et aussi, bien sûr, les industriels de l'internet : le Cloud computing. Un exemple, parmi bien d'autres, le passage du bureau physique au bureau dans les nuages évoqué par H. Guillaud à propos d'un article de Nova Spivack :

Hubert Guillaud, “Le Webtop : le Desktop organisé par le web,” Internet Actu, Septembre 12, 2008, ici.

Nova Spivack, “The Future of the Desktop,” ReadWriteWeb, Août 18, 2008, .

Nova Spivack propose une nouvelle organisation du bureau, adaptée à notre mobilité et à l'évolution du Web. Dans son argumentaire, il se sert de l'image du bibliothécaire comme d'un repoussoir. Extrait (trad JMS) :

Il faut basculer de l'image du bibliothécaire à celui de l'opérateur boursier. Dans le monde du PC, nous étions obnubilés par la nécessité de gérer nos informations sur nos ordinateurs - nous nous conduisions comme des bibliothécaires. Engranger les choses était notre souci, et les trouver était aussi difficile. Mais aujourd'hui, garder l'information n'est vraiment pas le problème : Google a rendu la recherche si puissante et omniprésente que beaucoup d'utilisateurs ne prennent plus la peine de garder quoi que ce soit - il le recherche de nouveau au besoin. Le problème du bibliothécaire a été dépassé par la force brute de la recherche à l'échelle du Web. Au moins pour le moment.

À sa place, nous devons résoudre un problème différent - celui de filtrer ce qui est réellement important et pertinent maintenant et dans un futur proche. Dans les limites de notre temps et de notre attention, nous devons prendre soin à ce que nous recherchons vraiment et ce à quoi nous devons porter notre attention. C'est l'état d'esprit de l'opérateur boursier. S'il se trompe dans son pari, il peut perdre des ressources précieuses, s'il a raison, alors il peut trouver un filon avant le reste du monde et gagner des avantages monnayables à avoir été le premier. Les opérateurs boursiers privilégient la découverte et surveillent les tendances. C'est une orientation et une activité très différente de celle d'un bibliothécaire, et c'est vers cela que nous allons.

Sans contester l'intérêt évident des propositions de N Spivack pour les développement de l'outil, on peut être affligé d'une telle méconnaissance des professions documentaires et donc de la sous-utilisation de leur apport. En 1988 il y a vingt ans donc (!) par exemple, François Jakobiak publiait un livre qui ne disait pas autre chose :

François Jakobiak, Maîtriser l'information critique, Paris : Les Editions d'organisation, 1988.- (Collection Systèmes d'information et de documentation), critique BBF ici.

Par ailleurs, N Spivack insiste sur la gestion du temps documentaire, la présentant là encore comme une rupture par rapport aux pratiques anciennes.

Comme notre vie numérique a évolué de nos vieux bureaux démodés à nos environnements web centrés sur les navigateurs, nous allons passer d’une organisation spatiale de l’information (répertoires, dossiers, bureaux…) à une organisation temporelle (flux, lignes de temps, microblogs, …).

Il ne s'agit pourtant que d'une dimension essentielle de l'archivistique, en particulier l'archivistique québécoise qui se préoccupe des documents courants et les gère à partir de calendriers.

Mais, il ne faut sans doute pas accabler l'auteur, les responsables de cette méconnaissance sont plutôt à rechercher du côté des professionnels de l'information eux-mêmes qui devraient être plus pro-actifs. Visiblement on a besoin d'eux. Sans doute la redocumentarisation en cours bouscule bien des pratiques, mais il me semble que les fondamentaux ne changent guère.

mercredi 10 septembre 2008

Vie privée, document et publicité

En ce moment les polémiques vont bon train sur la protection de la vie privée vs la collecte d'informations personnelles, soit que des gouvernements affichent leur volonté de contrôle, soit que des entreprises utilisent ces données pour construire leur marché. Le débat est plutôt confus, personne ne semblant produire une analyse satisfaisante, voir par exemple :

Daniel Kaplan, “Facebook-Edvige, les rapprochements hasardeux,” Internet Actu, Septembre 5, 2008, (ici).

Dans le même temps les négociations entre la Communauté européenne et Google avancent sur cette même question.

“Google tente de satisfaire les organismes de protection de la vie privée,” EurActiv, Septembre 10, 2008, ().

Extraits :

Pour les régulateurs, le problème principal est de déterminer si les adresses IP peuvent être considérées ou non comme des données personnelles. Si oui, les règles européennes en matière de protection des données seront appliquées et Google sera tenu de demander la permission des utilisateurs avant de stocker cette information. Les répercussions sur le modèle économique actuel de Google pourraient être énormes (EurActiv 09/04/08).

Pour le moment, la législation de l’UE ne définit pas si les adresses IP sont des données à caractère personnel ou non. La directive sur la protection des donnéesexternal considère comme donnée à caractère personnel « toute information concernant une personne identifiée ou identifiable ». (..)

Les experts des autorités européennes de protection de la vie privée ont salué l’initiative de Google comme une bonne nouvelle. Ils ont toutefois souligné qu’elle ne répond pas à la demande de réduire la durée de stockage à six mois. Par ailleurs, la question de l’autorisation préalable des utilisateurs reste ouverte.

Cependant, ils ont également concédé que les inquiétudes relatives à la vie privée pourraient perdre toute pertinence au cas où Chrome, le nouveau navigateur Internet lancé ce mois-ci par Google, gagnaient des part de marché conséquentes. Chrome, qui vise à fusionner la navigation et la recherche, pourrait rendre les moteurs de recherche caducs. En effet, une des innovations amenées par Chrome est le « mode incognito external », dans lequel le navigateur ne stocke aucune donnée personnelle.

Sur le lancement du navigateur, on apprend au même moment qu'une agence gouvernementale allemande met en garde les internautes contre les atteintes à la vie privée qu'il pourrait faciliter :

Laurence Girard, “Chrome suscite des craintes sur la confidentialité des données - Technologies,” Le Monde, Septembre 9, 2008, (ici).

Une poule n'y retrouverait pas ses petits.. pourtant je voudrais suggérer ici une piste de réflexion car il me semble que si l'on part d'un raisonnement documentaire on y voit déjà un peu plus clair. .

Le premier point à souligner est que les entrepreneurs du net ne s'intéressent aux données comportementales que pour bâtir le marché publicitaire. Ils ne cherchent pas à contrôler les individus, mais à vendre des espaces publicitaires aux annonceurs. Sans doute, la frontière entre les deux motivations n'est pas toujours claires, mais je crois qu'il est possible pourtant de la tracer, selon ce que l'on considère comme un document.

Dans les médias traditionnels de diffusion (presse, radio, TV, etc.) la publicité est insérée dans le support et on s'intéresse aux comportements du consommateur simplement pour faire coïncider l'attention de ce dernier avec le message que l'on veut lui transmettre. La publicité est un élément du document qui cherche à capter l'attention. On peut discuter, critiquer les moyens de cette captation d'attention, éventuellement parler de manipulation, mais ils sont clairement extérieurs à la personne. S'il y a contrôle, celui-ci est indirect et il est difficile de prétendre que ces moyens portent atteinte frontalement à la vie privée. Ou s'ils le font par des intrusions trop manifestes, on peut d'en défendre.

Dans les nouveaux marchés de l'internet, la publicité est insérée dans les requêtes des moteurs, dans les courriels, dans les communications et invitations des réseaux sociaux. On s'est alors manifestement rapproché des personnes et on capte leur attention au plus près de leur action. On s'intéresse au comportement de l'internaute au moment même où il se produit. Mais en réalité il y a deux cas de figure ou plutôt deux conceptions documentaires différentes :

  • Soit on s'intéresse aux documents produits (même privés) ou recherchés et on placera la publicité sur ceux-ci ou sur leurs présentations. C'est, me semble-t-il la politique de Google (y compris pour Gmail) et des moteurs en général. Ce pourrait être à l'avenir celle de Chrome.
  • Soit on s'intéresse aux individus eux-mêmes, qui deviennent les vecteurs de la publicité par les relations qu'ils construisent, et on placera la publicité en fonction de la connaissance que l'on aura de ces individus comme émetteurs de document. C'est la stratégie d'entreprises comme FaceBook. D'une certaine façon on pourrait dire, comme Olivier (par ex ici, ou ), qu'ici les individus sont devenus eux-mêmes des documents.

Pour cette raison, même si les ajustements seront sans doute longs, je crois que Google trouvera un compromis avec les États sur la question de la vie privée, par contre je serai plus pessimiste sur les «réseaux sociaux». Du côté du marché aussi la réponse ne sera pas la même. Pour le dire simplement, je ne crois pas vraiment à un fort développement du marché publicitaire dans les réseaux sociaux car on ne garde pas longtemps un ami trop intéressé ou l'on prend quelques distances avec un ami contagieux.

Complément du 11 septembre 2008

Voir aussi :

Jean-Marie Le Ray, Google vs Edvige, Adscriptor, 10 septembre 2008, ici.

Complément du 14 septembre 2008

Olivier élargit la question de façon astucieuse :

Olivier Ertzscheid, “Culture informationnelle, fracture cognitive, redocumentarisation de soi et plus si affinités.,” Affordance, Septembre 14, 2008, ici.

Extrait :

Ce qui permet d’indiquer que pour la première fois à l’échelle de la culture informationnelle, le premier terrain documentaire, c’est celui de ma propre subjectivité. C’est « moi ». L’une des toutes premières explorations documentaires de ces publics n’est plus celle d’un document physique ou même numérique : c’est celle de leur subjectivité connectée. Ceci peut peut-être expliquer un certain nombre de changements, de dysfonctionnements, de naïvetés constatées dans l’approche qu’ont les étudiants et les publics « novices » du « fait » documentaire. Une autre manière de voir les choses est de se dire que c’est là un retour au « Je suis moi-même la matière de mon livre » de Michel de Montaigne. A cette différence qu’en s’inscrivant sur Facebook à 15 ans, on n’a que très peu souvent conscience d’entrer en documentation de soi.

mardi 02 septembre 2008

Lancement du cours en ligne

Comme prévu, nous ouvrons donc à la session d'automne 2008 de la Maîtrise en sciences de l'information un cours en ligne sur l'économie de l'information : BLT655 Économie du document (ici). Il ne s'agit pas, malgré son nom d'un cours d'économie, mais bien d'un cours en sciences de l'information qui souligne la dimension économique de plus en plus prégnante dans le développement numérique du monde documentaire.

Au début de chaque semaine une nouvelle séance sera proposée. La première semaine est consacrée à la présentation générale, aux réglages techniques et aux contacts avec les étudiants. Le site du cours s'enrichira ainsi progressivement, semaine après semaine, jusqu'à Noël. Je n'annoncerai sur ce blogue que les deux prochaines mises en ligne. Un fil RSS permet de toutes façons de suivre l'actualité du cours. À partir de la fin octobre, par ailleurs, ce blogue accueillera les billets des étudiants inscrits au cours.

Ce fut un long chemin et ce lancement n'en est qu'une étape, une première version du cours, perfectible, qui j'espère s'améliorera avec le temps et les échanges qu'elle initiera à l'intérieur et à l'extérieur du groupe d'étudiants. Je suis content d'être arrivé à cette étape, car sans le cours ce blogue perdait beaucoup de sa raison d'être, et avec ce cours, les billets accumulées mois après mois reprennent sens. ils ont largement alimenté la préparation du cours et inversement ils sèmeront, du moins je l'espère, idées nouvelles, suggestions, doutes dans l'esprit curieux des étudiants. Inversement, les quelques internautes intéressés par le sujet trouveront dans le cours, s'ils ont la disponibilité pour le consulter, une grille de lecture pour ce blogue.

Je ne crois pas beaucoup à la pérennité d'un blogue autosuffisant. En cohérence avec le cours, je pense qu'il lui faut une économie qu'il ne peut trouver dans le simple plaisir du partage ou de la construction d'une reconnaissance ou d'une notoriété, du moins pour ce qui me concerne. Je ne crois pas non plus suffisant, au moins pour un universitaire, d'en rester à une simple information au travers d'un blogue ou d'une blogosphère ou encore des divers réseaux sociaux. Il est ironique d'ailleurs, mais tout à fait logique, de voir nombre de blogueurs célèbres publier des livres papier qu'ils promeuvent sans vergogne sur le vecteur numérique qui a construit leur notoriété, ou encore, principalement aux États-Unis, de voir les mêmes ou d'autres devenir des plumes ou des voix des médias traditionnels. Les documents ont un ordre qui s'inscrit dans leur différence de statut, même si la redocumentarisation actuelle bouscule les hiérarchies. Le cours est donc aussi l'occasion de retrouver un chemin dans ce qui est devenu, sans doute provisoirement, un labyrinthe documentaire. C'est aussi l'occasion de montrer, sans démagogie et avec modestie, que les universitaires ont leur place à prendre ou à retrouver et qu'il est important de tenter des expériences en ce sens.

Accessible en ligne, il comporte des ressources consultables. Les documents proposés ont trois statuts documentaires différents qu'il ne faut pas confondre, mais qui concourent tous les trois à la vitalité de l'ensemble, chacun à sa place. On peut prendre l'image d'un arbre pour les présenter :

  • Une bibliographie, constituée de travaux académiques, de rapports et de travaux d'experts, est proposée en ligne avec accès direct aux textes. Ces documents volontairement peu nombreux ont été élaborés sur un temps long par divers auteurs sur divers sujets. Ils sont le résultat de travaux en profondeur. Ils ont souvent subi l'évaluation par les pairs et un processus éditorial de filtrage et de corrections. Ce sont les racines du cours, les bases solides sur lesquelles le cours peut se développer, mais ces racines ont des ramifications diverses, s'alimentent à des sources variées, filtrées, et si elles convergent pour alimenter le thème central du cours, elles couvrent différents sujets.

ArbreThimoty Y. Hamilton

  • Le cours proprement dit est présenté sous forme de diapositives commentées. Ce savoir-là a été organisé pour et concentré sur le thème précis à enseigner. Il développe progressivement ses différentes facettes. C'est directement à partir de ces éléments que l'étudiant pourra construire son raisonnement et son esprit critique. Nous sommes face à un corps de connaissances dense et homogène, lourd même qui s'enrichit au fur et à mesure des semaines selon une progression linéaire. Cette partie là forme, en quelque sorte, le tronc de l'arbre qui porte la sève et monte vers le ciel. C'est à partir de cette matière que l'étudiant organisera les travaux qui lui sont demandés.
  • Le blogue, celui-ci et tous les liens vers le Web, envoient vers l'actualité du domaine, les évènements récents, les analyses, plus rapides et subjectives. Ces ressources sont essentielles, tant par les annonces dans un monde très changeant et labile qui bascule facilement, que par les points de vue qui orientent les décisions quotidiennes des acteurs. Il s'agit d'informations éphémères, multiples, hétérogènes, qu'il faut apprendre à trier, lire et décrypter. C'est comme les branches et les feuilles de l'arbre, fragiles et volatiles mais qui grâce à la lumière et la photosynthèse, alimentent et nourrissent son équilibre.

Il est utile de souligner à la fois la différence de statut de ces documents, car le Web a tendance à aplanir l'ordre documentaire, et la complémentarité de ces statuts pour acquérir les compétences et les savoirs dispensés. L'étudiant(e) devra différencier ses lectures, mais n'en négliger aucune. L'ensemble de ces ressources sera accessible en Creative Commons. Mais seuls les étudiant(e)s inscrits au cours auront accès aux travaux à réaliser et au forum d'échanges.

La difficulté est de réaliser un cours d'initiation qui permette néanmoins d'orienter les choix stratégiques pour de futurs responsables de service documentaire dans un environnement particulièrement fluctuant. Il faut donc faire comprendre les grandes logiques qui régissent les mouvements, rester vigilant sur les retournements ou imprévus et donner des outils d'analyse pour des situations concrètes. Ce souci explique le plan général du cours qui présentent d'abord les grandes logiques pour déboucher sur un outil d'aide à la décision. Mais le blogue et les dossiers à réaliser sont aussi là pour alerter sur les changements de l'actualité et pour impliquer les étudiant(e)s dans cette actualité.

Enfin, il me reste à remercier ceux qui m'ont aidé par leur appui ou leurs conseils à aboutir : mon université pour le (modeste mais bien réel) budget qu'elle m'a alloué, Vincent Audette-Chapdelaine, mon assistant, pour l'important travail de formatage, mise en page et en ligne et par avance pour l'encadrement des étudiants qu'il assurera avec moi, Lucie Carmel, responsable du laboratoire d'informatique, pour ses conseils toujours judicieux et Arnaud d'Alayer pour le suivi technique du blogue.

dimanche 08 juin 2008

Éco-doc : révision séquence 8

Poursuite des réflexions sur le cours sur l'économie du document, prévu à l'automne à distance (Plan et explications ici), avec la huitième séquence.

Cette séquence est consacrée à la « redocumentarisation ». On peut la mettre en parallèle avec la troisième séquence sur les modèles industriels (ici), illustrée dans les cinquième, sixième et septième séquences. Tout comme celles-là, elle propose une interprétation à partir de l'apport des sciences de l'information, elle sera aussi illustrée par des exemples dans la séquence suivante.

Si la réflexion était vraiment aboutie, je dirais que celle-ci fait plutôt appel à une autre racine de ces sciences : la dynamique des modèles industriels de la troisième séquence a été éclairée par l'introduction du modèle bibliothéconomique dans le raisonnement ; la redocumentarisation s'intéresse à la production du document lui-même et à son cycle de vie, c'est alors plutôt l'archivistique qui devrait intervenir. Les deux familles ont des perspectives différentes, mais elles sont également concernées par le numérique, mieux le numérique déplace, parfois efface, les frontières entre l'une et l'autre. Mais l'archivistique n'a pas encore vraiment, à ma connaissance, pris de front la problématique du numérique alors même qu'elle dispose d'outils pour l'éclairer (pour ceux qui en douteraient encore voir ici).

Les modèles industriels précédents représentaient la tentative de rentabiliser de façon autonome l'activité du Web à partir d'un développement des modèles traditionnels des industries de la culture. La redocumentarisation prend en compte la transformation de l'objet même qui est produit et échangé : le document. Il s'agit alors de relire avec une entrée documentaire les thèmes qui agitent les acteurs et analystes du Web. L'intérêt de cette approche est double. D'abord, elle fournit une interprétation des mouvements en cours et ceci aussi bien sur la longue durée que dans les constants développements de l'actualité. Ensuite, elle place les problématiques documentaires au centre de l'explication ce qui n'est que justice.

Cette séquence n'est pas la plus facile à développer, car elle s'appuie sur une théorie en cours de construction. Mais, arrivés aux 2/3 du cours, les étudiants ont maintenant une plus grande familiarité avec son objet et il est possible de suggérer des pistes sans prétendre proposer des réponses à toutes les questions. Elle s'appuie beaucoup sur les travaux réalisés dans le RTP-DOC, et tout particulièrement sur les premier et troisième textes de Roger (ici et ), mais aussi sur les réflexions développées depuis notamment dans l'écriture de ce blogue. Enfin, elle a l'avantage de disposer de très nombreuses illustrations et documents pédagogiques construits et disponibles sur la toile. Parmi ceux-là, la très célèbre vidéo de M. Wesch () me servira d'introduction et de conclusion pour vérifier que les notions ont bien été assimilées.

Pour résumer l'intrigue, il me suffit de reprendre ce court texte rédigé à la demande de Michèle de Battisti pour l'Oeil de l'ADBS du mois de mai (ici, réservé aux adhérents) :

Documentariser, c'est traiter, matériellement et intellectuellement, un document comme le font traditionnellement les professionnels de la documentation : le cataloguer, l'indexer, le résumer, le découper, éventuellement le renforcer, etc. L'objectif de la documentarisation est d'optimiser l'usage du document en permettant un meilleur accès à son contenu et une meilleure mise en contexte.

Le numérique implique une re-documentarisation. Dans un premier temps, il s'agit de traiter à nouveau des documents traditionnels qui ont été transposés sur un support numérique en utilisant les fonctionnalités de ce dernier. Mais bien des unités documentaires du Web ne ressemblent plus que de très loin aux documents traditionnels. La stabilité s'estompe et la redocumentarisation prend alors une tout autre dimension. Il s'agit d'apporter toutes les métadonnées indispensables à la reconstruction à la volée de documents et toute la traçabilité de son cycle. Les documents traditionnels, dans leur transposition numérique, acquièrent la plasticité des documents nativement numérique, qui eux-mêmes, par la facilité de leur production, témoignent des moindres activités humaines.

Cette nouvelle forme de documentarisation reflète ou tente de refléter une organisation post-moderne de notre rapport au monde, repérable aussi bien dans les sphères privée, collective et publique, qui se superposent de plus en plus. Comme à d’autres moments de l’Histoire, le document accompagne les mutations sociales, mais il s’est transformé au point que l’on peut se demander s’il s’agit encore de la même entité. Pourquoi alors reprendre le même terme, en ajoutant juste le préfixe re-, s'il s'agit d'un changement de paradigme ? En réalité, s'il y a bien une rupture, celle-ci est dans une continuité historique qu'il est d'autant plus important de souligner que les professions de la documentation devraient plus y faire valoir leur place. Maîtriser son ordre documentaire est pour une société une des conditions pour rester civilisée.


Séquence 8 : La redocumentarisation

Objectif général

À la fin de la séquence l'étudiant(e) devrait connaitre :

  1. La définition de la redocumentarisation.
  2. Son placement dans l'histoire et ses conséquences sur la notion de document.
  3. Les principaux décadrages qu'elle entraîne.

Objectif spécifique

À la fin de la séquence l'étudiant(e) devrait être capable de :

  1. Repérer des processus de redocumentarisation.
  2. En interpréter quelques enjeux.

Contenu de la séquence (base à réviser)

  • Histoire et définitions
    • Rappel des quatre âges de l'imprimé
    • De l'analogique au numérique
    • L'âge des fichiers et des (méta)données
    • Documentarisations et modernités
  • La recherche et les développements sur trois fronts
    • Forme (numérisation, systèmes de lecture, ergonomie.. XML ?)
    • Texte (traitement du texte, ontologies.. Web sémantique ?)
    • Médium (bibliothèque numérique, blogue, réseaux sociaux.. Web 2.0 ?)
    • Les potentialités de l'archivistique
  • Décadrages
    • Le privé publicisé
    • Le collectif éclaté
    • L'espace public redistribué

Évaluation

Quelques questions posées sur l'animation de Welsch.

Bibliographie (à venir)

mardi 13 mai 2008

Naviguer et lire, l'attention et le regard

Deux études signalées récemment ont attiré mon œil ou mon attention. La nuance n'est pas ici fortuite.

L'une et l'autre s'intéresse à la lecture, mais leur perspective est radicalement différente et en dit long sur les réflexions qui restent à mener sur la dimension Forme de la redocumentarisation.

La première est proposée par le gourou de l'usabilité des sites Web, Jacob Nielsen, qui retraite les données d'une recherche antérieure réalisée par des chercheurs allemands :

How Little Do Users Read?, Jakob Nielsen's Alertbox, May 6, 2008. (ici), repéré par F. Pisani ()

Harald Weinreich, Hartmut Obendorf, Eelco Herder, and Matthias Mayer, Not Quite the Average: An Empirical Study of Web Use, ACM Transactions on the Web, vol. 2, no. 1 (February 2008), article #5. ()

Après les avoir nettoyées des évènements accidentels, il en conclut (extraits trad JMS) :

J'ai été capable de construire de très belles formules pour décrire les pratiques de lecture des usagers pour les pages qui contenaient entre 30 et 1250 mots. Pour de plus longues pages, la lecture devient tout à fait erratique. De toutes façons, les pages avec un énorme nombre de mots ne sont sans doute pas de «vraies» pages - ce sont probablement plutôt soit des articles scientifiques ou des clauses contractuelles, sur lesquelles les gens ne passent pas leur temps (dans notre recherche pour le livre Prioritizing Web Usability, nous avions trouvé que les gens ne lisent environ que 10% des textes qu'ils sont supposés «accepter»). (..)

D'habitude, je considère que la vitesse de lecture est de 200 mots par minute, mais les usagers de cette étude sont particulièrement cultivés. J'irai donc jusqu'à 250 mots par minute. À cette vitesse de lecture, les internautes peuvent lire 18 mots en 4,4 secondes. Dès lors, quand on ajoute du texte à une page, on peut considérer que les clients en liront 18%.(..)

La formule semble indiquer que les gens passent une partie de leur temps à comprendre la mise en page et les fonctionnalités de navigation, comme à regarder les images. Il est clair que les gens ne lisent pas durant chaque seconde de leur visite.

Pourtant la totalité du temps passé sur une page est nécessairement la limite la plus haute du temps de lecture. Ainsi nous pouvons calculer le nombre maximal de mots qu'un usager est capable de lire, s'il consacrait tout le temps de sa visite à cette activité. (..)

La courbe décline très rapidement. Dans une visite moyenne, les usagers lisent la moitié des informations seulemnt sur les pages qui ont 111 mots ou moins.

Sur la totalité des données, une page moyenne comprend 593 mots. Donc en moyenne, les usagers auront le temps de lire 28% des mots s'ils consacrent tout leur temps à la lecture. De façon plus réaliste, disons que les usagers lisent environ 20% du texte sur une page moyenne.

On peut évidemment contester ces affirmations, qui ont néanmoins le mérite de nous alerter sur la différence entre lire et naviguer. Mais le plus intéressant pour moi est de noter la posture prise : l'objectif est de faire coller les pages Web aux limites de l'attention de l'internaute. Puisque l'internaute lit très peu, on nous conseille d'écrire très peu. Ainsi peut se configurer un certain ordre documentaire du Web.

La perspective de l'autre étude est tout autre. Je l'ai découverte grâce à Alain Pierrot (ici). Elle a été réalisée dans le mythique centre de recherche de Fuji Xerox à Palo Alto. Il s'agit de reformater des zônes d'un document afin qu'elles soient lisibles sur des terminaux de différents formats, en particulier sur les écrans minuscules d'un téléphone cellulaire. La meilleure synthèse est sur ce diaporama :

Seamless Documents, Inside Innovation at Xerox, Palo Alto California, 28029 avril 2008 Pdf

L’objectif est ici de permettre au lecteur de lire un passage préalablement repéré d’un document sur différents terminaux et tout particulièrement les écrans minuscules des téléphones cellulaires. Il est facile de comprendre l’enjeu. Le principe même du XML est de séparer la forme du contenu. On voudrait pouvoir lire chaque document sur n’importe quel support. Mais il reste que la mise en page a une signification et qu’il n’est pas anodin pour un document de passer d’un support à un autre d’une autre configuration. La proposition est ici de laisser la main au lecteur pour signaler les passages qu’il souhaite lire.

Mais tout comme dans l'étude précédente, ce qui m'intéresse le plus est la posture. Ce n'est pas pour rien que Xerox s'appelle The Document Company. Le point de départ n'est pas ici l'attention du lecteur, mais la surface du document.

Dans la première étude, l’attention est limitée et il faut produire des documents répondant à cette contrainte. Dans la seconde, c’est la surface du terminal qui est limitée et il faut pouvoir redécouper les documents pour qu’ils rentrent dans un espace contraint. Deux objectifs de redocumentarisation à partir d’un raisonnement sur la forme aux prémisses forts différents.

- page 4 de 13 -