Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

mardi 13 mai 2008

Naviguer et lire, l'attention et le regard

Deux études signalées récemment ont attiré mon œil ou mon attention. La nuance n'est pas ici fortuite.

L'une et l'autre s'intéresse à la lecture, mais leur perspective est radicalement différente et en dit long sur les réflexions qui restent à mener sur la dimension Forme de la redocumentarisation.

La première est proposée par le gourou de l'usabilité des sites Web, Jacob Nielsen, qui retraite les données d'une recherche antérieure réalisée par des chercheurs allemands :

How Little Do Users Read?, Jakob Nielsen's Alertbox, May 6, 2008. (ici), repéré par F. Pisani ()

Harald Weinreich, Hartmut Obendorf, Eelco Herder, and Matthias Mayer, Not Quite the Average: An Empirical Study of Web Use, ACM Transactions on the Web, vol. 2, no. 1 (February 2008), article #5. ()

Après les avoir nettoyées des évènements accidentels, il en conclut (extraits trad JMS) :

J'ai été capable de construire de très belles formules pour décrire les pratiques de lecture des usagers pour les pages qui contenaient entre 30 et 1250 mots. Pour de plus longues pages, la lecture devient tout à fait erratique. De toutes façons, les pages avec un énorme nombre de mots ne sont sans doute pas de «vraies» pages - ce sont probablement plutôt soit des articles scientifiques ou des clauses contractuelles, sur lesquelles les gens ne passent pas leur temps (dans notre recherche pour le livre Prioritizing Web Usability, nous avions trouvé que les gens ne lisent environ que 10% des textes qu'ils sont supposés «accepter»). (..)

D'habitude, je considère que la vitesse de lecture est de 200 mots par minute, mais les usagers de cette étude sont particulièrement cultivés. J'irai donc jusqu'à 250 mots par minute. À cette vitesse de lecture, les internautes peuvent lire 18 mots en 4,4 secondes. Dès lors, quand on ajoute du texte à une page, on peut considérer que les clients en liront 18%.(..)

La formule semble indiquer que les gens passent une partie de leur temps à comprendre la mise en page et les fonctionnalités de navigation, comme à regarder les images. Il est clair que les gens ne lisent pas durant chaque seconde de leur visite.

Pourtant la totalité du temps passé sur une page est nécessairement la limite la plus haute du temps de lecture. Ainsi nous pouvons calculer le nombre maximal de mots qu'un usager est capable de lire, s'il consacrait tout le temps de sa visite à cette activité. (..)

La courbe décline très rapidement. Dans une visite moyenne, les usagers lisent la moitié des informations seulemnt sur les pages qui ont 111 mots ou moins.

Sur la totalité des données, une page moyenne comprend 593 mots. Donc en moyenne, les usagers auront le temps de lire 28% des mots s'ils consacrent tout leur temps à la lecture. De façon plus réaliste, disons que les usagers lisent environ 20% du texte sur une page moyenne.

On peut évidemment contester ces affirmations, qui ont néanmoins le mérite de nous alerter sur la différence entre lire et naviguer. Mais le plus intéressant pour moi est de noter la posture prise : l'objectif est de faire coller les pages Web aux limites de l'attention de l'internaute. Puisque l'internaute lit très peu, on nous conseille d'écrire très peu. Ainsi peut se configurer un certain ordre documentaire du Web.

La perspective de l'autre étude est tout autre. Je l'ai découverte grâce à Alain Pierrot (ici). Elle a été réalisée dans le mythique centre de recherche de Fuji Xerox à Palo Alto. Il s'agit de reformater des zônes d'un document afin qu'elles soient lisibles sur des terminaux de différents formats, en particulier sur les écrans minuscules d'un téléphone cellulaire. La meilleure synthèse est sur ce diaporama :

Seamless Documents, Inside Innovation at Xerox, Palo Alto California, 28029 avril 2008 Pdf

L’objectif est ici de permettre au lecteur de lire un passage préalablement repéré d’un document sur différents terminaux et tout particulièrement les écrans minuscules des téléphones cellulaires. Il est facile de comprendre l’enjeu. Le principe même du XML est de séparer la forme du contenu. On voudrait pouvoir lire chaque document sur n’importe quel support. Mais il reste que la mise en page a une signification et qu’il n’est pas anodin pour un document de passer d’un support à un autre d’une autre configuration. La proposition est ici de laisser la main au lecteur pour signaler les passages qu’il souhaite lire.

Mais tout comme dans l'étude précédente, ce qui m'intéresse le plus est la posture. Ce n'est pas pour rien que Xerox s'appelle The Document Company. Le point de départ n'est pas ici l'attention du lecteur, mais la surface du document.

Dans la première étude, l’attention est limitée et il faut produire des documents répondant à cette contrainte. Dans la seconde, c’est la surface du terminal qui est limitée et il faut pouvoir redécouper les documents pour qu’ils rentrent dans un espace contraint. Deux objectifs de redocumentarisation à partir d’un raisonnement sur la forme aux prémisses forts différents.

mercredi 05 mars 2008

Le Web sémantique est documentaire

Repéré grâce à E. Broudoux sur la liste RTP-DOC

Un excellent diaporama de Fabien Gandon, plein d'humour, qui vise à répondre à ceux qui critiquent l'absence supposée de la dimension sociale dans le Web sémantique. Son intérêt est moins à mon avis dans son objectif premier (la polémique est, en effet, un peu vaine) que dans la clareté de sa présentation qui, en creux, montre combien la problématique et les interrogations du Web sémantique croisent celles, plus anciennes, des professions documentaires et des sciences de l'information..

Il n'y manque que le son pour préciser certaines diapositives trop allusives.

Gandon Fabien, Le web sémantique n'est pas antisocial, 2006, 28 diapos. ici

mercredi 20 février 2008

Mensonges, conversation et document

Hubert Guillaud rend compte (et commente ici) sur InternetActu d'une passionnante conférence d'une anthropologue australienne Geneviève Bell :

Bell Genevieve,Secrets, lies & the possible perils of truthful technology, conférence LIFT, 7 fév 2008 (vidéo)

L'anthropologue montre combien nous mentons en ligne, au point que c'est sans doute devenu un mode de régulation sociale. H. Guillaud termine son billet ainsi :

Genevieve Bell a conclu cette stimulante présentation d’une image éclairante, pour renverser et déstabiliser nos perspectives comme aime à le faire la chercheuse : celle d’un panneau de circulation qui indique aux automobilistes de ne pas suivre les indications délivrées par leurs systèmes GPS, car leurs plans comportent une erreur qui a provoqué de nombreux accidents (l’histoire racontée par la BBC pour ceux qui ne la connaissent pas). Il n’y a pas que nous qui mentons, les systèmes techniques en sont tout autant capables que nous.

En réalité, il s'agit là d'un processus différent : une erreur et non un mensonge. Il n'y a pas ici intentionalité de tromperie. Supposons un moment que ce soit le cas : immédiatement la tromperie serait considérée comme un acte grave et coupable et il y aurait une procédure judiciaire. Cette procédure peut être lancée aujourd'hui, mais sous une forme tout à fait différente.

Dans le cas du panneau, nous sommes devant un document, les multiples mensonges en ligne relèvent d'une conversation, deux genres sémiologiques au statut social différent. Ce qui est troublant, c'est que les conversations d'aujourd'hui reprennent bien des caractéristiques des documents d'hier. Voici donc une très belle illustration du paradoxe de Roger (voir ici).

samedi 16 février 2008

Écrire la science en français

JM Jolion me signale par courriel une pétition qui circule en France contre une tendance inquiétante de l'agence d'évaluation nationale à ne pas considérer au même niveau les publications scientifiques en anglais ou en français des chercheurs.

Trois raisons principales y sont données pour la défense des publications en français : 1) Les financements publics et donc l'accessibilité des résultats au contribuable ; 2) L'enseignement et les manuels ; 3) L'apprentissage d'une langue seconde.

Des Québécois en cette période de discussions sur le bilinguisme ajouteraient sans doute simplement la vitalité de la langue qui pour sa survie doit embrasser l'ensemble des activités humaines.

Pour ma part, je crois que l'essentiel est ailleurs : la diversité des langues participe aussi à la diversité des points de vue scientifiques. Il y a bien une informatique, une sociologie, une philosophie.. françaises qui n'ont pu se déployer que dans un environnement en français. Ce point est encore plus sensible dans les discussions et les échanges interdisciplinaires, pour y avoir participé je peux en témoigner.

Et la publication en français confère, s'ils en prennent la mesure, un avantage concurrentiel certains aux chercheurs qui maîtrisent un tant soit peu les deux langues : ils ont accès à la recherche internationale comme tous, mais ont par ailleurs les résultats et la sensibilité de leur communauté propre. Sur cette dimension d'ailleurs les Québécois devraient être particulièrement bien placés, mais, du moins dans les limites du domaine que je connais, ils ne l'exploitent que très peu.

Le même raisonnement est évidemment valable pour toute langue se déployant dans une civilisation suffisamment riche. Et les pays asiatiques ne se privent pas d'en jouer. Pour le dire plus pompeusement, une société qui maîtrise son ordre documentaire, et au premier chef les documents qui l'éclairent sur son avenir, s’appelle tout simplement une civilisation.

La pétition est ici.

jeudi 14 février 2008

XML 10 ans.. d'une révolution documentaire

Le consortium W3C fête les 10 ans de XML. L'anniversaire mérite d'être souligné tant le format s'est répandu et a révolutionné l'organisation du Web en favorisant flexibilité et interopérabilité entre les objets documentaires. Je cite le communiqué du W3C :

« Aujourd’hui, tous les ordinateurs du monde, qu’il s’agisse de postes de travail, de portables ou de stations de centre de données, traitent forcément du XML à un moment ou à un autre » déclare Tim Bray de Sun Microsystems. « Cela montre bien que les informations peuvent être regroupées, transmises et utilisées indépendamment des types d’ordinateurs ou de logiciels exploités. XML ne sera sans doute pas le seul vecteur neutre d’informations, mais ce fut le premier et à ce titre, il remplit bien sa mission. »

En fait, il est quasiment impossible de passer une journée sans avoir recours à une technologie qui repose, d’une manière ou d’une autre, sur XML. Quand vous faites le plein de votre voiture, XML passe souvent de la pompe à la station service. Quand vous configurez votre appareil photo numérique, vous utilisez des contrôles graphiques qui reposent sur XML. Lorsque vous le connectez à un ordinateur, cet appareil photo et le système d’exploitation communiquent en XML. Quand vous téléchargez de la musique numérique, le logiciel que vous utilisez pour l’organiser stocke les informations sur les chansons au format XML. Et quand vous explorez la planète Mars, XML vous accompagne ;

W3C XML fête ses 10 ans ! La communauté internationale est invitée à célébrer XML, Communiqué du 12 février 2008 ici

XML est un peu au document numérique ce que la page est au document papier : une forme standardisée et implicitement acceptée par l'ensemble de la société d'un contenu. Ainsi en faisant ce grand pas, XML a aussi transformé notre conception du rapport fond/forme des documents, sans qu'on y prenne vraiment garde. Voici ce que Roger en disait, il y a trois ans :

Les techniques documentaires fondées sur XML objectivent et réifient la tradition du document papier. Il est d’usage de considérer qu’un document structuré en XML recèle le fond – l’équivalent du manuscrit avant sa mise en forme typographique –, et que sa publication à travers par exemple des feuilles de style en est la forme. Mais les différentes représentations possibles d’un document en XML renvoient à des grammatisations différentes. Selon qu’elle adopte le formalisme des DTDs (Définition de Type de Document), des Schémas, ou bien encore des représentations logiques du Web sémantique, la codification XML renvoie à autant de considérations distinctes sur le contenu. (p.7-8)

Roger T Pédauque, “Le texte en jeu Permanence et transformations du document,” Avril 7, 2005, ici.

Ce n'est pas vraiment mon domaine de spécialités, mais, sauf erreur de ma part, je crois que les pistes lancées dans ce texte n'ont pas été suivies. Il est vrai que le style de Roger y est un peu abscons. Pourtant, il touche des questions essentielles et oubliées que cet anniversaire me donne l'occasion de rappeler.

Actu du 3 mars 2008 Gauthier Poupeau s'est depuis prêté au jeu, dans un long billet très critique de celui-là : Du Web sémantique au web de données, 2ème partie : retour sur un des articles de Roger T. Pédauque (ici)

- page 7 de 14 -