Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

Recherche - archithécaire

lundi 23 janvier 2012

A documentary approach of the Web

Vu_lu_su-couverture.jpg (Seen, Red, Known: Information Architects and the Oligopoly of the Web) Feb 9th 2012

From the introduction:

(...) The first chapter points out that the library as a collector of documents is by far the oldest of the media. Its model is being challenged by digital media, but they are not the first to do this. Movable type printing had already deprived it of its functions of reproduction and circulation of the books. Conversely, the library was, consciously or not, one of the first sources of inspiration for the development of the Web and, ironically, some of the digital players have made use of its model for very profitable businesses even if it had always been based on a non-market ecosystem.

The second chapter returns to the concept of document to show that if its two functions of transmitting and of proving are ancient, the document has become a familiar object only in the nineteenth century. Its emergence is a contemporary development of modern science. Its peak coincides with the systematization of the library model. As often in the humanities and social sciences, it is when an object appears to be disappearing that the greatest efforts to understand it are made. While analyzing the break-up of the document through digitization, a group of researchers, signing the pseudonym Roger T. Pédauque, proposed to clarify the nature of the document according to its three dimensions: form, text or content, and medium or transmission mode, in other words as it is seen, read and known. This threefold partition will be our framework of reflection in the rest of the book.

The third chapter shows how the documentary organization, hierarchical and systematic as it has been since the nineteenth century, dominated the twentieth century while perfecting itself, and became a mirror of the society emerging from the industrial and scientific revolution. The construction of the Web under the leadership of the W3C has led to a radical documentary re-engineering that enables the user and modifies the document in its three dimensions. Pushed to its limit, the process reverses our truth system by transforming the individual himself into a document. The ongoing documentary re-engineering is consistent with the emerging values of postmodern society.

For published documents, three markets were opened, only three, corresponding to the three dimensions of the document: the publishing market, including the sale of goods (form), the library, including the sale of access services (text) and the show which is the sale of attention (medium). The Web is between broadcasting and the library, as the press was between publishing and entertainment in the nineteenth century. In the evolution from publishing to broadcasting via the press and the Web, a gradual change is occurring in the management of the space-time aspect of the production and consumption of published documents as regulated by the pricing system. In addition, the Web imposes itself to the media and makes use of their cross accessing and permanent archiving capabilities to transform them into memory industries. It then becomes possible to think over the traditional cultural economy categories to highlight the importance of the economy of the document. This new reading of cultural industries based on a document entry is the subject of the fourth chapter.

Our three-dimensional analysis of the document allows last (fifth chapter) to throw some light on the strategies of the major industrial players on the Web and to compare them with the intentions of the engineers and the wishes of Internet activists, while noting the distance between the utopias and the industrial achievements. Locking mechanisms and leasing agreements were set up focusing, once again, on one or the other dimension of the document: the form by controlling objects (Apple), the content by navigating through texts with "industrial readings " (Google), or the relationship (Facebook), with the more or less successfully aim to grab the maximum profit.

The book ends with the need for new information professionals, able to understand and make use of the changes underway to build and manage new documentary infrastructures. The iSchools in North America today train professionals skilled in both computer science and information science. These new professionals are sometimes called Information Architects. In French, I suggest using the term "archithécaires" to indicate those new skills, rooted in the knowledge of library science, but greatly exceeding it.

In summary, starting from the history of the document and its three-dimensional analysis, the book offers a different perspective on what is being discussed on the web. It shows that the invention of the web by Briton Tim Berners-Lee is taking over the systematic indexing efforts launched in the late nineteenth century, changing the document itself in its three dimensions: form, content and medium. The Web is then like any other media: it follows the model of the library and of broadcasting to meet the documentary aspirations of a society that has deeply changed. The old media themselves are expanding their vocation by becoming "memory industries" through the constantly ongoing and public digital archiving of their production. The newcomers, Apple, Google, Facebook, each favor a different dimension of the document, trying to take a dominant position in the construction of a "neodocument." (...)

See also (English subtitles) :

mardi 22 novembre 2011

Vu, lu, su, résumé et couverture

Sortie le 10 février 2012 en librairie, et j'espère avant en ebook.

(...) Le premier chapitre rappelle que la bibliothèque qui collecte les documents est, et de beaucoup, le plus ancien des médias. Si le numérique a ébranlé son modèle, il n’est pas le premier à l’avoir fait. L’imprimerie à caractères mobiles l’avait déjà privée de la fonction de reproduction et circulation des livres. Inversement, la bibliothèque a été, consciemment ou non, une des premières sources d’inspiration pour le développement du Web et, ironiquement, certains des acteurs du numérique ont réussi à faire de l’exploitation de son modèle une activité très profitable alors que celui-ci était depuis toujours fondé sur un écosystème non marchand.

Le deuxième chapitre revient sur la notion de document en montrant que si ses deux fonctions, transmettre et prouver, sont très anciennes, le document n’est devenu un objet familier qu’au XIXe siècle. Son émergence est contemporaine du développement de la science moderne. Son apogée coïncide avec la systématisation du modèle de la bibliothèque. Comme souvent dans les sciences humaines et sociales, c’est au moment où l’objet semble s’échapper que les efforts pour le comprendre sont les plus grands. Analysant l’éclatement du document au travers du numérique, un collectif de chercheurs, signant du pseudonyme Roger T. Pédauque, a proposé d’éclairer la nature du document à partir de trois dimensions : la forme, le texte ou le contenu, et le médium ou la transmission ; le « vu », le « lu » et le « su ». Cette partition servira de canevas pour la réflexion dans la suite du livre.

Le troisième chapitre montre combien l’organisation documentaire, hiérarchique et systématique, issue du XIXe siècle, a dominé le XXe en se perfectionnant, miroir d’une société issue de la révolution industrielle et scientifique. La construction du Web sous l’impulsion du consortium W3C a conduit à une réingénierie documentaire radicale qui met aux commandes l’internaute et modifie le document dans ses trois dimensions. Poussé au bout, le processus renverse notre régime de vérité en faisant de l’individu lui-même un document. Cette réingénierie documentaire est en phase avec les valeurs émergentes d’une société postmoderne.

Pour les documents publiés, trois marchés, et trois seulement, qui correspondent aux trois dimensions du document, ont été ouverts : l’édition avec la vente de biens (forme), la bibliothèque avec la vente de services d’accès (texte) et enfin le spectacle avec la vente d’attention (médium). Le Web s’insère entre la radiotélévision et la bibliothèque, comme la presse s’était insérée entre l’édition et le spectacle au XIXe. De l’édition à la radiotélévision en passant par la presse et le Web, on observe une modification progressive de la gestion de l’espace-temps de la production-consommation des documents publiés, régulée par l’organisation tarifaire. De plus, le Web s’impose aux médias et les transforme en industries de la mémoire, par leur accès transversal et leur archivage permanent. Dès lors, il est possible de reconsidérer les catégories traditionnelles de l’économie de la culture pour mettre en avant l’importance de celle du document. Cette relecture des industries culturelles à partir d’une entrée documentaire est l’objet du quatrième chapitre.

L’analyse tridimensionnelle du document permet enfin (cinquième chapitre) d’éclairer les stratégies des principaux acteurs industriels du Web et de les comparer avec les intentions des ingénieurs et les souhaits des internautes militants, soulignant la distance entre les utopies et les réalisations industrielles. Des verrouillages et des affermages ont été mis en place en privilégiant, là encore, l’une ou l’autre dimension du document : la forme, en maîtrisant les objets (Apple), le contenu, en navigant au travers des textes par des « lectures industrielles » (Google), ou encore la relation (Facebook), de façon à accaparer avec plus ou moins de succès le maximum de profits.

Le livre se conclut par le besoin de nouveaux professionnels de l’information, capables de comprendre les mouvements en cours pour construire et gérer les nouvelles infrastructures documentaires. Les iSchools en Amérique du Nord forment aujourd’hui des professionnels compétents aussi bien en informatique qu’en sciences de l’information. On appelle parfois ces nouveaux professionnels des « architectes de l’information ». En français, je suggère d’utiliser le terme d’« archithécaires » pour signifier ces nouvelles compétences, puisant leurs racines dans les savoirs bibliothéconomiques, mais les dépassant très largement.

En résumé, à partir de l’histoire du document et de son analyse tridimensionnelle, le livre propose un éclairage différent de ceux qui se discutent sur le Web. On y constate que cette invention du Britannique Tim Berners-Lee prend la suite des efforts d’indexation systématique lancés à la fin du XIXe, modifiant le document lui-même dans ses trois dimensions : la forme, le contenu et la fonction de transmission. Le Web est alors un média comme un autre, s’inspirant du modèle de la bibliothèque et de celui de la radiotélévision pour répondre aux aspirations documentaires d’une société qui a changé en profondeur. Les anciens médias eux-mêmes élargissent leur vocation en devenant des « industries de la mémoire » par l’archivage numérique continu et public de leur production. Les nouveaux venus, Apple, Google, Facebook, privilégient chacun une dimension différente du document pour tenter de prendre une position dominante dans la construction d’un « néodocument ». (...)

Vu_lu_su-couverture.jpg

jeudi 13 janvier 2011

Tensions du web et architectes de l'information

Voici quelques nouvelles et résolutions pour l’année 2011.

Changement d'échelle

La grande différence entre les questionnements sur le numérique du début du millénaire et ceux de la fin de sa première décennie qui a vu l’explosion des usages du web est le passage à l’échelle. Ce qui relevait, il y a moins de 10 ans, d’un questionnement intellectuel, de montage de prototypes, d’expérimentations limitées, d’observation d’échantillons réduits, est devenu : numérisation de masse, gestion et traitement linguistique et formel de millions de documents ou de traces de navigation, préservation « de routine » de teraoctets, analyse de millions de connexions, usages de masse, stratégies industrielles internationales, investissements de millions et chiffre d’affaires de milliards d'euros ou de dollars, etc. Les mesures, sur les contenus ou les pratiques, sont désormais statistiques; les expérimentations se font directement dans le monde réel ; les retours sur investissement doivent être rapides ; les réussites sont spectaculaires, mais les échecs aussi sont nombreux, comme les ébranlements des structures plus anciennes. Les cartes se redistribuent sous nos yeux. Ce passage à l’échelle conduit à modifier les analyses, les pratiques professionnelles et, sans doute, les pratiques académiques de recherche elles-mêmes.

Sur la base de ce constat m'appuyant sur ma position transatlantique à mon petit niveau, j'ai pris quelques initiatives.

Roger et le web sous tensions

Un petit collectif de travail franco-québécois a décidé de reprendre la dynamique d’écriture de Roger T. Pédauque (pour les petits jeunes qui ne connaissent pas, une bonne explication ici). Le premier document-martyr sera soumis à vos critiques, ratures et annotations à la fin février. Voici son plan provisoire :

Titre : Le web sous tensions Parties : Humanités numériques ; naissance d’un média ; spécificité du web ; transformations des documents ; web sémantique, web des données ; architectes de l’information.

Les premiers rédacteurs sont :

  • Bruno Bachimont (UTC-INA, Sc de l’information-informatique),
  • Valérie Beaudouin (ParisTech ENST, Sociologie)
  • Jean Charlet (Inserm, Ing des connaissances-informatique)
  • Michael Eberle-Sinatra (UdeM, littérature et numérique)
  • Dominic Forest (UdeM, Sc de l’information-philosophie)
  • Benoit Habert (EDF-R&D, ENS-Lyon, linguistique et informatique)
  • Jean-Philippe Magué (ENS-Lyon, ingéniérie documentaire)
  • Yves Marcoux (UdeM, Sc de l’information-informatique)
  • Alain Mille (INSA, ingénierie des connaissances-informatique)
  • Jean-Michel Salaün (UdeM, Sc de l’information-économie)
  • Vincent Quint (Inria, Web)

Je suis persuadé qu’il nous faut continuer à inventer et expérimenter des processus collectifs de réflexion et d'expression scientifique et j’espère que vous participerez nombreux à cette aventure renouvelée.

Architectes de l'information

Le passage à l’échelle a conduit à faire appel à des spécialistes de l'organisation et du repérage de l'information, de même qu'à des spécialistes de l'expérience utilisateur pour les sites riches en contenus, des sites d'entreprise, de grandes organisations ou de commerce en ligne. Ces deux d'expertises, très inter-reliées, ont le même objectif : garantir un accès intuitif et facile au contenu du site, pour l'utilisateur d'un site Web (ou, plus généralement, de tout système d'information). Dans un environnement aussi compétitif, ce qui garantit que l'utilisateur d'un site y reviendra dépend en grande partie de sa première expérience. C’est ainsi que la notion d’architecte de l'information est apparue. Les architectes de l’information sont ces spécialistes de l'organisation et de la repérabilité de l'information, et leur pratique s'inscrit généralement dans la philosophie du design de l'expérience utilisateur. La préoccupation constante pour l'utilisateur est ce qui les distingue des informaticiens et architectes de systèmes, avec qui ils travaillent de près, mais qui agissent plutôt dans le «back-end», sur l'optimisation des processus, la structure des bases de données, etc.

À bien des égards, l'architecture de l'information s'apparente à la bibliothéconomie, dans ses objectifs et ses méthodes : classification, catégorisation, métadonnées, navigation. Selon un sondage mené par Morville et Rosenfeld (IA for the WWW, p. 338), 48.6% des architectes de l'information sondés avaient étudié en architecture de l'information et dans des domaines connexes (interaction homme-machine, utilisabilité, bibliothéconomie, etc.). Parmi ceux-là, 70% avaient une maîtrise, et le domaine d'étude le plus fréquent, rejoignant plus de la moitié des répondants, était la bibliothéconomie et les sciences de l'information.

Je n'ai pas, pour ma part, renoncé à l'appellation archithécaire, mais au niveau international, c'est bien celle d'architecte de l'information qui prime.

Une école d’été aura lieu conjointement des deux côtés de l’Atlantique sur ce thème.

  • À Montréal, il s’agit d’un cours crédité de la Maitrise en sciences de l’information, piloté par Yves Marcoux qui se tiendra du 24 mai au 3 juin 2011.
  • À Lyon, il s’agit d’un séminaire en résidentiel pour les doctorants, les chercheurs et les professionnels de l’information qui se tiendra du 21 au 27 mai sur sept jours consécutifs piloté par Jean-Philippe Magué. Ouverture des inscriptions fin février, places limitées, tarif environ 400€ pension complète comprise.

Le programme est en cours d’élaboration. Quatre demi-journées seront communes entre les deux volets. Retenez les dates si vous êtes intéressé(e)s.

D’autres initiatives sont à venir.

lundi 25 mai 2009

Bibliothèques publiques et archithécaires

Lionel Maurel présente et commente un intéressant article de ZNet sur son blogue Silex :

The Global Digital Public Library Network : une utopie ?, 24 mai 2009 ici

Bill Kallman : The Case for a Global Digital Public Library Network Policy.

C'est à lire vraiment. Cela tranche avec les polémiques françaises actuelles, à mon avis bien vaines, sur les lois en tout genre.

J'apprécie tout particulièrement la comparaison avec le modèle de la radio. Cela n'étonnera pas mes anciens étudiants du cours sur l'économie du document, petit à petit, on se rapproche de l'idée du pentagone (voir ici)

mercredi 20 mai 2009

E-science et archithécaires

Cet article du dernier numéro de D-Lib mérite lecture.

William Y. Arms, Manuel Calimlim, Lucia Walle, EScience in Practice, Lessons from the Cornell Web Lab, D-Lib Magazine, May/June 2009, Volume 15, Number 5/6. ici

Il pose les jalons de ce que pourraient devenir les professionnels de l'information dans un monde numérique : des archithécaires (voir ici et entre autres) dans cet exemple aux services des nouveaux développements de la science. Néanmoins, il me semble y avoir dans cet article une confusion, courante mais problématique, entre corpus et collection ou encore entre archive et bibliothèque. Cette confusion est sans doute inévitable dans le numérique où tous les éléments sont mis au même niveau, néanmoins il faudra reconstruire un ordre documentaire plus affirmé à l'avenir.

Le tout est présenté en sept leçons, dont plusieurs m'ont étonné. Voici quelques extraits traduits :

1. Construire un laboratoire d'abord, puis une bibliothèque

(Commencer par investir dans une bibliothèque est une stratégie risquée)

Toutes les bibliothèques sont rigides et les bibliothèques numériques ne font pas exception. elles exigent de gros investissements en temps et en argent, et réagissent lentement aux changements de circonstances. Les investissements seront perdus si les plans méconnaissent la recherche en train de se faire ou seront dépassés par des évènements extérieurs. (..)

En revanche, dans un laboratoire tel que le Web Lab si de nouvelles idées ou de nouvelles opportunités se présentent, les plans changent. Les bases solides sont la norme, mais les collections et les services sont flexibles pour répondre à de nouveaux objectifs de recherche. Le site du laboratoire ne fournit pas de services génériques pour un grand nombre de chercheurs, il donne un soutien personnalisé à chacun. (..)

2. Rester petit pour durer

Le financement permanent est le talon d'Achille des bibliothèques numériques. Alors qu'il est comparativement plutôt simple de trouver de l'argent pour innover, peu d'organisation ont un financement sur le long terme pour maintenir la croissance des collections et des services. (..)

Une partie du problème vient du fait qu'une bibliothèque numérique peut facilement devenir dépendante d'employés permanents. S'il y a une interruption de financement, il n'y a plus d'argent pour payer ces personnes et pas d'alternative pour continuer sans eux. Les centres de calcul souffrent des mêmes défauts : équipe nombreuse et coûts fixes élevés.

(Au Web Lab) il n'y a pas de salarié à plein temps. Les étudiants de premier et deuxième cycles ont fait le principal des développements. L'équipement a une vie limitée, mais les achats de matériels ont été synchronisés avec le subventionnement. Les ordinateurs sont gérés par le Center for Advanced Computing de Cornell, qui propose un service de base payant, pour le moment environ 25.000 $ l'an. Ainsi tant que cette facture est acquittée, le laboratoire peut survivre à une absence de fonds de plusieurs années.

3. Extraire des sous-collections gérables

(..) En pratique, nous nous sommes aperçus que peu de gens mènent des recherches sur le Web dans son entier. La plupart des chercheurs font des analyses détaillées sur des sous-collections, pas sur un balayage complet. (..)

4. Aller au-delà de la communauté académique

La communauté académique a des capacités limitées pour développer et maintenir les logiciels complexes utilisés par la recherche sur les grandes collections. Nous devons donc être prudents sur l'endroit où placer nos efforts et flexibles pour l'utilisation de logiciels issus d'autres sources. (..)

Pour les recherches conséquentes sur les données, les développements récents les plus importants sont sur l'open source pour les batteries d'ordinateurs bon marché. C'est une réponse aux besoins de l'industrie de l'internet qui emploient des programmeurs d'expertises et expériences variées pour construire de très grandes applications sur des regroupements d'ordinateurs disponibles. (..)

5. S'attendre à ce que les chercheurs comprennent l'informatique, mais ne pas leur demander d'être experts

6. Rechercher la généralisation, mais se défier de l'uniformisation

(..) Des mots comme « workflow », « provenance », « dépôt » (repository), et « archive » n'ont pas un seul sens, et la recherche d'approches globalisantes tend à occulter les vraies différences entre les domaines. (..)

Autant il y a un danger à perdre son énergie en construisant trop tôt des outils génériques, autant il est également anti-économique de ne pas bâtir des outils standards pour les tâches courantes, une fois un domaine stabilisé. (..)

7. Maîtriser les opérations en local pour la flexibilité et l'expertise

Il est facile d'être séduit par l'informatique dans les nuages et les super-centres de calcul, mais les arguments en faveur d'une maîtrise locale des opérations sont plus forts. (..) Si une université veut rester à la pointe, il faut que ses idées proviennent de son expérience pratique. (..)

Ajout du 26 mai 2009

Voir aussi sur un sujet proche :

Lynne Siemens, ‘It's a team if you use "reply all" ’: An exploration of research teams in digital humanities environments, Literary and Linguistic Computing Advance Access originally published online on April 13, 2009, Literary and Linguistic Computing 2009 24(2):225-233; ici

Repéré par le TGE-ADONIS qui propose le résumé en français ()

- page 1 de 3