Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

jeudi 28 janvier 2010

Pénétration internet US/Chine

Le rapport de Akamaï pour le 3e trimestre 2009 sur l'état de l'internet vient de sortir et il donne quelques chiffres intéressants pour éclairer le billet précédent sur la Chine. J'en ai tiré les deux tableaux ci-dessous.

Le premier rend compte de l'évolution du nombre d'adresses IP par pays. On peut y remarquer que la Chine se trouve au deuxième rang mondial en nombre d'adresses, encore loin derrière les États-Unis, mais que la croissance est très forte (30% annuel). Compte-tenu de la population en cause, les réserves sont encore considérables. Il y a une différence de 1 à 10 lorsque l'on regarde le nombre d'adresses IP par habitant aux États-Unis et en Chine (0,40 contre 0,04).

Akamai-report-Q3-2009-Adresses-IP.jpg

Le second tableau montre le nombre d'adresses connectées en large bande par habitant. Il confirme la place toute particulière prise par la Corée du Sud entièrement connectée (ici). Mais on peut aussi remarquer la position élevée de Hong-Kong qui arrive en 6ème position, montrant ainsi que la Chine dispose aussi des compétences techniques et d'un laboratoire social pour les usages de l'internet.

Akamai-report-Q3-2009-Large-bande.jpg

mardi 26 janvier 2010

La guerre du Web (nouvel episode : le netEmpire du milieu contre-attaque)

En rédigeant ce billet, j'ai été frappé par la parenté entre l'histoire du Web qui s'écrit sous nos yeux et la saga des Star Wars. Ce n'est évidemment pas un hasard, l'imaginaire des créateurs se nourrit de nos rêves et de nos utopies et vice-versa. On sait ce que la construction de l'internet doit à l'utopie californienne. Je laisse à d'autres plus savants que moi en sémiologie poursuivre cette piste, mais je suis sûr que Larry Page ou Serge Brin se rêvent déjà en Jedi ;-)

Ideogramme.TN__.jpg

Je ne reviens pas sur la discussion en cours. On trouvera sur le site de l'Atelier (ici) une bonne chronique du développement de l'internet en Chine.

La partie qui se joue aujourd'hui entre la Chine et les États-Unis est passionnante et sans doute décisive pour bien des équilibres planétaires : commerciaux, culturels, politiques et peut-être aussi militaires. Pour la comprendre correctement, il faut revenir un peu en arrière :

  • Google et d'autres gros de l'internet ont tenté avec un succès mitigé de s'implanter en Chine. Les raisons sont expliquées ici et .
  • L'État chinois a la volonté de faire évoluer sa société, tout en maintenant un contrôle étroit sur la communication. Il n'y a là rien de nouveau dans son histoire, mais l'internet est pour lui à la fois une formidable opportunité et un danger.
  • La crise financière a changé le rapport de force économique entre les USA et la Chine.

Hubert Guillaud (ici) vient de donner un éclairage intéressant sur le bras de fer qui se joue à présent entre Google-USA et l'État chinois. Il semble que ce dernier serait en passe de réussir son contrôle de l'internet via les DNS rédigées en idéogramme chinois. Dès lors, c'est tout un marché qui risque d'échapper à Google et aussi, au delà du contrôle politique qui agite beaucoup les commentateurs, c'est la mise en place potentielle d'un très puissant outil de protection commerciale via les réseaux sociaux, la publicité contextuelle et les sites de e-commerce.

Il est trop tôt pour proposer une vraie analyse. Mais voici quelques pistes qui montrent l'ampleur des questions posées :

Importance de l'écriture

J'ai déjà eu l'occasion de l'écrire. La vraie muraille de Chine contemporaine, c'est son écriture. L'écriture fait l'unité de la Chine, pourtant partagée en plusieurs langues. Mais elle reste inaccessible pour la quasi-totalité du reste du monde. Il est plus que symbolique que le champ de bataille soit aujourd'hui d'une part les moteurs de recherche dont la compétence est justement le traitement de la langue au travers de son écriture et d'autre part l'écriture des adresses. Il s'agit de la maîtrise de la faculté de nommer les choses et, au sens le plus fort, leur redocumentarisation.

Ainsi, nous assistons à la confrontation de deux mondes ou plutôt de deux humanités. Pour qui connait un peu la Chine, il n'y a pas vraiment de surprise. Reste à espérer que chacun puisse s'enrichir de la différence de l'autre. Mais cette partition est inégale. L'équivalent du mandarin chinois pour le monde occidental est l'écriture anglaise. Celle-là est beaucoup plus accessible et beaucoup plus répandue, y compris en Chine où l'on considère qu'il y a aujourd'hui plus d'étudiants anglophones qu'aux États-Unis mêmes.

Il reste au moins encore une écriture importante dans le monde qui n'utilise pas vraiment, me semble-t-il, l'internet comme outil de développement fort : l'arabe littéraire. Mais elle a trouvé un autre vecteur : le livre et la religion.

Retour des États et bipolarisation

On a eu tort de croire que la messe était dite pour les États et qu'ils ne pourraient plus contrôler un Internet devenu transnational. On reproche à la Chine de vouloir contrôler Internet, mais tous les États, avec leur culture propre, ont toujours cherché à contrôler les médias. Là encore, il est très significatif que ce contrôle passe par celui des moteurs et celui des adresses. C'est exactement comme dans la vie réelle : la circulation et les lieux.

Il est frappant de constater l'absence de l'Europe dans cette bataille. L'Europe est absente aussi bien au niveau industriel (aucun champion sur le Web) qu'au niveau politique (silence radio total pour le moment sur cet épisode). Ainsi il s'agit bien d'une bi-polarisation de chaque coté du Pacifique dont on verra à l'avenir quelle ampleur elle prendra.

Actu du 29 janvier

Voir les points de vue optimistes du président de l'ICANN (ici) et de T. Berners-Lee ().

Actu du 5 février 2010

Pour en rajouter dans le roman d'espionnage :

Piratage : la NSA pourrait venir en aide à Google... mais à quel prix ?, Numerama, 5 février 2010, ici et l'article du Washington Post ,

Actu du 10 mars 2010

Voir aussi cet article d'E. Scherer : Le web chinois, un énorme intranet ? ici

Actu du 13 mars 2010

Il semble que le départ de Google de Chine est imminent ici. Il devrait être suivi par celui d'eBay, une histoire différente mais qu'il faut sans doute aussi analyser comme une réplique sismique, une fois que l'on enlève le vernis politique là.

Actu du 30 avril 2010

Voir aussi ici l'AFP.

vendredi 08 janvier 2010

Suis-je un document ?

Dédicace spéciale aux étudiants de première année en Maitrise des sciences de l'information de l'EBSI

Voici quelques éléments de réponse à cette question, sans prétendre épuiser le sujet.

La première réponse naturelle à cette question, si l'on s'en tient aux définitions officielles ou aux pratiques des professions traditionnelles des sciences de l'information, bibliothécaires et archivistes, est clairement : non. La norme ISO 15489 sur le records management définit le document comme «Tout écrit ou enregistrement considéré comme une unité » (2001a, p. 3, ici ). Au Québec, le document a été défini de façon un peu plus large en 2001 dans la loi : la loi concernant le cadre juridique des technologies de l’information () indique que le document est une «Information portée par un support – information délimitée et structurée, de façon tangible ou logique selon le support qui la porte, et intelligible sous forme de mots, de sons ou d’images». Ainsi, pour ces textes officiels, le document est un objet (matériel ou électronique) sur lequel est consigné une information, en anglais on dira un «record», un enregistrement. Les savoirs pratiques qui ont structuré les professions traditionnelles du document se sont construits à partir de la manipulation de ces objets. À l'évidence, sauf à élargir considérablement la définition, je ne ressemble pas à de tels objets et, d'ailleurs, on ne trouve pas de bibliothèques ou d'archives d'humains.

Mais ces définitions, aussi opérationnelles soient-elles, restent à la surface des choses. Un document ne se réduit pas à sa forme et son contenu, sinon tout écrit en serait un et à quoi bon parler de «document» ? Dire qu'un écrit est un document, c'est lui donner un statut, une fonction. Le collectif de chercheurs Pédauque l'a signifié en proposant une définition tri-dimensionnelle : forme, contenu et médium, la troisième dimension, le médium renvoyant à la fonction sociale de mise en relation (salaun 2006). B. Bachimont dans son historique (2008, ici), montre qu'un document a eu deux fonctions complémentaires qui se sont affirmées au cours des siècles, et d'ailleurs fondent bibliothéconomie et archivistique : transmettre et prouver. Prenons successivement l'une et l'autre et voyons si elles peuvent s'appliquer à ma personne.

Transmettre

La transmission peut passer par les individus, c'est d'ailleurs la fonction première du professeur. Mais l'intérêt justement du processus documentaire est d'externaliser la mémoire humaine. L'écriture a été inventée pour classer, mémoriser et transmettre et bien des auteurs, historiens, anthropologues, philosophes (parmi d'autres, J. Goody, 1979 et 1986 ; R. Darnton 2008, M. Serres 2007) ont disserté sur l'évolution des techniques externes de mémorisation. En effet la transmission humaine est fragile. Ainsi les civilisations orales ont du mal à conserver leur patrimoine culturel et cognitif. «En Afrique, quand un vieillard meurt, c’est une bibliothèque qui brûle», nous dit Amadou Hampâté Bâ 1960 (Wkp). La même réflexion pourrait être reprise pour les connaissances tacites dans une organisation qui se perdent au départ à la retraite des ouvriers qualifiés. Si du point de vue de la transmission on pourrait me considérer comme un document, je serais un document à l'image de ma mémoire, disons plutôt un protodocument sans doute peu fiable et bien fragile. Tout l'effort de documentation, de mise en document, vise justement à réduire cette faiblesse.

La conférence de M. Serres, qui traite spécifiquement de l'externalisation de la mémoire, semble bien indiquer que le document est extérieur à la personne humaine. Et pourtant ironiquement elle nous alerte aussi sur une dimension supplémentaire, sans doute involontairement de la part de l'orateur. La conférence était publique, elle a été enregistrée. Par la magie de la vidéo, cette conférence nous est restituée en différé, au moment où nous, spectateurs (et il serait même plus juste d'employer le singulier), nous le souhaitons. Sans doute, dira-t-on, ce n'est pas vraiment M. Serres, ce n'est qu'une image, c'est un document au sens premier rappelé au début de ce texte.. et pourtant c'était bien lui au moment où il a été enregistré et, oui, c'EST bien lui, virtuellement en chair en os et en esprit, que nous écoutons quand nous cliquons sur la petite flèche qui lance le fichier. Nous avons bien Michel Serres, sous nos yeux et nos oreilles qui nous parle et, sans sa gestuelle, sa verve et sa force de conviction, nous l'écouterions avec moins d'intérêt. Pendant ce temps, le même Michel Serres vaque à des occupations qui nous sont totalement étrangères. Ainsi l'enregistrement audiovisuel est bien un document, mais un document d'une autre nature que l'écrit qui par l'illusion visuelle et sonore produit un effet de réalité et confond le document et son objet, tout spécialement pour la personne humaine du fait de l'empathie créée. C'était déjà le cas de la photographie depuis longtemps. Les albums de famille en font foi qui sont là pour nous rappeler comment nous, ou nos proches, étions tout le long de notre vie. Aujourd'hui, les possibilités d'intervenir sur les images par le numérique modifient rapidement notre perception de la relation entre la photographie et le réel, favorisant à la fois les manipulations et aussi le recul documentaire. Dans cette perspective audiovisuelle, on peut dire que je suis virtuellement un document, par exemple sur une vidéo chargée de transmettre comme ici.

En réalité, cette virtualisation de l'individu, par sa transformation en document ou peut-être faudrait-il dire en dossier documentaire, n'est pas née avec l'enregistrement de l'image et du son. On en trouve des manifestations dans la construction des personnages célèbres, grands de ce monde ou criminels, ou encore dans la construction progressive de l'auteur romantique entre le 18e et le 19e siècles. M. Foucault a particulièrement étudié ces constructions, en montrant par exemple pour les auteurs l'importance grandissante accordée à leurs archives comme parties prenantes de leur œuvre ainsi que le rappelle R. Chartier (2009). Avec l'arrivée du cinéma le phénomène s'est poursuivi par le star-system d'Hollywood. La diffusion massive de l'audiovisuel l'a considérablement amplifié, jusqu'à faire «star» l'homme ou la femme ordinaire dans les télé-réalités. Chacun ainsi peut avoir l'espoir de devenir célèbre, d'avoir son quart d'heure de gloire comme l'annonçait A. Warhol en 1968 (wkp). Et c'est peu dire que l'internet et le web ont fait exploser cette faculté ! Blogues et réseaux sociaux nous obligent à gérer aujourd'hui notre identité numérique, c'est à dire à contrôler plus ou moins laborieusement nos archives, et font de tout un chacun un auteur romantique aux petits pieds, virtuellement un document, en déplaçant les frontières entre les traces de notre vie privée et celles de notre vie publique. Il n'est pas surprenant que les adolescents soient les premiers touchés par cette nouvelle question existentielle, puisque l'adolescence est une période cruciale pour construire son identité (Marnach 2010). Mon double documentaire peut se repérer par exemple de cette façon : comme auteur de livres par WorldCat Identities (accueil, moi) ou par Google Livre (encore moi) ou comme internaute par exemple par une interrogation sur Google (toujours moi).

Prouver

La seconde fonction complémentaire de la première, celle de preuve, est à l'origine d'un des débats les plus célèbres des sciences de l'information sur la notion de document à partir de la proposition de S. Briet (1951, Buckland 1997, Day 2000, Lund 2008). Pour S. Briet, tout élément qui fait office de preuve est un document, y compris les êtres vivants, s'ils ont cette fonction. Ainsi une antilope dans un zoo est une source primaire donnant naissance à une très nombreuse documentation secondaire. À l'inverse, la même antilope, gambadant libre dans la savane n'a pas de statut documentaire. Selon cette perspective, tout individu est potentiellement un document s'il est utile à prouver quelque chose. Les hommes vivant en sociétés organisées, tous leurs faits et gestes sont potentiellement utiles pour au moins trois champs de connaissances : le savoir scientifique, le commerce, le politique,

La médecine, les sciences humaines, les sciences sociales et bon nombre de sciences appliquées s'appuient sur l'homme comme document : sur son corps, sur la personne et ses productions, sur l'individu en société, sur les utilisateurs d'objets ou de systèmes. Je suis donc potentiellement une source primaire d'information pour documenter toutes ces disciplines pour peu que je sois observé. La plupart du temps, je suis plus une source de données ponctuelles sur tel ou tel élément partiel qu'un document en soi, qui sont agrégées avec celles en provenance d'autres individus. Mais je peux devenir document à part entière si mon histoire est observée globalement, dans différentes dimensions, comme un archétype représentatif d'un ensemble. Ou encore, je le suis lorsque je suis suivi ou soigné médicalement, mon dossier médical me représente le plus fidèlement possible, ou tout au moins faut-il l'espérer.

Le marketing est apparu dans les années cinquante pour documenter systématiquement le commerce. Cette documentation s'appuie sur l'observation des consommateurs. Là encore, pour peu que je sois observé je suis une source documentaire, pour le meilleur (adapter les produits à mes besoins) ou pour le pire (me forcer à acheter des produits inutiles). Il s'est produit dans ce domaine un changement radical avec le Web. En effet, pour la première fois, les consommateurs peuvent être observés de façon massive et à leur insu par les traces de navigation qu'ils laissent. Je suis donc là encore une source documentaire, tout particulièrement pour les moteurs de recherches, les réseaux sociaux ou les sites de e-commerce. J'avoue que le manque de transparence dans ces domaines font de moi un document méfiant, cherchant sans doute naïvement à brouiller ma piste.

Le troisième champ est le politique, celui qui règle la vie en sociétés, petites ou grandes. Pour les individus, il s'agit des documents administratifs qui définissent notre identité (passeport, carte d'identité, etc.), nos droits et devoirs (visa, carte de sécurité sociale, feuille d'impôts), nos compétences (diplômes, certificats, permis de conduire etc.), nos jouissances (baux, propriétés, etc.), nos fonctions (contrat de travail). Là aussi des changements documentaires très importants sont apparus avec le numérique, les bases de données venant remplacer de plus en plus les documents traditionnels.

Éthique

Jusqu'à présent dans les pratiques des professions du document, les deux fonctions étaient relativement autonomes. La transmission a conduit à la bibliothéconomie, la preuve relevait plutôt de l'archivistique. Avec le numérique, j'ai souvent eu l'occasion de le dire, les frontières entre les deux pratiques ont tendance à s'estomper ce qui témoigne sans doute d'une confusion de plus en plus forte entre les deux fonctions. Mieux, tous les éléments présentés plus haut sont «redocumentarisés», c'est à dire reformatés, catalogués à nouveau, manuellement ou automatiquement. Ils sont, grâce aux performances informatiques qui agissent ici comme des langages documentaires sophistiqués, rangés dans des bases de données et peuvent être mis en relation, travaillés, recalculés à des échelles et selon des configurations jusqu'ici inédites. J'étais documenté, je suis redocumentarisé, c'est à dire que je suis entré dans un ordre documentaire qui, combinant données et métadonnées sur ma personne, peut faire apparaître un «moi documentaire» jusqu'ici impossible à observer. Pour le «document humain» cette confusion entre transmission et preuve et ces organisations documentaires inédites ne vont pas sans problème d'éthique. Au delà des intérêts et des menaces particulières à chaque dimension déjà notés, le risque principal me parait l'ampleur inédite que donne le numérique au mariage des deux fonctions. Dès lors que la fonction de transmission et celle de preuve s'évaluent sur une grande échelle et sur une grande profondeur, les risques de manipulations des individus, petites ou grandes, ponctuelles ou planifiées, sont réels au travers de leur double documentaire virtuel. N'oublions pas que les hommes ont externalisé leur mémoire pour pouvoir construire des connaissances en manipulant des objets porteurs de sens, les documents. Michel Serres, toujours optimiste, salue l'espace nouveau laissé à la création par l'allègement de notre mémoire. Le danger serait de retourner le raisonnement en se servant de ces mêmes objets pour nous manipuler. Michel Foucault, pessimiste, y trouverait sans doute confirmation de sa réflexion sur le pouvoir (1975).

Actu du 11 janvier 2010

Ceux qui pensent encore que cette question reste une curiosité intellectuelle quelque peu ésotérique liront avec profit cet intéressant billet de A. Dupin sur un débat chaud en France : Droit à l'oubli : le casse tête impossible ici.

Actu du 13 janvier

Il est aussi intéressant de relier cette problématique avec l'actualité immédiate, par ex le changement de politique de confidentialité de Facebook. Parmi, bien d'autres, les réflexions de F. Cavazza à ce sujet icim ou encore de Tristan Nitot .

Actu du 8 octobre 2010

La redocumentarisation commence au berceau :

“74 % des bébés français sont présents sur Internet - LeMonde.fr,” Le Monde, Octobre 8, 2010, ici.

Actu du 8 avril 2011

Joli billet de Cécile Portier sur les archives perso Remue.net.

mardi 05 janvier 2010

Cours Économie du document 2010

Le cru 2010 du cours sur l'économie des documents est maintenant ouvert (ici). La première semaine est traditionnellement consacrée à la présentation du plan de cours et de ses modalités.

À partir de la semaine prochaine, le contenu du cours sera mis en ligne tous les mercredis. Comme d'habitude, l'ensemble sera librement accessible, sauf la partie travaux et relation avec le professeur qui est réservée aux étudiants inscrits à l'Université de Montréal.

Il reste encore la possibilité de prendre quelques étudiants libres. Pour cela, il est nécessaire de m'envoyer très rapidement une demande avec un petit CV. Comme déjà indiqué, un pré-requis est nécessaire pour pouvoir suivre le cours utilement : un baccalauréat nord-américain (licence française) et des notions en sciences de l'information (p ex avoir assimilé ce livre). Tout étudiant ayant réussi le cours reçoit l'équivalent de 3 crédits nord-américains.

Pour ce cours, il a été négocié un seul tarif quelle que soit la provenance des étudiants, soit environ $ 277,19 CAD, ce qui est un tarif exceptionnel, très favorable comparativement aux prix pratiqués de ce côté de l'Atlantique.

lundi 21 décembre 2009

Évolution des professions du document

Le livre Introduction aux sciences de l'information sortira en librairie en France le 7 janvier grâce aux éditions La Découverte. Voici en avant-première, pour ceux qui manqueraient de lecture cette fin d'année, un long extrait du chapitre 1 consacré à l'évolution des professions, qui montre, je crois, tout l'intérêt d'une posture transatlantique.

Intr-sc-info-France.jpg

Rappel :

  • Toutes les informations sur le livre (introduction, table des matières, bibliographie sous Zotero, vidéo..) sont accessibles (ici).
  • Les admissions à la maîtrise (master) en sciences de l'information dont ce livre est le manuel de base sont maintenant ouvertes ()

Actu du 28 décembre 2009

Et les Éditions La Découverte viennent de mettre en ligne les 50 premières pages ici.

- page 45 de 144 -