Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

Mot-clé - 331. REINGENIERIES DOCUMENTAIRES ; D’une modernité à l’autre ; Objectivité et réflexivité

Fil des billets

samedi 16 février 2013

Il faut lire Alain Desrosières

Alain Desrosières est mort.

Je n'ai eu ni l'honneur, ni l'avantage de le connaître personnellement. Mais à la lecture de ses travaux, c'est pour moi un des plus fins analystes et un esprit parmi les plus subtils et érudits de son siècle. Son œuvre maîtresse et magistrale est :

DESROSIERES, A., 2010, La politique des grands nombres. Histoire de la raison statistique, La Découverte/Poche, Paris, 3ème édition.

En ligne, on pourra lire, par exemple :

Aujourd'hui, alors que partout on ne parle que d'humanités numériques, de web des données, de données ouvertes, de big data, de datajournalism, où l'on s'interroge sur la pertinence et l'effet des algorithmes (ici et ) et même maintenant de philosophie des données, il faut relire A. Desrosières qui nous explique que les calculs ne sont pas neutres et participent de la construction des institutions et du grand récit que les sociétés se font à elles-mêmes.

Pour comprendre l'importance du chemin qu'il nous montre, je ne prendrai qu'un court extrait du livre cité plus haut (p.398) :

Dans son architecture actuelle, la statistique se présente comme la combinaison de deux types d’outillages distincts (…). Le premier est politico-administratif : peu à peu se sont mis en place, depuis le 18e siècle, des systèmes d’enregistrement, de codage, de tabulation et de publications de « statistiques » au sens de description chiffrée de divers aspects du monde social. Le second est cognitif, et implique la mise en forme de schèmes scientifiques (moyenne, dispersion, corrélation, échantillonnage probabiliste), destinés à résumer, notamment par des outils mathématiques une diversité supposée non maîtrisable.

Remplaçons juste quelques mots pour l'appliquer à la période contemporaine, sans changer le raisonnement. Le paragraphe devient :

Dans son architecture actuelle, le web de données se présente comme la combinaison de deux types d’outillages distincts. Le premier est politico-administratif : peu à peu se sont mis en place, à partir de la fin du 19e siècle des systèmes d’enregistrement, de codage, de classification et de publication de « bases de données » au sens de description factuelles de divers aspects du monde social. Le second est cognitif et implique la constitution de schémas logiques destinés à résumer grâce à des algorithmes une diversité supposée non maîtrisable.

Il y a là de quoi retrousser ses manches et aiguiser ses neurones pour mieux éclairer notre époque... n'y a-t-il pas ?

mercredi 28 novembre 2012

De la pertinence des algorithmes (T. Gillepsie)

En écho aux interventions de D. Cardon et D. Kaplan au colloque archinfo et au webinaire Pédauque sur l'importance d'analyser de l'intérieur les conséquences de l'algorithme de recherche de Google, voici un article de Tarleton Gillepsie qui pose clairement la question du rôle éditorial des algorithmes et de la nécessité de mieux en comprendre les conséquences :

Gillespie, Tarleton. “The Relevance of Algorithms". forthcoming, in Media Technologies, ed. Tarleton Gillespie, Pablo Boczkowski, and Kirsten Foot. Cambridge, MA: MIT Press.

Extraits (trad. JMS) :

Les algorithmes jouent un rôle croissant dans la sélection des informations les plus pertinentes pour nous, devenant un élément crucial de notre participation à la vie publique. Les moteurs de recherche nous aident à naviguer dans les énormes bases de données d'information ou sur l'ensemble du web. Les algorithmes de recommandation cartographient nos préférences par rapport aux autres, suggérant de nouvelles informations ou des informations oubliées parmi les morceaux de culture qui comptent pour nous. Les algorithmes gèrent nos interactions sur les sites de réseaux sociaux, mettant en avant des informations d'un ami et excluant celles d'un autre. Les algorithmes construisent ce qui est "chaud" ou "tendance" ou "le plus discuté", écrémant le bavardage apparemment sans fin qui nous est présenté. Ensemble les algorithmes ne font pas que nous aider à trouver l'information, ils donnent le moyen de savoir ce qu'il y a à savoir et comment le savoir, de participer au débat social et politique, et de nous familiariser avec la chose publique à laquelle nous participons. Ils sont aujourd'hui la clé logique qui gouverne le flux d'informations dont nous dépendons, détenant "le pouvoir d'activer et d'affecter du sens, gérant la façon dont sont perçues les informations par les utilisateurs, la "distribution du sensible" (Langlois 2012)."

(...)

Nous avons besoin d'interroger les algorithmes comme un élément clé de notre écosystème informationnel (Anderson 2011) et des formes culturelles émergeant dans leur ombre (Striphas 2011), avec une attention particulière sur où et de quelle manière ils peuvent avoir des ramifications politiques. Cet essai est une carte conceptuelle pour y arriver. Je soulignerai six dimensions de la pertinence des algorithmes publics (cad ayant des conséquences publiques) qui ont un poids politique :

  1. Les schémas d'inclusion : les choix en amont qui mettent quoi à la première place dans un index, qui excluent quoi ? Et comment les données rendent l'algorithme opérationnel
  2. Les cycles d'anticipation : les implications des fournisseurs d'algorithmes pour tenter de bien connaître et prévoir les utilisateurs et comment leurs conclusions importent
  3. L'évaluation de la pertinence : les critères par lesquels les algorithmes décident de ce qui est pertinent, et comment ces critères nous sont cachés, et comment ils agissent sur les choix concernant les connaissances correctes et légitimes
  4. La promesse d'objectivité des algorithmes : la façon dont les caractéristiques techniques des algorithmes sont placées comme un gage d'impartialité, et comment cette affirmation est défendue face à la contradiction
  5. L'intrication avec la pratique : comment les utilisateurs réarrangent leurs pratiques en fonction des algorithmes dont elles dépendent et comment ils peuvent transformer les algorithmes en terrain de contestation politique, parfois même pour interroger la politique de l'algorithme lui-même
  6. La production de publics par le calcul : comment la présentation algorithmique des publics à eux-mêmes construit la compréhension qu'ils ont d'eux-mêmes, et qui est le mieux placé pour profiter de cette connaissance

L'auteur développe chacune de ces dimensions en les illustrant par des exemples et en rappelant les débats auxquels elles renvoient. On peut lui reprocher de rester en retrait, n'amenant pas de données ou d'analyses inédites, mais son essai a le mérite de proposer un canevas précis pour avancer. Il est plus que temps, en effet, que ces questions soient posées et que l'on sorte des deux ornières opposées de la neutralité ou l'objectivité des calculs d'un côté et de la manipulation ou les stratégies perverses de l'autre. Le programme proposé par Tarleton Gillepsie est autant un programme à grande échelle pour les chercheurs en SHS qu'une feuille de route pour un organisme public de régulation.

Cerise sur le gâteau : un tel programme nous permettrait peut-être aussi de sortir des polémiques convenues autour du droit d'auteur en comprenant plus lucidement le rôle éditorial du web et donc en repérant et mesurant plus lucidement les responsabilités des uns et des autres.

29-11-2012

Hubert Guillaud fait ce jour un cr beaucoup plus détaillé que le mien dans InternetActu.

Voir aussi : Algorithms are Decision Systems de T Striphas.

Le débat parait donc lancé. Il serait utile de ne pas le confiner juste à notre époque contemporaine. On pourrait aussi s'inspirer de l'important travail d'A. Desrosières sur l'histoire des statistiques qui préfigure celle des algorithmes :

''La constitution d’un espace rendant possible le débat contradictoire sur les options de la cité suppose l’existence d’un minimum d’éléments de référence communs aux divers acteurs : langage pour mettre en forme les choses, pour dire les fins et les moyens de l’action, pour en discuter les résultats. Ce langage ne préexiste pas au débat : il est négocié, stabilisé, inscrit, puis déformé et défait peu à peu, au fil des interactions propres à un espace et une période historique données.''

Alain Desrosières, La politique des grands nombres : histoire de la raison statistique. Paris : La Découverte, 2000,

J'avais proposé quelques pistes pour l'INRIA à l'occasion de son école sur le Web de données.

mardi 28 août 2012

Z comme Hacker

A lire une intéressante interview de Drapher sur la philosophie Hacker :

« De la société des hackers : interview ». Reflets Info, août 28, 2012.

qui montre une forte résonance entre les premiers temps des pionniers hyppies de la micro-informatique et de l'internet et des préoccupations plus contemporaines des hackers d'aujourd'hui face aux blocages politiques.

Pour autant, il serait aussi utile de tirer les leçons de l'histoire en se rappelant ce qu'est devenu le mouvement hyppie. Les mêmes forces sont aussi aujourd'hui à l’œuvre, transposée dans le contexte du nouveau millénaire. Petite devinette. Qui a écrit cela (trad JMS) ?

Le mot "hacker" a une connotation injustement négative à force d'être dépeint dans les médias comme des gens qui cassent dans les ordinateurs. En réalité, le hacking signifie simplement construire quelque chose rapidement ou tester les limites de ce qui peut être fait. Comme la plupart des choses, il peut être utilisé pour faire du bon ou du mauvais, mais la grande majorité des hackers que j'ai rencontrés ont tendance à être des gens idéalistes qui veulent avoir un impact positif sur le monde.

La Voie Hacker est une approche de construction qui suppose une amélioration continue et l'itération. Les hackers pensent que les choses peuvent toujours être améliorées et que rien n'est jamais fini. Ils doivent juste les réparer, souvent face à des gens qui disent que c'est impossible ou qui se contentent du statu quo. Les hackers cherchent à construire les meilleurs services sur le long terme par de rapides essais et des petites itérations plutôt que de tenter d'avoir tout juste d'un coup. Pour le mettre en place, nous avons construit un cadre de test qui permet à moment donné d'essayer des milliers de version de (XXX). Nous avons peint sur nos murs "faire est mieux que parfaire" (ou "le mieux est l'ennemi du bien", Done is better than perfect) pour nous rappeler à nous même d'être toujours sur la brêche.''

Le hacking est aussi une discipline en soi pratique et active. Au lieu de débattre pendant des jours de la meilleure idée ou de la meilleure façon de faire, les hackers font un prototype et vérifient s'il fonctionnent. Il y a un mantra hacker qu'on entend beaucoup chez nous : "le code est meilleur que les arguments".

Réponse :

Non ce n'est pas Jérémie Zimmermann de la Quadrature du net qui vient d'être lauréat d’un très prestigieux EFF Pioneer Award (félicitations à lui !).

Il s'agit d'un extrait d'une étonnante lettre dont j'avais déjà traduit quelques morceaux de bravoure dans un billet précédent.

mardi 05 avril 2011

La redocumentarisation (du journalisme) en deux citations

Après les quatre images du billet précédent, voici deux citations pour illustrer la redocumentarisation. Il s'agit de montrer l'inversion de la perspective du rapport à la vérité qui s'est opéré entre le début du 20e et celui du millénaire en prenant l'exemple du journalisme. Comme précédemment les commentaires sont bienvenus.

La première citation m'a déjà servi dans un précédent billet. Elle est tirée du livre de P. Starr The Creation of The Media (trad JMS) :

Lippmann {en 1920} exhortait les journalistes à être plus «objectifs», un mot qui venait d'apparaître pour décrire le journalisme. Les critiques aujourd'hui dénoncent l'objectivité comme une idéologie professionnelle, mais il est important de comprendre les pratiques professionnelles que Lippmann voulait faire adopter aux journalistes. Il voulait que les journalistes s'inspirent de la science en développant un «sens de la preuve» et en reconnaissant franchement les limites de l'information disponible : il les exhortait de démonter les idées reçues et les abstractions et de refuser de laisser de côté des nouvelles ou de mettre la morale ou n'importe quelle autre cause avant la véracité. Ce que Lippmann demandait avant tout aux journalistes était la responsabilité (accountability). p.396

La seconde citation est tirée d'un entretien sur RSLN avec Michael Cross du Guardian, un des plus avancés dans le journalisme de données :

(..) Que va t-il se passer si les données sont mal comprises et interprétées ? J’ai peur que nous ne puissions pas y faire grand chose et qu’il faille faire avec.

Dans le même temps, plus les données sont disponibles, plus il y a de chances pour que les gens en parlent, les analysent, les croisent : la discussion offre une chance de réinterpréter les données de manière efficace et fiable, même si elles sont peut-être utilisées pour servir un certain agenda.

Les données sont accessibles et, avec la puissance du web, nous pouvons faire en sorte que l’interprétation la plus fiable se retrouve mise en avant.

Reprenons les mots clés de l'une et l'autre citations sur un tableau pour les mettre en perspective. 1920 correspond à l'organisation systématique des systèmes documentaires qui a pour modèle la science positive. 2010 correspond à la transformation de notre rapport au document sur un tout autre modèle de rapport à la vérité. Le tableau montre l'écho de ce mouvement dans les pratiques journalistiques.

Redocumentarisation-journalisme.jpg

lundi 06 décembre 2010

De la transparence.. et des documents

Quelques remarques rapides pour accompagner le feuilleton WikiLeaks, à partir des préoccupations de ce blogue sur l'économie des documents.

P. Starr dans son livre The Creation of The Media rappelle la naissance de la notion d'objectivité dans la presse. Il cite Walter Lippman qui un des premiers en 1920 dans Liberty and The News l'a mise en avant. Extrait (trad JMS) :

Lippmann exhortait les journalistes à être plus « objectifs », un mot qui venait d'apparaître pour décrire le journalisme. Les critiques aujourd'hui dénoncent l'objectivité comme une idéologie professionnelle, mais il est important de comprendre les pratiques professionnelles que Lippmann voulait faire adopter aux journalistes. Il voulait que les journalistes s'inspirent de la science en développant un « sens de la preuve » et en reconnaissant franchement les limites de l'information disponible : il les exhortait de démonter les idées reçues et les abstractions et de refuser de laisser de côté des nouvelles ou de mettre la morale ou n'importe quelle autre cause avant la véracité. Ce que Lippmann demandait avant tout aux journalistes était la responsabilité (accountability). (..) Mais les journalistes ne pouvait pas faire tout seuls le travail indispensable ; ils avaient besoin d'experts pour organiser l'information à leur place et Lippmann suggérait la création de «observatoires politiques » - des instituts de recherche à la fois en dedans et en dehors du gouvernement - pour fournir les preuves systématiques qui pourraient servir, par exemple, pour évaluer les performances des agences gouvernementales. p.396-397

On retrouve bien des dimensions de ces fondations du journalisme moderne dans l'affaire Wikileaks, y compris dans l'évolution de la personnalité de son responsable. Mais ce que montre surtout Wikileaks est un déplacement de la notion de preuve vers l'évidence (au sens français et non anglais). On croit ce qui est publié non pas à cause d'une démonstration, mais parce que la méthode de publication des documents semble en garantir la véracité, à la fois parce qu'ils proviennent de témoins directs et qu'ils sont potentiellement visibles par tout le monde et donc vérifiables par tout un chacun. Cette évolution de l'« objectivité » vers la « transparence », avec les mêmes limites théoriques et la même efficacité pratique de l'une et l'autre utopie, est parfaitement en cohérence avec l'architecture anarchique et l'économie décalée du web et ses conséquences sur la transformation des médias. Les mêmes forces sont à l'œuvre dans la transformation de la science en e-science ou encore dans les débats sur la vie privée autour des réseaux sociaux.

Sans doute, ce succès est à mettre en résonance avec l'évolution même de nos sociétés dites post-modernes et leur rapport avec la vérité (sur ce point, voir Roger (ici et) : La seconde modernisation introduirait un effet de retour sur cette prétention à la maîtrise qui caractérisait la première car les conséquences ne peuvent plus être repoussées au-delà de nos générations. La prétention à la totalisation du savoir et au triomphe des autorités scientifiques seraient battues en brèche : la seconde modernisation introduit l'exigence d'une réflexivité, d'un savoir qui se déclare lui-même et qui se contrôle en connaissant ses limites et ses conditions de production. p.161

Néanmoins dans l'histoire de WikiLeaks la théorie du document permet de voir les limites de cette nouvelle idéologie. Même si les documents sont pour une part en accès libre, leur décryptage, c'est à dire leur accessibilité intellectuelle (lu), passe par cinq des journaux les plus prestigieux des États-Unis et d'Europe (ici). Et ainsi les données brutes, triées, mises en contexte et publiées par les journaux prennent le statut d'information journalistique avec toute la confiance attachée à ce statut (su). C'est la responsabilité journalistique (accountability), telle que définie dans les années vingt du siècle dernier qui l'a emporté.

L'erreur du raisonnement serait de croire que l'on transforme un ordre documentaire à partir d'une simple mise en accès (vu). L'abandon de la mise en ligne sans tri préalable des données brutes qui était pourtant le dogme initial du site () souligne a fortiori la prégnance d'un ordre documentaire pour la diffusion de documents d'archives d'institution.

Le passage de l'objectivité à la transparence modifie aussi les responsabilités d'une autre profession qui doit s'adapter très vite à la nouvelle donne du web. Il n'y a pas eu, en effet, d'enquête journalistique dans cette affaire, simplement la consultation par des journalistes de documents qui leur ont été proposés spontanément. On peut parier qu'à l'avenir la fonction archivistique, avec ses différents attributs va s'en trouver considérablement renforcée, pour le meilleur et pour le pire.

Je rappelle que, selon le manuel, les archivistes québécois évaluent, sélectionnent, acquièrent, conservent et mettent à disposition des documents d’archives, assurant leur intégrité intellectuelle et une conservation physique responsable, pour le bénéfice des utilisateurs actuels et celui des générations futures" (Association of Canadian Archivists 1999, notre trad.) comme leurs collègues ailleurs au Canada. Toutefois, à la différence de ces derniers, les québécois entendent aussi exercer des responsabilités sur « la gestion des documents qui consiste à assurer le contrôle systématique des documents pendant leur cycle de vie. »

Paradoxalement, il semble que dans cette histoire c'est bien l'ordre documentaire traditionnel, journalistique et archivistique, qui sortira renforcé, mais l'un et l'autre devront s'adapter à une nouvelle architecture de l'accès à l'information.

Actu un peu plus tard

Parmi les très nombreux billets sur WikiLeaks, deux proches de mes préoccupations Christian Fauré et Martin Lessard.

Actu du 15 déc 2010

Sur les chgts du journalismes, voir :

David Carr, “WikiLeaks Taps Power Of the Press — The Media Equation,” The New York Times, Décembre 12, 2010, rub. Business Day / Media & Advertising, ici.

Actu du 3 mars 2011

Pile sur le sujet, un papier de Y Benkler qui commence par une citation de T Roosevelt sur le journalisme à scandale et analyse en détail l'affaire Wikileaks, montrant à la fois les tentatives d'attaque contre le service et son responsable et ses capacités de résistance et constatant qu'il s'agit d'une évolution des formes du 4e pouvoir.

A FREE IRRESPONSIBLE PRESS: WIKILEAKS AND THE BATTLE OVER THE SOUL OF THE NETWORKED FOURTH ESTATE ici

- page 1 de 3