Edge vient de publier une conversation avec Alex Pentland qui a fondé au MIT un centre de recherche transversal intitulé : Center for Connection Science and Engineering. J'en reproduis de larges extraits traduits ci-dessous, mais l'ensemble mérite lecture.

« Reinventing Society In The Wake Of Big Data ». Edge, août 30, 2012. .

Je crois que le pouvoir des Bib Data c'est qu'elles renseignent sur les gens plutôt que sur leurs croyance. Il s'agit du comportement des consommateurs, des employés et des prospects pour vos nouvelles affaires. Contrairement à ce que la plupart des gens croient, il ne s'agit pas des choses que vous postez sur Facebook, il ne s'agit pas de vos recherches sur Google, et ce ne sont pas non plus les données tirées du fonctionnement interne de l'entreprise et des RFID. Les Big Data proviennent de choses comme les données de localisation de votre téléphone mobile ou de votre carte de crédit. Ce sont les petites miettes de données que vous laissez derrière vous quand vous vous déplacez sur terre.

Ce que ces miettes racontent, c'est l'histoire de votre vie. Elles disent ce que vous avez choisi de faire. C'est très différent de ce que vous mettez sur Facebook. Ce que vous mettez sur Facebook, c'est ce que vous voudriez dire aux gens, rédigé selon les normes d'aujourd'hui. (...)

Si je peux connaitre certains de vos comportements, je peux inférer le reste juste en vous comparant avec la foule de ceux qui vous ressemblent. Vous pouvez raconter toutes sortes de choses sur une personne, même si elle ne sont pas explicitement dans les données, parce que les gens sont tellement pris dans le tissu social environnant qui détermine le genre de choses qu'ils pensent normales, et les comportements qu'ils vont apprendre les uns des autres. (...)

Ce qui compte vraiment, c'est comment les gens sont reliés les uns aux autres par les machines et comment ils créent un marché financier, un gouvernement, une entreprise et d'autres structures sociales. (...)

C'est la promesse d'un système financier qui ne s'écroule pas, de gouvernements qui ne soient pas embourbés dans l'inaction, de systèmes de santé qui fonctionnent vraiment, et ainsi de suite, et ainsi de suite. (...)

Bien qu'il soit utile de raisonner sur des moyennes, les phénomènes sociaux sont faits en réalité de millions de petites transactions entre les individus. Il existe des modèles dans ces petites transactions qui sont responsables du krach boursier ou du printemps arabe. (...)

Cela veut dire que vous pouvez construire des villes plus efficaces, beaucoup plus humaines et qui dépensent énormément moins d'énergie. Mais vous avez besoin de voir les gens bouger pour obtenir ces résultats. (...)

Y a-t-il une opposition (au partage des données dans les entreprises) ? Étonnamment, peu. Les historiques de l'internet sont sans doute les plus opposés parce que (et je ne leur reproche pas) Facebook et Google ont grandi dans un monde complètement déréglementé. Pour eux, il est naturel de penser qu'ils ont le contrôle de leurs données, mais lentement, lentement ils en viennent à admettre qu'ils devront faire des compromis. (...)

Ce nouveau monde pourrait faire de George Orwell un petit joueur manquant d'imagination. Il est devenu très clair que l'on doit réfléchir fortement à la défense de la vie privée et à la propriété des données. George Orwell n'avait pas vu que si vous pouvez observer les modèles de comportements des gens qui interéagissent vous pouviez alors prévoir des choses comme qui va voter pour quoi ou comment va-t-il réagir à des situations variées comme un changement dans les réglements et ainsi de suite. Vous pouvez construire quelque chose qui, en première approximation ressemble vraiment à l'empire du mal. Et, bien sûr, certains chercheront à le faire. (...)

Même si on peut penser qu'il y a encore loin entre cette présentation et les réalisations concrètes, c'est une édifiante lecture sociale du mouvement des Big data, et de la redocumentarisation des personnes, faisant la différence entre l'explicite (le publié) et l'implicite (l'agit) montrant la bascule de l'explication statistique vers l'algorithmie. Il y a aussi derrière ce discours une idéologie de la transparence qui mériterait d'être plus interrogée et mieux assumée. J'ai essayé de poser quelques questions à ce sujet, m'en tenant à la problématique documentaire, dans un article écrit pour l'INRIA :

Salaün, Jean-Michel. Du document à la donnée et retour. La fourmilière ou les Lumières. In "Le document numérique à l’heure du web de données", séminaire INRIA, 1er au 5 octobre 2012, Carnac. Paris, ADBS Éditions, 2012

04-09-2012

« Internet et les fourmis fonctionnent de la même manière | Slate ». Slate.fr.

05-09-2012

Driscoll, Kevin. « From Punched Cards to “Big Data”: A Social History of Database Populism ». communication 1 1, nᵒ. 1 (août 29, 2012). http://scholarworks.umass.edu/cpo/vol1/iss1/4.