Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

Recherche - web média

lundi 11 octobre 2010

Les origines libertariennes de Facebook

En ces temps où on veut toujours nous faire croire que les débuts de l'internet étaient seulement portés par une idéologie californienne libératrice (ici), il est salutaire de lire ou relire l'article de Tom Hodgkinson sur Facebook. Prémonitoire et on ne peut plus d'actualité près de deux ans plus tard, soit une éternité à l'échelle temporelle du web :

Tom Hodgkinson, “With friends like these ...,” The Guardian, Janvier 14, 2008, ici, traduit en français par Noslibertés (la toute dernière partie n'est pas traduite. L'auteur y suggère simplement de remplacer le mot Facebook par Big Brother dans l'énoncé de la politique de la firme sur la vie privée. L'effet est saisissant au sens propre !). Repéré par l'Encyclopédie de l'Agora ()

Extraits :

Facebook est un projet bien établi, et les personnes derrière le financement, sont un groupe de spécialistes du capital-risque de la Silicon Valley, qui ont clairement pensé l'idéologie qu'elles souhaitent diffuser dans le monde entier. (..)

Bien que le projet ait été au départ conçu par le très médiatisé Mark Zuckerberg, le vrai dirigeant derrière Facebook est le philosophe Peter Thiel, spécialiste du capital-risque et futurologue de la Silicon Valley, âgé de 40 ans. Il y a seulement trois membres du conseil de direction sur Facebook : Peter Thiel, Mark Zuckerberg et Jim Breyer, appartenant au groupe de capitalrisque Accel Partners.(..)

Mais Thiel est plus qu'un capitaliste intelligent et avare. C'est un philosophe du futur et un activiste des néoconservateurs. Il est diplômé de philosophie à Stanford, en 1998 il coécrit un livre appelé "Le mythe de la diversité", qui est une attaque détaillée sur l'idéologie multiculturelle qui domine Stanford. Il estime que le multiculturalisme a conduit à une diminution des libertés individuelles. Alors qu'il était étudiant à Stanford, Thiel fondait un journal de droite, encore en service actuellement, appelé "Que la lumière soit". Thiel est un membre de TheVanguard.Org, un groupe de pression néoconservateur sur Internet, qui a été créé pour attaquer MoveOn.org, un groupe de pression de gauche qui travaille sur le Web. (..)

L'Internet fait immensément appel aux néoconservateurs tels que Thiel, parce qu'il promet une certaine forme de liberté dans des relations humaines et dans les affaires : absence de droits nationaux embêtants, suppression des frontières, etc. L'Internet est le cheval de Troyes du libre-échange et de l'expansion du laissez faire. Peter Thiel semble également soutenir les paradis fiscaux en mer, et réclame que 40 % de la richesse du monde réside dans les endroits tels que Vanuatu, les Îles Cayman, Monaco et les Barbade. Je pense qu'il est réaliste d'indiquer que Thiel, comme Rupert Murdoch, est contre l'impôt et les taxes. Il aime également la mondialisation de la culture numérique parce qu'elle rend les banquiers mondiaux difficiles à attaquer. «Vous ne pouvez pas avoir une révolution des ouvriers contre une banque, si la banque est domiciliée au Vanuatu, » estime t-il... (..)

Ainsi, Peter Thiel essaye de détruire le monde réel, qu'il appelle aussi « nature », pour le remplacer par un monde virtuel, et c'est dans ce contexte que nous devons regarder le succès de Facebook. Facebook est une expérience délibérée dans la manipulation globale, et Peter Thiel est une lumière pleine de promesse pour les néoconservateurs, avec un penchant pour les folies utopiques de la technologie. Pas vraiment quelqu'un que je souhaite aider à devenir riche pour ses projets...(..)

Bien sûr, il a un côté excessif dans la dénonciation, naïf dans la nostalgie et quelque peu ignorant du travail des ingénieurs et de la complexité des rouages économiques, mais il remet pas mal de pendules à l'heure et cela nous change des propos lénifiants habituels.

21-08-2012

« Transcript: Schmidt and Thiel smackdown - Fortune Tech ».

mercredi 15 septembre 2010

Théories du document

À la lecture de l'actualité, générale ou celle des Digital Humanities, je me disais que décidément on manquait d'une meilleure compréhension de la notion de document. Niels Lund a fait avec une collègue une excellente recension des théories à ce sujet dans laquelle il insiste sur l'originalité des apports francophones. Paradoxalement ceux-là paraissent bien méconnus au Québec ou dans l'Hexagone. Cela n'est pas nouveau. P. Otlet ou S. Briet ont été « redécouverts » par un professeur de Berkeley M. Buckland et la dernière rééditée en anglais, mais jamais en français..

Niels Windfeld Lund et Roswitha Skare, “Document Theory,” dans Encyclopedia of Library and Information Sciences, Third Edition, vol. 1, 1 vol., 2010, 1632-1639. (ici sur abonnement)

Voici la traduction du résumé de l'article :

Cet article donne une vue d'ensemble du développement historique des réflexions théoriques sur le document et de la formulation des théories du document. Partant de son prédécesseur latin documentum et des pratiques de la bureaucratie des États européens depuis le dix-septième siècle, le premier intérêt pour une théorie du document a été professionnel et se repère au début du vingtième siècle avec les noms de Paul Otlet et Suzanne Briet. Tandis que la notion de document et de documentation a été bien établie vers 1930, elle a été remplacée par celle d'information après la seconde guerre mondiale, au moins chez les anglophones. Néanmoins, à la même époque, une autre sorte de théorie du document a vu le jour, une théorie critique où l'on retrouve les noms de Michel Foucault, Harold Garfinkel et Dorothy E. Smith. Tandis que la théorie du document « professionnelle » développée par Paul Otlet et les autres insistait sur les connaissances plus ou moins contenus dans les documents et sur la façon dont quelque chose pouvait devenir document, la théorie générale développée par les théoriciens critiques comme Michel Foucault se préoccupait plus de ce qu'était et faisait un document. Depuis les années quatre-vingt-dix, on observe un renouveau de l'intérêt pour la notion de document et de documentation toujours à l'intérieur des sciences de l'information et des bibliothèques, avec des auteurs comme Michael Buckland, Ronald Day, and Bernd Frohmann. Ensemble avec un accent mis sur le document numérique, des théoriciens du document en Amérique du nord, en Scandinavie et en France ont souligné la complexité d'une théorie du document et la nécessité d'approches complémentaires articulant les dimensions physiques, sociales et culturelles pour comprendre ce qu'ils sont et ce qu'ils font.

Et voici en complément, quelques éléments de mon cru sur cette question, puisant largement dans l'article ci-dessus et dans les réflexions du RTP-DOC (ici) :

Pour la plupart des textes réglementaires ou des normes, le document est un objet (matériel ou électronique) sur lequel est consignée une information, en anglais on dira un record, un enregistrement. L’objet a une forme et l’information est un texte, au sens large c'est-à-dire aussi bien de l’écrit que de l’image ou du son représentés par des symboles. De ces premières définitions, il faut surtout retenir le terme « consigné ». Les sciences de l’information se sont construites autour de cette notion d’enregistrement, sans toujours bien le concevoir. Quand on y parle d’information il s’agit implicitement d’une information consignée.

Mais ces définitions officielles, aussi opérationnelles soient-elles pour régler bien des situations, restent à la surface des choses. Un document ne se réduit pas à sa forme et son contenu, sinon tout écrit en serait un. Dire qu'un écrit est document, c'est lui donner un statut, une fonction particulière. Plus précisément, un document a deux fonctions complémentaires qui se sont affirmées au cours des siècles avec la mise en place de procédures spécifiques : transmettre et prouver. La fonction principale du document est donc mémorielle : on enregistre une information sur un objet pour pouvoir la transmettre ou s’y référer. L’ensemble du système documentaire est en quelque sorte notre mémoire externe pour paraphraser M. Serres (ici).

Le RTP-DOC, au cours d’une réflexion collective, a proposé une représentation tri-dimensionnelle pour rendre compte de ces différentes facettes : forme, contenu ou texte et médium (ici). Les deux premières dimensions sont les plus communément indiquées, la troisième, le médium, renvoie à sa fonction sociale. En voici un petit résumé rapide que j’ai un peu adapté.

La première dimension du document, celle de la forme, est anthropologique. Il s’agit du rapport de notre corps et de nos sens à l’objet document, quelle que soit sa forme ou son support. Elle se traduit par l’équation Document = Support + inscription. L’inscription doit être lisible, c'est-à-dire déchiffrable. L’exemple le plus traditionnel est le livre imprimé. Pour bien des documents aujourd’hui, notamment les documents numériques, cette dimension passe par un appareillage spécial pour permettre leur lecture, et leur forme variera suivant le terminal de lecture. Cette dimension privilégie le repérage, le document doit pouvoir être vu.

La seconde dimension est intellectuelle. Il s’agit du rapport de notre cerveau et de ses capacités de raisonnement au contenu du document, au texte donc, quelle que soit la façon dont il est représenté. Elle se traduit par l’équation Document = Code + représentation. La représentation est préjugée être fidèlement rendue par le code, ce qui suppose donc qu’elle soit transposable et qu’elle existe préalablement. Si l’on reprend l’exemple de notre livre imprimé, l’accent cette fois est mis sur le texte, sur son sens sans se préoccuper de son support. La productivité du code informatique autorise une manipulation inédite des documents sous forme numérique, jusqu’à parfois les faire apparaître à la demande. Cette fois il ne suffit plus de repérer, cette dimension met en avant la signification, le document doit pouvoir être compris ou lu.

La troisième dimension est sociale. Il s’agit du rapport de notre humanité, de notre position dans une société, à la fonction du document, à sa capacité de médiation donc, quelle que soit sa forme ou son contenu. Elle se traduit par l’équation Document = Mémoire + transaction. Nous retrouvons alors les fonctions de transmission et de preuve. Dans le cas du livre imprimé, cette transmission passe par l’acte de lecture qui fait que l’information présentée est interprétée par le lecteur qui l’assimile. Le lecteur est transformé par l’information qui a été mise en mémoire sur le livre. Une fois de plus le numérique, cette fois principalement par la capacité des réseaux, modifie considérablement le rapport au temps et à l’espace, à la lecture au sens large et par la même sinon la fonction documentaire, du moins à la place du document dans le social. Cette dernière dimension insiste donc sur la fonction du document, la capacité de son contenu à être assimilé en dépassant le cercle intime et la barrière du temps, autrement à être su. 3-dimensions-document.jpg Chacune de ces dimensions a sa propre logique qui ne réduit pas aux autres et pourtant aucune n’est complètement indépendante des deux autres, et un document doit intégrer et coordonner les trois. Ses modalités anthropologiques (lisibilité-perception, forme-signe), intellectuelles (intelligibilité-assimilation, texte-contenu) et sociales (sociabilité-intégration, médium-relation) doivent non seulement être efficientes prises chacune séparément, mais encore être cohérentes entre elles.

Pour chacune de ces dimensions, les professions traditionnelles du document, archivistes, bibliothécaires et documentalistes, ont développé des outils adaptés : les classifications pour repérer les documents, l’indexation pour rendre compte du contenu et retrouver l’information, la conservation et les services d’accès pour les partager. Le numérique a fait surgir chaque fois des questions nouvelles qui ont été analysées et traitées par des expertises différentes, aussi bien en informatique que dans les sciences humaines et sociales.

J'ai souvent appliqué, sur ce blogue et ailleurs, cette grille de lecture pour analyser les développements actuels et leurs hésitations. Elle me parait tout à fait éclairante. Qu'est-ce que le web, sinon de l'information consignée et donc un système documentaire ?

mercredi 08 septembre 2010

Les contours de l'économie du document

Je suis en train de rédiger un manuel ou un livre pour accompagner le cours sur l'économie des documents, ce qui m'amène à réviser bien des notions présentées. J'en proposerai périodiquement quelques extraits pour les soumettre à une critique éventuelle. Voici donc un extrait du deuxième chapitre sur la délimitation du secteur.

La Commission européenne a publié en 2010 un livre vert sur les « industries culturelles et créatives » actuellement soumis à la discussion (ici) et qui s'appuie sur un rapport préalable sur la mesure des activités culturelles (pdf). Les experts européens, après avoir fait la synthèse des propositions des différents pays et organismes, ont suggéré de regrouper les activités culturelles en un « secteur culturel et créatif » dont les frontières sont définies dans le tableau ci-dessous (p.56).

Secteur-culturel-creatif-europe-56.jpg

On peut remarquer tout d’abord le découpage en un « cœur » et trois « cercles ». Le cœur représente les activités fondatrices du secteur : les arts visuels, les arts du spectacle, le patrimoine. Le cercle 1 reprend les industries culturelles dans leur acception classique. Les cercles 2 et 3 présentent ce que la Commission européenne appelle désormais les industries créatives : le design, l’architecture et la publicité d’une part et, d’autre part, les industries connexes. La délimitation de ces dernières constituant le cercle 3 est indiquée comme plus floue, car elles appartiennent aussi à d’autres sous-secteurs. Les activités citées sont les fabricants de matériels d’enregistrement et de lecture et les opérateurs de réseaux, reliés au secteur des technologies de l’information et de la communication.

Le cœur indiqué représente, en réalité, les origines anciennes de l’économie du document, on pourrait dire sa préhistoire. Les productions ont bien aussi les caractéristiques d’un document et notamment sa fonction de transmission ou de preuve, mais elles restent limitées au stade du prototype : l’œuvre d’art, le spectacle, le monument ou l’archive. Il s’agit en quelque sorte d’une activité protodocumentaire.

Il est une activité ici placée dans le patrimoine qu’il faut pourtant déplacer pour rendre compte correctement de l’économie du document. Suite à la diffusion du livre à grande échelle, puis des revues et des journaux, les bibliothèques quittent, en effet, ces prémices artisanaux et aléatoires pour se multiplier en inventant progressivement la bibliothéconomie, c'est-à-dire une organisation rationnelle, on pourrait dire industrielle, d’un service d’accès aux documents. Il faut donc les retirer du cœur ou des origines, du moins pour celles dont la mission première n’est pas la conservation, et les placer dans la rubrique suivante qui réunit les activités industrielles, le cercle 1.

Plusieurs corrections ou ajustements doivent être effectuées dans ce premier cercle. La musique, tout d’abord, est mise comme une catégorie générale dans les industries culturelles. Cela se justifie en économie de la culture par la cohérence, la complémentarité des différentes activités musicales et leur articulation. Mais, d’un point de vue documentaire, les concerts, la musique vivante relève du spectacle, c'est-à-dire de la catégorie précédente, tandis que la musique enregistrée, qui est directement de l’information consignée donc bel et bien un objet documentaire, participe clairement à la catégorie industrielle. Celle-ci, de plus, comprend aussi les bases de données qui sont exclues dans le tableau de la Commission. Enfin le plus problématique est que les nouveaux industriels du web-média sont absents de ce premier cercle, à part les jeux vidéos : ni les portails, ni les moteurs, ni les réseaux sociaux ne sont mentionnés. Pourtant ils jouent un rôle crucial aujourd’hui pour l’économie du document, déstabilisant les industries traditionnelles. Ajoutons-les donc dans cette rubrique sous l’appellation de web-média. L’ensemble de cette rubrique est nommée par les experts de la Commission européenne « industries culturelles ». J’en ai modifié les contours, il faut donc en changer le nom. Conformément à notre propos, je les baptiserai « industries de la mémoire ».

Dans le deuxième cercle, seule parmi les éléments initiaux la publicité concerne l’économie du document. Mais son importance relève moins de sa créativité que de l’ouverture d’un second marché, celui des annonceurs ou plus précisément la construction d’un marché bi-face comme nous l’avons vu au chapitre précédent. La publicité relève donc aussi des industries de la mémoire, mais d’une façon décalée. Son activité est parallèle et articulée à celle de la presse, de la radio-télévision et, depuis peu, du web-média.

La notion de secteur créatif ne fait pas directement sens pour l‘économie du document qui se fonde sur le l'information consignée. Par contre, d’autres activités ne relevant pas directement des industries de la mémoire reposent sur une création, manipulation, distribution de documents. L’éducation transmet des savoirs par l’intermédiaire de professeurs, mais aussi d’une intense activité documentaire. Les administrations, privées et publiques, fonctionnent avec des documents. Tout une série de professions, notaires, avocats, agents, sont là pour rédiger et certifier l’authenticité de documents, agissant comme tiers parties. Ces trois domaines se sont transformés avec l’arrivée des moyens légers de production et reproduction documentaires, machine à écrire, reprographie, photocopieuses. Ils explosent aujourd’hui avec la bureautique et les facilités offertes par le traitement, les mémoires et les réseaux numériques. Ils forment un secteur que l’on appelle de plus en plus la gestion des connaissances, plus connu sous sa dénomination anglaise : le knowledge managment. L’économie de ce secteur est difficile à circonscrire et mesurer.

Le troisième et dernier cercle enfin est succinctement évoqué, comme « industries associées » dans le rapport de la Commission européenne. Il agrège les fabricants de matériels, de logiciels et les opérateurs de télécommunication et comprend un « etc. » qui laisse la porte grande ouverte. Il est indiqué en remarque qu’il s’agit notamment du secteur des technologies de l’information et de la communication. Pour l’économie des documents, ces acteurs sont essentiels car ce sont eux qui de plus en plus supportent, mettent en forme les documents et les rendent accessibles. Mais leur dynamique dépasse très largement ce rattachement car ils concernent aussi d’autres activités et s’adressent à d’autres marchés comme le e-business, le e-commerce, ou simplement la bureautique et le téléphone.

Toutes ces remarques permettent maintenant de présenter les contours de l'économie du document sur un tableau qui s’inspire du tableau précédent en l’amendant et le simplifiant.

Economie-du-document.png

jeudi 02 septembre 2010

La fin de la récré

Continuons les lectures estivales. Le rédacteur en chef de Wired a le sens de la formule et de l'air du temps. Il sait capter les idées, les présenter et mettre en valeur l'essentiel. Un vrai pédagogue avec le péché mignon du professeur, un zeste de démagogie ici par exemple dans le schéma introductif quelque peu trompeur (voir sa critique sur Boingboing ici).

Chris Anderson et Michael Wolff, “The Web Is Dead. Long Live the Internet,” Septembre 2010, ici.

« Le web est mort, vive l'internet » donc. L'article a été beaucoup commenté en anglais, peu encore en français (sur OWNI ici). Mais c'est juste la rentrée, cela va venir.

L'article est en deux colonnes parallèles. Chacune écrite par un auteur présente la même thèse, mais d'une perspective différente, Anderson du point de vue de l'internaute à la recherche de simplicité, Wolff du point de vue des entrepreneurs à la recherche de contrôle et profit. La thèse n'est pas vraiment nouvelle et n'étonnera pas les lecteurs de ce blogue. Il s'agit de dire que le média internet est arrivé à maturité et que le web (c'est à dire l'accès par un navigateur) n'en est qu'une des applications, dont la rentabilité n'est pas toujours au rendez-vous. Dès lors d'autres joueurs, comme Apple, Amazon ou Facebook développent d'autres services qui rencontrent le succès par leur simplicité d'utilisation, notamment sur les appareils mobiles.

On peut discuter de l'opportunité de la distinction faite entre web et internet dans l'article. Mais j'ai eu souvent l'occasion de répéter ici que le web était dans l'enfance, une enfance pas si différente de celle des médias qui l'ont précédé notamment dans son caractère libertaire, pour ne pas acquiescer au constat général même s'il est un peu forcé pour les besoins de la démonstration. Mais, une fois constat fait, il reste à comprendre quelles sont les logiques du média qui s'installe. Ses prédécesseurs ont construit des modèles robustes. Quel sera celui du petit dernier ? Pour construire un modèle, il faut qu'entrent en résonance l'organisation de la technique (un choix dans les possibles), la satisfaction du social (un choix dans les usages) et une pérennité économique (un marché ou un support public). Pour le web, c'est le troisième qui est encore incertain.

J'ai déjà essayé de rendre compte de l'articulation de ces modèles (court, long) et de décrypter les ressorts des stratégies des principales firmes sur le web (). Mais il y a encore du boulot..

Actu du 7 oct 2010

Pour un résumé des débats américains, voir le billet de F. Pisani qui ne m'a pas vraiment convaincu :

“Le web n’est pas mort, l’internet ne va pas bien/1 - Transnets - Blog LeMonde.fr,” ici.

et la suite :

“Le web n’est pas mort, l’internet ne va pas bien/2 - Transnets - Blog LeMonde.fr,” .

mardi 31 août 2010

Economie de surveillance

Le Wall Street Journal a publié cet été une série de cinq articles sur la surveillance et le repérage des internautes. Ces articles sont aussi importants par les informations qu’ils apportent, que par le statut du journal qui les publie.

1. Julia Angwin, “The Web's New Gold Mine: Your Secrets,” wsj.com, Juillet 30, 2010, rub. What They Know, ici.

2. Nick Wingfield, “Microsoft Quashed Effort to Boost Online Privacy,” wsj.com, Août 2, 2010, rub. What They Know, ici.

3. Justin Scheck, “Stalkers Exploit Cellphone GPS,” wsj.com, Août 3, 2010, rub. What They Know, ici.

4. Emily Steel et Julia Angwin, “On the Web's Cutting Edge, Anonymity in Name Only,” wsj.com, Août 4, 2010, rub. What They Know, ici.

5. Jessica E. Vascellaro, “Google Agonizes on Privacy as Ad World Vaults Ahead,” wsj.com, Août 10, 2010, rub. What They Know, ici.

Voici quelques notes et commentaires article par article. Attention, il s’agit de ma lecture et de mon interprétation des articles et non d’un compte-rendu fidèle, j’y ai ajouté commentaires, liens et réflexions de mon cru. Le sous-titre représente la principale leçon que j’en ai tirée.

1. L’économie souterraine du ciblage

Le WSJ s’intéresse dans cet article introductif aux logiciels espions.

Du côté technique, les initiés n’apprendront pas grand-chose. J’avais déjà rendu compte d'une enquête sur les 50 sites les plus populaires des US (là où on trouvera aussi le lien vers l'enquête de AT&T sur 1.000 sites populaires citée dans l'article). Le journal a fait une expérience similaire avec un ordinateur test. Il a constaté que les 50 sites les plus fréquentés avaient déposé 3184 éléments de surveillance au total, la plupart du temps sans prévenir, une douzaine de sites en a déposé plus de cent, Wikipédia aucun. Un petit 1/3 sont inoffensifs, par exemple pour se rappeler son mot de passe. Mais les logiciels espions ne s’en tiennent pas à des cookies et sont de plus en plus sophistiqués. Certains, par exemple, suivent ce que font les gens en temps réel, et évaluent instantanément le lieu, les revenus, les comportements d’achat et même les conditions médicales des personnes. Certains se réimplantent automatiquement quand les usagers cherchent à s’en débarrasser, notamment en profitant des fonctionnalités de Flash d’Adobe. La relation entre les profils et les noms des personnes n’est pas faite. Les profils sont, en toute rigueur, ceux des machines des utilisateurs.

Plus inédits sont les éléments, même partiels, donnés sur cette économie. Les profils des individus ainsi recueillis, constamment actualisés, sont achetés et vendus sur une sorte de bourse qui a pris son envol dans les derniers 18 mois. Le journal a ainsi identifié plus de 100 sociétés d’intermédiaires en concurrence sur les données comportementales et d’intérêts des individus. Parmi celles-ci la société BlueKai surveille, par exemple, les visiteurs de eBay.com ou de Expedia.com en temps réel et ces données sont revendues sur son site. Plus de 50 millions d’informations sur les habitudes de navigation des internautes sont vendues chaque jour à 1/10 de centime de $ pièce. On considère que la publicité ciblée a fait un chiffre d’affaires de 23 Milliards de $ l’année dernière.

Ces données peuvent être une rentrée supplémentaire pour des sites qui ne peuvent se financer complètement par la vente d’espace publicitaire. Il semble néanmoins que, naïfs, inconscients ou complices passifs, nombre de sites ne sont pas au courant des logiciels espions qu’ils transmettent et qui sont initiés par des entreprises-tiers d’un nouveau genre où règnent les statisticiens. Par ailleurs, si aux États-Unis l’utilisation des cookies est réglementée, les autres logiciels espions, bien plus intrusifs ne le sont pas, pas encore.

In fine, l’objectif est, bien sûr, de cibler au plus près le consommateur. Voici trois citations illustratives de l’objectif des responsables de ces sociétés : « Les annonceurs veulent accéder aux personnes, pas aux pages web » ; « Quand une publicité est correctement ciblée, elle cesse d’être une publicité pour devenir une importante information » ; « Nous dirigeons les gens vers différentes files de l’autoroute ». Mais, cette détermination a des limites. Il n’est pas sûr que nous voulions rester toujours dans les mêmes rails et nous sommes, comme tous les humains, heureusement versatiles.

2. L’importance du navigateur et des choix techniques

Un important débat a eu lieu à Microsoft au moment de la mise au point de Internet Explorer 8 entre les ingénieurs et les responsables de la stratégie. Les premiers avaient imaginé un navigateur qui protégeait par défaut la vie privée des internautes en les prévenant des logiciels intrusifs et leur donnant la possibilité de les bloquer. Mais suite à des pressions internes de nouveaux recrutés issus de la publicité sur le web et de la consultation des représentants de cette branche. La tendance a été renversée, rendant quasi-impossible cette protection, qui n’existe plus par défaut et qu’il faut réenclencher à chaque ouverture du navigateur.

L’épisode est intéressant à double titre. D’une part, il illustre combien la logique économique du web est radicalement différente de celle de l’économie classique des logiciels, culture initial de MSN, et repose exclusivement sur la publicité ciblée. D’autre part, il montre le rôle essentiel dans cette économie du navigateur dont les choix techniques ne sont pas gravés dans le marbre.

MSN, malgré tout, cherche encore à se démarquer de ses concurrents sur le web en appliquant une politique plus rigoureuse sur les données qu’il collecte, comme le montre cet article du journal de la firme : Lee Pender, “Privacy: What Does Microsoft Know About You?”, Redmondmag.com, Janvier 7, 2010, ici.

L’épisode peut aussi faire réfléchir à la stratégie de Mozilla avec Firefox, drapé dans la vertu du logiciel libre, mais ne défendant pas mieux les données privées..

3. Cellulaire ou mobile

En Amérique du nord, on dit « téléphone cellulaire », en Europe « téléphone mobile », ou plus rapidement cellulaire et mobile. La différence sémantique est ironique, l’un insiste sur le repérage, le quadrillage voire l’enfermement, tandis que l’autre pointe la liberté, le déplacement. Sans doute, il s’agit de l’envers et du revers d’une même médaille, mais le pile et le face sont pour le moins contrastés. Une même technologie, un même service est désigné selon les continents par des qualificatifs opposés. Ici, je garderai « cellulaire », plus représentatif des propos du WSJ. Les compagnies de téléphone savent, en effet, où se trouvent leurs abonnés à trente mètres près.

L’article met en balance deux conséquences de ce repérage : d’un côté il indique la possibilité de repérer des victimes d’accidents ou de délits ou encore de sécuriser les enfants, qui justifie officiellement la réglementation US d’installation d’une puce GPS dans tous les téléphones cellulaires ; mais il insiste surtout sur les dangers du harcèlement et de la surveillance domestique, multipliant les exemples de femmes battues, retrouvées par leur mari grâce au traçage familial de leur téléphone portable proposé aux abonnés d’un cellulaire. En réalité, les enjeux me paraissent ailleurs : sur la surveillance policière ou le contrôle social d’un côté, la publicité contextualisée, de l’autre

Un chercheur d’une société de sécurité informatique, Don Bailey d’ISec Partners, a montré qu’il suffisait du numéro de cellulaire de la personne, d’un ordinateur, de quelques connaissances sur la technologie des cellulaires pour surveiller n’importe qui. Pour les paranos ou les incrédules, toutes les explications du chercheur sont ici . Il y explique comment il est possible de savoir, pour quelques cents et, tout de même, avec quelques compétences informatiques : qui vous êtes, quels sont les membres de votre famille, vos amis, vos collègues, où vous êtes, où ils sont, ce que vous êtes probablement en train de faire, pourquoi.. et ce que vous allez probablement faire ensuite.

4. Anonymat et personnalisation

Cet article donne une illustration concrète de ce qu’il est possible aujourd’hui de faire avec les données collectées. Il prend l’exemple de la société (x+1) qui a trouvé son modèle d’affaires en 2008 après de nombreux déboires et changements auparavant.

En utilisant les bases de données construites comme indiqué dans le premier article, la société est capable instantanément de donner le profil de consommation de n’importe quel internaute. Ils n’ont pas a priori son nom, mais croisent les références des données, avec la propriété des maisons, le revenu familial, le statut familial, les restaurants habituels, entre autres. Et en utilisant les probabilités, ils font des hypothèses sur les penchants de l’internaute. Le directeur de la société indique : « Jamais, nous ne savons rien sur une personne ».

Sans doute, il leur arrive de se tromper, mais leurs propositions sont suffisamment fiables pour qu’ils aient trouvé un marché auprès des vendeurs de cartes de crédit qui évaluent ainsi en temps réel la fiabilité de leurs nouveaux clients. Comme le dit le journaliste : « en résumé, les sites web ont gagné la possibilité de décider si vous serez un bon consommateur ou non, avant même que vous ne leur disiez quoi que ce soit sur vous-même ». Les conseils d’Amazon à partir de leur base de données maison sont largement dépassés. Ces techniques ouvrent la possibilité de construire un commerce personnalisé où produits, services ou même prix sont proposés selon le profil de chacun.

Mais la préservation de l’anonymat est toute relative et, par ailleurs même si ces sociétés disent ne pas faire de discrimination selon les genres, les profils ethniques, les handicaps qui tombent sous le coup de la loi, de tels profilages peuvent conduire facilement à des dérives éthiques. Ainsi, comme le titre de l’article l’indique, cette économie du web est limite.

5. Contextuel ou comportemental

Le dernier article est celui qui m'a le plus intéressé. Il s'appuie sur un document interne de la société, remue-méninges qui montre les hésitations de Google pour l'exploitation des données qu'il récolte sur les internautes face à la montée de la concurrence. De part sa domination du marché de la publicité en ligne, la position de Google est déterminante à la fois vis-à-vis de ses concurrents et aussi vis-à-vis de l'évolution de la réglementation que chacun sent proche.

La firme détient par son moteur la plus grosse base de données sur les intentions des internautes, mais a résisté jusqu'à présent à surveiller ces derniers sans leur consentement pour préserver son image. Le savoir faire de Google est d'abord contextuel, une expertise de traitement des textes, aussi bien les requêtes des internautes que les documents publiés sur le web et non comportemental, une connaissance des réactions des personnes. Cette dernière expertise est celle de FaceBook ou des jeunes firmes présentés dans les autres articles de la série. D'un côté une expertise linguistique, de l'autre une expertise sociologique. C'est aussi dans ce contexte que l'on peut relire le slogan « don't be evil », on peut chez Google manipuler les mots, pas les personnes. Les débats internes à Google sur l'utilisation des cookies par exemple sont très vifs et ne sont pas sans rappeler les débats de MSN présentés dans un autre article de la série. Dans les deux cas le dilemme est le même : comment préserver la culture de l'entreprise tout en faisant face à la concurrence ?

Une animation très claire, qui accompagne l'article, montre combien aujourd'hui les données engrangées sont nombreuses, recueillies par diverses services de Google et sont encore cloisonnées pour leur exploitation publicitaire. Reste que l'article ne dit pas à quoi servent l'important stock de données collectées en dehors d'une utilisation pour la publicité, par exemple par la barre d'outil de Google.

Suite notamment à l'achat de Double-Click en 2007, à la montée de la concurrence dont Facebook, il semble que la position de la firme a évolué sur le cookies. D'ailleurs, l'enquête déjà citée () montrait que Google est très présent dans la surveillance. Une stratégie pour sortir du dilemme par le haut serait de devenir une bourse d'échanges de données ou une régie de publicité comportementale ciblée.

Actu 24 septembre 2010

Voir aussi :

The convergence of Google, government and privacy - O'Reilly Radar, ici.

Actu du 7 octobre 2010

Comme prévu, la régulation va très très vite dans ce domaine :

“Publicité ciblée : les Américains aussi se mettent à l'abri - Etreintes digitales,” ici.

Actu du 13 octobre 2010

Conformément à l'esprit français dans la continuité de la CNIL, l'argumentaire est plutôt mis ici sur l'éthique et non sur le commerce. Deux références :

Le livre de D. Kaplan, présentation ici

La signature de chartes sur le droit à l'oubli : pour la publicité ciblée (ici) et dans les sites collaboratifs (). Signatures refusées par Facebook et Google.. entre autres.

Dans ce domaine, l'autodiscipline est peu efficiente, seule compte la norme comme le propose Helen Bissenbaum ().

Actu du 18 oct 2010

Le WSJ continue à creuser le même sillon en en faisant une rubrique régulière What they know ici et notamment cet article :

Julia Angwin et Steve Stecklow, “'Scrapers\' Dig Deep for Data on Web,” wsj.com, Octobre 12, 2010, ici .

Actu du 26 octobre 2010

Voir ce nouvel article sur une levée de fonds de la société Cloudera.

Actu du 27 octobre 2010

A suivre :

“Confidentialité : Google poursuivi en justice aux Etats-Unis,” Le Monde, Octobre 27, 2010, ici.

- page 11 de 38 -