Recherche

Recherche - wikipedia

samedi 09 mars 2013

L’ouverture des données favorise-t-elle l’économie ?

Par Jean-Michel Salaun le samedi 09 mars 2013, 04:18 - Cours

Ce billet a été rédigé par Adam Sofineti et Marilyne Veilleux dans le cadre du cours Economie du document.

De nombreux arguments sont mis de l’avant pour justifier et expliquer les bénéfices émergeant de l’ouverture des données. Bien que les arguments politiques (démocratie, participation citoyenne, transparence, etc.) soient plus souvent qu’autrement mis de l’avant, les arguments économiques ne sont pas à négliger.

12 commentaires

vendredi 14 septembre 2012

Nouveau régime de vérité, démonstration par l'absurde

Par Jean-Michel Salaun le vendredi 14 septembre 2012, 16:09 - Web 2.0

Décidément Wikipédia est un excellent marqueur des changements documentaires en cours et de leurs limites. La récente histoire autour de Philippe Roth, un des plus célèbres écrivains nord-américains, est pleine d'enseignements. C'est une sorte de démonstration par l'absurde, comme il en existe en mathématique.

On trouvera un résumé de l'histoire ici. Ph. Roth contestait la relation dans Wikipédia de l'inspiration du personnage principal d'un de ses romans, présentée par un critique et reprise dans Wikipédia. Pour cela, il a envoyé une lettre ouverte sur le New Yorker pour demander à l'encyclopédie d'effectuer la correction après que son agent ait échoué à corriger en son nom directement la rubrique, faute de pouvoir présenter de références crédibles. Aujourd'hui la rubrique est corrigée.

L'histoire de Philippe Roth s'énervant à corriger une erreur sur l'interprétation de son œuvre ne serait qu'une anecdote, parmi les très nombreuses discussions internes et externes autour des pages de l'encyclopédie, si le statut d'auteur du plaignant, le moyen employé et la réaction des wikipédiens n'éclairaient de façon éclatante ces changements en cours dans les régimes de vérité et leurs limites que j'ai déjà eu l'occasion souvent de pointer sur ce blogue ou ailleurs.

L'effacement de l'auteur

Le premier point à noter est que l'information produite par l'auteur sur son inspiration était jusqu'à présent inédite (ou presque, il en avait fait allusion dans une interview), contrairement à la spéculation du critique citée dans Wikipédia qui avait été publiée, elle, dans un journal reconnu et reprise ensuite par d'autres. Dès lors, la demande de correction n'a pas été jugée digne de foi selon les règles même de Wikipédia, car non référencée. Et les corrections du biographe autoproclamé (sic) de l'auteur ont été effacées par des éditeurs chevronnés de l'encyclopédie, qui ont au contraire surligné la version jugée erronée par l'auteur de la nouvelle (voir la discussion ici).

Aujourd'hui la rubrique de Wikipédia est corrigée sur la foi de la lettre publiée par Ph. Roth. Toujours selon les règles de Wikipédia, la précision sur l'inspiration est maintenant "sourcée", c'est à dire qu'elle peut-être validée par une référence publiée. Les règles de rédaction de Wikipédia sont très claires à ce sujet : Les articles de Wikipédia devraient reposer principalement sur des sources secondaires fiables. Toute utilisation de sources primaires devrait s'appuyer sur des sources secondaires, et ne pas être une sélection, analyse, synthèse ou interprétation inédite réalisée par un contributeur de Wikipédia. Les sources primaires seules sont acceptées si elles consistent en des assertions factuelles et non sujettes à interprétation ou polémique.

La lettre ouverte de Ph. Roth n'est pas un simple accès d'humeur. Il s'agit d'un long texte, précisant dans le détail les tenants et les aboutissants de son inspiration et pourquoi l'interprétation précédente était erronée. L'ampleur de l'argumentaire montre que Ph. Roth a pris très au sérieux la documentation de son œuvre, au-delà de l'agacement qu'il laisse poindre.

Mais, comme le fait remarquer un Wikipédien dans la discussion autour de l'article incriminé (trad JMS) : Le plus génant pour moi est d'avoir considéré que Roth n'était pas une source valide. Et oui, je comprends l'aspect préventif de la différence entre des sources primaires et secondaires. Mais seul Roth peut parler de ses propres motivations. Pour n'importe qui d'autres, cela relève d'une simple spéculation. Et la spéculation ne devrait pas faire partie d'un bon article d'encyclopédie.

Il s'agit ainsi bien d'une démonstration par l'absurde du nouveau régime de vérité représenté par Wikipédia. Il est, en effet, absurde de considérer qu'un auteur ne soit pas la meilleure source pour éclairer son inspiration, mais, en même temps, la règle défendue par l'encyclopédie est sa garantie contre des intrusions intempestives non contrôlables. On ne saurait mieux illustrer que Wikipédia, et sans doute le web en général, se trouve à la fois dans la continuité d'une tradition documentaire et en même temps peut-être dans une bascule de notre régime de vérité. Son fonctionnement repose sur l'accessibilité des documents et leur valeur n'est construite que par leur inter-relation. J'ai déjà montré combien cette logique était à la base même du développement du web et combien Wikipédia y jouait un rôle décisif (par ex ici).

Cette logique entre en contradiction avec la polarisation sur l'auteur et sur la création des deux derniers siècles, y compris dans la science. Elle retourne notre relation au savoir qui devient le résultat d'une interrogation contrôlée d'un patrimoine documentaire accumulé et donc seulement de façon indirecte le résultat de la découverte d'un travail créatif, d'un inédit, d'une invention. La création n'est plus au centre, elle fait place au partage. En réalité, création et partage sont depuis toujours les deux piliers de l'avancement du savoir dans une société. Mais depuis au moins deux siècles l'accent a été mis dans les sociétés occidentales sur la création qui a été particulièrement valorisée. Le web insiste à l'inverse sur le partage, jusqu'à, comme le montre l'histoire de Ph. Roth, contester la parole du créateur.

Ainsi on voit grâce à l'absurdité de cette situation que le dialogue de sourds entre les défenseurs du droit d'auteur et les tenants du partage a des racines plus profondes que la simple dénonciation de logiques marchandes, rentes indues ou prédations illégitimes. Même si les appétits marchands brouillent les pistes, derrière ces incompréhensions se cache aussi, et peut-être surtout, une transformation de notre rapport au document, considéré comme soit comme le résultat d'une création, soit comme un patrimoine.

Les limites de l'attention

La seconde leçon de cette petite histoire est la question, souvent mal comprise, de l'économie de l'attention, et ici sa fragilité. La garantie de la qualité de Wikipédia est dans la sagesse des foules, ou plutôt de la multitude pour reprendre un mot à la mode, puisque sa correction est laissée sous la surveillance de chacun. Mais on oublie souvent que l'économie de la multitude repose sur l'attention. Pour Wikipédia, la garantie de qualité dépend du bon fonctionnement de la chaîne attentionnelle des différents acteurs concernés par la production de l'encyclopédie. Et l'encyclopédie a mis en place des mécanismes efficaces pour pallier cette difficulté, mais au risque de réduire "la multitude" à un petit nombre de contributeurs investis d'un pouvoir éditorial radical, comme nous allons le voir.

Remarquons, d'abord, que l'allusion, maintenant contestée par Ph. Roth, à l'inspiration de la nouvelle ne date pas d'hier sur Wikipédia. Elle était présente depuis longtemps, précisément depuis octobre 2005 (ici) et n'a été relevée par l'auteur qu'il y a quelques jours. J'ignore comment son attention a été attirée, mais on peut penser que le rôle de plus en plus important joué par Wikipédia dans le monde scolaire a pu jouer dans sa volonté de correction de la rubrique.

Plus révélateur, est le scénario de la correction manquée :

Le 20 août la première correction est faite par un internaute avec ce commentaire : I have removed the reference to Anatole Broyard, at Philip Roth's insistence. I am his biographer (j'ai retiré la référence à Anatole Broyard sur l'insistance de Philip Roth, je suis son biographe).
Une minute après, un éditeur de wkp remet le texte initial avec pour commentaire Can you verify that? (Pouvez-vous le vérifier ?).
Vingt minutes plus tard. La correction est renouvelée avec ce nouveau commentaire : Once again, I removed the reference to Anatole Broyard. It is wholly inaccurate and therefore pointless. I am Roth's biographer, and have removed it at his request. (Une nouvelle fois, j'ai enlevé la référence à Anatole Broyard. C'est tout à fait inexact et donc sans objet. Je suis le biographe de Roth et j'ai fait cette correction à sa demande).
Six minutes après, un autre éditeur de wkp remet de nouveau le texte initial et ajoute de nouveaux détails pour confirmer l'inspiration de la nouvelle par le personnage d'A. Broyard. Cet éditeur prendra deux heures de son temps pour cette rédaction. Comme l'indique le wikipédien qui relate l'histoire : cet éditeur a du se prendre pour un vrai détective !

Le timing est plus intéressant encore que le contenu de l'échange. Les éditeurs de Wikipédia sont intervenus en un temps record, alertés sans doute par les robots qui repèrent les corrections. Cette précipitation, doublée d'une référence brutale à des règles inconnues de l'internaute néophyte, décourage l'argumentation. Face à une telle surveillance et radicalité, il est peu probable que quiconque ait le goût d'insister.

Mais Ph. Roth a de la suite dans les idées. Il est assez logique alors que, constatant l'échec de son autorité d'auteur (confirmé dit-il par un échange de courrier) non reconnue par l'encyclopédie, il ait préféré changer de terrain et choisir un lieu où justement sa qualité n'était pas contestée, une revue traditionnelle, pour faire valoir son point de vue.

Cette histoire souligne doublement les limites de l'économie de l'attention sur le web. La vulgate commune de la sagesse des foules voudrait qu'une sorte de main invisible de l'attention de la multitude régule la valeur sur le web. Les éléments les plus pertinents seraient mis en avant par le jeu des interactions des internautes.

On constate d'abord que Wikipédia a mis en place une organisation qui, de fait, courcircuite cette logique grâce à un petit nombre d'éditeurs bénévoles appuyés par des robots. Ensuite, l'encyclopédie évite les pièges de l'auto-édition ou des stratégies de référencement des activistes du web en s'appuyant sur le modèle éditorial traditionnel pour ses références.

Si l'on ajoute que Wikipédia devient, lui-même, une référence sur le web et ailleurs, et même pour la construction du web de données par DBpédia, l'histoire de Philippe Roth n'a pas fini de nous faire réfléchir.

16-09-2012

Pour un procès à charge contre Ph Roth par un wikipédien :

« Philip Roth and Wikipedia, Non-Commercial Use », 15 sept 2012 .

La charge montre surtout, à mon avis, l'écart entre les deux mondes, aussi radicaux et sûrs de leur bon droit l'un que l'autre.

8 commentaires

mercredi 06 juin 2012

Web de données, Google, Wikipédia, les liaisons dangereuses

Par Jean-Michel Salaun le mercredi 06 juin 2012, 10:07 - Moteurs

Voici un nouveau billet pour montrer combien les avancées techniques et commerciales du web peuvent se lire au travers de la grille de la théorie du document et que celle-ci permet de souligner des impensés ou des non-dits. Cette fois je prendrai deux illustrations reliées : le web de données et la dernière annonce de Googlle, le Knowledge Graph.

Le web de données

Tim Berners-Lee dans une prestation, bien connue de la petite histoire du web, a prôné la mise à disposition libre des données, pour réaliser ce qu'il appelle le web de données, après avoir renoncé à l'appellation "web sémantique". Dans cette conférence de février 2009 à TED, je retiendrai pour mon propos le passage soulignant le rôle joué par Wikipédia (à 8mn 25s), et notamment cette diapositive.

L'image devrait éveiller quelques souvenirs aux bibliothécaires. Wikipédia, en effet, réalise une opération qui s'apparente au cataloguage, plaçant dans des champs des données descriptives du document principal pour construire une sorte de répertoire bibliographique, DBpédia, même si ici les champs sont moins formalisés que ceux des catalogueurs.

L'homologie est encore plus surprenante si l'on se souvient que P. Otlet, un des premiers théoriciens du document, avait lui-aussi proposé la réalisation d'une encyclopédie dans son rêve de cataloguer tous les documents du monde. On peut le vérifier, par exemple, sur cette image tirée de son livre testament (p.41) et bien connue des lecteurs de ce blogue :

Pourtant, il existe une différence radicale entre le projet de P. Otlet et celui de T. Berners-Lee. La documentarisation s'est déplacée. Pour le premier, l'enjeu est de récolter les documents pour les cataloguer, et l'encyclopédie n'est qu'un aboutissement, en réalité une utopie qui ne sera jamais vraiment opérationnelle. Pour le promoteur du web, cet objectif est atteint. En effet, les documents sont déjà en ligne, repérables par les moteurs de recherche, mis en place par la première étape du web. Mieux l'encyclopédie est aussi déjà là et s'enrichit dans une dynamique continue selon la logique de la seconde étape du web (Wikipédia est une figure emblématique du web 2.0).

L'enjeu est alors différent, conforme à l'évolution de la société - nous ne sommes plus à l'époque du triomphe de la science positive. Il s'agit de reconstruire des documents à partir des requètes des internautes en se servant comme ossature logique des données récoltées notamment dans l'encyclopédie et aussi dans d'autres bases coopératives comme Freebase. DBpédia est considérée par les chercheurs comme un noyau pour un web de données ouvertes. Tim O'Reilly, l'inventeur de l'expression Web 2.0 souligne pour sa part que Freebase constitue le pont entre l'intelligence collective issue de la base du web 2.0 et le monde plus structuré du web sémantique (ici trad JMS).

Nous sommes toujours dans une sorte de cataloguage, mais les métadonnées ne servent plus à retrouver un document, "libérées", rendues interopérables et traitables par les logiciels du web de données, elles se détachent de leur document d'origine pour se combiner et produire de nouveaux documents, nous dirons des néodocuments. A cet ensemble premier, peut alors se relier nombre de bases de toutes natures, libérées elles-aussi, mais ordonnées grâce à l'ossature initiale. Ci-dessous la version de sept 2011 du graphe ainsi constitué (voir ici pour naviguer dessus)

L'encyclopédie Wikipédia est un outil privilégié pour construire l'armature de ce nouvel ensemble car elle a vocation à être neutre et universelle. Tout se passe comme si les wikipédiens avaient catalogué les entrées de l'encyclopédie en ligne et que la mise en réseau de cette classification universelle pouvait autoriser la construction d'un nouveau monde documentaire, celui du néodocument servant sans doute moins à transmettre et prouver, comme son ancêtre, mais plus à échanger et convaincre dans une relation utilitariste.

Et en trichant un peu, on peut modifier et compléter alors le tableau de P. Otlet pour bien signifier la continuité historique de la logique documentaire du web, y compris pour ses applications les plus contemporaines. Peut-être que d'autres, plus doués que moi en graphisme, auront le plaisir de développer les pictogrammes...

Le Knowledge Graph

Google a annoncé tout récemment l'intégration d'une dimension sémantique dans son moteur de recherche, baptisée Knowledge Graph (communiqué, pour une présentation rapide en fr voir Abondance, et une analyse voir Affordance). La firme fait ici un pas important vers le web de données.

Le principe du service est de proposer parallèlement aux réponses traditionnelles aux requêtes (liste de liens vers des documents pertinents récupérés par le PageRank), des informations construites à la volée donnant des éléments de contexte et, le cas échéant, la réponse elle-même. Google a indiqué qu'il avait soigneusement retravaillé son algorithme pour puiser des informations dans des bases de données comme Freebase ou Wikipedia afin de donner du contexte aux mots. (Les Echos).

Là encore, la continuité avec l'histoire documentaire est manifeste. Déjà comme l'indique Tim Berners-Lee lui-même, Google avait permis au premier web de devenir une bibliothèque : dès le développement du Web, ses détracteurs ont souligné qu’il ne pourrait jamais être une bibliothèque bien organisée, que sans base de données centrale et sans structure arborescente, on ne pourrait jamais être sûr de tout trouver. Ils avaient raison. Mais la puissance d’expression du système a mis à la disposition du public des quantités importantes d’informations et les moteurs de recherche (qui auraient paru tout à fait irréalisables il y a dix ans) permettent de trouver des ressources. (citation extraite de l'article qui lance le web sémantique, trad fr ici). Avec ce nouveau service, Google reconstruit à la volée un néodocument correspondant au contexte de la requête et l'affiche sur la page de réponse. Il participe ainsi directement à la suite de l'aventure, le web des données ou le web 3.

L'avenir nous dira quel sera l'intérêt et le succès de ces néodocuments, qui remplaceront sans doute quelques documents traditionnels et ouvriront peut-être aussi d'autres avenues. Mais avec l'arrivée de Google dans le paysage du web de données, il est déjà possible de pointer un non-dit de cette aventure. Pour cela l'analyse en trois dimensions du document (vu, lu, su) est éclairante. J'ai déjà eu l'occasion de dire que les trois étapes de l'histoire du web privilégiaient chaque fois une des dimensions : la forme, le repérage, le vu avec le premier web, celui du document ; le medium, la transmission, l'échange, le su avec le web 2.0, celui du partage ; le sens, le contenu, le lu avec le web de données, l'ex-web sémantique. Tim Berners-Lee et ses collègues du W3C se sont surtout intéressés aux webs 1 et 3, considérant le 2 comme simplement une extension naturelle du 1 et repoussant les questions sociales dans les dernières couches logicielles du ''cake''. Pourtant le carburant économique du web, nous le savons, est bien dans l'économie de l'attention, c'est-à-dire dans la deuxième dimension.

Déjà dans le premier web pris selon cette dimension, Google et Wikipédia n'étaient pas sans connivence (ici). On peut même prétendre que sans Google, Wikipédia n'aurait pas eu le même succès et que sans Wikipédia, Google n'aurait pas eu la même saveur. Mieux, la tentative de Google de construire sa propre encyclopédie a tourné court, comme si le succès de la coopération dans Wikipédia impliquait l'affichage du désintéressement. Les deux services sont alors complémentaires, fondant un écosystème au sens fort du terme basé sur l'économie de l'attention.

Il est un peu tôt pour savoir ce que donnera le nouveau service de Google en termes documentaires, mais on peut déjà avoir une petite idée de son impact sur l'économie de l'attention. Comme l'explique O. Andrieu sur ''Abondance'', Il semble déjà que l'impact sur le nombre de requêtes soit important. Il ajoute : Cela est logique dans le sens où le "Knowledge Graph" propose de nombreux liens concernant l'objet de la requête et de l'"entité nommée" détectée. D'ailleurs, cela pourrait clairement être à l'avantage de Google : l'internaute tape une requête sur la page d'accueil du moteur, obtient les résultats du Knowledge Graph, reclique sur les liens de recherche proposés, etc. Bref, autant de possibilité d'afficher des Adwords pour Google et autant de clics publicitaires potentiels !. De plus le processus tend à réduire l'impact des stratégies de référencement des sites au profit de l'achat de mots-clés, ce qui est doublement profitable pour Google. Inversement, il tend à faire monter dans les réponses les rubriques de Wikipédia...

Pour illustrer l'importance du changement, voici trois requêtes faites sur Google.com, telles qu'elles apparaissent en plein écran sur ma machine. Le néodocument généré automatiquement se trouve sur la droite. Le lecteur conclura de lui-même.

29 juillet 2012

ITW d'Emily Moxley, responsable du Knowledge Graph chez Google :

« How Google Organizes the World: Q&A With the Manager of Knowledge Graph ». ReadWriteWeb, 26 juil 2012 .

Extraits (trad JMS) :

ReadWriteWeb: Quel est l'objectif de Google avec le Knowledge Graph ?

Emily Moxley : Il s'agit de cartographier le monde réel en quelque chose que les ordinateurs puissent comprendre. Cela consiste à prendre des objets du monde réel, à comprendre ce que sont ces choses et quelles sont les choses importantes à leur sujet, ainsi que leurs relations à d'autres choses. C'est la partie que je trouve la plus fascinante : Quelle est la relation entre toutes ces différentes choses ? (..)

RWW: Comment les choses sont ajoutées au Knowledge Graph ? Apprend-il de noueaux concepts des usagers ?

EM: Il est actualisé très activement par les employés de Google. Avant, Metaweb (JMS : qui a développé Freebase, rachetée par Google) était cette base d'entités et de faits et les employés de cette société utilisaient beaucoup leur intuition sur ce qui importait pour les usagers et sur quelle information aller chercher. Depuis qu'ils ont été rachetés par Google, Google dispose de tous ces usagers cherchant de l'information,(...) Google sait que les gens qui cherchent une chose en cherchent aussi d'autres. Ainsi on peut voir des relations intéressantes en regardant les sessions agrégées des usagers. Une des prochaines étapes est effectivement d'expliquer ces relations fortuites. Qu'est-ce qui est semblable à ce groupe d'acteurs ? Qu'est-ce qui explique dans ce film que les gens le recherche souvent avec ces cinq autres ? (..)

RWW: Est-ce que travailler avec des sources de données extérieures comme le CIA World Factbook ou Wikipedia, est plus compliqué que travailler avec les données de Freebase ?

EM: Il y a un vrai défi avec les sources de données externes, c'est la correspondance (reconciliation). Même en interne, nous venons d'acheter Metaweb il y a deux ans, et nous avions déjà une énorme quantité de données dans certains domaines, les données des livres et cartes locales sont les principaux. Ces deux étaient bien plus importants que Freebase. Ils disposaient de beaucoup plus d'entités et d'informations. Les faire correspondre à la nouvelle organisation des données fut un gros défi. (..) Ce n'est pas plus difficile avec des éléments extérieurs qu'internes.

RWW: Mais devez-vous corriger des choses ? Comment choisissez-vous si c'est plutôt le CIA World Factbook ou Google qui a raison ?

EM: Volontairement, nous essayons de nous en tenir à des choses définitivement vraies - factuelles - pas des choses sujètes à spéculation ou opinion, et nous faisons des erreurs du côté des faits. Aussi si cela est sujet de controverse, nous pourrions décider de ne pas le montrer (dans la Knowledge box). (...)

Avec Knowledge Graph l'objectif est différent (de la recherche classique). Il s'agit d'obtenir une information le plus rapidement possible, mais aussi de vous donner des informations que vous ne saviez même pas que vous recherchiez. (...)

9 août 2012

La présentation officielle en vidéo du KG. Cela va très vite, la recherche par image a été intégrée.

30 août 2012

Il semble que les infos de profil de Google + soient intégrées maintenant :

3 commentaires

mardi 17 janvier 2012

Les femmes lisent (des livres), les hommes écrivent (sur le web)

Par Jean-Michel Salaun le mardi 17 janvier 2012, 19:45 - Socio

Le DEPS a publié une très intéressante synthèse de ses enquêtes sur les pratiques culturelles, reprenant notamment l'analyse générationnelle déjà initiée :

Olivier Donnat, « Pratiques culturelles, 1973-2008, Dynamiques générationnelles et pesanteurs sociales », Culture études DEPS Ministère de la Culture et de la Communication, nᵒ. 7: 2011. Pdf

Il est utile de la compléter avec l'étude de l'Insee sur la gestion du temps des Français :

Layla Ricroch et Benoit Roumier, « Depuis 11 ans, moins de tâches ménagères, plus d’Internet », INSEE Première, nᵒ. 1377 (novembre 2011).

Forte des données régulièrement collectées, l'étude d'O. Donnat est très documentée et confirme bien des tendances esquissées dans une précédente publication sur la baisse tendancielle de la lecture traditionnelle, la montée de l'audiovisuel et le succès de la musique enregistrée, ainsi que le rôle particulier des sorties et des pratiques amateurs. Mais intégrant les données de 2008, elle permet de souligner ce que l'on pressentait : le poids des pratiques numériques sur les plus récentes générations. Tout cela conduit O. Donnat à écrire :

Aussi l’évolution des pratiques culturelles doit-elle être appréciée d’un double point de vue difficilement conciliable : le premier souligne la permanence d’une forte stratification sociale des pratiques culturelles et confirme la pertinence des schémas théoriques articulés autour de la notion de capital culturel, tandis que le second met en lumière la force des mutations générationnelles, rappelant que les formes de la domination culturelle, loin d’être éternelles, se renouvellent en liaison avec les transformations de la structure sociale, des conditions d’accès à la culture et des modes d’expression artistique.

Pourtant la leçon la plus nouvelle de mon point de vue, et la plus dérangeante si on la met en regard avec les pratiques actuelles sur le web, est l'accentuation et l'orientation des différences sexuées dans les pratiques culturelles et tout particulièrement pour le livre.

Les femmes ont aujourd’hui un engagement plus fort dans le monde du livre que les hommes dans tous les milieux sociaux, à la fois parce qu’elles sont plus nombreuses à lire quand elles sont jeunes et qu’elles résistent mieux à la diminution du rythme de lecture qui accompagne l’avancée en âge. Cela se traduit par exemple sur ce schéma.

Livre_HF-DEPS

Pour la fréquentation des bibliothèques, le constat va dans le même sens. Les jeunes femmes sont les principales contributrices de la progression constatée à l’échelle nationale. (..) Plus nombreuses à suivre des études et plus souvent en charge des activités culturelles périscolaires des enfants quand elles sont mères de famille, elles ont largement profité, au moins jusqu’à la fin des années 1990, des effets d’offre et de la diversification des services proposés (ouverture aux supports audiovisuels, développement de l’édition pour la jeunesse, etc.).

Du côté de l'Insee, on constate : Le temps domestique quotidien, resté stable chez les hommes, a diminué chez les femmes, en particulier chez celles qui n’ont pas d’emploi (une demi-heure de moins par jour depuis 1999). Cette évolution confirme et prolonge la baisse observée entre 1986 et 1999. L’écart entre les hommes et les femmes s’est donc réduit, mais demeure : il est d’une heure et demie par jour.

Et surtout, on observe un écart important en faveur des hommes pour le temps passé devant l'ordinateur (hors travail), quel que soit l'âge :

Maintenant si l'on s'intéresse aux internautes les plus actifs sur le web, la situation devient caricaturale. Parmi de nombreux exemples (communauté du libre, bibliosphère, entreprises du NASDAQ, etc.) prenons celui de Wikipédia. Selon une enquête réalisée en 2009 par la fondation, 68% des lecteurs et surtout 87% des contributeurs sont des hommes !

Une interprétation déprimante du croisement de ces tendances soulignerait que les unes investissent les activités de distinction délaissées par les autres qui s'installent sur les lieux de pouvoir de demain... Provocation de ma part sans doute, et pourtant, est-ce un hasard si la question, rarement posée, reste sans réponse ? Il est troublant de lire sur Wikipédia à la rubrique Le genre et Wikipédia, sous l'affirmation Les femmes sont minoritaires dans la communauté Wikipédia :

9 août 2012

Infographic: Wikipedia's Gender Gap Exposed

6 commentaires

mardi 16 février 2010

L’économie des liens de/à Wikipédia

Par Jean-Michel Salaun le mardi 16 février 2010, 19:32 - Cours

Ce billet a été rédigé par Antonin Boileau dans le cadre du cours SCI6355 sur l'économie du document de la maîtrise en sciences de l'information de l'EBSI.

Le 15 janvier passé a été marqué par les réjouissances d’un important segment de la population internaute : les contributeurs et organisateurs de l’encyclopédie libre Wikipédia ont célébré le « Wikipedia Day » , qui correspond à la date de création de la première version (américaine) de l'encyclopédie en 2001. C’est donc le neuvième anniversaire de Wikipédia que fêtaient ses participants avec des rassemblements organisés à New York et à Bangalore durant le mois de janvier.

Le projet de l’encyclopédie est devenu assez bien connu du public, mais qu’en est-il de son aspect économique ? Il semble que trop souvent les observateurs et critiques concentrent leur attention sur le débat des notions de savoir ou d’autorité dans le contexte du Web. De fait, cette saturation de la bande au niveau de « l’économie de la cognition » de Wikipédia, laisse en plan les autres économies qui lui sont constitutives, soit celles de « l’attention » et du « don ». Je reprends ici les bases de recherche jetées par Jean-Michel Salaün dans un billet de 2007 sur ce même blogue, où il a positionné Wikipédia au carrefour de ces trois dimensions économiques.

Je profite donc de ce billet invité pour attirer l’attention sur la façon dont l’économie de l’attention et l’ouverture au Web plus large marquent le déroulement du projet de l’encyclopédie libre.

Il me paraît utile de rappeler tout d’abord comment Wikipédia s’insère dans l’une des économies de l’attention les plus importantes du Web actuel, celle de Google :

La blogosphère et la communauté du Web 2.0, toutes 2 en croissance exponentielle, génèrent de mois en mois un nombre de liens toujours plus colossaux vers les pages de Wikipedia. Le Pagerank de ces pages montent en proportion et les amène dorénavant en 1ère page des résultats des résultats organiques de Google: faites l'essai avec un ensemble de noms communs sur Google.com. (2007)

Ce billet du blogue de Didier Durand veut expliquer la présence presque constante de Wikipédia dans les premières (voire la première) pages de résultats du très connu moteur de recherche. D’autres commentateurs abondent dans ce sens, certains allant jusqu’à associer la montée en visibilité de l’encyclopédie au travail de référence par hyperlien d’une myriade de blogues et autres petits sites, qui de leur côté ne jouissent pas réciproquement des liens externes de Wikipédia. En effet, par une décision controversée de la direction de la Wikimedia Foundation en 2007, il est accolé aux liens sortants de l’encyclopédie un attribut HTML (rel="nofollow") qui assure l’absence de ces liens dans le calcul Pagerank de Google . Cette initiative, l’une de plusieurs prises dans le contexte de la lutte contre la récupération publicitaire (spamming) subreptice du projet, a été l’objet de plusieurs discussions au sein de Wikipédia en vue d’arriver à un consensus.

Mais si Wikipédia ne renvoie pas un peu de sa visibilité sous la forme de Pagerank aux sites externes, et lutte officiellement contre l’emploi de ses espaces d’édition à des fins promotionnelles, l’encyclopédie ne parvient tout de même pas à se garder complètement de participer dans une économie de l’attention aux multiples débouchés commerciaux. Dans un article du magazine Forbes, Don Steele, représentant la chaîne de télévision américaine Comedy Central, décrit Wikipédia comme l’un des principaux attracteurs de nouvelle clientèle pour le site Web de l’entreprise, avec plus de 250 pages de l’encyclopédie dédiées à une seule de leur série télévisée.

(Dans un article plus récent, Forbes relève l’existence d’un projet en cours d’essai chez Google visant à introduire des liens vers Wikipédia aux côtés de certains articles sur Google News. S’agit-il là d’un nouvel affront du moteur californien aux médias de la nouvelle écrite ?)

Dans une même ligne d’idée, on peut isoler d’autres instances de liens sortants de Wikipédia qui profitent à certains intéressés : plus de 20 000 liens vers les wikis de Wikia, l’annuaire Web commercial associé à Jimmy Wales et faisant affaire avec Adsense, la régie publicitaire de Google ; plus de 200 000 liens vers la banque de données cinématographique Internet Movie Database (acheté en 1998 par Amazon, qui est aussi un des appuis financiers de longue date de Wikia).

Malgré les mesures contre la promotion commerciale et l’autopromotion, Wikipédia n’est donc pas imperméable aux effets de la résonance induits par la popularité d’un produit ou d’un service. Si la couverture « encyclopédique » en paraît biaisée, je dirais que c’est davantage le fait de la résonance des pratiques internautes au niveau de la représentation de services Web externes au sein de Wikipédia, que du fait d’infiltrations opportunes par quelques agents mercantiles (qui existent néanmoins, exemple ).

8 commentaires

« billets précédents - page 1 de 4

Economie du document (Bloc-notes de Jean-Michel Salaün)

Recherche - wikipedia

L’ouverture des données favorise-t-elle l’économie ?

Nouveau régime de vérité, démonstration par l'absurde

L'effacement de l'auteur

Les limites de l'attention

Web de données, Google, Wikipédia, les liaisons dangereuses

Les femmes lisent (des livres), les hommes écrivent (sur le web)

L’économie des liens de/à Wikipédia

À retenir

Catégories

Liens

Cours Ecodoc

Master Archinfo (ENS)

Maîtrise SI (EBSI-UdeM)