Archivistique et Cloud computing
Par Jean-Michel Salaun le lundi 19 mai 2008, 06:30 - Socio - Lien permanent
L'expression consacrée pour le calcul parallèle est maintenant Cloud computing. Elle renvoie à une technique informatique ancienne visant l'amélioration de la performance des machines pour de très gros calculs scientifiques, mais elle est aujourd'hui appliquée pour notre communication et documentation ordinaire grâce aux centres de données mis en place par les firmes comme Google ou Amazon dans le cadre de leur activité.
Christian Fauré vient de prononcer une intéressante conférence à l'association Ars Industrialis sur le sujet. Il faut passer au-dessus de la tentative un peu agaçante de vouloir enfermer le propos dans une pensée globalisante, qui est le péché mignon de cette association pilotée par B. Stiegler. Je ne suis pas sûr, par exemple, que la théorie des coûts de transaction soit applicable à ce phénomène et encore moins d'A. Gramsci et son intellectuel organique aient vraiment un rapport, pour parler d'auteurs que je connais un peu. Néanmoins le propos de C. Fauré est important pour la thématique de ce blogue, très important même. Il rejoint des constatations faites par François Bourdoncle, responsable d'Exalead, entendues à la journée d'études évoquée dans le précédent billet.
Christian Fauré, La gigantomachie autour des data centers, 17 mai 2008, Vidéo (je n'ai réussi qu'à avoir le son sur ma machine)
La puissance des centres de données des firmes s'adressant au grand public, alliée à la facilité pour l'utilisateur (ergonomie, rapidité..) des outils documentaires et de communication disponibles tend à externaliser l'activité documentaire des organisations. Chacun peut en faire l'expérience quand il utilise Gmail ou Yahoo! plutôt que la messagerie mise à sa disposition par son organisation, ou quand il préfère un de leurs services partagés pour un travail collectif. Les demandes des utilisateurs, habitués à la facilité des outils qu'ils ont expérimentés dans leur vie quotidienne privée et dans leur loisir, sont de retrouver le même confort sur leur poste de travail. Or cette puissance de calcul est hors de portée de chaque organisation prise individuellement et les outils internes ne peuvent rivaliser avec ceux mis à disposition gratuitement par des firmes qui se rémunèrent sur un autre marché, en particulier celui de la publicité.
Toute organisation est confrontée à ce phénomène, y compris les universités où les étudiants, les chercheurs et les professeurs, font suivre leur courriel dans leur boite Gmail, ouvrent des blogues ou des services partagés pour leurs travaux à l'extérieur des services informatiques à leur disposition. Bien sûr cela pose des problèmes de confidentialité, mais l'essentiel est ailleurs.
Comme le souligne C. Fauré, l'organisation elle-même se trouve menacée, comme si des morceaux essentiels de son activité lui échappait de plus en plus. Il s'agit ni plus ni moins de ce qui la cimente : sa communication et sa mémoire. J'ajouterai pour ma part que le problème est d'abord archivistique, au sens québécois des archives intégrées. Les archivistes jusqu'à présent étaient confrontés avec le numérique à une explosion quantitative et qualitative, mais elle ne remettait pas vraiment en cause leurs principes fondamentaux. Ils font face avec ce phénomène à un défi beaucoup plus grand. Comme les bibliothécaires avant eux qui ont vu leurs fonctions principales s'externaliser (collection, traitement, accès..). les archivistes voient à leur tour les documents leur échapper.
Il y a là une réflexion à mener d'urgence et des pratiques nouvelles à inventer. Selon que l'on est optimiste, on dira que l'archiviste sera celui qui sauvera l'organisation de son éclatement documentaire en lui permettant de ne pas perdre sa mémoire vive et à long terme, ou pessimiste que l'archivistique va s'éclater et ses compétences se diluer avec l'organisation elle-même.
Actu du 20 mai 2008
Voir le billet de D. Durand sur l'investissement de MS dans le domaine :
Cloud computing: microsoft monte sur le nuage avec 100+ millions de boîtes à lettres Exchange pour 2012, Média & Tech, 20 mai 2008. Ici
Actu du 21 mai 2008
Repéré par le compte-rendu de Virginie Clayssen (ici), voir l'excellente synthèse :
Naugès Louis, Web 2.0, “On the cloud” : mais où ?, 13 avril 2008,. Là
et en suivant les liens, suite à la question d'A. Pierrot en commentaire :
Koomey Jonathan G., ESTIMATING TOTAL POWER CONSUMPTION BY SERVERS IN THE U.S. AND THE WORLD, Final report, February 15, 2007. Pdf (pas encore lu)
Actu du 31 mai 2008
Repérés par F. Pisani (ici) qui en fait une lecture un peu superficielle, deux articles de presse sur le sujet :
Down on the server farm, The Economist, 22 mai 2008. ici
Thompson Bill, Storm warning for cloud computing, BBC-News, 27 mai 2008. Là
Actu du 7 juin 2008
Repéré grâce à H. Le Crosnier, cet article ancien mais révélateur :
Stephen Baker, “Google and the Wisdom of Clouds,” BusinessWeek: magazine, Décembre 13, 2007, ici.
Commentaires
Une réflexion parmi tant d'autres : est-ce que tout ce qui est produit dans une organisation se vaut? Est-ce que tout ces documents produits méritent d'être sauvés? Il y a évidemment une quantité d'informations qui se perdent en soi dans cette fuite vers d'autres outils "gratuits" et disponibles sur le Web. Je pense qu'avant d'y voir le début d'un gouffre dans lequel s'enfonce la mémoire, il faut savoir de quoi se compose la mémoire. De toute cette information ou des pratiques pérennes et des informations abouties et cohérentes?
De toute cette démultiplication des canaux de communication, il est important de cibler ceux par lesquels la mémoire des organisations s'en va véritablement.
Qu'est ce qu'une "archive intégrée"?
Bonjour Aline,
Le rôle de l'archivistique est justement d'évaluer documents et informations pour sélectionner ceux et celles qui méritent un traitement documentaire en vue d'une réutilisation et d'une éventuelle conservation. Le problème posé par l'évolution décrite dans le billet est que si la maîtrise des outils informationnels échappent à l'organisation, ce travail archivistique risque de ne plus être réalisable ou alors qu'il échappera lui aussi à l'organisation.
L'archivistique intégrée traite globalement des documents actifs, semi-actifs et historiques. Elle a été développée principalement au Québec, elle suppose une intervention de l'archiviste en amont, au moment même de la production des documents et non simplement, comme dans l'archivistique française, en fin de cycle de vie.
À propos du cloud computing vs. calcul parallèle :
il me semble qu'il y a lieu de réfléchir au niveau de connectivité que l'Internet Protocol (IP) permet pour la répartition de la puissance de calcul et du stockage.
Certes, les consommations électriques et leur contrepartie énergétiques sont à prendre en compte. Mais la “logique de concentration industrielle” répond-elle à une nécessité, ou à une prise de contrôle des flux en concentrant le fonctionnement du réseau sur un plus petit nombre de noeuds, à la faveur de la vogue des terminaux mobiles connectés par intermittence, dont les clients légers et OS simplifiés ne proposent pas les fonctionnalités de relais disponibles en standard sur les ordinateurs personnels ?
Les frais de constitution, d'entretien et de rentabilisation des infrastructures de distribution d'énergie et de transmission des packets d'information vers les utilisateurs répartis sur l'ensemble de la planète subsistent, et le bilan écologique des dispositifs mobiles alimentés par batteries, changés tous les deux ans me paraît mériter un examen sérieux.
Bonjour Alain,
La nécessité n'est pas vraiment une notion en économie, on raisonne plutôt en intérêts.
La concentration des firmes répond à la structure d'un marché d'intermédiaires où les externalités sont fortes. Autrement dit les internautes ont intérêt à se trouver sur les réseaux les plus fréquentés et ces réseaux doivent comprendre le plus de documents possibles. À cela s'ajoute que la valeur est créée par l'attention, autrement dit la vitesse de réaction du système est très importante. Très grand nombreX2 + vitesse = besoin fort en puissance de calcul. D'où des investissements très lourds en centres de calcul qui deviennent en retour de fortes barrières à l'entrée.
Enfin la concentration réduit les coûts de transaction en réduisant le nombre d'acteurs dans la négociation. Mais la puissance de calcul permet aussi de très importantes économies dans ce domaine où le calcul remplace la discussion sur les prestations et leur tarif.
La conférence de C. Fauré montre que cette position prise sur le marché grand public déborde par contagion sur le marché du travail et alors des problèmes nouveaux apparaissent car une organisation vit aussi par son système d'échange d'informations et de documents.
Le bilan économique et énergétique global n'est en effet pas évident. Mais s'est-on posé sérieusement cette question au début de l'automobile ? Sans doute, avec le réchauffement de la planète les consciences sont plus affutées. C. Fauré donne des chiffres impressionnants à ce sujet. Je ne sais d'où il les a précisément tirés.
Bonjour Jean-Michel,
Voir aussi ce billet : nauges.typepad.com/my_web...
A suivre, en partie en rapport avec cette thématique, le blog tout juste ouvert du projet du JISC Preservation of Web Resources (jiscpowr.jiscinvolve.org/... qui examinera notamment les questions de records management, et dont l'un de membres déclare: "A particular area of interest to me is what preservation means in a Web 2.0 environment in which organisations may be making use of third party Web sites."