L’ouverture des données favorise-t-elle l’économie ?
Par Jean-Michel Salaun le samedi 09 mars 2013, 04:18 - Cours - Lien permanent
Ce billet a été rédigé par Adam Sofineti et Marilyne Veilleux dans le cadre du cours Economie du document.
De nombreux arguments sont mis de l’avant pour justifier et expliquer
les bénéfices émergeant de l’ouverture des données. Bien que les
arguments politiques (démocratie, participation citoyenne, transparence,
etc.) soient plus souvent qu’autrement mis de l’avant, les arguments
économiques ne sont pas à négliger.
Ce court billet présentera en premier lieu quelques éléments essentiels à comprendre au sujet des données ouvertes. Par la suite, deux initiatives concrètes nées de l’ouverture des données publiques seront rapidement présentées, afin d’illustrer comment les données ouvertes stimulent l’innovation et permettent d’améliorer la vie quotidienne des citoyens.
1. Éléments à garder en tête
1.1. Donnée ou information ?
Ma situation géographique enregistrée dans mon téléphone intelligent, la vitesse de mes déplacements, la température extérieure, le nombre de citoyens utilisant les transports en commun, etc. : pratiquement tout ce qui nous entoure est « donnée ». Une donnée est, de par sa définition, brute. Elle n’est pas encore interprétée et c’est ce qui la différencie d’une information. En ce sens, une donnée est manipulable, interprétable, traitable et analysable, tandis qu’une information a été contextualisée et mise en forme. Par exemple, le fait que 74,61% des Québécois se soient rendus aux urnes en 2012 est une donnée brute qui n’a pas été traitée. Par contre, si je lis dans un journal qu’un plus grand nombre de Québécois ont voté l’an dernier que lors des élections de 2008, il s’agit d’une information : la donnée a été traitée et interprétée.
1.2. Donnée ouverte
Pour qu’une donnée soit considérée comme étant « ouverte », elle doit répondre à plusieurs critères d’ordres technique, juridique et économique : elle doit être disponible dans un format facilitant sa réutilisation, ses licences d’utilisation ne doivent pas restreindre son utilisation et la réutilisation de cette donnée ne doit pas engendrer de redevances qui pourraient constituer un frein économique pour le citoyen. À ce sujet, la ville de Montréal a adopté une liste de 10 principes de la donnée ouverte allant dans le même sens : les données ouvertes sont complètes, primaires, opportunes, accessibles, exploitables, non discriminatoires, non propriétaires, libres de droits, permanentes et disponibles à moindre coût (pour des définitions de ces concepts, visitez http://donnees.ville.montreal.qc.ca/demarche/dix-principes/).
1.3. Transparence et respect de la vie privée
Lorsque la décision de libérer des données est prise, la protection des informations personnelles est un enjeu de premier plan. Avant de publier des données publiques, l’institution détentrice doit s’assurer qu’elles sont bien anonymes. En ce qui concerne les données personnelles, l’accès à celles-ci ne doit être possible que pour l’individu concerné, via un portail web sécurisé.
Trouver l’équilibre entre la transparence et le respect de la vie privée est essentiel afin de préserver la confiance qu’éprouvent les citoyens envers leurs institutions. Ces deux aspects (la transparence et le respect de la vie privée) sont compatibles aussi longtemps que de bonnes structures de gouvernance sont en place. Pour plus d'information à ce sujet, nous vous recommandons de consulter le Open Data White Paper: Unleashing the Potential du gouvernement britannique.
2. Exemples d’initiatives
2.1. Handimap
Les données ouvertes de la ville de Rennes en France a donné lieu en 2011 à un concours nommé « Rennes Métropole en accès libre » (http://www.data.rennes-metropole.fr/) visant à récompenser les idées de services innovants utilisant les données publiques libres. Dans le cadre de ce concours, deux développeurs ont décidé de mettre leur connaissance de la cartographie en ligne en commun afin de créer un projet pouvant aider les citoyens atteints d’un handicap ou à mobilité réduite : Handimap (http://www.handimap.org/).
Le service du système d’information géographique (SIG) de la ville de Rennes gère un fichier recensant l'entièreté des emplacements de trottoirs surbaissés, données étant utilisées surtout dans le cadre de travaux d’aménagement. À l’aide de cette source et de d’autres données ouvertes disponibles, les deux ingénieurs en informatique ont créé ce nouveau service disponible en ligne, permettant de générer gratuitement des itinéraires adaptés aux individus à mobilité réduite. Cette initiative a, par la suite, été reproduite dans la ville de Montpellier.
2.2. Legislation.gov.uk
Legislation.gov.uk est un site web de données ouvertes créé par les Archives nationales qui facilite l'accès des citoyens britanniques à la législation en vigueur, entrant de ce fait directement en compétition avec les éditeurs commerciaux. Afin de maintenir le site à jour, des bénévoles sont formés par les rédacteurs afin d’acquérir les connaissances nécessaires. Ainsi, les données se trouvant sur legislation.gov.uk sont aussi récentes que celles des sites commerciaux. Dans un article publié sur le site Internet de The Law Society Gazette, le commentateur juridique Joshua Rozenberg invite justement les citoyens à se présenter comme bénévoles pour maintenir le site à jour :
« Ignorance of the law is, notoriously, no excuse. But the individual citizen has never had access to a free, up-to-date account of what the law is on any particular topic. Acts of parliament can be consulted in public libraries (if there are any left) but a printed copy is only the starting point: many acts do not specify a commencement date and the legislation, as passed, cannot tell you whether it has been subsequently amended or repealed.
That information is provided online by Westlaw UK and LexisNexis; but it comes at a price. The two legal publishers employ teams of researchers to update and annotate raw legislation as it arrives from parliament. If the Ministry of Justice did not buy subscriptions to these valuable services, even the judges would have difficulty keeping up.»
À première vue, le processus de publication semble être similaire à celui utilisé sur Wikipedia. Par contre, les conséquences peuvent ici s'avérer graves. Pour éviter les erreurs, chaque modification est révisée quatre fois avant d'être publiée.
Pour accéder aux données, l'utilisateur peut se servir du moteur de recherche afin de trouver une loi. Il peut ensuite télécharger la loi entière, ou seulement les sections qui l’intéressent (en ajoutant /data.xml ou /data.rdf à l'URL, par exemple). De plus, pour faciliter la réutilisation de ces données dans le cadre du développement de nouvelles applications, le site offre une interface de programmation (API). Fait important : ces données peuvent être réutilisées gratuitement sous l'Open Government Licence.
Grâce à ce site, les données ouvertes ont pu être utilisées pour créer plusieurs applications pour les téléphones intelligents (par exemple iLegal). Un service a aussi été créé afin d’aider les enseignants de droit dans leurs cours.
3. Conclusion
Dans le cas de Handimap, les données offertes par la voirie de la ville de Rennes et de la ville de Montpellier ont été reprises par un groupe de développeurs qui ont créé une application pour les citoyens handicapés. L'application mobile ainsi que sa version Web sont offertes gratuitement. Il s’agit donc d’un nouveau service pour les citoyens, qui n’implique aucun coût (autant pour les citoyens que pour les villes).
Pour ce qui est du site legislation.gov.uk, les jeux de données offrent une autonomisation des entreprises et des citoyens. Si, pour les entreprises, l’avantage principal de ces données demeure la création de produits et de services, pour les citoyens, il s’agit d’un accès à de l’information juridique à jour.
Il existe de plus en plus d’exemples d'utilisation des données ouvertes, qui sont les fruits des sociétés informatisées et des politiques des gouvernements ouverts. Bien que nous nous soyons limités à ces deux exemples, il serait intéressant d’exposer dans un billet ultérieur les avantages économiques des données ouvertes dans les pays en développement, ainsi que l’impact des données ouvertes internationales (données des Nations Unies, La Banque mondiale, etc.). La valeur démocratique et économique des données ouvertes ne fait plus de doute. Il ne reste que les administrateurs publics à convaincre.
Commentaires
Il est très intéressant de pouvoir créer des données réutilisables. Combien de fois avons-nous créé des bases de données qui ne se parlent pas entre elles et qui, avec le temps, deviennent désuètes à causes des logiciels utilisés pour les opérer. Les données ouvertes sont un pas en avant dans la construction d'une immense banque de connaissances toujours utilisables. Étant donné, d'ailleurs, que cela est en grande partie possible grâce à la contribution de bénévoles, je me demande s'il n'y a pas un lien à faire avec une plus grande quantité de jeunes retraités éduqués et en santé présents dans les pays occidentaux et l'émergence des projets de données ouvertes. Toute cette économie du partage dont nous parlons ne serait pas possible sans la disponibilité et les capacités de personnes prêtes à faire ce bénévolat.
J’ai bien apprécié votre billet. À propos des données ouvertes, le gouvernement du Québec par la voie d’une déclaration (http://www.donnees.gouv.qc.ca/inc/P...), s’engage à devenir un gouvernement ouvert « en encourageant davantage la transparence, la participation des citoyens et la collaboration entre les acteurs gouvernementaux. On peut voir le site sous le nom : Gouvernement ouvert : transparence-participation-collaboration(http://www.donnees.gouv.qc.ca/?node...). Suite aux nombreux scandales de fraudes et de corruption, les données ouvertes deviendront-elles un genre de pare-feu de bonnes intentions?
@Elaine
En effet, Tim Berners-Lee a initié le plan de cinq étoiles pour le déploiement des données ouvertes http://5stardata.info/. Selon ce plan, les données ouvertes liées représentent l’apogée de l’ouverture des données. Pour le moment beaucoup des jeux de données ouvertes sont loin de cette situation idéale, mais pour une institution, il est important de reconnaitre l’importance de l’ouverture des données et de s’engager même avec de petits pas sur ce chemin.
Concernant le bénévolat des retraités, tu as parfaitement raison. L’idée de les impliquer est tout à fait logique, après tout, certains d’entre eux ont créé ces données pendant leurs années de travail et leurs expériences sont des atouts précieux.
@Pascale
Cette semaine dans le Dévoir, Fabien Deglise http://www.ledevoir.com/societe/act... accuse le gouvernement du Québec de manipuler certaines de ces données. Il cite ces sources proches du dossier : « [...] pour le moment, à Québec, on est en train de confondre données publiques et données ouvertes. Les données publiques peuvent faire l’objet de mise en forme, de manipulation… Les données ouvertes, elles, doivent être brutes pour être crédibles. »
Je viens de tomber sur cet article de David Eaves sur la politisation de la collecte des données : Lies, Damned Lies, and Open Data | http://www.slate.com/articles/techn... Comme l'auteur remarque, l'ouverture des données est juste une étape dans une lutte continue pour un débat rationnel et une politique publique fondée sur des preuves.
En tant que citoyens, et spécialement en tant que fonctionnaires, nous devrons rester vigilants sur les intentions derrière le choix qu’une administration fait quant à l’ouverture des certaines données et la rétention des autres, ou sur carrément la négligence de les collecter.
@Elaine Comme l'a déjà répondu Adam, il y a un lien à faire entre l'implication bénévole et les données publiques ouvertes. Par contre, il faut garder en tête que les données ouvertes peuvent être utilisées, oui par des bénévoles, mais aussi par des organismes à but non lucratif, ainsi qu'à des organisations privées. Les entreprises peuvent être notamment intéressées à réutiliser les données économiques, commerciales, géographiques, ainsi que celles concernant les transports. Si ce sujet vous intéresse, le cabinet Bluenove a publié en 2011 une étude s'intitulant « Open Data: quels enjeux et opportunités pour les entreprises ? » (disponible en version pdf ici: http://mobile.bva.fr/data/actualite...).
Enfin, le secteur privé peut aussi participer au mouvement en « libérant » ses propres données, mais il est plus question de demi-ouverture des API. À ce sujet, vous pouvez consulter le billet « Pourquoi partager ses données quand la loi ne vous y oblige pas ? »: http://donneesouvertes.info/2012/06...
Tout ceci est très intéressant.
En lisant la deuxième initiative de votre texte, soit celle de Legislation.gov.uk, ça m’a fait pensé à un article que j’ai lu vendredi dernier qui relate que le gouvernement britannique se serait officiellement prononcé en faveur des données ouvertes allant jusqu’à dire que les formats propriétaires ne devraient être utilisés qu’en de rares occasion spécifiques. Cette une avancée intéressante qui influencera peut-être d’autres gouvernements. Vous pouvez lire l’article ici : http://www.computerweekly.com/news/...
Plus près de chez nous, il y a Québec Ouvert, une autre initiative intéressante, qui profitera d’une consultation sur la Loi de l’accès à l'information, débutant le 9 avril prochain, pour faire valoir l’accessibilité citoyenne aux données brutes, numériques et ouvertes. Québec Ouvert affirme que « les données ouvertes constituent un changement de fond dans notre société qui permettent d'aboutir à une démocratie plus ouverte, transparente et participative, où les citoyens peuvent s'impliquer plus directement et aider à résoudre collaborativement des problèmes de société ». Il est à noter qu’il existe plusieurs autres initiatives de ce genre comme Montréal Ouvert, Gatineau Ouverte, etc. Pour en savoir plus sur la plus récente initiative de Québec Ouvert : http://quebecouvert.org/article/pos...
Vendredi dernier, je suis tombé sur une autre initiative en lien avec l’accès ouvert des publications scientifiques dans un article paru dans Le Monde (http://bit.ly/Ydtg66). On y apprend qu’à l’été 2012, la Commission européenne émettait une recommandation quant à la publication en accès ouvert des résultats de la recherche scientifique financée par des fonds publics afin de renforcer la visibilité de la recherche européenne. On dit que les Universités ont un rôle clef à jouer dans ce débat, car « la diffusion des connaissances et des résultats de la recherche et leur communication auprès du plus grand nombre font partie de leurs missions ». L’article se termine avec des arguments en faveur de l’ouverture des données. Par exemple, on peut y lire que « l'accès privatif bride la dissémination des idées et est inadapté aux nouveaux paradigmes offerts par le numérique. Il est temps devoir dans le Web une formidable occasion dans le domaine de l'innovation, de la diffusion des savoirs et de l'émergence de nouvelles idées. Nous n'avons pas peur de l'accès ouvert. Sortir les savoirs des silos et des frontières des campus, c'est les ouvrir à tous, c'est reconnaître à la connaissance un rôle moteur dans nos sociétés, c'est ouvrir des perspectives d'enrichissement collectif ». Une communauté de responsables d'universités, d'enseignants-chercheurs, d'éditeurs et de responsables de bibliothèques prônent des arguments en faveur de l’ouverture des données et proposent à ceux qui adhèrent à cette vision d’aller signer la tribune ici : http://iloveopenaccess.org/
Force est de constater que l’ouverture des données alimente de nombreux débats.
Merci Marc pour ces liens! Je viens de signer la tribune d'I love open access.
Pour savoir plus sur les données ouvertes, et pour faire des nouveaux contactes dans ce domaine, je vous recommande de consulter le programme de la miniconférence Échange sur les données ouvertes http://odx13.com/. Il reste seulement 14 places, dépêchez-vous.
Si vous habitez la Rive Sud de Montréal, et les données ouvertes vous tiennent à coeur, s'il vous plait de me faire une signe. Il faut qu’on parle.
Magnifique billet! Difficile de dire plus, mais votre texte m'a rappelé un blog lu récemment qui était critique face à cette « nouvelle mode » des données ouvertes disant qu'il ne suffisait pas de mettre des «hackers» face à des données pour régler les problèmes de ce monde. Citation du texte : « Any data scientist worth their salary will tell you that you should start with a question, NOT the data. Unfortunately, data hackathons often lack clear problem definitions. Most companies think that if you can just get hackers, pizza, and data together in a room, magic will happen. This is the same as if Habitat for Humanity gathered its volunteers around a pile of wood and said, “Have at it!” By the end of the day you’d be left with a half of a sunroom with 14 outlets in it. » Article de blog : http://blogs.hbr.org/cs/2013/03/you...
@Catherine Je suis tout à fait d'accord avec la citation que vous nous faites parvenir et j'ai lu le billet avec intérêt. Par contre, il ne faut pas perdre de vue que les hackathon sont plus souvent qu'autrement organisés autour d'une problématique centrale sur laquelle réfléchir. Par exemple, Québec Ouvert a organisé un hackathon au mois de novembre dernier sur le thème de la lutte contre la corruption (http://quebecouvert.org/events/hack...). En gros, l'objectif était de réfléchir en groupe à l'utilisation des données ouvertes pour cibler la corruption et la combattre. Bref, un thème a été donné et les équipes ont travaillé sur cette problématique.
@Catherine J'ai oublié de vous mettre un lien très intéressant si vous êtes intéressée à la question des hackathon: http://donneesouvertes.info/2013/01...
Ce billet est très intéressant et nous permet d'envisager tout le potentiel des données ouvertes.
Pour avoir consulté de nombreux portails de données ouvertes (Royaume-Unis, États-Unis, Australie, Toronto, Montréal), je crois que c'est surtout l'aspect économique qui est mis de l'avant puisque les applications qui permettent de décortiquer les données doivent donner lieu à un retour d'investissement. Certaines données qui ne peuvent générer de profit ne sont donc pas analysées. La transparence, qui était l'un des principes de départ semble avoir été mise de côté. De plus, pour favoriser la transparence, je crois qu'il faudrait divulguer davantage que des données, par exemple des rapports internes, qui permettent d'avoir une vision plus complètent du portrait. Il est aussi triste de constater que le portail de la ville de Montréal ne soit pas mieux garni, étant donné qu'il existe depuis un certain temps. Les ressources financières ne comportent par exemple qu'un seul jeu de données.
@Marie-Claire Vous faites une excellente observation, en effet, souvent, les développeurs et les entreprises cherchent à créer des outils qui peuvent être vendus. Pour une administration, la création d'une application à partir de leurs jeux de données est interprétée comme un signe de succès. Il existe ce cercle vicieux dans lequel une administration peut tomber, en priorisant l'ouverture des données qui peuvent susciter l'intérêt des entrepreneurs, et de négliger d’autres jeux.
Pour éviter ce piège, les citoyens doivent demander l’ouverture de plus des données, et si les données cherchées ne sont pas collectées, de faire la demande en ce sens aussi.
À l’heure actuelle, un des problèmes qui doivent être résolus, pour le citoyen il n’est pas toujours évident à quel palier du gouvernement s’adresser avec sa demande.