Réponse à la consultation CoDesign Data.gouv.

fr
Nom : Chrzanowski Pierre [oui] Particulier [oui] Je souhaite la publication de ma contribution Adresse mail : pierre.chrzanowski@gmail.com Téléphone : Adresse postale [oui] Je souhaite être invité aux ateliers de travail

Pouvez-vous préciser brièvement les raisons votre intérêt pour l’open data : Membre de l'Open Knowledge Foundation France.

Introduction Cette réponse représente le point de vue de son auteur, pas nécessairement celui des autres membres de l'association Open Knowledge Foundation France. Au vue delà des améliorations techniques et fonctionnelles, que l'on peut déjà trouver sur d'autres plateformes Open Data, cet exercice de co-design représente une excellente occasion pour réfléchir plus généralement au rôle et à la place d'une plateforme dans une politique d'ouverture et de réutilisation des données publiques. Vous trouverez ci-dessous ma réponse à la consultation, ainsi qu'une brève réflexion sur les enjeux d'une plateforme nationale Open Data en guise d'introduction. Les enjeux d'une plateforme nationale de données publiques La France compte aujourd'hui un peu plus de 20 portails Open Data. C'est un résultat positif qui montre le dynamisme de l'ouverture des données publiques dans le pays, à tous les niveaux. Mais c'est aussi un chiffre qui doit nous interpeller : le portail est-il un outil indispensable dans une politique Open Data ? Nous sommes aujourd'hui dans une logique où ouvrir ses données signifie pour un territoire ouvrir son portail web. C'est une démarche légitime : la collectivité souhaite pouvoir valoriser son initiative Open Data en disposant d'outils qu'elle maitrise et qui lui permettront de communiquer avec ces administrés. Mais c'est une logique qui, bien souvent, néglige le contenu au profit du contenant. Dès lors, que pourrait apporter une plateforme commune à une politique nationale Open Data ? Une politique d'ouverture des données publiques est généralement bâtie autour de trois enjeux : innovation et création de valeur socioéconomique, amélioration des services publics et du fonctionnement des administrations, et enfin transparence et responsabilité de la gouvernance publique. Le postulat étant que ces secteurs bénéficieront grandement d'une circulation libre et d'une réutilisation intelligente de ces données publiques. Les politiques Open Data menées par notre

gouvernement et nos collectivités s'inscrivent, au moins dans les intentions, dans ce triptyque. Chacun agissant dans son périmètre de compétences. Dans ce contexte, une politique nationale de données publiques pourrait être considérée comme la gestion d'un système d'information d'un nouveau genre où l' « organisation » devient le territoire national, avec tous les échelons administratifs qu'il comporte, où les « acteurs » sont les administrations, les entreprises, les associations, les média, les citoyens, voire les acteurs étrangers, et où les « processus » sont remplacés par les « services publics » et toutes les activités participant au bon fonctionnement d'une société. Cette comparaison, très simpliste, devrait cependant nous faire réaliser qu'une plateforme Open Data n'est ni plus ni moins qu'un système de gestion de jeux de données qui intègre à la fois producteurs et ré-utilisateurs de données publiques. Ce n'est d'ailleurs pas sans raison que CKAN, le logiciel Open Source Open Data à succès, se définit comme un Database Management System (Système de Gestion de Données). C'est dans ce sens que nous devrions repenser data.gouv.fr. Nous avons besoin d'une plateforme ouverte qui soit capable de fédérer l'ensemble des données publiques disponibles en France, qui facilite leur circulation à travers un ensemble hétérogène et complexe d'acteurs, qui favorise leur réutilisation en offrant le meilleur niveau d'information associé et de mise en contexte, et qui enfin nous offre des outils pour publier et modifier ces données dans les standards, formats et qualités adéquates. Ainsi, comme toute plateforme, ce n'est pas le contenant mais le contenu qui fera de data.gouv.fr un succès, et qui permettra de faire émerger les succes stories qui pourront être valorisées en page d'accueil du site national, ou bien sur les autres portails locaux. Réponses au questionnaire Avant de répondre au questionnaire, je me permets de mentionner la liste des fonctionnalités présentes dans la dernière version de CKAN ( http://ckan.org/features/) qui nous offre déjà une première base riche d'inspiration pour la future version de data.gouv.fr.

1. Comment améliorer la collecte et la pertinence des données ? (Sourcing collaboratif, accueil de données crowd-sourcées, indexation collaborative, autres pistes ?) (a) Offrir des outils et processus de publication très simples pour les producteurs de données : ne pas négliger l'expérience utilisateur du producteur de données qui doit être égale à celle du ré-utilisateur. Guider le producteur de données à travers un environnement didactique : inscription sur la plateforme > validation de l'inscription > déclaration de la ressource > renseignement des métadonnées associées > téléchargement du jeu de données > conversion éventuelle du jeu de données dans le format adéquat > validation > publication. (b) Proposer des ressources pédagogiques pour les producteurs de données : un grand nombre de ces ressources existent déjà en libre accès. (c) Recenser les jeux de données disponibles sur data.gouv.fr: publier le jeu de données des jeux de données disponibles sur data.gouv.fr. (d) Recenser les producteurs de données sur le territoire français : publier un jeu de données recensant les administrations, organismes publics et autres opérateurs de services publics sur le territoire français. L'amélioration de ce jeu de données pourrait

2

se faire de manière collaborative via la mise en place d’un projet tel que publicbodies.org (e) Cartographier les données existantes mais non disponibles en Open Data : chaque ré-utilisateur potentiel a en général une bonne idée des données qui pourraient lui être utiles, mais pas nécessairement des administrations qui les produisent ou les collectent. Une cartographie des types de jeux de données et de leur disponibilité permettrait ainsi (a) de pouvoir consulter plus finement les ré-utilisateurs sur les jeux de données souhaitées et (b) d'établir des liens directs entre producteurs et ré-utilisateurs potentiels. Afin de définir les dimensions de cette cartographie, nous pourrions utiliser la typologie des données déjà accessibles ainsi que le recensement des producteurs de données. (f) Permettre une gestion de version des jeux de données avec suivi des modifications et corrections apportées. Permettre également pour les ré-utilisateurs de proposer des améliorations, à faire valider par le gestionnaire du jeu de données. 2. Comment faciliter la réutilisation et l’exploitation des données ? (Quel degré d’interprétation des données par Data.gouv.fr ? Transformation des formats ? Présentation s d’indicateurs, de tableaux de bords ? Datavisualisations ?) (a) Associer à chaque jeu de donnée un indicateur, à définir, sur sa qualité qui sera évalué par le producteur lui même. Autoriser également les commentaires sur le jeu de données par les ré-utilisateurs. Question également traitée dans les réponses 1.(c), (d), (e), (f) et 2. (a), (b). 3. Quelle doit êre l’expérience utilisateur sur le site ? (Expérience de recherche de données ? Accompagnement de débats de société ? Espaces collaboratifs ? Espace personnel ? Portail de la communauté open data ?) (b) Contextualiser la recherche : permettre la recherche de données suivant de multiples dimensions, parmi lesquelles : • couverture du territoire • producteur et/ou niveau administratif • dimension temporelle : historique, temps réel (période de maj), prévision, etc. • mots clés associés • typologie des données : statistiques, infrastructures, etc. (c) Favoriser la sérendipité : pour chaque jeu de données, lister les jeux de données associés en fonction des dimensions préalablement définies et des historiques de recherche des utilisateurs (à la manière d'amazon). 4. Comment favoriser la réutilisation et l’innovation à partir de la plateforme ? (Liste de ressources technologiques ? Annuaire de startups ? Outils pour les développeurs ? Exemples de réutilisations possibles) (a) Lister les réutilisations : permettre à chacun de publier son application, service ou autre réutilisation dans un catalogue disponible sur la plateforme. (b) Inspirer via les success stories : important travail éditorial et de narration

(storytelling) autour des succès de réutilisations en France mais aussi dans les autres pays. Partager et raconter les succès autour de l'open data en humanisant le propos et en ciblant différent publics. Faire participer la communauté open data, mais pas seulement. (c) Proposer une plateforme ouverte et innovante : répondre, dans la mesure du possible, aux exigences de la communauté pour la future version de data.gouv.fr et publier le code de la plateforme en open source (le cercle vertueux de l'innovation). 5. Comment mieux insérer data.gouv.fr dans le réseau des ressources open data ? (Annuaires des ressources nationales ? Liens avec fichiers complémentaires ? Autres pistes ?) (a) Fédérer les catalogues : travailler, par secteurs et avec l'ensemble des acteurs concernés, sur l'interopérabilité des catalogues et l'harmonisation des métadonnées, des licences, etc. Fédérer les jeux de données des autres catalogues sur la plateforme. La complexité du millefeuille administratif et les enjeux politiques doivent être transparents pour le ré-utilisateur. (b) Publier aussi les données au format linked data : alors que de plus en plus de données publiques sont disponibles en format linked data (cf http://lod-cloud.net/) et que de nombreuses entreprises, institutions et projets de recherche poussent la diffusion de ce format sur le web, il serait dommage de ne pas s’y préparer, voire d’en profiter. Parmi les promesses du linked data : une amélioration considérable de l'expérience de recherche et de la capacité à traiter des jeux de données décentralisés. Citons également la construction de thésaurus commun pour les administrations. 6. Comment construire un retour vers les administrations qui partagent leurs données ? (Enrichissement des données ? Créations de référentiels de coproduction avec les citoyens ? Autres suggestions ?) (a) Associer au jeu de données le contact de la personne ou de l'administration en charge de sa production, de sa collecte ou de sa publication. (b) Permettre d'associer les applications et services proposés dans le catalogue aux jeux de données utilisés, avec présence de rétroliens sur la page des jeux de données en question.

Autres remarques, suggestions...

4

Master your semester with Scribd & The New York Times

Special offer for students: Only $4.99/month.

Master your semester with Scribd & The New York Times

Cancel anytime.