Professional Documents
Culture Documents
BILAN DTAPE DE LA STRATGIE FRANAISE & PROPOSITIONS POUR EN FAIRE UN AXE MAJEUR DE CRATION DE VALEUR POUR LINDUSTRIE NUMRIQUE
MAI 2014
EDITO
LAssociation Franaise des Editeurs de Logiciels et Solutions Internet (AFDEL) suit de prs le dveloppement des projets Open Data en France et ltranger. An dassurer une veille performante sur ce sujet, une commission ddie runissant la fois les adhrents AFDEL et des acteurs majeurs de lOpen Data tels quEtalab, La Poste ou la RATP a t constitue en 2011. Si Invoke, diteur de logiciels reconnu pour son expertise dans le domaine du reporting rglementaire a choisi danimer cette commission, cest parce que nous sommes convaincus que louverture des donnes publiques reprsente un puissant levier de cration de richesse pour lindustrie du numrique. En prambule, flicitons-nous que lOpen Data connaisse en France un dveloppement aussi prometteur. Le nombre dinitiatives, la varit des jeux de donnes mis disposition et la rapidit de dploiement des projets fait en effet de la France un des leaders en matire dOpen Data. Ce dveloppement est en outre port par des initiatives publiques telles que la feuille de route du Gouvernement en matire douverture et de partage des donnes publiques, ou la mission dinformation du Snat sur lopen data et la protection de la vie prive . Autant de signes forts de la volont des pouvoirs publiques davancer rapidement sur ces sujets. Cependant, il ne faut pas perdre de vue quau-del de leur caractre gratuit, il est impratif que les donnes soient exploitables par le plus grand nombre pour rvler le potentiel de lOpen Data. Cela implique que ces donnes soient non seulement numriques et disponibles en ligne, mais galement organises via lutilisation de mta-modles standard et structurs tels que XML, XBRL ou JSON. LAFDEL formule donc des propositions damliorations qui visent notamment crer les organes de gouvernance ncessaires, homogniser les formats, mettre n au principe de redevance pour les donnes publiques et normaliser les API. Bonne lecture, Rmi Lacour, PDG Invoke, President Commission Open Data de lADFEL
SOMMAIRE
1. CONTEXTE RGLEMENTAIRE : LES VOLUTIONS BIENVENUES DU CADRE RGLEMENTAIRE 2. TUDE DE CAS OPEN DATA 2.1. TUDE DE CAS N1 : PLATEFORME DATA.GOV DU GOUVERNEMENT AMRICAIN 2.2. TUDE DE CAS N2 : PLATEFORME DATA.GOV.UK DU GOUVERNEMENT BRITANNIQUE 2.3. TUDE DE CAS N3 : PLATEFORME DATA.GOUV.FR DU GOUVERNEMENT FRANAIS 2.4. TUDE DE CAS N4 (COLLECTIVIT LOCALE) : VILLE DE RENNES 2.5. TUDE DE CAS N5 (ENTREpRISE pUbLIQUE) : SNCF 2.6. TUDE DE CAS N6 (EXpLOITANT pRIV) : NAVIDIS 3. SYNTHSE DES TUDES DE CAS
DES OBJECTIFS DONT LHTROGNIT FREINE LE PROCESSUS DOUVERTURE DES DONNES PUBLIQUES
6 8
8 9 10 11 12 13
14
15 15 15 15
N1
: DONNES TROp pEU pRCISES pOUR GNRER UNE INFORMATION VALEUR AJOUTE N2 : HTROGNIT DES DONNES pROpOSES ENTRE TERRITOIRES N3 : HTROGNIT DES FORMATS pROpOSS N4 : COT DACQUISITION DES DONNES SUpRIEUR AUX VENTES GNRES pAR LEXpLOITANT
4. PROPOSITIONS 5. ENQUTE DES DITEURS DE LOGICIELS 6. POUR ALLER PLUS LOIN 6.1. SITES OpEN DATA 6.2. TUDES SUR LOpEN DATA LA COMMISSION OPEN DATA A PROPOS DE LAFDEL LES MEMBRES DE LAFDEL
17 18 20
20 21
22 23 24
Cadre rglementaire
aux documents administratifs et la rutilisation dinformation publique Garantit toute personne laccs aux documents produits ou reus par lEtat, les collectivits territoriales et les autres organismes de droit public Procdure de recours au travers de la Commission dAccs aux Documents Administratifs (CADA) 1978 : Loi sur la libert daccs 2003 : Directive europenne sur la rutilisation des informations du secteur public Ensemble minimal de principes pour faciliter la rutilisation de documents publiques 2005 : Ordonnance relative la libert daccs aux documents administratifs et la rutilisation des informations publiques Application franaise de la directive europenne de 2003 Renforcement de la CADA 2011 : Proposition de modication de la directive 2011 : Dcret portant sur la cration de la mission Etalab Cration dun portail unique interministriel des donnes publiques
de 2003
Mesures contraignantes pour inciter les tats membres lancer/ renforcer leur politique Open Data
1980
1985
1990
1995
2000
2005
2010
2008 : Dveloppement des ides dOpen Government lors de la campagne prsidentielle de Barak Obama
2012 : Lancement dinitiatives Open Data par les collectivits territoriales Municipalits dAix-en-Provence, Angers, Bordeaux, Brocas, Chang, Coulommiers, Issy-les-Moulineaux, Toulouse, Le Mans, Longjumeau, Montpellier, Nantes, Paris, Rennes, Saint-Quentin et Versailles Dpartements de Gironde, Loire Atlantique, Sane et Loire Rgions Aquitaine, PACA etPays de la Loire
Le cadre rglementaire franais dni ainsi aujourdhui clairement : Une double ambition politique europenne et nationale qui consiste :
Mettre disposition des donnes publiques, en mettant laccent sur les donnes fort
impact socital (sant, ducation, etc.) et/ou fort potentiel.
(source : feuille de route Etalab)
Un dispositif de recours pour permettre aux citoyens daccder aux donnes publiques quils recherchent : Commission dAccs aux Documents Administratifs (CADA). Un portail unique interministriel (data.gouv.fr) de centralisation des donnes publiques de lEtat et de ses tablissements publics pilot par la mission Etalab. Le cadre rglementaire est en revanche plus ou sur plusieurs aspects : Les modalits de tarication de linformation fournie :
La directive europenne prconise que laccs aux donnes soit propos un tarif au
maximum quivalent au cot de collecte;
La feuille de route du Premier Ministre Jean-Marc Ayrault la mission Etalab prcise que
la mise disposition des donnes sur le portail data.gouv.fr doit se faire de manire gratuite;
Mais le mode de mise disposition gratuite des donnes ne semble pas ce jour faire
lunanimit parmi lensemble des projets Open Data. La nature et niveau de dtail des donnes communiques
La comparaison des donnes Open Data entre pays, rgions, communes est encore
aujourdhui difcile. Chaque organisation Open Data communique les donnes qui lui semblent tre les plus pertinentes.
2.1. TUDE
DE CAS N1
: PLATEFORME
Barack Obama a inscrit lOpen Data au cur de son programme lectoral en 2008, partant du principe que linformation dtenue par le gouvernement fdral est un bien national. Le portail Open Data amricain a ainsi vu le jour peu de temps aprs son lection, ds 2009, avec pour ambition de faire voluer les mentalits des agences fdrales en matire de transparence. Vritable succs en termes de volumes dutilisation (225 agences partenaires, 90 000 jeux de donnes, 350 applications citoyennes dont plus de 140 applications mobiles), la plateforme amricaine doit cependant faire face de nouveaux ds : Le maintien du service dans un environnement de restrictions budgtaires; Une implication htrogne des tats et des municipalits (39 tats et 17 villes participants) au 31/12/2013.
Illustration 2.1 : portail Open Data du gouvernement amricain
Les facteurs-cls de succs de linitiative amricaine ont t : Limpulsion forte du Prsident des Etats-Unis pour lancer le programme et inciter les agences fdrales communiquer les donnes dont elles disposaient; Lexistence de donnes publiques nombreuses et ables issues dune longue tradition de collecte de donnes publiques, mene par des agences disposant dune relative autonomie et de ressources importantes; Un tissu dynamique dentreprises et dentrepreneurs exploitant ces donnes des ns commerciales en proposant de nouvelles solutions et services. 8
2.2. TUDE
DE CAS N2
: PLATEFORME
DATA.GOV.UK DU GOUVERNEMENT
BRITANNIQUE
Dans la ligne de la plateforme amricaine, le premier ministre Britannique a lanc en 2010 son portail Open Data www.data.gov.uk. Vritable succs en termes de volumes dutilisation (1 140 organisations publiques partenaires mettant disposition 18 000 jeux de donnes, 150 000 visiteurs/ mois, 315 applications en ligne), la plateforme britannique se caractrise par : Une mise disposition gratuite de lensemble des donnes; Une forte adhsion des collectivits territoriales et des organismes publiques locaux (hpitaux, muss, universits...); Une faible homognisation du format des donnes mises disposition, gnralement dans des formats non-structurs ( lexception des donnes provenant du bureau national des statistiques).
Illustration 2.2 : portail Open Data du gouvernement britannique
Les facteurs-cls de succs de linitiative britannique ont t : Limpulsion forte du Premier Ministre David Cameron, Lobligation pour les administrations et organismes publics de publier le dtail de toutes les suprieures 25 000 , La mise disposition gratuite de lensemble des donnes.
2.3. TUDE
DE CAS N3
: PLATEFORME
Le site data.gouv.fr, pilot par la mission Etalab, directement rattach au premier ministre, a t lanc en 2011 dans la ligne des plateformes open data amricaines et britanniques. Dans un premier temps cantonn la centralisation des donnes publies par lINSEE, les ministres et par certains organismes publics, le site data.gouv.fr et la mission Ethalab ont dans un deuxime temps contribus : La formalisation et la communication de meilleures pratiques destination des oprateurs publiques (Vademecum de louverture et du partage des donnes publiques du 13 septembre 2013) La centralisation dun maximum de donnes publiques provenant non seulement de ltat mais galement :
Des entreprises et organismes publiques Des collectivits locales Voire des associations, mdias, et reprsentants de la socit civile
La cration et lanimation dune communaut open data pour :
Partager les expriences entre les utilisateurs et les contributeurs, pour commenter et
enrichir des jeux de donnes, et ainsi permettre une amlioration continue des donnes Au niveau technique, si le portail a pour vocation de proposer des dispositifs dAPI, les formats proposs sont eux largement inuencs par les demandes de la communaut.
10
2.4. TUDE
DE CAS N4
(COLLECTIVIT
LOCALE)
: VILLE
DE
RENNES
La ville de Rennes a t la premire mtropole franaise lancer une initiative de mise disposition des donnes publiques issues de son rseau de transport, de donnes gographiques municipales et dautres informations pratiques golocalises de 1 500 organismes publics et associatifs. La dmarche de ville de Rennes se caractrise par : La mobilisation des diffrents acteurs de la vie municipale (mairie, communaut urbaine, oprateur du rseau de transports); De multiples formats de donnes proposs; Un forum pour que les exploitants puissent dposer leurs messages / demandes; La mise disposition dune API par loprateur de transport (Kolis); La mise disposition gratuite de ces donnes.
De nombreuses initiatives dexploitation de ces donnes ont vu le jour. On compte ce jour un vingtaine dapplications (web et mobile) mises disposition par des dveloppeurs utilisant des donnes de Rennes Mtropole.
11
2.5. TUDE
DE CAS N5
(ENTREpRISE
pUbLIQUE)
: SNCF
La SNCF a lanc une dmarche Open Data oriente exploitants, dont lobjectif est de construire avec un rseau de partenaires innovants (dveloppeurs, designers, data scientists) de nouveaux services pour les voyageurs au quotidien. La dmarche de la SNCF se caractrise par : Des informations varies (horaires, quipements en gare, taux de remplissage des trains...); Une mise jour en live des donnes; Une plateforme dchange communautaire avec les exploitants pour collecter leurs suggestions sur les donnes mettre disposition; La mise disposition de deux API (interfaces de programmation); La mise disposition gratuite de ces donnes.
Les premiers bilans de cette initiative sont trs positifs avec la ralisation de plusieurs applications mobiles bases sur ces donnes tels que Tranquilien (remplissage des trains par wagon) ou Mobili (itinraire le plus adapt pour les personnes mobilit rduite) Deux des facteurs cls de succs de linitiative Open Data de la SNCF semblent tre : Lapproche collaborative avec les exploitants pour favoriser la mise disposition des donnes les plus pertinentes; La mise disposition gratuite des donnes adaptes aux modles conomiques des start-up exploitantes.
12
2.6. TUDE
DE CAS N6
(EXpLOITANT
pRIV)
: NAVIDIS
A lorigine, Navidis est un diteur de logiciels spcialis dans les solutions de cartographies interactives destination des collectivits et des entreprises. Face la multiplication des canaux de collecte dinformation valeur ajoute (notamment des donnes publiques), Navidis a lanc Navty, une plateforme permettant dagrger des contenus et de services golocaliss dhyperproximit. La dmarche de Navidis de se caractrise par : Lexploitation dune technologie propritaire de visualisation 3D La recherche du plus grand nombre dinformations intgrer dans la plateforme Navty (bonnes affaires par enseigne, rseau local de petites annonces, covoiturage dynamique, vide grenier permanant...) La participation des programmes publics dinvestissements numriques :
Projet City+ avec la communaut dagglomration Grand Paris Seine Ouest dans le
cadre du Grand Emprunt / Investissements dAvenir Ville Numrique
Projet de plateforme Cloud Computing EPIC (European Platform for Intelligent Cities)
destination des collectivits et en partenariat avec IBM et Deloitte
Projet Issy Grid pour la mise disposition ludique dinformation sur les rseaux dnergie
de la ville dIssy-les-Moulineaux
Illustration 2.6 : Utilisation de donnes Open Data par lapplication Navty
Les facteurs-cls de succs les plus notables du projet de Navidis semblent tre : La capacit proposer de manire conjointe une information traite provenant de projets Open Data (exemple : travaux sur la voirie) avec une visualisation 3D unique issue de la technologie de Navidis; La capacit collecter une diversit dinformations la plus vaste possible pour fdrer un cosystme de fournisseurs de donnes autour de la plateforme Navty. 13
3. SYNTHSE DES TUDES DE CAS : DES OBJECTIFS DONT LHTROGNIT FREINE LE PROCESSUS DOUVERTURE DES DONNES PUBLIQUES
LOpen Data est port par un double objectif : De transparence citoyenne; De levier de croissance pour les acteurs de lconomie numrique au travers de lexploitation de ces donnes. Les administrations et entreprises publiques qui produisent ces donnes vont donc tre naturellement portes sur le premier objectif, alors que les entreprises prives exploitant ces donnes vont se focaliser sur le deuxime objectif. Cette htrognit des objectifs poursuivis gnre des risques et des freins au dveloppement de lOpen Data quil est ncessaire dadresser. Il est par exemple essentiel de rduire le nombre des formats proposs.
Fournisseur de donnes Administration Objectif principal Transparence Ets publique Transparence Amlioration du service client Chiffre daffaires li la vente de donnes Citoyen Exploitants Toutes hors donnes sensibles Faible / moyenne Eleve pour les donnes gographiques Mixte : gratuit + vente des donnes proposes aux exploitants
Exploitants Ets prive / start-up Chiffre daffaires li proposition de services valeur ajoute partir des donnes publiques Clients potentiels
Risques Risque n1 : manque de prcision des donnes (frquence, dtails, homognit) pour gnrer une information valeur ajoute
Citoyen Toutes
Faible / moyenne
Modle conomique
Risque n2 : htrogDonnes porteuses de nit des donnes provaleur ajoute pour un poses par les diffrents client potentiel fournisseurs Eleve pour une majorit de donnes Risque n3 : htrogniporteuses de valeur t des formats proposs ajoute Risque n4 : cot dacVente des donnes quisition des donnes exploits ou des ux lis lexploitation des suprieur aux ventes donnes (ex: publicit) gnes par lexploitant
14
Un premier risque pouvant remettre en cause lintrt dun projet Open Data consiste communiquer des informations publiques un niveau trop faible pour gnrer des informations valeur ajoute. La thmatique transport du portail Open Data du Conseil Gnral de Sane-et-Loire constitue un bon exemple de ce type de risque : Le Conseil Gnral organise et nance les transports de voyageurs et les transports scolaires; A ce titre, le Conseil Gnral a ouvert une section Transport sur le site Open Data du Dpartement; Seule la localisation gographique de lensemble des arrts de bus de dpartement est mise disposition. En consquence, aucun exploitant externe nutilise ces donnes dans le but de proposer des services valeur ajoute. A linverse, si le Conseil Gnral mettait disposition des informations plus prcises (les horaires de bus, la capacit des bus, le taux de remplissage, les prix des billets....), des exploitants privs se seraient probablement manifests comme cela est le cas dans dautres territoires.
Un second risque consiste communiquer des informations diffrentes entre les projets locaux dOpen Data. Or pour dpasser lre artisanale, les start-up exploitant les donnes Open Data devront industrialiser leurs processus et dployer leurs applications sur plusieurs territoires. Cela ne sera possible quavec des donnes homognes entre les territoires.
La capacit collecter, intgrer, analyser et restituer les donnes issues de lOpen Data de manire automatise, industrielle est un pr-requis cl pour la ralisation dun certain nombre dinitiatives de valorisation conomique de ces donnes. Or cette capacit dindustrialisation des tapes de collecte passe galement par une homognit des formats de donnes. Le portail Open Data de la ville Rennes constitue ainsi un bon exemple de ce type de risque (cf. illustration 2.3): 16 formats de donnes sont utiliss; Suivant la nature des donnes (statistiques de frquentation, donnes nancires, donnes gographiques ou cartographiques...), un ou plusieurs formats sont proposs
Laccs aux donnes publiques franaises ncessite encore souvent le paiement dune licence. Etalab liste ainsi 13 administrations proposant 96 familles de donnes payantes. Les ministres
15
adoptent ensuite souvent un modle de tarication spcique en fonction des donnes quils commercialisent. Cette approche de donnes publiques payantes est issue dune poque o : Les principes de lOpen Data taient encore peu connus; Le principe adopt tait que les utilisateurs devaient contribuer au cot de collecte et de mise disposition de ces donnes. Deux volutions rendent aujourdhui cette approche obsolte. Premirement, le faible niveau de revenus gnr par les organismes publiques par la vente de ces donnes. Ainsi les 5 organismes ayant collect le plus de revenus au titre de la vente de donnes publiques sont : Mto France : 39 M (sur un budget total de 389 M) IGN : 16 M (sur un budget total de 166 M) INSEE : 9 M (sur un budget de 442 M) SHOM : 2M sur un budget de 68 M DGFiP : 1,2 M sur un budget de 8 451M Deuximement, le fort cot dopportunit. En effet, bien que faibles, les redevances daccs aux donnes publiques peuvent empcher lmergence de nouvelles activits conomiques innovantes bases sur : La cration de valeur ajoute partir dune compilation dimportants volumes de donnes; Lincertitude quant la russite du modle conomique bas sur la compilation de ces donnes publiques.
16
Des types de donnes mises disposition Des dimensions de dcomposition de ces types de donnes Des formats de donnes Des API proposes
Proposition n2 : Crer un organe de gouvernance de niveau europen, en charge de coordonner les initiatives Open Data nationales pour dnir et maintenir un rfrentiel commun (taxonomie) :
Des types de donnes mises disposition Des dimensions de dcomposition de ces types de donnes
Proposition n3 : Choisir un format dchange de donnes pivot pour la majorit des donnes de lOpen Data, bas sur la technologie XML
Format libre de tous droits Format permettant de structurer les donnes par sous-familles XML dj dotes de dictionnaires
de donnes Exemple 1 : sous-format XBRL pour les donnes comptables et nancires Exemple 2 : sous-format SVG pour les graphiques et images
Le maintien des rfrentiels de donnes doit tre ralis par les organes de gouvernance
proposs dans les propositions n1 et n2
La multiplication dAPI spciques par chaque fournisseur de donnes oblige les exploitants
se conformer de multiples protocoles, et rend plus lourd la maintenance des applications
Proposition n5 : Supprimer la notion de redevance pour les donnes publiques, ds lors que cette redevance na pas dimpact sur lquilibre conomique de lorganisme public producteur de ces donnes
Les modles de redevances de Mto Format ou de lIGN seraient ainsi prservs Mais les administrations telles que la DGFiP, le Ministre de lEducation Nationale ou la Direction
de lInformation Lgale et Administrative du Premier Ministre adopteraient le modle de la gratuit
17
Rponse des adhrents AFDEL la question : Pensez-vous que lOpen Data puisse tre un levier de croissance signicatif ?
15%
38%
23%
23%
31%
54%
15%
15%
54%
31%
38%
54%
8%
Trs important
Plutt important
Peu important
Pas important
Pour 53% des diteurs interrogs, lOpen Data est un levier de croissance important ou trs important pour leur entreprise dans les trois prochaines annes (85% long terme).
18
Rponse des adhrents AFDEL la question : Quelles sont les principales difcults rencontres lors de la collecte de donnes Open Data ?
33%
42%
25%
18%
55%
18%
9%
8%
58%
17%
17%
33%
25%
33%
8%
17%
17%
45%
25%
11%
22%
44%
22%
17%
58%
25%
Pour 75% des diteurs interrogs, il est difcile ou trs difcile daccder aux donnes et 58% dentre eux considrent que le manque dhomognit des formats est un frein important ou trs important lutilisation des donnes.
19
20
6.2. ETUDES
SUR LOpEN
DATA
Etat des lieux de lOpen Data en France rdig (nov. 2012) www.deciderensemble.com/travaux/etude
Avis du CNN sur la promotion des initiatives Open Data (juin 2012) http://www.cnnumerique.fr/wp-content/ uploads /2012/06/201206-05_ AvisCNNum _12_ OpenData.pdf
Proposition de directive du Parlement Europen et du Conseil sur la rutilisation des informations du secteur public (dc. 2011) http://ec.europa.eu/information_society/policy/psi/docs/pdfs/directive_ proposal/2012/fr.pdf
Etude de limpact dune baisse des redevances sur la rutilisation des donnes Open Data(sept. 2011) http://ec.europa.eu/information_society/policy/psi/facilitating_reuse/psigroup/index_en.htm
Rapport Graham Vickery sur le march de la rutilisation des donnes publiques (2008) www.umic.pt/images/stories/publicacoes6/psi_nal_version_formatted-1. pdf
Plan daction du gouvernement pour lapplication de la Charte G8 douverture des donnes publiques www.gouvernement.fr/gouvernement/plan-d-action-g8-sur-l-ouverture-desdonnees-publiques
16 propositions pour une politique nationale ambitieuse des donnes publiques (juil. 2011) www.ladocumentationfrancaise.fr/var/storage/rapports-publics/114000407/0000.pdf
21
22
A PROPOS DE LAFDEL
LAssociation Franaise des diteurs de Logiciels et Solutions Internet, AFDEL, a pour vocation de rassembler les diteurs et socits Internet autour dun esprit de communaut et dtre le porteparole de lindustrie numrique en France. LAFDEL est le reprsentant de la profession dditeur de logiciels et de services Internet en France.
Elle compte aujourdhui plus de 350 membres (CA global : 8,5 Mds) rpartis dans toute la France : grands groupes de dimension internationale dont les premiers franais (60 % du Top 100 France en CA), PME et Start-ups.
De statut loi de 1901, lAFDEL contribue au dveloppement de ses membres en dfendant les intrts de la profession, en organisant lchange des bonnes pratiques entre ses adhrents, en mettant leur disposition un ensemble de services ddis et en favorisant les synergies daction entre eux.
LAFDEL est membre de deux fdrations professionnelles, la FIEEC pour les synergies mtier et la CINOV au titre de la convention collective CINOV-Syntec. Elle participe ainsi la gestion de la convention collective Syntec-CINOV et de loffre de formation de branche. Elle participe galement aux travaux du Medef.
En rgion, lAFDEL sappuie sur le dynamisme des nombreux clusters avec lesquels elle a nou des partenariats dans lintrt de ses membres communs.
23
24
Le document de positionnement de lAFDEL sur louverture des donnes publiques (Open Data) est le produit des travaux de la commission Open Data de lAFDEL, prside par Rmi Lacour, PDG dInvoke, auxquel ont particip les entreprises membres de lAssociations. Coordination : Emmanuel Lempert Chef de projet : Pascal Malingue Design et communication : Fabrice Larrue et Justine Reverdiau
Association Franaise des Editeurs de Logiciels et Solutions Internet 11-17 rue de lAmiral Hamelin, 75016 Paris Tlphone : 01 49 53 05 89 Email : info@afdel.fr www.afdel.fr 25
26