Sur France Culture

En passant

J’étais invité dans l’émission de France Culture La Grande Table (animée par Caroline Broué) sur le thème « Où sont passés les nouvelles technologies dans la campagne ? » Il y a été question de politique numérique, de Twitter … et un peu d’open data, sortie du livre oblige ! Les échanges avec Christophe Carriou et Alban Martin sont à réécouter en ligne.

[Atelier] Comment parler des données ouvertes à des non-développeurs ?

Comment parler des données ouvertes à un public de non-développeurs ? Comment fournir les bases nécessaires pour mieux en saisir les contours, les enjeux et les limites ? Dans le cadre du séminaire Cultures numériques de Sciences Po Rennes, j’ai animé un atelier pratique qui visait à répondre, par l’exemple des données de mobilité,  à ces questions.

Une thématique : la mobilité urbaine

Le marquage au sol

J’ai choisi d’orienter cet atelier sur la thématique de la mobilité urbaine. En effet, ce thème occupe une place à part dans le domaine de l’open data :

  • les données liées à la mobilité et aux transports sont celles qui sont les plus demandées par les réutilisateurs-développeurs (tant en France qu’à l’étranger),
  • ce sont aussi celles qui font le plus souvent l’objet d’une réutilisation sous la forme d’applications mobiles, et ces dernières sont la « vitrine » la plus visible  de l’open data pour un public non-initié (voir notamment la part des applications transport dans les concours open data),
  • les confrontations entre les détenteurs et les réutilisateurs (tant professionnels qu’amateurs) préexistaient à l’open data mais se trouvent largement renforcées par le mouvement d’ouverture des données (les litiges ayant opposés la RATP ou JC Decaux à des développeurs ont alimenté la chronique),
  • enfin, le cadre juridique, technique et institutionnel est particulièrement complexe : les questions de mobilité concernent des acteurs publics multiples (à tous les échelons administratifs) mais aussi des acteurs privés (délégataires de service public ou opérateur privé hors délégation).
Le tableau des départs

Le tableau des départs

La séance réunit une vingtaine d’étudiants de Sciences Po Rennes, de l’Université Rennes 2 et de l’Ecole des Beaux-Arts. Elle débute par une question : « comment peut-on se déplacer aujourd’hui dans une ville comme Rennes ?« .

Les étudiants ont recensé plus d’une vingtaine de modes de transports différents, du métro au vélo individuel en passant par l’auto-partage ou le taxi-vélo. A mon grand étonnement, la voiture individuelle est citée en dernier dans cette liste. Faut-il y voir un signal faible ? Ou plus simplement le fait que posséder un véhicule reste un luxe pour nombre d’étudiants ?

L’information, l’autre carburant de la mobilité

Une information voyageurs

Une information voyageurs

On se pose ensuite la question de toutes les informations dont nous avons besoin pour utiliser un mode de transport, par exemple le bus : le plan du réseau, les horaires, la localisation des points de vente, le mode d’emploi du réseau (tarifs), l’information sur des déviations, des travaux ou des perturbations, … On recense ensuite tous les « lieux », physiques ou numériques, où l’on peut trouver cette information : aux arrêts bien sûr, mais aussi sur le site de l’opérateur du réseau de transport, dans les brochures et les guides papier, par SMS, en utilisant l’une des nombreuses applications mobiles (héritage du concours open data). On peut aussi – et c’est parfois le plus simple – interroger un ami, un membre de la famille, un inconnu ou le chauffeur à un arrêt de bus … L’objectif est ici de montrer que l‘information est aujourd’hui une composante essentielle de la mobilité dans sa diversité.

Les données : de quoi parle-t-on ?

J’introduis alors par un court exposé la différence entre une donnée et une information, une donnée publique et une donnée ouverte, … On évoque aussi les données collaboratives (par exemple les alertes contrôleurs sur Twitter, avatar numérique des appels de phares sur la route). Je propose par ailleurs des éléments de typologie, notamment pour distinguer les données statiques des données dynamiques.

La chasse aux données : la mise en pratique

Dans le kit : une photo du quartier

Dans le kit : une photo du quartier

Chaque groupe de quatre étudiants se voit remettre un kit et des instructions pour partir à la chasse aux données de mobilité dans un rayon de 300 mètres autour de la Cantine numérique rennaise. Le kit contient :

  • une photographie aérienne du quartier, proposée sur le portail open data de Rennes Métropole,
  • des gommettes de couleur, pour identifier chaque mode de transport : vélo/piéton, bus/métro, car/train, voiture, …
  • des instructions pour prendre une photo à l’aide d’un téléphone mobile / smartphone (nota : la plupart des étudiants en sont équipés : pas d’argent pour une voiture, mais du budget pour un téléphone… un autre signal faible ?).

Je n’ai pas choisi le quartier par hasard : il concentre un très grand nombre de modes de transport, les gares routières et ferroviaires, des stations de vélo en libre service, une station de taxis, de voitures en auto-partage, de métro, …

La mise en commun : ce qu’ils ont ramené de la chasse

Dans la gare

Les participants se retrouvent après 45 minutes pour faire une mise en commun de leurs découvertes. Chacun présente sa carte du quartier annotée et un court rapport d’étonnement. Ils ont recensé, localisé et décrit plus de 80 points correspondants à une donnée de mobilité dans le quartier: un panneau de signalisation, un temps d’attente à un arrêt de bus, la localisation d’un ascenseur accessible aux personnes à mobilité réduite, … J’ai reçu plus de 40 photos – qui servent d’ailleurs à illustrer ce billet. L’échange se poursuit autour de quelques questions-clés : qui produit ces données ? à qui et à quoi servent-elles ? sont-elles ouvrables ou peut-être même déjà ouvertes ? que pourrait-on imaginer avec ?

Mettre en lumière la complexité et les enjeux

L'état de fonctionnement de l'ascenseur du métro : une donnée ouverte

L’état de fonctionnement de l’ascenseur du métro : une donnée ouverte

L’exercice aura aussi permis de mettre en lumière quelques curiosités. Par exemple, dans la gare de Rennes il y a deux ascenseurs situés de chaque côté des escalators et séparés à peine de quelques dizaines de mètres. Celui de gauche relie la station de métro, le hall de la gare et l’accès au premier étage (où se situent les guichets et l’accès aux quais). Il est géré par l’exploitant du métro, Keolis Rennes (filiale de la SNCF) et son état de fonctionnement est une donnée ouverte – c’est à dire qu’elle est disponible pour la réutilisation via la plate-forme open data de l’opérateur.

Celui de droite est apparemment géré par Gares & Connexions (une autre filiale de la SNCF) qui ne fournit pas cette même donnée en mode ouvert. Si l’on cherche à développer un service en ligne pour l’accès des personnes à mobilité, la différence est très nette. Cet exemple, relevé par les étudiants, permet d’illustrer concrètement la complexité institutionnelle du sujet.

Une information dynamique

La gare routière, toute proche, révèle elle aussi l’enchevêtrement des acteurs qui produisent, gèrent, détiennent et potentiellement ouvrent des données liées à la mobilité. Les lignes interurbaines sont gérées sous la marque Illenoo (autorité compétente : le département), mais le lieu accueille aussi un service de transport par car de la Région Bretagne, et un service assuré par la SNCF… Le parking tout proche est pour sa part sous la gestion d’Effia.

Le taxi, parent pauvre de la donnée ouverte ?

Le taxi, parent pauvre de la donnée ouverte ?

Les étudiants ont par ailleurs noté qu’il est un service de mobilité qui ne fournit que très peu d’informations à ses usagers : les taxis. En effet à la station toute proche, l’information se réduit à deux numéros de téléphone, … On imagine pourtant que les systèmes de localisation et de dispatch qu’ils utilisent pourraient fournir des informations très précieuses pour les clients potentiels – par exemple le nombre de taxis présent sur la zone à un instant T, une indication de la durée d’attente moyenne, …

On constate que si la majorité des services de mobilité manient et utilisent des données (taxis y compris), peu les ouvrent encore pour en permettre une réutilisation par des tiers.

Une alternative : le crowdsourcing ?

Pour finir, une anecdote. Les étudiants avaient pour mission de prendre des photographies à l’extérieur mais aussi à l’intérieur des gares. Or, en raison du plan Vigipirate il est interdit de prendre de telles vues et l’un des groupes se l’est vu rappeler gentiment mais fermement par les forces de l’ordre en patrouille dans la bâtiment… L’idée d’une collecte par les usagers eux-mêmes (en mode crowdsourcing), comme réponse à la complexité institutionnelle, se heurte donc à de nouveaux obstacles…

Epilogue

Ce séminaire a été l’occasion de tester une version beta de cet atelier. Dans une prochaine édition, et avec plus de temps, nous pourrions imaginer prolonger cette chasse aux données sur des supports numériques, en abondant des services existants (Open Street Map) ou en construisant de nouveaux jeux de données concernant « toute la mobilité du quartier en données ouvertes »… A suivre.

Merci aux participant-e-s à cet atelier, à Christophe Carriou organisateur du séminaire Cultures numériques, ainsi qu’aux « invités spéciaux » Hugues Aubin et Sébastien Dupas (@instantarchi) pour les photographies.

Où est le marché de l’open data ?

« Tant que l’open data ne trouvera pas son modèle économique, il ne décollera pas » : combien de fois ai-je entendu cette remarque dans les débats autour de l’ouverture des données publiques ? Il faut bien avouer que la question du marché de l’open data – et d’un hypothétique retour sur investissement – cristallise les échanges entre les promoteurs de l’ouverture et les sceptiques.

Des applications

Ces derniers soulignent que les développeurs d’applications issues des concours sont rarement en mesure de rentabiliser leurs efforts (et accessoirement que l’on a trouvé le moyen de les faire travailler gratuitement). En face, les promoteurs du mouvement répètent, parfois comme un mantra, les chiffres publiés par la Commission européenne qui prédisent un avenir radieux à la réutilisation des données publiques.

Qu’en est-il vraiment ? L’open data est-il un marché ? Si oui, comment peut-on le mesurer et l’évaluer ? Quels en sont les bénéficiaires ? En un mot : à qui profite vraiment l’open data ?

Pour tenter de répondre à ces questions sur le marché de l’open data, je propose de regarder trois niveaux d’analyse : les données (la matière première), les usages (ce que l’on « produit » avec l’open data) et les acteurs (des détenteurs aux utilisateurs finaux en passant par les réutilisateurs de données ouvertes).

1- La donnée publique : une matière première, une « mine d’or » à exploiter ?

La Commission européenne s’est attachée depuis longtemps à mesurer le marché des informations publiques, notamment dans le cadre de l’évaluation de la directive de 2003.

L’étude MEPSIR (Measuring European Public Sector Information Re-Use) de 2006 participait de cette ambition. En dépit de la prudence affichée par ses auteurs, elle a connue son heure de gloire avec les débuts du mouvement open data en Europe. Il n’est guère de conférence, ou d’articles de cette époque où l’on ne cite pas les près de 30 milliards d’euros annoncés par MEPSIR.

Au-delà de la querelle des chiffres, il me semble incontestable qu’il y a un bien un marché des informations publiques. L’information juridique ou météorologique, le registre du commerce et des sociétés ou celui des immatriculations de véhicules : pour tout cela il y a une offre et une demande, des tarifs, des transactions – bref, en un mot un marché.

La nuance à apporter est que, à de très rares exceptions près, les données aujourd’hui « ouvertes » par les collectivités et les gouvernements ne sont pas celles qui faisaient l’objet de cette monétisation. Les horaires de bus (pour prendre un exemple d’une donnée qui est souvent réutilisée par les développeurs d’applications mobiles) ne sont quasiment jamais vendus. Ils sont proposés gratuitement au format papier, qu’il s’agisse des guides horaires ou même de ceux affichés dans les stations. De même pour les données statistiques de l’INSEE référencées sur le portail data.gouv.fr. Certaines données ouvertes localement, notamment géographiques, étaient parfois tarifées, mais en pratique elles étaient rarement vendues. C’est d’ailleurs le coût de la non-gratuité qui a joué en faveur de leur ouverture.

Il ne s’agit pas pour autant de dire que ces données n’ont pas de valeur, mais plutôt que leur valeur n’est pas monétaire.

2- Les usages : ce que produit l’open data

Le deuxième niveau d’analyse concerne les usages, ce que l’on fait avec les données ouvertes. On a tendance à penser que l’open data ne sert qu’à produire des applications mobiles, et à restreindre le modèle économique de l’open data à la seule vente de ces applications.

L’équation « marché de l’open data = somme des CA des éditeurs d’applications mobiles basées sur l’open data » est réductrice de deux points de vue. Une étude des revenus perçus par les développeurs d’applications vendues sur l’AppStore révèle un fonctionnement de marché proche d’une économie des « hits », semblable à celle des jeux vidéos. Quelques grands succès masquent le fait que nombre de développeurs parviennent difficilement à rentabiliser leurs investissements. Autrement dit, open data ou pas, il est aujourd’hui difficile de faire fortune avec une application mobile.

D’autre part, et il s’agit d’une précision importante, il y a beaucoup d’autres réutilisations possibles des données ouvertes. Dans mon ouvrage (« L’open data », Fyp Editions mars 2012), je propose de distinguer au moins quatre classes de réutilisations possibles :

  • la consultation : un internaute accède directement à une donnée en ligne, pour prendre une décision (quelle compagnie aérienne est la plus ponctuelle ?), recueillir une information (comment évolue les effectifs dans le collège de mon quartier ?), …
  • la médiation : les données sont retravaillées par un tiers pour les rendre accessibles au grand public, c’est par exemple le champ du datajournalisme ou de la visualisation de données,
  • l’application : un développeur utilise les données ouvertes pour construire et proposer un service ou une application mobile,
  • la réutilisation spécialisée : certaines données sont utilisées comme de la matière première qui rentre dans un process… ce sont des «intrants» pour des entreprises ou des organisations.

Ce dernier type de réutilisation mérite d’être détaillé, car il est souvent le plus méconnu.

L’un des fichiers techniques les plus populaires (en nombre de téléchargements) sur les plateformes open data concerne les nomenclatures des voies et les adresses. Pour le commun des mortels, ce fichier qui permet notamment d’associer une adresse postale (12, rue des Marronniers, Paris) à des coordonnées géographiques, ne présente guère d’intérêt. Mais pour les entreprises qui font du e-commerce, de la livraison ou tout simplement qui veulent requalifier leur fichier clients en fonction de critères géographiques, cette donnée a de la valeur.

Quelle compagnie aérienne est la plus ponctuelle ?

Autre exemple : si les indicateurs de qualité des transports, proposé par le Ministère de l’Ecologie, étaient disponible en données ouvertes, on pourrait imaginer qu’un site comparateur de prix de billets d’avion puisse intégrer dans ses résultats un indice de fiabilité ou de ponctualité des compagnies aériennes. Un vrai plus pour l’éditeur de ce site et pour les consommateurs aussi…

On pourrait multiplier les exemples de réutilisation spécialisée, notamment pour l’immobilier ou l’urbanisme (mesure de l’accessibilité d’un logement en transports en commun par exemple). Le point commun de ce type de production de l’open data, c’est qu’elle reste largement ignorée et sans aucun doute sous-estimée. Les réutilisateurs spécialisés ne participent pas aux concours open data, ils ne publient pas toujours le fruit de leur travail. Bref, ils restent bien souvent « sous le radar » des observateurs du marché.

3- Les acteurs 

Le dernier angle d’analyse du marché de l’open data concerne les bénéfices perçus par chacun des acteurs de l’open data, c’est-à-dire :

  • les détenteurs de données (Etat, collectivités mais aussi certaines entreprises qui opèrent des délégations de service public : Veolia, Keolis, Suez, …),
  • les réutilisateurs de rang 1 (ceux qui réutilisent la donnée brute),
  • les utilisateurs finaux.

Il y a pour les détenteurs de données un bénéfice direct : ils sont parfois eux-mêmes réutilisateurs de leurs propres données. A partir du moment où une donnée est facilement consultable ou interrogeable, par exemple via une interface de programmation (API), il devient possible de l’utiliser en interne, alors que nombre de données ne sont pas partagées au sein des organisations. Les entreprises qui se lancent dans l’open data ont d’ailleurs bien compris que cet usage interne est source de réduction des coûts et représente un potentiel d’innovation à explorer.

Concernant les acteurs publics, les principaux bénéfices sont indirects : retombées médiatiques (l’open data reste encore une affaire de pionniers), mise à disposition de services mobiles qu’ils ne peuvent ou ne souhaitent pas développer,, développement d’un éco-système favorable à l’innovation numérique sur leur territoire, …

Deuxième acteur de la chaîne, les réutilisateurs. Il est essentiel de comprendre et de prendre en compte leurs motivations car elles dépassent parfois la recherche du profit immédiat. L’enquête réalisée par Socrata aux Etats-Unis (Open Government Data Benchmark Study 2011) révèle qu’un peu moins de 3% des développeurs interrogés ont pour motivation le fait que leur service puisse être un jour profitable. La première motivation (pour plus de 40% des répondants) est que leur application puisse être utile au quotidien pour ceux qui l’utilisent.

La première motivation exprimée c’est «je veux faire un service qui soit utile».

Certains développent par jeu, pour l’apprentissage, pour acquérir de nouvelles compétences ou pour bâtir leur réputation. Ils ne rentabilisent pas leur travail directement, mais parfois les retombées indirectes peuvent être non négligeables (notamment parce qu’ils se font connaître, qu’ils développent des activités annexes ou qu’ils trouvent de nouvelles opportunités professionnelles). Ces derniers bénéfices sont d’ailleurs aussi souvent cités par les entreprises qui développent des services basés sur des données ouvertes dans le cadre de concours.

Il me semble que, à la lumière de la diversité des motivations exprimées, il y a sans doute de quoi repenser les critères de succès des démarches open data, plus axé sur l’utilité perçue par les utilisateurs finaux ou les retombées pour les réutilisateurs que sur les seuls revenus tirés de la vente d’applications.

Enfin : les utilisateurs finaux. Ils sont les bénéficiaires ultimes de l’open data, qu’ils consultent des données en ligne, y accèdent via des visualisations ou utilisent des applications et services.

« Our apps are whiz-kid certified »

On a beaucoup de mal à mesurer globalement les bénéfices qu’ils retirent de l’ouverture des données publiques, mais quelques exemples permettent de les entrevoir. Pour l’utilisateur d’une application transport, il s’agit d’abord d’un gain de temps (savoir quand arrive mon bus me permet de ne pas l’attendre à l’arrêt) mais aussi une incitation à utiliser les transports collectifs (ou le vélo en libre-service).

Toujours dans les transports, mais pour la voiture cette fois-ci : Nantes a ouvert un jeu de données concernant la disponibilité temps réel des places de parkings publics dans la ville. Ainsi celui qui utilise cette info (par ex. via une appli mobile) ne va pas tourner en rond dans la ville, perdre du temps, générer du trafic supplémentaire ce qui représente un coût tant pour lui que pour la collectivité dans son ensemble. On sait notamment que dans les grandes villes, une part non négligeable des automobilistes qui circulent à un instant T sont en fait des gens qui cherchent une place pour se garer…

Fait intéressant, nombre d’utilisateurs finaux ignorent jusqu’à l’existence même de l’ouverture des données et sont loins de se douter qu’elle puisse avoir un rapport avec le service qu’ils utilisent.

Il me semble que le marché de l’open data est donc déjà une réalité, mais que les bénéfices ne sont pas là où l’on pourrait les attendre le plus spontanément (ils sont plus indirects que directs, sans doute plus dans la réutilisation spécialisée que dans les applications). D’autre part, il est essentiel de reconnaître qu’une partie de l’ouverture des données publiques se situe hors-marché. L’économie de la contribution et l’approche par les biens communs sont tout aussi importantes que les mécanismes de marché pour comprendre la dynamique qui se met en oeuvre sous nos yeux.

Crédits photographiques : Rennes Métropole, Ministère de l’Ecologie et des Transports, Simon Chignard. Cet article est publié sous licence CC-BY-SA.

« L’open data », le livre bientôt en librairie

« L’open data, comprendre l’ouverture des données publiques »

(Simon Chignard, Fyp Editions – sortie le 29 mars 2012)

L'open dataLa donnée est au coeur du fonctionnement des institutions publiques, de l’Etat aux collectivités. Elle permet d’aider à la décision, d’évaluer les politiques mises en oeuvre ou de faire vivre les services urbains de notre vie quotidienne (transports, vie culturelle, économie, politique sociale, …).

L’open data consiste à mettre à disposition toutes les données publiques numériques non nominatives, ne relevant pas de la vie privée ni de la sécurité. Tout autant une philosophie de l’action publique qu’une pratique concrète, l’ouverture des données publiques a vue le jour dans les pays anglo-saxons. Déjà en France certains territoires et le gouvernement se lancent dans l’ouverture de leurs données publiques, transformant ainsi une contrainte légale (permettre l’accès à tous des documents administratifs) en une opportunité pour innover et favoriser la transparence.

Ce livre montre comme l’open data peut être source d’innovation tant pour les institutions que pour ceux qui réutilisent les données publiques, dans les domaines économiques, culturels et sociaux:

  • comment concrètement initier et animer une démarche d’ouverture de données publiques ?
  • comment utiliser ces données pour construire de nouveaux services, pour réinventer la relation entre citoyens et administrations, pour développer l’économie d’un territoire ?

Proposant à la fois des repères pour replacer l’open data dans le contexte français et une boîte à outils pour agir, l’auteur nous éclaire aussi sur les enjeux et les limites de l’ouverture des données publiques. L’open data peut-il vraiment permettre à chacun de participer aux affaires publiques « chaque jour et pas seulement le jour de l’élection » ?