« Tant que l’open data ne trouvera pas son modèle économique, il ne décollera pas » : combien de fois ai-je entendu cette remarque dans les débats autour de l’ouverture des données publiques ? Il faut bien avouer que la question du marché de l’open data – et d’un hypothétique retour sur investissement – cristallise les échanges entre les promoteurs de l’ouverture et les sceptiques.
Ces derniers soulignent que les développeurs d’applications issues des concours sont rarement en mesure de rentabiliser leurs efforts (et accessoirement que l’on a trouvé le moyen de les faire travailler gratuitement). En face, les promoteurs du mouvement répètent, parfois comme un mantra, les chiffres publiés par la Commission européenne qui prédisent un avenir radieux à la réutilisation des données publiques.
Qu’en est-il vraiment ? L’open data est-il un marché ? Si oui, comment peut-on le mesurer et l’évaluer ? Quels en sont les bénéficiaires ? En un mot : à qui profite vraiment l’open data ?
Pour tenter de répondre à ces questions sur le marché de l’open data, je propose de regarder trois niveaux d’analyse : les données (la matière première), les usages (ce que l’on « produit » avec l’open data) et les acteurs (des détenteurs aux utilisateurs finaux en passant par les réutilisateurs de données ouvertes).
1- La donnée publique : une matière première, une « mine d’or » à exploiter ?
La Commission européenne s’est attachée depuis longtemps à mesurer le marché des informations publiques, notamment dans le cadre de l’évaluation de la directive de 2003.
L’étude MEPSIR (Measuring European Public Sector Information Re-Use) de 2006 participait de cette ambition. En dépit de la prudence affichée par ses auteurs, elle a connue son heure de gloire avec les débuts du mouvement open data en Europe. Il n’est guère de conférence, ou d’articles de cette époque où l’on ne cite pas les près de 30 milliards d’euros annoncés par MEPSIR.
Au-delà de la querelle des chiffres, il me semble incontestable qu’il y a un bien un marché des informations publiques. L’information juridique ou météorologique, le registre du commerce et des sociétés ou celui des immatriculations de véhicules : pour tout cela il y a une offre et une demande, des tarifs, des transactions – bref, en un mot un marché.
La nuance à apporter est que, à de très rares exceptions près, les données aujourd’hui « ouvertes » par les collectivités et les gouvernements ne sont pas celles qui faisaient l’objet de cette monétisation. Les horaires de bus (pour prendre un exemple d’une donnée qui est souvent réutilisée par les développeurs d’applications mobiles) ne sont quasiment jamais vendus. Ils sont proposés gratuitement au format papier, qu’il s’agisse des guides horaires ou même de ceux affichés dans les stations. De même pour les données statistiques de l’INSEE référencées sur le portail data.gouv.fr. Certaines données ouvertes localement, notamment géographiques, étaient parfois tarifées, mais en pratique elles étaient rarement vendues. C’est d’ailleurs le coût de la non-gratuité qui a joué en faveur de leur ouverture.
Il ne s’agit pas pour autant de dire que ces données n’ont pas de valeur, mais plutôt que leur valeur n’est pas monétaire.
2- Les usages : ce que produit l’open data
Le deuxième niveau d’analyse concerne les usages, ce que l’on fait avec les données ouvertes. On a tendance à penser que l’open data ne sert qu’à produire des applications mobiles, et à restreindre le modèle économique de l’open data à la seule vente de ces applications.
L’équation « marché de l’open data = somme des CA des éditeurs d’applications mobiles basées sur l’open data » est réductrice de deux points de vue. Une étude des revenus perçus par les développeurs d’applications vendues sur l’AppStore révèle un fonctionnement de marché proche d’une économie des « hits », semblable à celle des jeux vidéos. Quelques grands succès masquent le fait que nombre de développeurs parviennent difficilement à rentabiliser leurs investissements. Autrement dit, open data ou pas, il est aujourd’hui difficile de faire fortune avec une application mobile.
D’autre part, et il s’agit d’une précision importante, il y a beaucoup d’autres réutilisations possibles des données ouvertes. Dans mon ouvrage (« L’open data », Fyp Editions mars 2012), je propose de distinguer au moins quatre classes de réutilisations possibles :
- la consultation : un internaute accède directement à une donnée en ligne, pour prendre une décision (quelle compagnie aérienne est la plus ponctuelle ?), recueillir une information (comment évolue les effectifs dans le collège de mon quartier ?), …
- la médiation : les données sont retravaillées par un tiers pour les rendre accessibles au grand public, c’est par exemple le champ du datajournalisme ou de la visualisation de données,
- l’application : un développeur utilise les données ouvertes pour construire et proposer un service ou une application mobile,
- la réutilisation spécialisée : certaines données sont utilisées comme de la matière première qui rentre dans un process… ce sont des «intrants» pour des entreprises ou des organisations.
Ce dernier type de réutilisation mérite d’être détaillé, car il est souvent le plus méconnu.
L’un des fichiers techniques les plus populaires (en nombre de téléchargements) sur les plateformes open data concerne les nomenclatures des voies et les adresses. Pour le commun des mortels, ce fichier qui permet notamment d’associer une adresse postale (12, rue des Marronniers, Paris) à des coordonnées géographiques, ne présente guère d’intérêt. Mais pour les entreprises qui font du e-commerce, de la livraison ou tout simplement qui veulent requalifier leur fichier clients en fonction de critères géographiques, cette donnée a de la valeur.
Autre exemple : si les indicateurs de qualité des transports, proposé par le Ministère de l’Ecologie, étaient disponible en données ouvertes, on pourrait imaginer qu’un site comparateur de prix de billets d’avion puisse intégrer dans ses résultats un indice de fiabilité ou de ponctualité des compagnies aériennes. Un vrai plus pour l’éditeur de ce site et pour les consommateurs aussi…
On pourrait multiplier les exemples de réutilisation spécialisée, notamment pour l’immobilier ou l’urbanisme (mesure de l’accessibilité d’un logement en transports en commun par exemple). Le point commun de ce type de production de l’open data, c’est qu’elle reste largement ignorée et sans aucun doute sous-estimée. Les réutilisateurs spécialisés ne participent pas aux concours open data, ils ne publient pas toujours le fruit de leur travail. Bref, ils restent bien souvent « sous le radar » des observateurs du marché.
3- Les acteurs
Le dernier angle d’analyse du marché de l’open data concerne les bénéfices perçus par chacun des acteurs de l’open data, c’est-à-dire :
- les détenteurs de données (Etat, collectivités mais aussi certaines entreprises qui opèrent des délégations de service public : Veolia, Keolis, Suez, …),
- les réutilisateurs de rang 1 (ceux qui réutilisent la donnée brute),
- les utilisateurs finaux.
Il y a pour les détenteurs de données un bénéfice direct : ils sont parfois eux-mêmes réutilisateurs de leurs propres données. A partir du moment où une donnée est facilement consultable ou interrogeable, par exemple via une interface de programmation (API), il devient possible de l’utiliser en interne, alors que nombre de données ne sont pas partagées au sein des organisations. Les entreprises qui se lancent dans l’open data ont d’ailleurs bien compris que cet usage interne est source de réduction des coûts et représente un potentiel d’innovation à explorer.
Concernant les acteurs publics, les principaux bénéfices sont indirects : retombées médiatiques (l’open data reste encore une affaire de pionniers), mise à disposition de services mobiles qu’ils ne peuvent ou ne souhaitent pas développer,, développement d’un éco-système favorable à l’innovation numérique sur leur territoire, …
Deuxième acteur de la chaîne, les réutilisateurs. Il est essentiel de comprendre et de prendre en compte leurs motivations car elles dépassent parfois la recherche du profit immédiat. L’enquête réalisée par Socrata aux Etats-Unis (Open Government Data Benchmark Study 2011) révèle qu’un peu moins de 3% des développeurs interrogés ont pour motivation le fait que leur service puisse être un jour profitable. La première motivation (pour plus de 40% des répondants) est que leur application puisse être utile au quotidien pour ceux qui l’utilisent.
La première motivation exprimée c’est «je veux faire un service qui soit utile».
Certains développent par jeu, pour l’apprentissage, pour acquérir de nouvelles compétences ou pour bâtir leur réputation. Ils ne rentabilisent pas leur travail directement, mais parfois les retombées indirectes peuvent être non négligeables (notamment parce qu’ils se font connaître, qu’ils développent des activités annexes ou qu’ils trouvent de nouvelles opportunités professionnelles). Ces derniers bénéfices sont d’ailleurs aussi souvent cités par les entreprises qui développent des services basés sur des données ouvertes dans le cadre de concours.
Il me semble que, à la lumière de la diversité des motivations exprimées, il y a sans doute de quoi repenser les critères de succès des démarches open data, plus axé sur l’utilité perçue par les utilisateurs finaux ou les retombées pour les réutilisateurs que sur les seuls revenus tirés de la vente d’applications.
Enfin : les utilisateurs finaux. Ils sont les bénéficiaires ultimes de l’open data, qu’ils consultent des données en ligne, y accèdent via des visualisations ou utilisent des applications et services.
On a beaucoup de mal à mesurer globalement les bénéfices qu’ils retirent de l’ouverture des données publiques, mais quelques exemples permettent de les entrevoir. Pour l’utilisateur d’une application transport, il s’agit d’abord d’un gain de temps (savoir quand arrive mon bus me permet de ne pas l’attendre à l’arrêt) mais aussi une incitation à utiliser les transports collectifs (ou le vélo en libre-service).
Toujours dans les transports, mais pour la voiture cette fois-ci : Nantes a ouvert un jeu de données concernant la disponibilité temps réel des places de parkings publics dans la ville. Ainsi celui qui utilise cette info (par ex. via une appli mobile) ne va pas tourner en rond dans la ville, perdre du temps, générer du trafic supplémentaire ce qui représente un coût tant pour lui que pour la collectivité dans son ensemble. On sait notamment que dans les grandes villes, une part non négligeable des automobilistes qui circulent à un instant T sont en fait des gens qui cherchent une place pour se garer…
Fait intéressant, nombre d’utilisateurs finaux ignorent jusqu’à l’existence même de l’ouverture des données et sont loins de se douter qu’elle puisse avoir un rapport avec le service qu’ils utilisent.
Il me semble que le marché de l’open data est donc déjà une réalité, mais que les bénéfices ne sont pas là où l’on pourrait les attendre le plus spontanément (ils sont plus indirects que directs, sans doute plus dans la réutilisation spécialisée que dans les applications). D’autre part, il est essentiel de reconnaître qu’une partie de l’ouverture des données publiques se situe hors-marché. L’économie de la contribution et l’approche par les biens communs sont tout aussi importantes que les mécanismes de marché pour comprendre la dynamique qui se met en oeuvre sous nos yeux.
Crédits photographiques : Rennes Métropole, Ministère de l’Ecologie et des Transports, Simon Chignard. Cet article est publié sous licence CC-BY-SA.
> Il y a pour les détenteurs de données un bénéfice direct : ils sont parfois eux-mêmes réutilisateurs de leurs propres données.
En soit c’est pas juste « parfois » en ce qui concerne les collectivités et administrations puisque celles-ci sont les 1ères consommatrices de données publiques via la loi de 1978. L’ouverture prônée par l’OpenData leur offrira, à terme, surtout une aisance pour obtenir les dites données 🙂
Belle démonstration, Simon. Tu expliques bien que finalement ce ne sont peut-être pas les mécanismes de marché qui sont les mieux à même de donner toute leur valeur aux données publiques ouvertes !
Tu as raison, il faut donc inventer des modes de gestion adaptés à leur statut de biens publics, c’est à dire ouverts à tous (non-exclusifs) et dont la consommation par un agent n’a pas d’effet sur la quantité disponible pour les autres (non-rivaux).
(aparté : j’emploie le terme « bien public » et toi celui de « bien commun » dans ta conclusion, alors qu’il me semblait que ce dernier était en général employé pour des biens dont l’utilisation est non-exclusive mais rivale… or d’après moi, il n’y a pas rivalité : si j’utilise des données publiques, je ne te prive pas de les utiliser de ton côté ! Peux-tu m’expliquer ? Avons nous une divergence sur le fond ou un léger décalage sémantique… ?)
Ce petit aparté sémantique m’a remémoré la fameuse « tragédie des biens communs » de Garrett Hardin mais il me semble que nous ne sommes justement pas dans un cas de surexploitation d’une ressource limitée, due à la compétition pour l’accès à ce bien commun. En fait, je me demande si l’on n’est pas face à un cas de « tragédie des anti-communs » (cf la page wikipedia qui cite pas mal de références : http://en.wikipedia.org/wiki/Tragedy_of_the_anticommons)
Ce modèle décrit des situations où la complexité des droits de propriété sur un bien (voire des barrières juridico-administratives) empêchent d’arriver collectivement à produire un bénéfice socialement désirable (les bénéfices indirects que tu évoques).
Que penses-tu de cette clé de lecture ?
Peut on parler de marché de l’opendata à proprement dit ou évoquer la dynamisation du marché par l’opendata ? Prenons le marché existant qui se nourrit des données disponibles (hors opendata), alors, l’apport de ces nouvelles données ouvertes et organisées par un tiers, ne serait il pas à même de permettre un accroissement de la qualité des produits, services, informations… exposés par les acteurs du marché. Je donne un exemple simple : Imaginons une interaction entre les acteurs de l’immobilier du territoire de Rennes métropole et le service de visualisation et qualification du tissus urbain tel que le propose Urbanility. http://urbanility.com C’est déjà possible mais un échange rémunérateur et équitable est tout à fait envisageable. La qualité du produit s’en trouverait grandie, la prestation de l’acteur du marché mieux perçue par l’acheteur potentiel et le fournisseur du service rémunéré pour son travail sur la donnée ouverte. Le marché à peut être tout à gagner à investir sur la production d’outil de traitement de la donnée libérée.
Ceci étant et par sensibilité personnelle, je retiens surtout la dernière partie de ce propos « L’économie de la contribution et l’approche par les biens communs sont tout aussi importantes que les mécanismes de marché… » C’est tout à fait juste et j’aimerais tant qu’il préfigure les mécanismes économiques de demain, à l’échelle Européenne au moins.
Faisons de Rennes (encore une fois) un territoire expérimental et précurseur dans cette optique…!?
Ping : Open Data | Pearltrees
Ping : Où est le marché de l’open data ? « Bylb0's Blog
Et si nous ré-évaluions le vieux concept de » marché mortar » ?
Bien sur que les données publiques ont une valeur monétaire, plutôt décalée d’ailleurs que indirecte. Quelque soit l’état du marché, des usages et des acteurs, cette valeur monétaire est directement inclus dans ce que rapporteront les emplois et les taxes en retour.
Peut être pourrait –on identifier 3 freins naturels à la création d’un marché, au sens « ancien » du terme.
1-La disponibilité gratuite de la matière initiale cache le coût de collecte (donc de la valeur initiale) et élimine une barrière (c’est la raison d’être de l’open …)
2-L’économie par la contribution utile et le bien commun favorise l’émulation (porteuse de performance et de nouveaux usages), mais pas la différenciation au sens « market » du terme
3-Les biens mis à disposition sont consommés ponctuellement par le plus grand nombre, sans que l’on sache exactement comment. On pourrait alors imaginer que les usages proposés sont encore dans le domaine du confort même « utile » et que la consommation ponctuelle, ne parvient pas à conféré à l’usage la notion de service.
Consommation ponctuelle, besoin non avéré, valorisation pas établie, l’open data ne serait donc pas un marché au sens « mortar ».
Alors que pourrait-être un marché Mortar ?
Imaginons un acteur qui « privatiserait » les données brutes publiées en y ajoutant une valeur ajoutée forte, non réalisable facilement par des tiers : comme de la collecte pertinente ou sélective, de l’aggrégation sur des volumes très important, un traitement personnel, pour en faire une information privée, délivrable à la fois à des acteurs industriels et au plus grand nombre…
Pratiquement : un opérateur de services avec des modèles économiques largement représentés à la fois dans le « Mortar » et aussi dans le « Clic ».
L’avènement de ce type d’acteurs permettrait de monétiser un marché tout en laissant « libre » et utile le marché tel qu’il existe aujourd’hui peut-être même de permettre à la donnée brute distribuée aujord’hui d’inclure quelques éléments de traitements supplémentaires…