Comment diffuser et valoriser des données d’entreprises ?

Pourquoi l’open data devrait-il se limiter aux seuls acteurs publics ? Comment les entreprises peuvent-elles l’intégrer dans leur stratégie de diffusion et de valorisation de leurs données ? Pour répondre à ces questions, je vous propose un premier article consacré à la définition des univers de diffusion des données d’entreprises. On y parle open data, mais pas seulement.

Quelles données partager ? Avec quel public ? De prime abord, les interrogations sont identiques pour les secteurs privés et publics. En réalité, les deux approches se distingue par le contexte juridique qui s’applique. Il n’y a pas d’obligation pour les entreprises de mettre à disposition leurs données, hormis quelques exceptions précises (données environnementales et financières notamment). La démarche doit être d’autant plus volontariste pour les acteurs privés.

1- Quelles données diffuser ? auprès de quels acteurs ?

Définir une stratégie de diffusion passe d’abord par un état des lieux des données et des informations existantes au sein de l’entreprise. On cherche notamment à identifier et recenser les données que l’on souhaite diffuser, valoriser et, a contrario, les données que l’on souhaite protéger. En parallèle, pour chacun des types de données identifiés, on évalue les acteurs cibles avec lesquels on pourrait les partager. Il peut s’agir de quelques partenaires déjà sélectionnés ou d’un plus large public de réutilisateurs.

2 – Les 3 univers de diffusion des données

Le croisement entre les deux questions permet de repérer à minima trois univers de diffusion des données, comme le synthétise le schéma ci-dessus (en licence CC-BY rappelons-le). Par univers de diffusion on désigne un ensemble cohérent de critères techniques, juridiques et économiques liés à la diffusion et à la réutilisation des données.

Par exemple, dans l’univers bien connu de l’échange de données informatisées (EDI) – que l’on qualifie de modèle semi-ouvert, l’accès aux données est limité à quelques partenaires pré-selectionnés et avec lesquels le lien contractuel est fort (engagement de niveau de services, clause de semi-exclusivité, etc…).

Le modèle demi-ouvert a notamment été mis en oeuvre avec succès par les entreprises du web et certains fournisseurs d’information financière (Bloomberg, …). Il consiste à offrir un accès partiel aux données via des interfaces de programmation (API)Ce modèle est juridiquement moins contraignant que l’EDI et doit permettre une diffusion des données auprès d’un ensemble plus large de partenaires réutilisateurs. Il n’est cependant pas question, à l’instar de Twitter ou d’Amazon de permettre l’accès à la totalité des données brutes.

Enfin, le modèle ouvert est celui des données ouvertes (open data). L’ouverture est alors à la fois technique (la fourniture de données brutes dans un format ouvert et facilitant la réutilisation), juridique (l’utilisation de la licence ouverte proposée par Etalab, la licence ODbL) et économique (peu ou pas de redevances sur la réutilisation des données).

Mais la question de l’ouverture ne se limite pas à des critères formels, elle impose aussi une remise en cause des modèles de management pour passer d’un mode de contrôle a priori à un mode de modération a posteriori.

3 – Un impératif : respecter la cohérence des univers

Une erreur pour les entreprises serait de ne pas respecter la cohérence de chaque univers et de vouloir faire de l’open data « à leur sauce ». Cela se traduit notamment par la création d’une licence sur-mesure ou le souhait de rester dans le contrôle a priori. Rien aujourd’hui n’oblige les acteurs privés à faire de l’open data et, comme cet article l’illustre, il y a plusieurs moyens de diffuser des données. Par contre, il me semble essentiel, si l’on choisit un univers, d’en accepter les règles, même si parfois elles relèvent davantage des us et coutumes que de la loi !

Où est le marché de l’open data ?

« Tant que l’open data ne trouvera pas son modèle économique, il ne décollera pas » : combien de fois ai-je entendu cette remarque dans les débats autour de l’ouverture des données publiques ? Il faut bien avouer que la question du marché de l’open data – et d’un hypothétique retour sur investissement – cristallise les échanges entre les promoteurs de l’ouverture et les sceptiques.

Des applications

Ces derniers soulignent que les développeurs d’applications issues des concours sont rarement en mesure de rentabiliser leurs efforts (et accessoirement que l’on a trouvé le moyen de les faire travailler gratuitement). En face, les promoteurs du mouvement répètent, parfois comme un mantra, les chiffres publiés par la Commission européenne qui prédisent un avenir radieux à la réutilisation des données publiques.

Qu’en est-il vraiment ? L’open data est-il un marché ? Si oui, comment peut-on le mesurer et l’évaluer ? Quels en sont les bénéficiaires ? En un mot : à qui profite vraiment l’open data ?

Pour tenter de répondre à ces questions sur le marché de l’open data, je propose de regarder trois niveaux d’analyse : les données (la matière première), les usages (ce que l’on « produit » avec l’open data) et les acteurs (des détenteurs aux utilisateurs finaux en passant par les réutilisateurs de données ouvertes).

1- La donnée publique : une matière première, une « mine d’or » à exploiter ?

La Commission européenne s’est attachée depuis longtemps à mesurer le marché des informations publiques, notamment dans le cadre de l’évaluation de la directive de 2003.

L’étude MEPSIR (Measuring European Public Sector Information Re-Use) de 2006 participait de cette ambition. En dépit de la prudence affichée par ses auteurs, elle a connue son heure de gloire avec les débuts du mouvement open data en Europe. Il n’est guère de conférence, ou d’articles de cette époque où l’on ne cite pas les près de 30 milliards d’euros annoncés par MEPSIR.

Au-delà de la querelle des chiffres, il me semble incontestable qu’il y a un bien un marché des informations publiques. L’information juridique ou météorologique, le registre du commerce et des sociétés ou celui des immatriculations de véhicules : pour tout cela il y a une offre et une demande, des tarifs, des transactions – bref, en un mot un marché.

La nuance à apporter est que, à de très rares exceptions près, les données aujourd’hui « ouvertes » par les collectivités et les gouvernements ne sont pas celles qui faisaient l’objet de cette monétisation. Les horaires de bus (pour prendre un exemple d’une donnée qui est souvent réutilisée par les développeurs d’applications mobiles) ne sont quasiment jamais vendus. Ils sont proposés gratuitement au format papier, qu’il s’agisse des guides horaires ou même de ceux affichés dans les stations. De même pour les données statistiques de l’INSEE référencées sur le portail data.gouv.fr. Certaines données ouvertes localement, notamment géographiques, étaient parfois tarifées, mais en pratique elles étaient rarement vendues. C’est d’ailleurs le coût de la non-gratuité qui a joué en faveur de leur ouverture.

Il ne s’agit pas pour autant de dire que ces données n’ont pas de valeur, mais plutôt que leur valeur n’est pas monétaire.

2- Les usages : ce que produit l’open data

Le deuxième niveau d’analyse concerne les usages, ce que l’on fait avec les données ouvertes. On a tendance à penser que l’open data ne sert qu’à produire des applications mobiles, et à restreindre le modèle économique de l’open data à la seule vente de ces applications.

L’équation « marché de l’open data = somme des CA des éditeurs d’applications mobiles basées sur l’open data » est réductrice de deux points de vue. Une étude des revenus perçus par les développeurs d’applications vendues sur l’AppStore révèle un fonctionnement de marché proche d’une économie des « hits », semblable à celle des jeux vidéos. Quelques grands succès masquent le fait que nombre de développeurs parviennent difficilement à rentabiliser leurs investissements. Autrement dit, open data ou pas, il est aujourd’hui difficile de faire fortune avec une application mobile.

D’autre part, et il s’agit d’une précision importante, il y a beaucoup d’autres réutilisations possibles des données ouvertes. Dans mon ouvrage (« L’open data », Fyp Editions mars 2012), je propose de distinguer au moins quatre classes de réutilisations possibles :

  • la consultation : un internaute accède directement à une donnée en ligne, pour prendre une décision (quelle compagnie aérienne est la plus ponctuelle ?), recueillir une information (comment évolue les effectifs dans le collège de mon quartier ?), …
  • la médiation : les données sont retravaillées par un tiers pour les rendre accessibles au grand public, c’est par exemple le champ du datajournalisme ou de la visualisation de données,
  • l’application : un développeur utilise les données ouvertes pour construire et proposer un service ou une application mobile,
  • la réutilisation spécialisée : certaines données sont utilisées comme de la matière première qui rentre dans un process… ce sont des «intrants» pour des entreprises ou des organisations.

Ce dernier type de réutilisation mérite d’être détaillé, car il est souvent le plus méconnu.

L’un des fichiers techniques les plus populaires (en nombre de téléchargements) sur les plateformes open data concerne les nomenclatures des voies et les adresses. Pour le commun des mortels, ce fichier qui permet notamment d’associer une adresse postale (12, rue des Marronniers, Paris) à des coordonnées géographiques, ne présente guère d’intérêt. Mais pour les entreprises qui font du e-commerce, de la livraison ou tout simplement qui veulent requalifier leur fichier clients en fonction de critères géographiques, cette donnée a de la valeur.

Quelle compagnie aérienne est la plus ponctuelle ?

Autre exemple : si les indicateurs de qualité des transports, proposé par le Ministère de l’Ecologie, étaient disponible en données ouvertes, on pourrait imaginer qu’un site comparateur de prix de billets d’avion puisse intégrer dans ses résultats un indice de fiabilité ou de ponctualité des compagnies aériennes. Un vrai plus pour l’éditeur de ce site et pour les consommateurs aussi…

On pourrait multiplier les exemples de réutilisation spécialisée, notamment pour l’immobilier ou l’urbanisme (mesure de l’accessibilité d’un logement en transports en commun par exemple). Le point commun de ce type de production de l’open data, c’est qu’elle reste largement ignorée et sans aucun doute sous-estimée. Les réutilisateurs spécialisés ne participent pas aux concours open data, ils ne publient pas toujours le fruit de leur travail. Bref, ils restent bien souvent « sous le radar » des observateurs du marché.

3- Les acteurs 

Le dernier angle d’analyse du marché de l’open data concerne les bénéfices perçus par chacun des acteurs de l’open data, c’est-à-dire :

  • les détenteurs de données (Etat, collectivités mais aussi certaines entreprises qui opèrent des délégations de service public : Veolia, Keolis, Suez, …),
  • les réutilisateurs de rang 1 (ceux qui réutilisent la donnée brute),
  • les utilisateurs finaux.

Il y a pour les détenteurs de données un bénéfice direct : ils sont parfois eux-mêmes réutilisateurs de leurs propres données. A partir du moment où une donnée est facilement consultable ou interrogeable, par exemple via une interface de programmation (API), il devient possible de l’utiliser en interne, alors que nombre de données ne sont pas partagées au sein des organisations. Les entreprises qui se lancent dans l’open data ont d’ailleurs bien compris que cet usage interne est source de réduction des coûts et représente un potentiel d’innovation à explorer.

Concernant les acteurs publics, les principaux bénéfices sont indirects : retombées médiatiques (l’open data reste encore une affaire de pionniers), mise à disposition de services mobiles qu’ils ne peuvent ou ne souhaitent pas développer,, développement d’un éco-système favorable à l’innovation numérique sur leur territoire, …

Deuxième acteur de la chaîne, les réutilisateurs. Il est essentiel de comprendre et de prendre en compte leurs motivations car elles dépassent parfois la recherche du profit immédiat. L’enquête réalisée par Socrata aux Etats-Unis (Open Government Data Benchmark Study 2011) révèle qu’un peu moins de 3% des développeurs interrogés ont pour motivation le fait que leur service puisse être un jour profitable. La première motivation (pour plus de 40% des répondants) est que leur application puisse être utile au quotidien pour ceux qui l’utilisent.

La première motivation exprimée c’est «je veux faire un service qui soit utile».

Certains développent par jeu, pour l’apprentissage, pour acquérir de nouvelles compétences ou pour bâtir leur réputation. Ils ne rentabilisent pas leur travail directement, mais parfois les retombées indirectes peuvent être non négligeables (notamment parce qu’ils se font connaître, qu’ils développent des activités annexes ou qu’ils trouvent de nouvelles opportunités professionnelles). Ces derniers bénéfices sont d’ailleurs aussi souvent cités par les entreprises qui développent des services basés sur des données ouvertes dans le cadre de concours.

Il me semble que, à la lumière de la diversité des motivations exprimées, il y a sans doute de quoi repenser les critères de succès des démarches open data, plus axé sur l’utilité perçue par les utilisateurs finaux ou les retombées pour les réutilisateurs que sur les seuls revenus tirés de la vente d’applications.

Enfin : les utilisateurs finaux. Ils sont les bénéficiaires ultimes de l’open data, qu’ils consultent des données en ligne, y accèdent via des visualisations ou utilisent des applications et services.

« Our apps are whiz-kid certified »

On a beaucoup de mal à mesurer globalement les bénéfices qu’ils retirent de l’ouverture des données publiques, mais quelques exemples permettent de les entrevoir. Pour l’utilisateur d’une application transport, il s’agit d’abord d’un gain de temps (savoir quand arrive mon bus me permet de ne pas l’attendre à l’arrêt) mais aussi une incitation à utiliser les transports collectifs (ou le vélo en libre-service).

Toujours dans les transports, mais pour la voiture cette fois-ci : Nantes a ouvert un jeu de données concernant la disponibilité temps réel des places de parkings publics dans la ville. Ainsi celui qui utilise cette info (par ex. via une appli mobile) ne va pas tourner en rond dans la ville, perdre du temps, générer du trafic supplémentaire ce qui représente un coût tant pour lui que pour la collectivité dans son ensemble. On sait notamment que dans les grandes villes, une part non négligeable des automobilistes qui circulent à un instant T sont en fait des gens qui cherchent une place pour se garer…

Fait intéressant, nombre d’utilisateurs finaux ignorent jusqu’à l’existence même de l’ouverture des données et sont loins de se douter qu’elle puisse avoir un rapport avec le service qu’ils utilisent.

Il me semble que le marché de l’open data est donc déjà une réalité, mais que les bénéfices ne sont pas là où l’on pourrait les attendre le plus spontanément (ils sont plus indirects que directs, sans doute plus dans la réutilisation spécialisée que dans les applications). D’autre part, il est essentiel de reconnaître qu’une partie de l’ouverture des données publiques se situe hors-marché. L’économie de la contribution et l’approche par les biens communs sont tout aussi importantes que les mécanismes de marché pour comprendre la dynamique qui se met en oeuvre sous nos yeux.

Crédits photographiques : Rennes Métropole, Ministère de l’Ecologie et des Transports, Simon Chignard. Cet article est publié sous licence CC-BY-SA.