Mardi matin, Louis-David Benyayer et moi étions invités par le think tank Renaissance numérique à présenter notre ouvrage Datanomics. Il a notamment été question, lors de cette heure de discussion, de la position de la SNCF et de sa volonté de vendre les données via sa nouvelle API en mode freemium. L’Usine Digitale s’en est fait l’écho, reprenant le tonitruant « Tu déconnes, Yves !« , adressé à Yves Tirode, le patron du digital au sein de la compagnie nationale. Retour sur le sujet, de manière un peu moins… lapidaire.
La SNCF met en oeuvre actuellement son ambitieuse stratégie digitale, qui inclut notamment l’ouverture d’une API d’accès aux données, en mode freemium. La vente de données est présentée comme la solution pour contrer le risque – bien réel ! – que représente Google et les plateformes numériques. Pour ma part, je ne crois pas que la marchandisation des données soit une réponse efficace. Des stratégies alternatives sont déjà mises en oeuvre dans de nombreux secteurs, dont la distribution. Mais avant de les développer, il me semble nécessaire de retracer les enjeux du sujet. La nouvelle stratégie de la SNCF en matière de données s’appuie sur un déjà long historique autour des données ouvertes, que l’on pourrait résumer par la formule de Danah Boyd: « It’s complicated ! ».
1 – Pourquoi c’est compliqué
L’idée de l’API freemium est de faire payer les données selon le niveau d’usage. Cela permettrait a priori de réconcilier deux objectifs: favoriser l’innovation ouverte (en ouvrant les données, y compris temps réel, aux petites start-ups) et se prémunir de l’hégémonie des grands acteurs du web (qui paieraient plein pot). Et c’est là, à mon avis, qu’il y a un besoin de clarification.
Dans Datanomics, nous avons identifiés trois facettes de la valeur des données:
– quand elles sont revendues par ceux qui les collectent, les produisent ou les aggrègent, les données prennent une forme de matière première,
– quand elles sont utilisées, sans marchandisation, par exemple pour réduire les coûts ou développer les revenus, elles prennent une forme de levier,
– enfin, quand elles constituent une arme stratégique pour défendre et conquérir une position concurrentielle, elles prennent une valeur d’actif.
Ces trois facettes de la valeur ne sont pas exclusives. Certaines entreprises ou certaines données, révèlent plusieurs formes simultanées de valeur. Cette grille me semble pertinente pour voir ce qui se joue autour de la vente des données TGV. Il faut considérer la donnée comme un actif stratégique qui permet de défendre un marché ou de conquérir une nouvelle position, et pas uniquement comme une matière première que l’on vend et que l’on achète.
On ne connait pas encore la grille tarifaire de l’API SNCF. Elle doit être annoncée cet été. Mais on peut au moins regarder ce qui se fait à l’étranger. Au Royaume-Uni, une start-up accompagnée par l’Open Data Institute propose un service similaire, Transport API. Sa grille tarifaire est en ligne. On peut ainsi y lire que pour un accès illimité, sans contrainte de nombre de requêtes, il faut s’acquitter d’un peu plus de 100 000 euros par an.
Admettons que la SNCF arrive à placer la barre encore plus haut et qu’elle fixe les tarifs, pour un acteur gros consommateur de son API freemium (genre Google) à 1 million d’euros par an. A partir de là, on a deux hypothèses. La première: Google accepte de payer. 1 million d’euros: ca fait déjà une très jolie somme, sur le marché de la donnée. Mais rappelons juste qu’une rame de TGV cela coûte entre 15 et 20 millions d’euros. On ne brade pas un actif stratégique pour le prix d’un demi-wagon de train. La seconde hypothèse: Google ne veut pas payer. C’est un peu une stratégie « à la Grand Lyon« : je fixe un tarif qui, en résumé, veut dire: « on ne veut pas de vous ».
Dans cette optique, la SNCF ne veut en réalité pas vendre ses données à Google.
Considérer la donnée comme un actif stratégique, c’est notamment l’utiliser pour construire un rapport de force favorable. Ce qui fait la vraie richesse de Twitter ou Facebook ce n’est pas de vendre les données aux développeurs, mais de maîtriser le robinet, en l’occurrence l’API. Le pouvoir de ces entreprises c’est de décider des conditions d’accès, et de pouvoir les modifier sans préavis. Ce qui est vrai pour Twitter l’est aussi pour le gouvernement américain: le GPS est accessible gratuitement, mais les américains se réservent le droit de dégrader ou d’interrompre le service.
Le GPS est d’ailleurs un bon exemple où la donnée a un coût important (on évalue le programme à 14 milliards de dollars), une valeur d’usage très forte (70 milliards de dollars par an) mais un prix égale à zéro. L’argument « cela doit avoir un prix parce que cela a un coût » n’est pas toujours vrai. Dans le domaine de la distribution aussi, la donnée permet de recomposer la chaîne de valeur. Walmart offre ainsi à tous ses fournisseurs une donnée temps réel sur les niveaux de stocks et de vente de leurs produits (Walmart Retail Link). En procédant ainsi, le géant américain renverse la responsabilité: c’est au fabriquant de s’assurer que le produit est disponible. Cette donnée n’est pas vendue, mais cela ne l’empêche d’avoir une valeur stratégique très forte.
Ce débat ne concerne pas que la SNCF. Toutes les entreprises qui produisent des données se posent les mêmes questions et sont confrontées aux mêmes enjeux. Mais ce serait une erreur de les laisser croire que la marchandisation est une réponse au risque que représente les plateformes du numérique…
Crédit photo: SNCF TGV Duplex 275 par eldelinux
Ping : La marchandisation des données SNCF n'es...
Ping : La marchandisation des données SNCF n’est pas la réponse à Google | Médialex
Bonjour Simon,
je fais une réponse rapide à cet article sur lequel je viens de tomber, ne connaissant pas ton blog au préalable. Je suis assez favorable à la démarche de la SNCF à travers cette API freemium, sachant que je ne connaissais pas non plus les divergences internes concernant la politique d’ouverture des données, tout en ayant suivi quelques initiatives.
Mais il me semble que ta critique repose notamment sur la grille d’analyse que vous avez établie, ce qui amène à classer les « données en API freemium » (pour simplifier) de la SNCF dans la catégorie « actif stratégique ». Mais si l’on va au bout de la logique de gestion d’un actif stratégique, on peut concevoir qu’il ne se vende, ni ne se cède du tout…en général, sachant que tu n’évoques cette stratégie qu’en cas de prix dissuasif.
Il faut aussi ramener la valeur potentielle de cet actif dans le périmètre concerné. En l’occurrence, il ne peut être comparé à la fabrication d’une rame de TGV car il ressortit prioritairement à l’activité commerciale, même si les données concernées peuvent être réutilisées en interne par plusieurs directions/départements/unités.
Sa valeur doit aussi être examinée en fonction de sa place dans les activités prioritairement concernées (vente de billets, informations des voyageurs…). Là encore, il me semble que l’on ne peut pas comparer avec les Apis de Google, dont les modèles économiques sont très différents. D’ailleurs, si Google veut mieux exploiter les données de la SNCF que la SNCF elle-même, c’est gagné d’avance, à moins que la SNCF se transforme en labo de recherche californien – au-delà de ses relations avec l’ « écosystème » – éventuellement financé par la DARPA :).
Effectivement, la SNCF ne veut pas se faire « ubériser » tout en alimentant un écosystème de JEI, qu’elle tente de contrôler (notion de « rapport de forces » dans ton article), sans toutefois y parvenir tout à fait puisque « Capitaine train » lui taille quand même quelques croupières, me semble-t-il. N’est pas Walmart qui veut :)…sauf que c’est plutôt de l’EDI.
La politique d’ouverture des « données en API freemium » de la SNCF est donc en effet un peu ambiguë, mais elle n’est pas déloyale. Cela résulte aussi de contraintes juridiques. Par contre, tu as raison, le prix sera difficile à fixer. On aura bien besoin de « data scientists » pour cette tâche:).
Cordialement.
MarcH