J’ai testé les données « ouvertes » d’Uber et Airbnb en France

Uber et Airbnb ont récemment communiqué sur la mise à disposition volontaire de données issues de leurs services respectifs. Que valent vraiment ces données ? Permettent-elles de répondre aux questions que ces plateformes posent aux territoires ? Ce qui se joue ici c’est bien la capacité à disposer des données pour réguler les grandes plateformes du numérique.

Uber Movement est accessible depuis l’été 2017 pour les villes de Boston, Washington, Manille et Sydney. Les données concernant la région parisienne sont disponibles depuis fin octobre. « Rendre service aux villes et contribuer à répondre à leurs défis de transport et d’aménagements urbains” sont les deux objectifs annoncés officiellement lors du lancement de la plateforme. Concrètement, pour se connecter à Uber Movement il faudra tout d’abord vous inscrire sur la plateforme avec votre email. Les données disponibles concernent les temps de transport entre deux points (aggrégés à des zones IRIS de l’INSEE).  Vous pourrez aussi sélectionner, via l’interface des périodes précises (par exemple une seule semaine en 2016 ou 2017, ou le pic de trafic du matin) et télécharger l’ensemble dans un fichier au format CSV. Les données sont disponibles en licence CC-BY-NC, c’est à dire que leur usage commercial n’est pas autorisé.

uber-movement

Dataville by Airbnb

L’annonce du programme Dataville par Airbnb a coincidé avec le salon des Maires de France qui s’est tenu il y a quelques semaines à Paris. A vrai dire il ne s’agit pas d’une coincidence, car dans sa communication officielle Airbnb vise clairement les élus des territoires, expliquant que « le portail permettra aux municipalités de mieux suivre le développement de l’activité touristique via Airbnb sur leur commune, son impact positif sur l’attractivité de leur commune comme sur le pouvoir d’achat de leurs administrés ». L’entreprise insiste d’ailleurs sur son effort de transparence.

Que trouve-t-on sur la plateforme Dataville ?

  • Le nombre d’annonces dans la ville au 1er septembre 2017
  • Le nombre de voyageurs accueillis entre septembre 2016 et septembre 2017
  • Le nombre de pays dont sont originaires les voyageurs qui y ont séjourné
  • Le revenu annuel médian d’un hôte dans la commune

Toutes ces données sont visualisables via une interface web (comme chez Uber Movement) mais pas du tout téléchargeables (contrairement à Uber).

dataville-rennes

Open Data où es-tu ? 

Commençons très vite par régler ce point: difficile de parler de données ouvertes dans l’exemple d’Airbnb ou d’Uber. Les données d’Uber, bien que téléchargeables, sont diffusées avec une licence qui ne permet pas de les qualifier d’open data car elle interdit expressément tout usage commercial. De même, le fait que l’inscription soit requise pour accéder aux données d’Uber Movement constitue un frein à la réutilisation. C’est pas de l’open data, point. 

Des données bien inoffensives

Mais là n’est peut-être pas l’essentiel. Que peut-on dire des données qui sont ainsi volontairement exposées par ces deux entreprises ? Tout d’abord qu’il s’agit bien de données originales, au sens de « qui n’ont pas été exposées auparavant« .

Impossible, avant Uber Movement, de connaître l’historique des temps de transport avec ce niveau de détail. Et Airbnb propose bien, avec Dataville, des données qui n’étaient pas auparavant facilement accessibles, par exemple le nombre de voyageurs ou le nombre de pays d’origine.

Ces données volontairement mises à disposition ont un autre point commun: elles sont inoffensives ! Elles permettent difficilement  de répondre aux questions que posent ces plateformes sur les territoires.

Prenons quelques exemples pour nous en convaincre.

Si je suis élu d’une ville où Uber propose son service de VTC, je peux par exemple m’interroger sur son impact sur la congestion urbaine. Est-ce que les clients d’Uber auraient par exemple pu utiliser le réseau de transport en commun, ou est-ce que le VTC permet de pallier une offre défaillante ? Rien dans les données d’Uber Movement ne vous permettra de répondre à cette question. Vous aurez les temps de parcours (ce qui n’est pas inintéressant) mais rien sur le nombre moyen d’utilisateurs du service sur ce même parcours (ce qui serait beaucoup plus utile !), en respectant bien sûr les seuils du secret statistique.

Second exemple, avec Airbnb. Quels sont les termes du débat public concernant Airbnb ?    J’en recense au moins trois. Le premier est le risque d’éviction dans les quartiers les plus touristiques, les propriétaires préférant mettre leur logement sur Airbnb que de le louer à l’année (il suffit d’être une fois passé dans le Marais vers 9h-10h quand tout le monde quitte son logement avec des grosses valises pour se rendre compte de quoi l’on parle !).

Second débat, la présence, sur la plateforme, de propriétaires professionnels, bien loin de l’image cool et sympa de celui qui accueille des touristes sur le canapé du salon. Plusieurs articles de presse se sont ainsi fait l’écho de propriétaires qui possèdent plusieurs appartements (voire dizaine d’appartements) sur la plateforme…

Troisième débat, les revenus générés par la plateforme pour les « hôtes » selon la terminologie d’Airbnb. S’agit-il de revenus accessoires ou bien de revenus dignes d’une activité principale (et donc professionnelle) – et qui intéressent donc l’administration fiscale ?

Là encore difficile de répondre à ces questions avec les données mises à disposition par Airbnb. Le niveau de granularité des données est à la commune, pas à l’arrondissement et encore moins au quartier ou à la zone Iris. Pour Paris, on apprend par exemple que 65 000 annonces sont disponibles sur une année, que 2 millions de voyageurs de 178 nationalités différentes ont fréquenté un appartement Airbnb dans la capitale.

C’est grand, Paris. Ce n’est sûrement pas avec ce genre de données qu’on va pouvoir comprendre un peu finement la réalité de l’impact d’Airbnb dans chaque quartier de la capitale !

J’ai fait la même recherche pour la ville de Rennes, et il est précisé que le revenu annuel d’un hôte est de 1400 euros, soit un peu plus de 100 euros par mois. A première vue cela correspond donc bien à des revenus accessoires, du « beurre dans les épinards » (oui, en Bretagne on aime autant le beurre que les épinards…).

Il faut donc aller lire la définition de la métrique selon Airbnb: « valeur médiane du revenu total gagné par l’hôte sur la période d’un an couverte par l’étude. Le revenu annuel est présenté pour un hôte type« . Qu’est-ce qu’un « hôte type » ? L’histoire et Airbnb ne le racontent pas, donc nous sommes en droit d’imaginer. Peut-être qu’un hôte type c’est par exemple un propriétaire qui n’a qu’un appartement et qui ne le met en location que quelques jours par mois ? Autant dire qu’avec de telles métriques nous ne sommes pas prêt de pouvoir répondre à la question de la professionnalisation des « hôtes » Airbnb !

D’ailleurs quand on veut en savoir plus sur le programme on est renvoyés vers le site Airbnb Citizen qui vous propose, au milieu de nombreux témoignages d’utilisateurs de la plateforme, de relayer les campagnes d’influence à destination des élus, comme celle ci-dessous.

airbnb-lobbying

C’est plus subtil que du Data-washing

Spontanément nous pourrions crier au data-washing, c’est-à-dire une tentative de se refaire une virginité en publiant des données inoffensives.

Il me semble que les initiatives dont nous parlons ici sont un peu plus subtiles. Ce qui est très clair ce que le choix des données mises à disposition ne doit rien au hasard. Ce n’est pas à un datascientist de chez Uber ou d’Airbnb qu’on va apprendre que des données agrégées sont beaucoup moins utiles que des données détaillées ! Ces sociétés sont réputées pour leur maîtrise des données, on ne peut pas penser une minute qu’elles proposent ces données-là sans avoir envisagé ce qui pourrait (ou plutôt ne pourrait pas) en être fait.

Je pense plutôt que ces initiatives illustrent parfaitement la notion de donnée comme actif stratégique telle que nous la définissions avec Louis-David Benyayer dans Datanomics.

Pour Airbnb ou Uber, la donnée est devenue l’objet et le support de la relation avec les territoires. Lever, ne serait-ce que très légèrement, le voile sur les données c’est aussi se mettre en ordre de bataille pour les discussions à venir, notamment sur les possibles régulations de ces plateformes.

C’est aussi montrer pour mieux cacher, au moment même où les principales métropoles semblent de plus en plus préoccupées par l’impact de ces plateformes sur leur territoire. Si l’on voulait vraiment rentrer dans une régulation par la donnée, telle que proposée par Nick Grossman, alors on ne pourrait pas se contenter des données que les plateformes voudront bien mettre à disposition. La Commission européenne s’intéresse d’ailleurs beaucoup aux données d’intérêt général (1): c’est un outil essentiel pour lutter contre l’asymétrie d’information qui caractérise la relation entre plateformes et territoires !

(1) dans le cadre de la révision en cours de la directive sur les informations du secteur public (PSI).

 

 

Open Data Transport : les enjeux du débat à venir

Où va l'open data transport ?

Où va l’open data transport ?

La feuille de route gouvernementale sur l’ouverture des données publiques (open data) prévoit l’organisation de six débats thématiques et ouverts. L’un d’eux doit précisement s’intéresser aux données du transport.  Ce billet de blog se propose de commencer à identifer les enjeux et les questions du débat à venir.

(Edité le 3 juin pour rajouter un schéma sur les données déjà ouvertes et préciser les questions liées aux formats de mise à disposition).

1 – Le contexte actuel et les objectifs des débats thématiques

Les débats thématiques ont plusieurs objectifs décrits dans la feuille de route : ils doivent permettre d’identifier et de publier de nouveaux jeux de données stratégiques et de qualité, mais aussi d’étudier la possibilité d’élargir et d’étendre la politique d’ouverture des données à l’ensemble des acteurs : collectivités territoriales, délégataires de service public, entreprises publiques, établissements publics à caractère industriel ou commercial, … On voit bien que l’enjeu pour l’open data transport est important, car les changements pourraient concerner l’ensemble des acteurs de la mobilité et des transports.

Par ailleurs, ce débat à venir s’inscrit plus généralement dans la réaffirmation, tant en France qu’aux Etats-Unis, des principes de l’ouverture des données « par défaut » et de la gratuité des données brutes comme l’un des leviers / piliers de cette politique. L’acte 3 de la décentralisation explicite d’ailleurs ce principe d’open data par défaut. Certes, la perspective de son adoption s’éloigne un peu – ce qui pourrait soulager ceux qui sont inquiets des risques que feraient peser, selon eux, la généralisation de l’open data. Mais l’Europe ne reste pas non plus inactive, avec l’adoption de la nouvelle directive PSI (public sector information) qui fixe des orientations assez fortes (et notamment le principe access = reuse) et finalement assez proches des principes défendus par la feuille de route gouvernemental.

Il y aura donc un débat thématique sur les données du transport et de la mobilité. La perspective d’un open data « par défaut », et non d’un open data comme une « option » éclaire  bien sûr d’une lumière nouvelle les questions à venir. En voici quelques unes.

2 – Quelles données ?

Les données du transport, et plus globalement de la mobilité sont diverses et variées. On y retrouve tous les types de données que nous manions quotidiennement dans le domaine de l’open data : données brutes / données enrichies, données historiques / données prédictives, données en stock / données en flux, données de description / données d’exploitation ou de commercialisation, …

Dans une optique de mobilité au sens large, il faut aussi prendre en compte un grand nombre de modes : piéton, vélo, automobile, transports en commun, … Enfin, et ce n’est pas là la moindre difficulté, les données de mobilité sont produites / collectées / gérées par un très grand nombre d’acteurs aux statuts juridiques et aux stratégies parfois incompatibles.

Nous avons donc potentiellement un très grand nombre de données concernées, elles-mêmes très diverses dans leurs caractéristiques, leurs statuts juridiques, leurs valeurs identifiées, réalisées ou perçues. L’un des enjeux du débat sera donc de tenter de classer ces données et de leur attribuer une priorité d’ouverture – un peu à la manière des données « stratégiques » citées par la feuille de route gouvernementale.

OpenDataTransport-donneesdejaouvertes.009Une rapide analyse des sites open data des réseaux de New-York (MTA), Londres (TfL, Transport for London), Paris (Ratp, Transilien) et Rennes (Star) permet déjà d’identifier une très grande diversité dans les données déjà ouvertes.

Le schéma ci-contre en présente une sélection, classée selon deux axes : l’objectif (transparence / participation) et le type de données (dynamiques / statiques).

La question de la valeur des données sera bien sûr au coeur des échanges. Par essence, cette valeur est multiple (valeur monétaire, valeur d’usage, valeur de ré-utilisation, valeur d’image, …) et dépend en partie de ceux qui réutilisent la donnée – et de ceux qui la réutiliseront demain ! Nous aurons donc – et ce ne sera pas facile – à discuter du partage de la valeur de données alors que nous n’avons qu’une vision assez partielle de leur vraie valeur actuelle et future pour l’ensemble des acteurs de la chaîne…

Concernant les critères de priorisation, il y aura aussi à coup sûr un débat dans le débat. Faut-il considérer les données selon l’usage qu’elles permettent (par exemple le calcul d’itinéraires) ou alors selon le statut (AOT, exploitant) de celui qui va l’ouvrir ? Faut-il prendre comme premier critère l’impact économique, social et sociétal de la donnée ? Et si oui, comment faire ? Nous pourrions imaginer par exemple de favoriser l’ouverture de données qui encouragent le transfert modal vers des modes de déplacements moins polluants que la voiture individuelle – c’est une piste parmi d’autres.

(Le débat devra par contre permettre de clarifier le statut juridique de la donnée de transport, et ce sera déjà une grande avancée)

3 – Quels acteurs ?

Le second enjeu est bien sûr lié aux acteurs qui seront concernés par l’ouverture des données du transport. Il faudra trouver une certaine concordance entre la loi d’organisation des transports (LOTI) et les futurs ajustements liés à l’open data. Certaines autorités organisatrices des transports craignent que l’obligation qui pourrait les viser « épargne » leur exploitant si celui est une entreprise publique ou un EPIC ou un EPA (on parle bien sûr de la SNCF ou de la RATP).

La question des acteurs rejoint celle du périmètre de l’ouverture et l’Etat n’est pas tout à fait un acteur neutre. L’open data pourrait figurer parmi les objectifs assignés aux systèmes d’informations multimodaux, qu’il s’agisse de SIM départementaux, régionaux ou nationaux. On pourrait aller un peu plus loin et imaginer que l’Etat et l’Europe réservent leurs co-financements aux seuls projets de SIM mettant en oeuvre des politiques d’ouverture et de partage des données – mais, encore une fois, ce n’est qu’une piste parmi d’autres.

4 – Quelles modalités d’ouverture ?

Les deux premiers enjeux que j’ai cité correspondent donc aux questions du « quoi ? » et du « qui ? ». La question des modalités de l’ouverture – le « comment » – est bien sûr l’une des plus importantes.

Premier élément des modalités de l’ouverture : le degré d’obligation. Va-t-on être dans le domaine de la bonne pratique, de l’incitation (si besoin avec des mécanismes financiers du type subvention conditionnée à la mise en place d’une politique open data) ou de l’obligation (mandatory) ? Bien sûr il y aura toute une palette de réponses, selon les types de données, les acteurs ou les usages pressentis.

Second élément : la licence applicable à ces données.  Certaines collectivités ont déjà fait part de leurs craintes sur des réutilisations de « leurs » données contraires à leurs objectifs de politique publique. Le Grand Lyon par exemple a ainsi conçu une approche SmartData, avec trois licences différentes dont l’une avec des données payantes – c’est leur réponse à l’open data et aux périls qu’ils ont déjà eu l’occasion de dénoncer. Le débat devra donc aussi trancher : pourra-t-on à l’avenir proposer une diversité de licences ou la licence ouverte, proposée et mise en oeuvre par Etalab, va-t-elle s’imposer à tous ?

Troisième élément : les « formats » de mise à disposition. Ce terme peut s’entendre de deux manières. La première concerne le mode de mise à disposition, le second les formats des données elles-mêmes. Concernant les modes de mise à disposition, certains acteurs des transports privilégient la mise en oeuvre de services (webservices, API),  plutôt que de la mise à disposition de données en téléchargement – une opposition qui n’est pas irréductible à mon avis, les deux modes correspondant à des usages et des cibles de réutilisateurs différents. A propos des formats, la plupart des réseaux mettent une partie de leurs données à disposition en GTFS, le standard de facto pour la réutilisation de données transport en mode open data. Le gouvernement va-t-il inciter à – ou imposer – l’usage d’autres formats (mieux connus du domaine des transports) ? Ou alors va-t-il laisser ces éléments au libre choix des acteurs ?

Dernier élément, qui va souvent de pair avec la question de la licence : la monétisation et le partage de la valeur. Doit-on imposer un partage des revenus avec les autorités organisatrices en cas de réutilisation commerciale des données ? Doit-on discriminer les utilisateurs selon l’usage des données (la non-discrimination entre utilisateurs étant, rappelons-le, l’un des principes fondamentaux de l’open data).

5 – Un débat qui ne se limite pas au domaine des transports publics

On voit donc que le débat à venir sera sans doute très riche, passionnant et porteur d’enjeux importants.

Mais je voudrais ici rappeler (amicalement) aux acteurs du monde des transports que ce débat thématique ne sera que l’un des six qui sont prévus.

Dans la galaxie du sujet open data, le transport est l’une des thématiques mais pas la seule. Les débat sur les données de santé, ou les données culturelles, seront à coup sûr tout aussi impliquant pour l’open data. L’idée d’une licence dédiée pour les données transports, par exemple, me semble devoir être confronté à ce « moment Galilée« .

Les acteurs du transport ne sont pas plus légitimes que les acteurs de la santé ou de la culture pour réclamer une licence propre et un régime d’exception (la culture en bénéficie déjà)… je doute que ce voeu puisse donc être exaucé, ou alors l’Etat accepte de céder une situation avec une licence (sans doute critique, mais lisible) pour une kyrielle de licences thématiques (c’est possible, mais j’émets des doutes sérieux).

Sans compter que la galaxie de l’open data en France tourne elle-même d’un astre encore plus large, la politique européenne en matière de réutilisations des données publiques. Et dans ce domaine, au regard de la nouvelle directive européenne, l’heure n’est pas à définir de nouvelles redevances mais plutôt à les limiter… Un vrai moment Galilée !

Je profite de ce billet pour vous inviter à suivre les travaux de la journée d’échange sur l’Open Data Transport, que je co-organise avec le GART et Christophe Duquesne. Rien de tel qu’une bonne discussion pour trouver des réponses !

Que faire avec les données ouvertes de mobilité ?

Le 19 décembre 2012 j’ai animé à la Cantine de Rennes une soirée spéciale sur les données ouvertes de mobilité. A cette occasion, j’ai présenté un tour du monde des réutilisations possibles de ces données. L’objectif : démontrer, par l’exemple, que l’open data transport ne sert pas uniquement à produire des applications mobiles !

1 – L’information voyageur ne se limite pas aux applications mobiles

The City Dashboard (Casa - UCL)

The City Dashboard
(Casa – UCL)

L’application mobile d’information voyageur est bien souvent la face la plus visible de l’open data pour le grand public, en témoigne le grand nombre de services mobiles proposés lors des concours et autres hackatons de données ouvertes. Cependant, cette focalisation sur un seul type de réutilisation génère aussi une incapacité à appréhender tous les usages possibles des données de mobilité.

La problématique de diffusion et de partage de la donnée transport s’inscrit aujourd’hui dans une double tendance : accroissement de la demande d’information voyageur (en tous lieux, en tous temps et sur tous supports) et difficulté à proposer une offre institutionnelle qui couvre l’ensemble des besoins, aussi spécifiques soient-ils.

Dès lors, l’open data est une piste pour répondre à cette diversité de besoins. L’info de mobilité prend son sens à partir du moment où elle est disponible au moment où on en a besoin, dans sa poche, dans l’écran du bus, sur le site Internet du réseau mais aussi – et surtout – dans tous les lieux où elle est aujourd’hui absente. Trois exemples pour illustrer cet usage de « consultation » de la donnée de mobilité (je reprends ici la grille de 4 classes de réutilisation développée dans mon ouvrage) :

Le City Dashboard a été développé par des universitaires britanniques. Ils proposent en un seul écran un tableau de bord de la ville, en particulier sur les questions de mobilité. On y retrouve notamment le taux d’utilisation en temps réel des stations de vélo en libre-service, mais aussi les perturbations dans le métro et l’état du trafic routier… mais aussi la météo, les dernières actualités ou les tendances locales sur Twitter… Le City Dashboard a été conçu pour être déployé partout via un simple écran de PC.

The Muni-Watch(Joe Hugues)

The Muni-Watch
(Joe Hugues)

La montre « Muni Watch » (du nom du réseau de transport municipal de San Francisco) a été développé par Joe Hughes. La montre indique les 3 prochains horaires de passage pour l’arrêt de bus le plus proche – elle communique en Bluetooth avec un smartphone Android. A noter que le projet a été l’un des premiers initiés suite à l’ouverture des données de cette ville californienne… et date de 2008 !

Plus près de nous, dans le cadre du LabFab rennais, Baptiste Gaultier a conçu « La Boîte » sur une base Arduino (électronique open source). Cette petite boîte, qui trouvera  sa place dans votre salon, indique la météo, le nombre de minutes avant le prochain passage d’un bus ou le nombre d’emails reçus…

Aussi anecdotiques puissent-ils paraître, ces deux derniers projets montrent que l’on peut encore imaginer de nouvelles formes de diffusion de l’information de mobilité. Il y a sans aucun doute des pistes à creuser du côté de l’ambient computing pour créer des objets communicants qui nous informent tout en restant le moins intrusif possible. Le lapin Nabaztag, la star de Noël (en 2006…), ou la lampe Orb étaient de bons candidats pour afficher l’imminence du passage d’un bus avec des codes couleurs très simples…

2 – Des médiations : rendre visible les mobilités dans la ville

5 millions de trajets vélo (Jo Wood - City University London)

5 millions de trajets vélo en une image
(Jo Wood – City University London)

Les médiations – notamment visuelles – permettent de représenter les flux de mobilité dans la ville. La représentation cartographique pré-existait bien entendu au mouvement d’ouverture des données, mais l’open data lui a donné un nouveau souffle. Les visualisations peuvent être ludiques ou avoir un objectif professionnel – par exemple dans le domaine de l’analyse de l’accessibilité. Trois exemples pour illustrer ce second type de réutilisation des données de mobilité (la médiation) :

L’opérateur des transports londoniens (TfL) a mis en ligne un fichier comportant le 1er million de trajets effectués par le service de vélo en libre-service de la capitale Barclays Cycle Hire (connu sous le surnom de Boris Bikes, le prénom du maire). Ces données historiques ont donné lieu à plusieurs représentations : l’effet d’une grève du métro sur l’utilisation du service de vélo, le repérage des principaux noeuds de circulation ou encore les jours de fréquentation record du service…

Melbourne Pedestrian Map

Melbourne Pedestrian Map (City of Melbourne)

La municipalité de Melbourne en Australie dispose d’une série de 18 capteurs piétonniers répartis dans le centre-ville. Ils enregistrent en temps réel le nombre de piétons qui empruntent un trajet particulier. Ces données ont donné lieu à une représentation interactive, on peut ainsi visualiser les flux de piétons heure par heure ou « rejouer » une journée d’affluence exceptionnelle (la parade annuelle par exemple). A noter que Melbourne propose les données brutes en téléchargement, ce qui permet donc de construire sa propre visualisation ou – encore mieux – d’utiliser ces données comme matière première (cf. la prochaine classe d’utilisation).

Enfin, dans le cadre du concours Rennes Métropole en accès libre, la société Isokron avait réalisé une très intéressante vidéo « Un lundi à Rennes » qui répondait visuellement à la question : jusqu’où peut-on se aller en 10, 15 ou 30 minutes en n’empruntant que les transports publics ? Cette dernière visualisation est clairement plus ludique qu’informative, mais elle propose une autre représentation du réseau de transport urbain…

3 – La donnée de mobilité comme matière première

La donnée de mobilité peut aussi être utilisée comme une matière première, pour un usage qui n’est pas directement lié à la mobilité. En effet, la question de l’accessibilité d’un lieu – que ce soit à pied, en voiture ou en transport en commun – est un sujet qui intéresse bien au-delà des opérateurs de mobilité. Les gestionnaires de grands équipements sportifs, ou encore de centres commerciaux, utilisent la donnée de mobilité comme un intrant dans un processus, par exemple au moment de prendre des décisions d’investissement. Cette question intéresse aussi au plus haut point le marché de l’immobilier.

Transit-friendly apartment search (TransitScore)

Transit-friendly apartment search (TransitScore)

Aux Etats-Unis, la société WalkScore (issue de la fondation FrontSeat) propose une note d’accessibilité pour chaque adresse d’une ville américaine ou canadienne. Le WalkScore (et son équivalent le TransitScore) est un indice qui évalue sur une échelle de 1 à 100 la marchabilité d’un lieu, c’est à dire la capacité à y effectuer la plupart des actes de la vie quotidienne sans avoir à prendre sa voiture. On voit déjà apparaître les premières annonces immobilières qui font figurer ce score dans le descriptif du bien… L’impact de cet indice sur le niveau des prix a lui aussi été évalué. Le plus intéressant dans le WalkScore est la monétisation de cet indice : la société propose un service en ligne à destination des agents immobiliers indépendants.

Ainsi, chacun peut créer une affiche personnalisée avec l’adresse du bien, son score d’accessibilité, une carte des principaux équipements et services de proximité (paramétrables selon le profil des acheteurs pressentis) et bien sûr le contact de l’agent immobilier…. Chaque fiche est facturée 5 dollars, la reproduction étant assurée directement par l’utilisateur du service. WalkScore propose aussi un ensemble de services de syndication de son contenu et de ses données… Bref, l’open data est ici à la fois une matière première et une partie de la production de la société.

Les croisements entre donnée de mobilité et d’autres sources de données restent encore largement à imaginer et à travailler. Un exemple : croiser les données issues de mon Fitbit (le nombre de pas parcourus, le nombre d’étages gravis quotidiennement) avec celles de ma carte de transport, pour montrer concrètement comment l’on peut faire de l’activité physique en prenant les transports en commun (par exemple en n’utilisant jamais les escalators ou les ascenseurs…).

4 – L’art et le jeu, d’autres modes de réutilisations

Je propose de finir ce tour du monde de la réutilisation des données par deux approches différentes et résolument non-utilitaristes de l’open data : le jeu et l’art. Les données de mobilité, notamment par leur caractère souvent urbain, se prêtent bien à des jeux grandeur nature. L’un des premiers exemples est le jeu Chromaroma, qui réutilise (initialement de manière un peu sauvage, aujourd’hui de manière bien encadrée) les données des Oyster Cards (l’équivalent des pass Navigo à Paris). Chromaroma est un véritable jeu dans la ville où les joueurs, regroupés en équipes, accomplissent des challenges et prennent possession – virtuellement bien sûr – de stations de métro (sur le modèle du maire d’un lieu Foursquare).

Dans le domaine artistique, le projet Conductor: MTA.me propose une représentation poétique des mouvements du métro new-yorkais : chaque ligne est une corde de guitare et les croisements génère une mélodie étrange qui évolue au cours de la journée et de l’activité du réseau…

Bref, les données ouvertes de mobilité offrent un éventail de réutilisations très larges, qui dépassent de loin les premières applications mobiles qui ont déjà été développées…

Monétiser les données du transport public… chiche ?

Le groupement des autorités responsables des transports (GART) vient de prendre publiquement position en faveur de l’instauration d’une redevance liée à l’usage commercial des données du transport public.Le sujet est loin d’être anodin pour l’open data Comment concilier innovation et contribution, sans jeter le bébé avec l’eau du bain ?

1 – « Une utilisation à des fins commerciales qui pose question »

Le communiqué du GART fait mention dès les premières lignes du mouvement d’ouverture des données (open data) qui « vise avant tout l’émergence de services innovants et le développement d’initiatives locales » (souligné par mes soins). Mais les données ainsi ouvertes intéressent aussi « tout particulièrement les opérateurs de transport, les géants du web (moteurs de recherche tels que Google, sites web ou acteurs de l’industrie informatique comme Apple) qui monétisent ces informations via l’intermédiaire de la publicité« . Le texte indique par ailleurs que l’utilisation à des fins commerciales de ces données pose question, eu égard au financement de leur production par les autorités organisatrices des transports.

Il y a beaucoup d’idées dans les quelques lignes de ce communiqué, je vais essayer de les clarifier en les étudiant une par une.

Premier élément : l’open data, cela sert à faire émerger des initiatives locales (comprendre : des petites choses bien sympathiques par de gentils contributeurs locaux). Second point : attention les données intéressent aussi des grands acteurs du numérique (Google, Apple) et « des opérateurs de transport » (par exemple la SNCF qui pourrait intégrer dans ses services web des données issues des AOT ?). Troisième point : c’est choquant que ces données fassent l’objet d’une réutilisation commerciale alors que les ré-utilisateurs ne contribuent pas à leur financement.

On retrouve, dans ce troisième point, l’écho des discussions houleuses en cours entre Google et une partie des éditeurs de presse sur le partage des revenus publicitaires liés au service Google Actualités.

Là où le bât blesse me semble-t-il c’est que les données des transports dont nous parlons ici sont juridiquement des données publiques. La commission d’accès aux documents administratifs, dont l’avis avait été sollicité par l’AFIMB l’avait bien confirmé pour les données des horaires théoriques par exemple. Le législateur européen (directive de 2007) a introduit un principe de non-discrimination selon l’usage commercial ou non-commercial des données publiques.

En résumé : si les données du transport public sont des données publiques (à la CADA de le préciser), on ne peut pas justifier l’instauration d’une redevance uniquement par le fait que la réutilisation génère des revenus commerciaux (notamment via la publicité). Dura lex sed lex

Reste l’argument moral : pourquoi laisser des tiers (hormis peut-être les gentils développeurs locaux déjà mentionnés) faire de l’argent sans leur demander de contribuer au bon fonctionnement du système ? Cette question-là me semble beaucoup plus intéressante !

2 – Google, le passager clandestin de l’information transport 

Il n’y point de hasard dans le fait que le communiqué du GART désigne Google parmi les « passagers clandestins » de l’information transport. J’ai déjà eu l’occasion dans mon ouvrage (Open Data, comprendre l’ouverture des données publiques) d’expliquer le rôle de Google dans le domaine de l’information voyageur.

Le géant américain intervient à plusieurs niveaux de la chaîne. Il a porté sur les fonds baptismaux le format d’échange de données GTFS (General Transit Feed Specifications dont le G signifiait initialement Google) aujourd’hui largement utilisé dans les initiatives d’ouverture des données transport. Son service Google Transit propose du calcul d’itinéraires sur le web et les smartphones. Enfin, il ne faut pas être devin pour imaginer qu’à terme Google puisse intervenir lui aussi sur le marché des transports, par exemple en vendant directement des titres de transport via Google Wallet.

Plus généralement, il y a je pense une grande méfiance de la part du secteur des transports vis-à-vis de Google, méfiance partagée tant par les financeurs que par les exploitants. La tribune publiée à la rentrée par le P-DG de la SNCF évoquait la « dangereuse hégémonie des géants du Net et de leurs services commerciaux« .

Risquons ici une opinion personnelle : je pense que l’on tolère d’autant plus mal les « passagers clandestins » du numérique que Google, Apple et autres multinationales du numérique pratiquent une « optimisation fiscale » (un terme politiquement correct pour désigner les stratégies légales pour réduire l’impôt) qui commence à choquer, et pas seulement dans l’Hexagone (voir à ce propos les enquêtes détaillées et édifiantes de BFMTV et de Bloomberg, deux sources pourtant très business-friendly). En ces temps de disette des finances publiques, on comprend aisément que de telles pratiques puissent irriter…

Il y a donc une vraie question posée à ces entreprises mais pour autant il me semble que la position du GART risque, en voulant les cibler, de pénaliser une dynamique encore naissante en France autour de la réutilisation des données transports, dynamique qui n’est pas uniquement portée par des géants du Net.

3 – Des services utiles… pour qui ?

Prenons les quelques agglomérations qui ont ouvert leurs données transport en France. Pour Rennes ou Nantes par exemple, combien d’applications développées par des développeurs tiers pour une application officielle ? A qui servent ces applications ? A ceux qui les utilisent bien sûr, mais pas uniquement me semble-t-il.

De tels services d’infomobilité renforcent l’attractivité du transport public, et c’est bien un objectif partagé par les autorités responsables des transports. Combien de collectivités auront l’envie, les moyens et la créativité de développer un service de calculateurs d’itinéraires pour personnes à mobilité réduite à l’instar d’Handimap ? Combien d’autorités organisatrices des transports sont organisées pour développer des applications mobiles pour un nombre croissant de plateformes ? Dès lors, la position du GART suscite au moins trois interrogations :

– Pourquoi prendre le risque, en voulant cibler les « passagers clandestins » de décourager l’émergence de nouveaux services par de nouveaux entrants ?

– Pourquoi vouloir limiter l’open data à des initiatives locales non-marchandes et ne pas encourager les économies d’échelles pourtant bien nécessaires pour assurer la pérennité de ces services ?

– Pourquoi demander au gouvernement un projet de taxe sur l’usage commercial des données transport plutôt que la mise en place d’un référentiel commun d’ouverture de ces données, valable partout sur notre territoire ?

4 – Des pistes pour concilier innovation et contribution … et ne pas jeter le bébé avec l’eau du bain

Comment dès lors concilier la possibilité d’innover avec la contribution au financement du système ? Des solutions existent et elles dépassent largement l’idée d’une redevance telle que la propose le GART.

Première piste : si la cible c’est Google, alors ouvrons les données transport en privilégiant une licence OdBL ! Le moteur de recherche n’aime pas beaucoup les obligations liées à cette licence – et c’est d’ailleurs l’une des raisons de son adoption par Open Street Map (mémo : regardez aussi la licence utilisée par la SNCF).

Deuxième piste : une tarification à l’usage sans barrière à l’entrée. On peut imaginer que, pour couvrir les frais de mise à disposition des données temps réel via des API, on mette en place une tarification double : gratuite jusqu’à X requêtes (par jour, par minute, …) puis payante pour les utilisateurs les plus gourmands. C’est d’ailleurs exactement le modèle mis en place par Google lui-même pour son service Google Maps !

Troisième piste : distinguer l’usage des données et l’usage des éléments de marque. Plusieurs réseaux de transport publics étrangers, et notamment le MTA (New-York) et TfL (Transport for London) font contribuer les ré-utilisateurs non pas sur la donnée mais sur l’usage des éléments de marque : le logo du réseau, les codes graphiques, le nom, … New-York par exemple demande aux développeurs qui souhaitent les utiliser de signer un contrat et de payer des royalties en cas d’usage commercial. En clair, si l’application est gratuite (ce qui n’interdit pas la pub !) et que le développeur ne veut pas mettre le logo du réseau dans ses écrans, il ne paie rien à personne. Et son service présente un bénéfice pour tous, autorité organisatrice incluse !

Les 3 leçons de l’ouverture des données de la RATP

C’était incontestablement l’actualité open data de l’été : la régie des transports parisiens a fait un premier pas en ouvrant quelques jeux de données. Au-delà du buzz généré par cette annonce, retour sur les leçons de l’ouverture des données façon RATP. Des leçons qui ne s’adressent pas uniquement au domaine de la mobilité … 

1 – L’ouverture des données est-elle inéluctable ?

L’open data et la RATP c’était déjà toute une histoire. Pour fédérer un mouvement, rien de tel que de se donner un ennemi commun, et il faut bien avouer que la régie a tout fait pour tenir au mieux le rôle du méchant. La très médiatisée affaire qui a opposé l’an dernier l’éditeur de l’application CheckMyMetro et la RATP en est le point de départ, le « moment » open data a fait le reste.

Je parle de « moment » parce qu’objectivement la situation était plus complexe que la fable de David contre Goliath. Le débat s’est dans un premier temps concentré sur l’usage non-autorisé du plan de métro parisien par la start-up. Or un plan c’est un document, pas une donnée. Evoquer l’open data dans ce cas, c’est tout à fait abusif. La CADA, qui avait été sollicitée pour rendre son avis a d’ailleurs très clairement précisé que le plan est le fruit d’une création intellectuelle et qu’il ne rentre donc pas dans le champ de la donnée publique.

La loi CADA de 1978 exonère d’ailleurs clairement certains établissements, dont la RATP, de certaines obligations en matière de réutilisation des données publiques. Précisons enfin que l’application CheckMyMetro permet à ses utilisateurs de signaler les contrôleurs. Une telle fonction, de nature à encourager la fraude, n’aide bien entendu pas à apaiser les relations !

Sur le papier donc, et si l’on se reporte aux textes juridiques, il n’y avait pas de raison que la RATP publie des données en open data. Elle n’y était pas obligée.

La première leçon de cette histoire, c’est la combinaison d’une maladresse initiale (la gestion du conflit), du « moment » open data et d’un emballement médiatique généralisé, renforcé par les prises de position répétées de l’ancien président du Conseil national du numérique.

Ce que la loi n’exigeait pas est devenu une obligation quasi-morale. Bref, à bien des points de vue, la RATP se trouvait alors dans une position défensive – et je suis prêt à parier que d’autres prendront bientôt la place de la régie dans cette position plutôt inconfortable (JC Decaux ?).

2 – Valoriser sa marque ou limiter l’usage sauvage des données ?

Comment dès lors passer d’une position défensive à une position offensive ? J’ai décrit dans un billet précédent 9 stratégies de diffusion des données. La RATP me semble une très bonne illustration des mouvements possibles pour passer d’une position défensive à une position offensive. Le premier problème à résoudre était celui de la réutilisation non-autorisée de son plan de métro et des éléments graphiques s’y référant. Le second était lié à l’utilisation sauvage des données horaires, récupérées à partir de son site Wap.

La RATP vient de résoudre la première question, en permettant un usage bien encadré de certains éléments graphiques – dont le fameux plan. « Volte-face » a écrit l’éditeur de CheckMyMetro dans une communiqué de presse à la tonalité victorieuse (poursuivant ainsi la fable de David contre Goliath).

J’y vois plutôt un mouvement habile de la part de la régie pour protéger et valoriser sa marque. On peut par exemple lire dans les conditions d’utilisation que seule la RATP peut utiliser le logo vert comme icône d’application mobile. En ce sens, on se rapproche davantage du programme « Don’t pretend to be us » des transports londoniens.

Force est de reconnaître que sur le deuxième sujet, celui des données, rien n’est acquis. Les jeux de données aujourd’hui publiés sur Etalab ne brillent pas par leur extraordinaire richesse. On est encore loin de ce que d’autres réseaux en France (Rennes, Nantes, Toulouse, …) ou ailleurs (New-York, San Francisco, Londres) ont pu proposer. La prochaine étape sera de passer des intentions aux actes, notamment en proposant des API sur un vrai site dédié, et non quelques fichiers sur le portail gouvernemental. Mais la régie aura au moins su faire baisser la pression médiatique sur le sujet… et c’est déjà beaucoup !

3 – Qui doit gérer l’ouverture des données « publiques » ?

Le premier pas de la RATP marque aussi une tendance : ce sont de plus en plus les exploitants de services – et non les administrations et autorités organisatrices – qui gèrent l’ouverture des données. En région Ile-de-France, cela est particulièrement flagrant : Transilien et la régie se sont lancés dans l’open data bien avant le STIF, pourtant l’autorité qui organise les transports sur ce territoire.

Cette troisième et dernière leçon ne concerne pas uniquement le domaine de la mobilité mais s’adresse à tous ceux qui gèrent des délégations de service public, pour l’eau, l’énergie ou les déchets. Cette mission d’ouverture (et le travail d’animation qui va de pair) va-t-elle peu à peu être intégrée dans de futurs appels d’offres ?

Rendre visible les données ouvertes de Rennes, Nantes et Marseille

Comment rendre visibles les données ouvertes ? J’ai déjà eu l’occasion de raconter l’atelier que j’ai animé à Rennes pour les étudiants de Sciences Po sur le thème des données de mobilité dans la ville. J’ai eu l’opportunité de proposer deux nouvelles sessions, l’une à Nantes lors de la Semaine européenne de l’open data, et l’autre à Marseille lors des rencontres régionales Open PACA. Je vous propose un regard croisé sur ces 3 ateliers…

1 – La chasse aux données en quelques mots

Pour rappel, l’ambition de cette animation est de fournir en 2 heures les éléments de base pour comprendre les données ouvertes et être capable de les repérer dans la ville. La thématique de la mobilité a été choisie pour de multiples raisons, déjà amplement détaillées dans de précédents billets. Chaque atelier regroupe une douzaine de participants et se déroule en 3 temps. On débute tout d’abord par une séance de remue-méninge collectif : « Comment se déplace-t-on aujourd’hui à Rennes / Nantes / Marseille ? Quelles sont les informations nécessaires pour se déplacer en vélo / en bus / à pied / en voiture ? ». Un court exposé théorique permet de faire la distinction entre une donnée et une information, une donnée publique et une donnée ouverte.

Chaque groupe (de 3 à 4 participants) se voit remettre un plan du quartier (une photographie aérienne ou une carte Open Street Map), des gommettes de couleur correspondant à des modes de déplacements (en l’occurrence : la voiture individuelle, le bus et métro, le vélo). Panneaux de signalisation, fiche horaire de bus, information de voirie, … Tout ce qui permet de se déplacer est répertorié et photographié. La dernière partie de l’atelier est consacrée à une mise en commun de nos « découvertes » et surtout à une première lecture critique des données (ou de leurs artefacts pour être plus exact) : à quoi et à qui sert cette donnée ? Qui la collecte et la gère ? Quelle réutilisation peut-on en imaginer ?

2 – Rennes, Nantes et Marseille : les terrains de notre chasse aux données

La Cantine numérique rennaise a accueilli la première session en mars 2012. Situé au sein de l’équipement culturel Les Champs Libres, le lieu est à proximité immédiate du quartier de la gare, hub important des transports rennais. On y trouve notamment les gares routières et ferroviaires, une ligne de métro, de nombreux arrêts de bus urbain, des stations de vélo en libre-service, …

La seconde session s’est déroulée en mai 2012 à la Cantine numérique de Nantes et le terrain choisi pour notre chasse était les environs de la place du Commerce, lui aussi un hub important des transports de la ville (stations de tram, bus, parkings souterrains, stations de vélo en libre-service, …) bien que plus éloigné de la gare. A noter, les nantais sont les seuls français à pouvoir jouir d’un mode de transport ancestral : l’éléphant (quoique sous une forme largement modernisée et plutôt destinée aux touristes).

Les rencontres régionales de l’open data en région Provence Alpes Côte d’Azur ont fourni le cadre de la troisième session à Marseille en juillet 2012. L’atelier s’est déroulé dans les environs immédiats du siège du Conseil régional, dans le quartier de la Porte d’Aix. Si vous êtes déjà venus à Marseille en voiture, vous connaissez cet endroit car jusqu’à récemment c’était la fin de l’autoroute… Mais le quartier est aussi desservi par le métro et de nombreux bus.

J’ai détaillé les terrains de notre chasse aux données car il me semble évident qu’ils ne sont pas étrangers aux différents résultats obtenus. La session rennaise a fait l’objet d’un compte-rendu détaillé, je vous invite donc à le consulter. Voici les points marquants de mon rapport d’étonnement pour Nantes et Marseille.

3  – En vélo, tu iras à Nantes … mais pas toujours en open data

La part modale du vélo s’établit à environ 2% dans la capitale ligérienne (pour mémoire, cet indicateur mesure la part des déplacements qui sont effectués à l’aide de ce mode de transport), contre 4% à Rennes et 1% à Marseille (source des données Fubicy et EPOMM). Les participants nantais de l’atelier ont ainsi pu repérer de très nombreuses données et informations sur cette thématique autour de la place du Commerce : indication de pistes cyclables et de parking vélos, itinéraires vélo, …

Le service de vélo en libre-service Bicloo a attiré l’attention du groupe. En effet, la plate-forme nantaise open data propose bien un jeu de données sur le service Bicloo mais celui-ci ne concerne que la localisation des stations… et non les données les plus utiles pour les réutilisateurs à savoir la disponibilité en temps réel des vélos et des places restantes.

« Mais pourtant, le site web du Bicloo c’est bien celui de Nantes Métropole, non ? » m’a fait remarquer l’un des participants à cet atelier. Une remarque de bon sens évidemment, puisque le visiteur du site bicloo.nantesmetropole.fr devra consulter les mentions légales pour constater que le site est géré par JC Decaux, l’exploitant du système de vélo en libre-service… et non pas Nantes Métropole, dont le logo apparaît pourtant en bonne place.

Cet exemple a permis au groupe d’illustrer la différence entre une donnée et une donnée publique – JC Decaux n’exerçant pas dans le cas présent une « mission de service public » et n’étant donc pas concerné par la loi CADA de 1978. La lecture des conditions générales d’utilisation de l’application iPhone officielle de JC Decaux démontre aussi parfaitement ce que n’est pas une donnée ouverte. Le design de l’application AllBikesNow et ses écrans de pub sont en tant que tels des pousses-au-crime, en l’occurrence une véritable incitation à la réutilisation sauvage. Vu la qualité des développements internes, il sera difficile de justifier longtemps le contrôle exercé sur les données…

4  – A Marseille en voiture tu iras … et patient tu seras

Marseille, le Vieux-Port, la vue depuis Notre Dame de la Garde, les plages … J’aime beaucoup la ville, surtout depuis que j’y viens en TGV et que je m’y déplace en tram et à pied… Mais ma vision de touriste n’était pas celle des participants à la 3è session de cet atelier. Le groupe « vélo » a sillonné le quartier pendant près d’une heure et sans grand succès. Mis à part une station de vélo en libre-service, peu d’informations disponibles pour les rares cyclistes de la capitale du Sud… Le groupe « voiture » a par contre repéré plusieurs dizaines de points d’intérêt pour l’automobiliste : des parkings, des panneaux de signalisation, de nombreuses déviations, des plots pour empêcher les automobilistes de se garer sur les trottoirs, …

Devant la profusion des informations (des ordres et des contre-ordres), l’information la plus claire n’est pas toujours là où on l’attend : c’est le panneau publicitaire géant pour une grande chaîne hôtelière qui indique le plus sûrement son chemin à l’automobiliste qui veut rejoindre l’A55 et le quartier de la Joliette ! Dernier élément de curiosité : les panneaux qui indiquent le fast-food le plus proche sont très intelligemment (et sans doute aussi très illégalement) disposés. A chaque carrefour important, depuis les principaux arrêts de bus, à partir de la sortie du métro : celui qui cherche le Mac Donald’s ne peut pas se perdre !

Au-delà de leur caractère anecdotique, ces deux exemples montrent que les données utiles pour la mobilité ne sont pas l’apanage exclusif des acteurs publics ou des grands opérateurs. Si elle se veut complète, l’ouverture des données doit donc aussi impliquer ces acteurs qui ne relèvent d’une mission de service public – et échappent donc ainsi à la loi CADA de 1978 (voir à ce sujet mon précédent billet : pourquoi ouvrir ses données quand la loi ne vous y oblige pas ?).

5 – Comment améliorer cet atelier ?

L’ambition de ce format d’animation est de fournir en un temps court les bases de compréhension des données et de montrer leur réalité dans notre vie quotidienne. La thématique de la mobilité n’est au final qu’un prétexte, et je travaille d’ailleurs sur de nouveaux ateliers avec d’autres thématiques (la culture, le tourisme, la petite enfance, …).

Je pense que cet objectif de « vue d’ensemble » est à peu près atteint (si vous avez participé à cet atelier et/ou que vous souhaitez proposer des idées, n’hésitez pas à commenter ce billet). Cependant, j’en vois aussi les limites et je m’interroge sur plusieurs points :

– l’intérêt de la carte comme support de découverte : cet atelier n’est pas une cartopartie, on ne vise pas l’exhaustivité mais plutôt la diversité des points d’intérêt. La carte sert aussi à délimiter le terrain de jeu, mais est-elle vraiment utile ?

– le caractère parfois déceptif de l’exercice : cet atelier vise aussi à susciter l’intérêt et la curiosité pour les données ouvertes or parfois, comme dans l’exemple du Bicloo à Nantes, on peut en ressortir en se disant « qu’on ne peut rien faire avec les données ouvertes à ce jour… » En 2 heures on ne produit pas de réalisations concrètes, on pose juste les bases de compréhension du contexte juridique de l’open data en France,

– la capacité à porter un regard critique sur la donnée : ce format permet de montrer qu’avant la réutilisation il y a une utilisation… mais c’est à peu près tout en matière de critique de la donnée brute. Je pense que c’est en grande partie dû à la thématique retenue, celle de la mobilité qui se prête peut-être moins à l’exercice que d’autres sujets…

Je travaille actuellement à la définition de formats d’animation autour de la culture de la donnée. Un prochain billet racontera l’atelier que j’ai eu le plaisir de co-animer la semaine dernière à Brest, une pierre de plus à l’édifice d’un « truc » genre infolab. A suivre 😉

Le mobile, la mobilité et l’open data


Vendredi soir dernier j’étais invité au lancement des HackDays de Transilien. La filiale Ile-de-France de la SNCF a ouvert des premiers jeux de données et organise un hackaton durant 48 heures à la Cantine de Paris. A cette occasion, j’ai traité du rapport entre le (téléphone) mobile, la mobilité (les transports) et les données ouvertes. Extrait de cette intervention. 

Pourquoi les applications mobiles pour les transports représentent-elles la face la plus visible de l’open data ? Comment expliquer le lien très fort entre le mobile, la mobilité et les données ouvertes ? Cet billet se propose d’explorer les dimensions de cette relation à trois. Une relation historique et relativement féconde.

1 – Le mobile et la mobilité : temps de transport, temps perdu ?

La téléportation, un moyen de transport ? (photo by PauliePaul)

Depuis plus de 50 ans, le temps de transport est resté globalement stable dans les pays développés. Chacun passe en moyenne une heure par jour à se déplacer – quel que soit le motif de ce déplacement (aller au travail, visiter des amis, faire du tourisme, se déplacer pour ses loisirs, …). Mais cette étonnante stabilité cache en réalité deux évolutions importantes, la première étant bien entendu l’accroissement des distances parcourues. La seconde évolution est liée à l’occupation de ce temps de transport.

On considère souvent le temps de transport comme du temps perdu, un temps à minimiser au maximum (l’évaluation économique d’un nouveau projet d’autoroute ou d’une nouvelle ligne de métro s’appuie d’ailleurs largement sur cette idée de temps à re-gagner). L’article « The Gift of travel time » publié en 2007 dans le très sérieux Journal of Transport Geography remet justement en cause ce dogme. Les deux chercheurs britanniques, sociologues des transports, se sont attachés à comprendre comment nous utilisons notre temps pendant que nous nous déplaçons.

Dans une bonne logique utilitariste, si le temps de transport est exclusivement un temps perdu, alors chacun d’entre nous devrait chercher à le réduire à zéro. D’où l’hypothèse de la téléportation que les deux chercheurs ont testé (on parle bien là d’hypothèse dans la mesure où la téléportation n’existe pas encore en dehors des films de science-fiction…) : « et si votre temps de transport était réduit à zéro et que vous puissiez vous rendre instantanément d’un point à l’autre, de votre bureau à votre salon ?« . Curieusement, peu de personnes interrogées se sont montrées intéressées par un tel scénario.

L’article explique que le temps de transport a une valeur en tant que telle pour les voyageurs. On parle notamment d’un temps de transition (transition time), d’un sas entre deux lieux, deux moments, deux rôles. Je quitte mon travail en fin de journée et mon trajet me permet aussi de me préparer à arriver dans mon foyer. Mais le plus intéressant dans cet article de 2007 est la notion de temps équipé. Si le temps de transport n’est pas exclusivement du temps perdu, c’est aussi parce que nous l’équipons d’un ensemble d’outils, numériques ou pas, pour le rendre « utile » mais pas seulement.

Equiper le temps de transport – avant l’iPhone (photo by Rockheim)

Bien avant l’arrivée de l’iPhone, on savait déjà « équiper » le temps de transport. La lecture d’un livre ou de la presse en est l’illustration. On peut d’ailleurs souligner que sans métro et RER, il n’y aurait pas de presse gratuite. La grande innovation, pour les voyageurs, date de 1979 et s’est vendu à plus de 200 millions d’exemplaires. Le Walkman propose une expérience inédite, celle de l’écoute musicale en ballade qui permet de se re-créer une bulle personnelle au milieu des autres passagers. En un mot, d’individualiser un transport collectif. Les téléphones mobiles permettent de passer des appels mais aussi d’envoyer des SMS. Cette dernière fonction, moins intrusive, est largement répandue dans les transports. Le succès de l’i-mode au Japon au début des années 2000 préfigure celui de l’Internet mobile. On explique d’ailleurs en partie cet engouement des japonais pour l’i-mode par le fait qu’ils sont de grands commuters

2 – Le smartphone : gagner du temps et faire passer le temps

Le smartphone réconcilie les deux temps du transport. Lorsque je consulte les horaires de passage de mon RER, que j’identifie la sortie la plus proche de ma correspondance, que je prépare mon prochain déplacement en réservant un billet de train et une chambre d’hôtel, que je confirme à ma compagne que je vais bien chercher notre fille à la crèche, je gagne du temps. Mais au cours du même trajet, je vais aussi regarder les résultats de mon équipe de foot favorite, visionner une vidéo de ma fille, perfectionner mon niveau à Angry Birds ou Cut the Rope, commenter la photo d’un ami sur Facebook ou signaler via Twitter qu’il y a des contrôleurs à Saint-Lazare… Bref je vais faire passer le temps (ou le « tuer »).

Le lien fort entre smartphone et mobilité tient en partie à cette double dimension de time-saver et time-killer. La proximité entre l’outil (le téléphone mobile) et l’activité (se déplacer) est naturelle : ils ont des gènes en commun.

3 – L’open data et le mobile : pourquoi d’abord des applications mobiles ?

Les applications mobiles représentent la face la plus visible de l’open data – au risque d’ailleurs d’occulter toutes les autres réutilisations possibles des données ouvertes. Comment peut-on expliquer cette sur-représentation ?

Apps For Democracy : l’un des tous premiers concours open data

Cela tient en partie au mode d’animation principal de l’open data, à savoir les concours. Les premiers concours de réutilisation des données ouvertes (Washington D.C., New-York, San Francisco, Chicago, Londres, …) sont des concours d’applications mobiles. Le contexte technologique n’y est sans doute pas étranger : dans les années 2008-2009 les applications mobiles deviennent à la mode. Quand Rennes lance son concours en 2010, l’accent est clairement mis sur ce type de réutilisation (comme plus récemment à Nantes ou en Saône-et-Loire d’ailleurs). L’open data des territoires oriente aussi les réutilisateurs vers des services utiles au quotidien – et les applications mobiles en font partie.

Il y a d’ailleurs une certaine ironie de l’histoire à faire des applications mobiles la face la plus visible de l’open data. Comme je l’ai déjà souligné dans un précédent billet, il n’y a pas d’open data sans open source. Or, que peut-on imaginer de plus antinomique à l’ouverture qu’une application mobile pour iPhone ? Si Tim Berners-Lee était déjà mort, il se retournerait dans sa tombe !

4 – La mobilité, une place à part

Enfin, la question de la mobilité et des transports occupe une place à part dans le domaine des données ouvertes. La demande des réutilisateurs est forte (voir par exemple les résultats de l’enquête menée par Socrata en 2011 ou celle réalisée pour mon bouquin en France). De tous les jeux de données ouvrables, ce sont ceux qui concernent la mobilité (au sens large : les transports collectifs mais aussi le vélo, la marche à pied, les parkings, …) qui sont les plus demandés.

C’est aussi dans le champ de la mobilité que l’on trouve le plus de réutilisation « sauvage » en cas de non-ouverture des données. Le cas de CheckMyMetro a été largement médiatisé, de même que les multiples déboires des développeurs avec l’exploitant du Vélib’.
Lors de mon récent déplacement à Montpellier, j’ai découvert le travail remarquable du développeur qui a crée Api Tam, une API qui permet d’interroger les horaires du réseau de transport montpelliérain. C’est du grand art : au lieu de développer une application mobile, il a conçu des outils qui permettent à tous les réutilisateurs d’utiliser les données pas encore ouvertes par l’opérateur local de transport (la TAM) … En prime, il reste fidèle à l’open source puisque tout est redistribué sur GitHub.

La demande pour ce type de données est forte et elle se traduit aussi par de nombreuses réalisations concrètes. La majorité des applications mobiles développées dans le cadre des concours (tant aux Etats-Unis qu’en Europe) ont un rapport avec cette thématique.

En conclusion, on voit donc bien que le lien entre le mobile, la mobilité et l’open data est fort et fécond. Reste la question de l’oeuf et de la poule, que j’ai encore un peu de mal à identifier avec précision. Est-ce que l’on a beaucoup d’applis de transport parce que les concours ont orienté les réutilisateurs vers ce type de développement ? L’appétit pour les données transport vient-il justement de cette orientation particulière qui date des années 2008-2009 ou est-elle plus générique ? Vos commentaires et éclairages sont les bienvenus !