Open Data Transport : les enjeux du débat à venir

Où va l'open data transport ?

Où va l’open data transport ?

La feuille de route gouvernementale sur l’ouverture des données publiques (open data) prévoit l’organisation de six débats thématiques et ouverts. L’un d’eux doit précisement s’intéresser aux données du transport.  Ce billet de blog se propose de commencer à identifer les enjeux et les questions du débat à venir.

(Edité le 3 juin pour rajouter un schéma sur les données déjà ouvertes et préciser les questions liées aux formats de mise à disposition).

1 – Le contexte actuel et les objectifs des débats thématiques

Les débats thématiques ont plusieurs objectifs décrits dans la feuille de route : ils doivent permettre d’identifier et de publier de nouveaux jeux de données stratégiques et de qualité, mais aussi d’étudier la possibilité d’élargir et d’étendre la politique d’ouverture des données à l’ensemble des acteurs : collectivités territoriales, délégataires de service public, entreprises publiques, établissements publics à caractère industriel ou commercial, … On voit bien que l’enjeu pour l’open data transport est important, car les changements pourraient concerner l’ensemble des acteurs de la mobilité et des transports.

Par ailleurs, ce débat à venir s’inscrit plus généralement dans la réaffirmation, tant en France qu’aux Etats-Unis, des principes de l’ouverture des données « par défaut » et de la gratuité des données brutes comme l’un des leviers / piliers de cette politique. L’acte 3 de la décentralisation explicite d’ailleurs ce principe d’open data par défaut. Certes, la perspective de son adoption s’éloigne un peu – ce qui pourrait soulager ceux qui sont inquiets des risques que feraient peser, selon eux, la généralisation de l’open data. Mais l’Europe ne reste pas non plus inactive, avec l’adoption de la nouvelle directive PSI (public sector information) qui fixe des orientations assez fortes (et notamment le principe access = reuse) et finalement assez proches des principes défendus par la feuille de route gouvernemental.

Il y aura donc un débat thématique sur les données du transport et de la mobilité. La perspective d’un open data « par défaut », et non d’un open data comme une « option » éclaire  bien sûr d’une lumière nouvelle les questions à venir. En voici quelques unes.

2 – Quelles données ?

Les données du transport, et plus globalement de la mobilité sont diverses et variées. On y retrouve tous les types de données que nous manions quotidiennement dans le domaine de l’open data : données brutes / données enrichies, données historiques / données prédictives, données en stock / données en flux, données de description / données d’exploitation ou de commercialisation, …

Dans une optique de mobilité au sens large, il faut aussi prendre en compte un grand nombre de modes : piéton, vélo, automobile, transports en commun, … Enfin, et ce n’est pas là la moindre difficulté, les données de mobilité sont produites / collectées / gérées par un très grand nombre d’acteurs aux statuts juridiques et aux stratégies parfois incompatibles.

Nous avons donc potentiellement un très grand nombre de données concernées, elles-mêmes très diverses dans leurs caractéristiques, leurs statuts juridiques, leurs valeurs identifiées, réalisées ou perçues. L’un des enjeux du débat sera donc de tenter de classer ces données et de leur attribuer une priorité d’ouverture – un peu à la manière des données « stratégiques » citées par la feuille de route gouvernementale.

OpenDataTransport-donneesdejaouvertes.009Une rapide analyse des sites open data des réseaux de New-York (MTA), Londres (TfL, Transport for London), Paris (Ratp, Transilien) et Rennes (Star) permet déjà d’identifier une très grande diversité dans les données déjà ouvertes.

Le schéma ci-contre en présente une sélection, classée selon deux axes : l’objectif (transparence / participation) et le type de données (dynamiques / statiques).

La question de la valeur des données sera bien sûr au coeur des échanges. Par essence, cette valeur est multiple (valeur monétaire, valeur d’usage, valeur de ré-utilisation, valeur d’image, …) et dépend en partie de ceux qui réutilisent la donnée – et de ceux qui la réutiliseront demain ! Nous aurons donc – et ce ne sera pas facile – à discuter du partage de la valeur de données alors que nous n’avons qu’une vision assez partielle de leur vraie valeur actuelle et future pour l’ensemble des acteurs de la chaîne…

Concernant les critères de priorisation, il y aura aussi à coup sûr un débat dans le débat. Faut-il considérer les données selon l’usage qu’elles permettent (par exemple le calcul d’itinéraires) ou alors selon le statut (AOT, exploitant) de celui qui va l’ouvrir ? Faut-il prendre comme premier critère l’impact économique, social et sociétal de la donnée ? Et si oui, comment faire ? Nous pourrions imaginer par exemple de favoriser l’ouverture de données qui encouragent le transfert modal vers des modes de déplacements moins polluants que la voiture individuelle – c’est une piste parmi d’autres.

(Le débat devra par contre permettre de clarifier le statut juridique de la donnée de transport, et ce sera déjà une grande avancée)

3 – Quels acteurs ?

Le second enjeu est bien sûr lié aux acteurs qui seront concernés par l’ouverture des données du transport. Il faudra trouver une certaine concordance entre la loi d’organisation des transports (LOTI) et les futurs ajustements liés à l’open data. Certaines autorités organisatrices des transports craignent que l’obligation qui pourrait les viser « épargne » leur exploitant si celui est une entreprise publique ou un EPIC ou un EPA (on parle bien sûr de la SNCF ou de la RATP).

La question des acteurs rejoint celle du périmètre de l’ouverture et l’Etat n’est pas tout à fait un acteur neutre. L’open data pourrait figurer parmi les objectifs assignés aux systèmes d’informations multimodaux, qu’il s’agisse de SIM départementaux, régionaux ou nationaux. On pourrait aller un peu plus loin et imaginer que l’Etat et l’Europe réservent leurs co-financements aux seuls projets de SIM mettant en oeuvre des politiques d’ouverture et de partage des données – mais, encore une fois, ce n’est qu’une piste parmi d’autres.

4 – Quelles modalités d’ouverture ?

Les deux premiers enjeux que j’ai cité correspondent donc aux questions du « quoi ? » et du « qui ? ». La question des modalités de l’ouverture – le « comment » – est bien sûr l’une des plus importantes.

Premier élément des modalités de l’ouverture : le degré d’obligation. Va-t-on être dans le domaine de la bonne pratique, de l’incitation (si besoin avec des mécanismes financiers du type subvention conditionnée à la mise en place d’une politique open data) ou de l’obligation (mandatory) ? Bien sûr il y aura toute une palette de réponses, selon les types de données, les acteurs ou les usages pressentis.

Second élément : la licence applicable à ces données.  Certaines collectivités ont déjà fait part de leurs craintes sur des réutilisations de « leurs » données contraires à leurs objectifs de politique publique. Le Grand Lyon par exemple a ainsi conçu une approche SmartData, avec trois licences différentes dont l’une avec des données payantes – c’est leur réponse à l’open data et aux périls qu’ils ont déjà eu l’occasion de dénoncer. Le débat devra donc aussi trancher : pourra-t-on à l’avenir proposer une diversité de licences ou la licence ouverte, proposée et mise en oeuvre par Etalab, va-t-elle s’imposer à tous ?

Troisième élément : les « formats » de mise à disposition. Ce terme peut s’entendre de deux manières. La première concerne le mode de mise à disposition, le second les formats des données elles-mêmes. Concernant les modes de mise à disposition, certains acteurs des transports privilégient la mise en oeuvre de services (webservices, API),  plutôt que de la mise à disposition de données en téléchargement – une opposition qui n’est pas irréductible à mon avis, les deux modes correspondant à des usages et des cibles de réutilisateurs différents. A propos des formats, la plupart des réseaux mettent une partie de leurs données à disposition en GTFS, le standard de facto pour la réutilisation de données transport en mode open data. Le gouvernement va-t-il inciter à – ou imposer – l’usage d’autres formats (mieux connus du domaine des transports) ? Ou alors va-t-il laisser ces éléments au libre choix des acteurs ?

Dernier élément, qui va souvent de pair avec la question de la licence : la monétisation et le partage de la valeur. Doit-on imposer un partage des revenus avec les autorités organisatrices en cas de réutilisation commerciale des données ? Doit-on discriminer les utilisateurs selon l’usage des données (la non-discrimination entre utilisateurs étant, rappelons-le, l’un des principes fondamentaux de l’open data).

5 – Un débat qui ne se limite pas au domaine des transports publics

On voit donc que le débat à venir sera sans doute très riche, passionnant et porteur d’enjeux importants.

Mais je voudrais ici rappeler (amicalement) aux acteurs du monde des transports que ce débat thématique ne sera que l’un des six qui sont prévus.

Dans la galaxie du sujet open data, le transport est l’une des thématiques mais pas la seule. Les débat sur les données de santé, ou les données culturelles, seront à coup sûr tout aussi impliquant pour l’open data. L’idée d’une licence dédiée pour les données transports, par exemple, me semble devoir être confronté à ce « moment Galilée« .

Les acteurs du transport ne sont pas plus légitimes que les acteurs de la santé ou de la culture pour réclamer une licence propre et un régime d’exception (la culture en bénéficie déjà)… je doute que ce voeu puisse donc être exaucé, ou alors l’Etat accepte de céder une situation avec une licence (sans doute critique, mais lisible) pour une kyrielle de licences thématiques (c’est possible, mais j’émets des doutes sérieux).

Sans compter que la galaxie de l’open data en France tourne elle-même d’un astre encore plus large, la politique européenne en matière de réutilisations des données publiques. Et dans ce domaine, au regard de la nouvelle directive européenne, l’heure n’est pas à définir de nouvelles redevances mais plutôt à les limiter… Un vrai moment Galilée !

Je profite de ce billet pour vous inviter à suivre les travaux de la journée d’échange sur l’Open Data Transport, que je co-organise avec le GART et Christophe Duquesne. Rien de tel qu’une bonne discussion pour trouver des réponses !

Que faire avec les données ouvertes de mobilité ?

Le 19 décembre 2012 j’ai animé à la Cantine de Rennes une soirée spéciale sur les données ouvertes de mobilité. A cette occasion, j’ai présenté un tour du monde des réutilisations possibles de ces données. L’objectif : démontrer, par l’exemple, que l’open data transport ne sert pas uniquement à produire des applications mobiles !

1 – L’information voyageur ne se limite pas aux applications mobiles

The City Dashboard (Casa - UCL)

The City Dashboard
(Casa – UCL)

L’application mobile d’information voyageur est bien souvent la face la plus visible de l’open data pour le grand public, en témoigne le grand nombre de services mobiles proposés lors des concours et autres hackatons de données ouvertes. Cependant, cette focalisation sur un seul type de réutilisation génère aussi une incapacité à appréhender tous les usages possibles des données de mobilité.

La problématique de diffusion et de partage de la donnée transport s’inscrit aujourd’hui dans une double tendance : accroissement de la demande d’information voyageur (en tous lieux, en tous temps et sur tous supports) et difficulté à proposer une offre institutionnelle qui couvre l’ensemble des besoins, aussi spécifiques soient-ils.

Dès lors, l’open data est une piste pour répondre à cette diversité de besoins. L’info de mobilité prend son sens à partir du moment où elle est disponible au moment où on en a besoin, dans sa poche, dans l’écran du bus, sur le site Internet du réseau mais aussi – et surtout – dans tous les lieux où elle est aujourd’hui absente. Trois exemples pour illustrer cet usage de « consultation » de la donnée de mobilité (je reprends ici la grille de 4 classes de réutilisation développée dans mon ouvrage) :

Le City Dashboard a été développé par des universitaires britanniques. Ils proposent en un seul écran un tableau de bord de la ville, en particulier sur les questions de mobilité. On y retrouve notamment le taux d’utilisation en temps réel des stations de vélo en libre-service, mais aussi les perturbations dans le métro et l’état du trafic routier… mais aussi la météo, les dernières actualités ou les tendances locales sur Twitter… Le City Dashboard a été conçu pour être déployé partout via un simple écran de PC.

The Muni-Watch(Joe Hugues)

The Muni-Watch
(Joe Hugues)

La montre « Muni Watch » (du nom du réseau de transport municipal de San Francisco) a été développé par Joe Hughes. La montre indique les 3 prochains horaires de passage pour l’arrêt de bus le plus proche – elle communique en Bluetooth avec un smartphone Android. A noter que le projet a été l’un des premiers initiés suite à l’ouverture des données de cette ville californienne… et date de 2008 !

Plus près de nous, dans le cadre du LabFab rennais, Baptiste Gaultier a conçu « La Boîte » sur une base Arduino (électronique open source). Cette petite boîte, qui trouvera  sa place dans votre salon, indique la météo, le nombre de minutes avant le prochain passage d’un bus ou le nombre d’emails reçus…

Aussi anecdotiques puissent-ils paraître, ces deux derniers projets montrent que l’on peut encore imaginer de nouvelles formes de diffusion de l’information de mobilité. Il y a sans aucun doute des pistes à creuser du côté de l’ambient computing pour créer des objets communicants qui nous informent tout en restant le moins intrusif possible. Le lapin Nabaztag, la star de Noël (en 2006…), ou la lampe Orb étaient de bons candidats pour afficher l’imminence du passage d’un bus avec des codes couleurs très simples…

2 – Des médiations : rendre visible les mobilités dans la ville

5 millions de trajets vélo (Jo Wood - City University London)

5 millions de trajets vélo en une image
(Jo Wood – City University London)

Les médiations – notamment visuelles – permettent de représenter les flux de mobilité dans la ville. La représentation cartographique pré-existait bien entendu au mouvement d’ouverture des données, mais l’open data lui a donné un nouveau souffle. Les visualisations peuvent être ludiques ou avoir un objectif professionnel – par exemple dans le domaine de l’analyse de l’accessibilité. Trois exemples pour illustrer ce second type de réutilisation des données de mobilité (la médiation) :

L’opérateur des transports londoniens (TfL) a mis en ligne un fichier comportant le 1er million de trajets effectués par le service de vélo en libre-service de la capitale Barclays Cycle Hire (connu sous le surnom de Boris Bikes, le prénom du maire). Ces données historiques ont donné lieu à plusieurs représentations : l’effet d’une grève du métro sur l’utilisation du service de vélo, le repérage des principaux noeuds de circulation ou encore les jours de fréquentation record du service…

Melbourne Pedestrian Map

Melbourne Pedestrian Map (City of Melbourne)

La municipalité de Melbourne en Australie dispose d’une série de 18 capteurs piétonniers répartis dans le centre-ville. Ils enregistrent en temps réel le nombre de piétons qui empruntent un trajet particulier. Ces données ont donné lieu à une représentation interactive, on peut ainsi visualiser les flux de piétons heure par heure ou « rejouer » une journée d’affluence exceptionnelle (la parade annuelle par exemple). A noter que Melbourne propose les données brutes en téléchargement, ce qui permet donc de construire sa propre visualisation ou – encore mieux – d’utiliser ces données comme matière première (cf. la prochaine classe d’utilisation).

Enfin, dans le cadre du concours Rennes Métropole en accès libre, la société Isokron avait réalisé une très intéressante vidéo « Un lundi à Rennes » qui répondait visuellement à la question : jusqu’où peut-on se aller en 10, 15 ou 30 minutes en n’empruntant que les transports publics ? Cette dernière visualisation est clairement plus ludique qu’informative, mais elle propose une autre représentation du réseau de transport urbain…

3 – La donnée de mobilité comme matière première

La donnée de mobilité peut aussi être utilisée comme une matière première, pour un usage qui n’est pas directement lié à la mobilité. En effet, la question de l’accessibilité d’un lieu – que ce soit à pied, en voiture ou en transport en commun – est un sujet qui intéresse bien au-delà des opérateurs de mobilité. Les gestionnaires de grands équipements sportifs, ou encore de centres commerciaux, utilisent la donnée de mobilité comme un intrant dans un processus, par exemple au moment de prendre des décisions d’investissement. Cette question intéresse aussi au plus haut point le marché de l’immobilier.

Transit-friendly apartment search (TransitScore)

Transit-friendly apartment search (TransitScore)

Aux Etats-Unis, la société WalkScore (issue de la fondation FrontSeat) propose une note d’accessibilité pour chaque adresse d’une ville américaine ou canadienne. Le WalkScore (et son équivalent le TransitScore) est un indice qui évalue sur une échelle de 1 à 100 la marchabilité d’un lieu, c’est à dire la capacité à y effectuer la plupart des actes de la vie quotidienne sans avoir à prendre sa voiture. On voit déjà apparaître les premières annonces immobilières qui font figurer ce score dans le descriptif du bien… L’impact de cet indice sur le niveau des prix a lui aussi été évalué. Le plus intéressant dans le WalkScore est la monétisation de cet indice : la société propose un service en ligne à destination des agents immobiliers indépendants.

Ainsi, chacun peut créer une affiche personnalisée avec l’adresse du bien, son score d’accessibilité, une carte des principaux équipements et services de proximité (paramétrables selon le profil des acheteurs pressentis) et bien sûr le contact de l’agent immobilier…. Chaque fiche est facturée 5 dollars, la reproduction étant assurée directement par l’utilisateur du service. WalkScore propose aussi un ensemble de services de syndication de son contenu et de ses données… Bref, l’open data est ici à la fois une matière première et une partie de la production de la société.

Les croisements entre donnée de mobilité et d’autres sources de données restent encore largement à imaginer et à travailler. Un exemple : croiser les données issues de mon Fitbit (le nombre de pas parcourus, le nombre d’étages gravis quotidiennement) avec celles de ma carte de transport, pour montrer concrètement comment l’on peut faire de l’activité physique en prenant les transports en commun (par exemple en n’utilisant jamais les escalators ou les ascenseurs…).

4 – L’art et le jeu, d’autres modes de réutilisations

Je propose de finir ce tour du monde de la réutilisation des données par deux approches différentes et résolument non-utilitaristes de l’open data : le jeu et l’art. Les données de mobilité, notamment par leur caractère souvent urbain, se prêtent bien à des jeux grandeur nature. L’un des premiers exemples est le jeu Chromaroma, qui réutilise (initialement de manière un peu sauvage, aujourd’hui de manière bien encadrée) les données des Oyster Cards (l’équivalent des pass Navigo à Paris). Chromaroma est un véritable jeu dans la ville où les joueurs, regroupés en équipes, accomplissent des challenges et prennent possession – virtuellement bien sûr – de stations de métro (sur le modèle du maire d’un lieu Foursquare).

Dans le domaine artistique, le projet Conductor: MTA.me propose une représentation poétique des mouvements du métro new-yorkais : chaque ligne est une corde de guitare et les croisements génère une mélodie étrange qui évolue au cours de la journée et de l’activité du réseau…

Bref, les données ouvertes de mobilité offrent un éventail de réutilisations très larges, qui dépassent de loin les premières applications mobiles qui ont déjà été développées…