Les conflits liés aux données « fermées » se multiplient

La Deutsche Bahn ne veut pas ouvrir ses données ? OpenPlanB s’en charge …

Le récent conflit qui oppose le site FourmiSanté et l’Assurance Maladie (1) vient s’ajouter à une longue liste de confrontations liées à des données « fermées ». Partout en Europe, nous assistons à la multiplication de cas similaires.

Comment peut-on analyser ces conflits ? L’open data peut-il être une réponse aux défis qu’ils posent ?

En Allemagne le groupe de data hacktivists Open Plan B vient de publier les données de la Deutsche Bahn, en réponse expliquent-ils à l’immobilisme du transporteur en matière d’open data. En Suisse, c’est le site fédéral permettant de calculer le montant des primes d’assurance maladie qui a lui aussi fait la une de l’actualité, un député réclamant récemment l’ouverture des données fédérales. En Belgique, le groupe de développeurs iRail.be propose une interface non-officielle d’accès aux données de la compagnie ferroviaire nationale, … On voit donc que cette question n’est pas spécifique à la France. 

1 – A l’origine, la multiplication des services en ligne

La réutilisation non-autorisée de données n’est pas une invention de l’ère Internet. Qui se souvient par exemple du 36 17 ANNU, le premier annuaire inversé sur Minitel qui a fait la fortune du tycoon français Xavier Niel ? Les numéros des abonnés étaient récupérés à partir de l’annuaire 36 11 proposé par France Telecom, en veillant à ne pas dépasser la limite fatidique des 3 minutes, au-delà desquelles le service devenait payant. Une pratique qui a d’ailleurs valu à cet éditeur l’une des plus lourdes condamnations jamais prononcées en matière de bases de données en France (pour mémoire, 100 millions de francs et une astreinte de 4 millions supplémentaires par jour).

Aujourd’hui ce ne sont pas seulement la liste des abonnés au téléphone que l’on peut retrouver sur Internet, mais la plupart des services et administrations publics : localisation et horaires des équipements, informations détaillées sur les transports et leur qualité, données sur la qualité des établissements hospitaliers ou sur les tarifs pratiqués par les médecins, … Ce qui demandait, à l’époque du Minitel, une batterie de serveurs, est aujourd’hui accessible à n’importe quel individu un peu motivé et équipé. La « barrière à l’entrée » pour la collecte non-autorisée de données s’est donc très largement abaissée.

Ajoutons aussi que le travail de collecte est aussi largement facilité par le fait que nombre d’administrations et d’entreprises ont recours aux mêmes prestataires et aux mêmes systèmes pour mettre en ligne leurs données. C’est l’exemple du calculateur d’itinéraires développé en Allemagne par la société Hafas et largement utilisée par de très nombreux réseaux de transport en Europe et aux Etats-Unis. Une fois que l’accès au système Hafas via des API devient documenté pour une ville, il le devient rapidement pour toutes

2 – En face, la réutilisation non-autorisée se professionnalise

L’histoire se déroule souvent de cette manière : une entreprise (ou une administration) découvre un jour qu’une application non-officielle a fait son apparition sur l’AppStore. Parfois – trop souvent -, on s’aperçoit aussi que le dit-développeur avait d’ailleurs fait auparavant une demande officielle d’accès à ces données mais que, ne sachant pas quelle position adopter, on ne lui a pas répondu. Face au « fait accompli« , la première réaction est de mettre en route la machine juridique : mise en demeure, demande du retrait de l’application ou du service en ligne, …

La suite a un air de déjà-vu : le développeur un peu malin médiatise le conflit et interpelle les pouvoirs publics. D’ailleurs cela marche souvent et le changement de champ de bataille (du juridique au moral) tourne rarement à l’avantage de celui qui voit ses données utilisées sans son accord : les élus s’en mêlent, écrivent des lettres ouvertes comme à New-York en 2009 (le fait déclencheur de l’open data du transporteur new-yorkais) ou à Lyon plus récemment.

Le conflit est alors plutôt de type asymétrique : le détenteur des données a le sentiment d’avoir le droit de son côté (n’a-t-il d’ailleurs pas pris le soin de détailler des conditions d’utilisation sur son site web ?), mais le réutilisateur a les « cartes médiatiques » en main, et le moment « open data » (déjà évoqué dans un précédent billet) joue à plein. L’incompréhension est totale.

Mais il y a mieux que les applications non-officielles. J’ai cité plus haut l’exemple de Open Plan B en Allemagne, on peut aussi citer aussi la kyrielle d’API (interfaces de programmation) non-officielles qui se multiplient, à Montpellier, en Suisse, en Belgique. Ceux qui développent ces outils font en quelque sorte le boulot que les détenteurs de données ne veulent pas faire. En voulant contrôler leurs données, ils encouragent l’émergence de tels services et in fine, abandonnent encore davantage leur capacité à maîtriser l’usage qui en est fait.

3 – L’open data : ouvrir pour fournir un cadre à la réutilisation

Personne n’a intérêt à la réutilisation non-autorisée des données, même pas le développeur. En procédant hors d’un cadre technique et juridique clair, il doit faire face à une incertitude juridique qui freine aussi sûrement l’innovation que les redevances tarifaires. A Londres, c’est l’exemple de ce développeur d’une application très populaire qui a découvert un matin que son service ne fonctionnait plus : le site web de l’opérateur Transport for London (TfL) avait modifié la structure de ses pages web sans avertir personne, …

Le détenteur de données a lui aussi intérêt à préciser le cadre juridique, technique et économique de réutilisation des données. Les mises en demeures, les demandes de retrait d’application : cela fonctionne peut-être dans un premier temps (en témoigne la prudence affichée par les réutilisateurs concernés) mais in fine cela ne saurait constituer une politique en matière de diffusion et de valorisation des données.

Hier la RATP, aujourd’hui l’assurance maladie ou certains opérateurs ferroviaires européens : si vos données ne sont pas encore réutilisées sans votre accord, vous savez ce qu’il vous reste à faire : commencer à réfléchir sérieusement à votre politique open data

(1) : Il s’agit dans le cas présent de la réutilisation non-autorisée des tarifs des médecins publiés sur le site ameli-direct.

5 réflexions au sujet de « Les conflits liés aux données « fermées » se multiplient »

  1. Il me semble que dans le récent conflit qui oppose le site FourmiSanté et l’Assurance Maladie, le contexte juridique n’est pas le même que pour la RATP ou la SNCF.

    La CNIL et la CADA ont toutes les deux récemment statuées le fait que les données sur les professionnels de santé publiées sur le site AMELI Direct constituent des « données personnelles » (puisque ces professionnels opèrent sous leur nom propre) et donc étaient de ce fait exclues du droit à réutilisation défini par la loi de 1978.

    Lorsque FourmiSanté aspire les infos référencées sur le site de l’Assurance Maladie, ils détourneraient donc « peu légalement » des données personnelles et pas des données publiques ouvertes.

    Après, ils exploitent intelligemment le mouvement OpenData pour créer un buzz et essayer d’obtenir par un biais médiatique ce qu’ils n’ont pas obtenu d’un point de vue légal, mais pirater des données personnelles, cela me semble peu compatible avec l’esprit de l’Open Data

    • Merci Nicolas pour votre commentaire et l’éclairage supplémentaire que vous apportez. Je vous rejoins en grande partie.

      Le problème de la frontière donnée personnelle / donnée ouverte s’était déjà posé je crois au Royaume-Uni : le fichier qui listait tous les fournisseurs d’une collectivité donnait aussi leurs adresses. Or un certain nombre d’entre eux (travailleurs indépendants) résidaient à l’adresse mentionnée…
      Ceci dit, parmi les arguments évoqués par la CPAM il avait le fait que les données tarifaires publiées par Fourmi Santé n’étaient pas à jour et, sur ce point particulier, il me semble qu’une solution pourrait être de proposer des données dynamiques en open data, avec une obligation de fraîcheur. Le site open data de TfL (Transport for London) impose ainsi une garantie de fraîcheur.
      Enfin, plus globalement et pour rebondir sur votre dernier propos, ce ne serait pas la première fois que le terme open data est utilisé à tort et à travers… Le contexte actuel de renégociation des honoraires entre l’Assurance maladie et les syndicats de médecins ne doit pas non plus être étranger à la crispation de l’Assurance Maladie, non ?

      • Bonjour Simon,

        Ayant déjà été impliqué à titre professionnel dans des négociations avec la CNAM, je crois surtout que cet organisme souhaite garder la maitrise totale des données dont ils disposent sur les établissements et professionnels de santé et assurer eux-mêmes la publication et la promotion de ces contenus sur le web et le mobile.

        Les notions d’OpenData ou même de « partenariat » ne semblent pas faire partie de leur vocabulaire, même si cela ne va pas in fine dans le sens de l’intérêt du grand public puisque le site internet ameli.direct reste plutôt confidentiel

  2. Ping : Les conflits liés aux données “fermées” se multiplient | opendemocracy | Scoop.it

  3. Ping : Les conflits liés aux données “fermées” se multiplient - donneesouvertes.info | Administration électronique | Scoop.it

Les commentaires sont fermés.