Open data : qu’est-ce qu’une donnée ouverte ?
Une donnée est un fait brut, qui n’as pas encore été interprété. Par exemple, si en consultant un thermomètre je lis "18°C" il s’agit bien d’une donnée. Si je dis qu’il fait "plutôt doux pour la saison", on a affaire à une information. L’open data ne s’intéresse qu’aux données brutes. Les acteurs publics (et les acteurs privés) manipulent un grand nombre de données et d’informations, qu’ils mettent parfois en ligne.
Prenons l’exemple du site Qualité Transports récemment mis en place par le Ministère de l’Ecologie. Il propose de consulter des indicateurs de qualité pour plusieurs modes : le train, l’avion et, à terme, les transports urbains. On peut par exemple obtenir une réponse à une question précise : "Si je dois réserver un vol entre Nice et Paris, quelle compagnie est la plus fiable ?". La notion de fiabilité peut s’entendre de plusieurs manières : on peut tenir compte du pourcentage de vols annulés ou des retards moyens…
Il s’agit bien ici de données brutes. Peut-on pour autant parler de données ouvertes ? Il faut pour cela regarder comment l’on peut les réutiliser. Le site Qualité Transports permet bien de télécharger les indicateurs… mais au format PDF ! Impossible donc de réaliser facilement des traitements, par exemple pour comparer dans le temps la ponctualité des dessertes ferroviaires et aériennes entre Paris et le Sud-Ouest de la France, par exemple. Impossible aussi d’imaginer de proposer, sur un site de comparateur de billets d’avions, l’intégration de ces données pourtant très intéressantes.
L’exemple du site Qualité Transports le démontre, si besoin était : publier des documents PDF en ligne, ce n’est pas réaliser l’ouverture des données publiques…
Pour qu’une donnée soit ouverte, elle doit répondre à trois grands critères :
- techniques : les données brutes doivent être exploitables de manière automatique (i.e. par des programmes informatiques) et mise à disposition dans des formats les plus ouvertes possibles et non propriétaires (par exemple : on privilégie le format .csv à .xls d’Excel),
- juridiques : les licences doivent clarifier les droits et les obligations des détenteurs et des réutilisateurs de données, elles doivent être les plus ouvertes possibles (par exemple : obligation d’attribution ou de partage à l’identique),
- économiques : peu ou pas de redevances tarifaires (susceptibles de constituer des freins à la réutilisation), tarification maximale au coût marginal, …

Ping: Les mauvaises données des marchés » OWNI, News, Augmented
Ping: Pourquoi partager ses données (quand la loi ne vous y oblige pas) ? | données ouvertes