Quelques conseils aux participants des concours et autres hackathons

Ce lundi j’interviens à Marseille lors d’un atelier ouvert aux participants du concours Open Data lancé par la région PACA. L’objectif : encourager la créativité des réutilisateurs et des développeurs. La saison des concours et des hackathons est bel et bien lancée ! Je vous propose des extraits de cette intervention, sous forme de conseils aux participants, illustrés de quelques réutilisations que j’ai repéré ces derniers mois…

1 – Parole de jury

TransitVis, l'un des lauréats du Urban Data Challenge

TransitVis, l’un des lauréats du Urban Data Challenge

Commençons par la fin de l’histoire. Vous avez fini vos développements, votre dossier de participation est complet, vous venez de soumettre votre service ou votre application. Le jury doit maintenant se réunir pour l’étudier et départager les vainqueurs parmi les participants.

En tant que candidat il ne faut jamais oublier qu’un concours (ou un hackathon) c’est une compétition, pas un examen (contrairement au bac, il ne suffit pas d’avoir la moyenne pour être reçu). Le jury est un élément essentiel de cette compétition. Sa composition est souvent rendue publique. Il rassemble généralement des représentants des organisateurs (collectivité ou entreprises), les partenaires du concours et, parfois, des personnalités qualifiées.

Le jury d’un concours devra identifier les lauréats parmi 40 à 50 participants, celui d’un hackathon aura deux heures pour départager 5 à 10 équipes… La clé de la compétition repose donc souvent sur la différenciation d’un dossier ou d’une application parmi l’ensemble des réutilisations (je parle bien de différenciation plutôt que d’originalité, je reviendrai ultérieurement sur cette distinction qui me semble essentiel). Comment proposer quelque chose de différent ? Je vous propose quelques pistes illustrées.

2 – La donnée, un ingrédient

A la base de tous les concours vous avez donc des données, que l’on peut considérer comme des ingrédients. Lisez bien le règlement du concours : il précise souvent les données que vous pouvez utiliser (uniquement celles de l’organisateur, toutes celles en rapport avec le thème ou le territoire, etc…).

Si je poursuis la métaphore culinaire, vous êtes donc, en tant que participant, le cuisinier. Votre premier travail sera d’évaluer tous les ingrédients qui rentrent dans votre cuisine. Cette donnée est-elle bien fraîche ? Comment pourrais-je l’utiliser ? Faut-il la modifier, l’arranger, la transformer ou peut-on la consommer « crue » ? Une très belle donnée, bien riche, peut parfois se consommer crue si l’on sait la présenter, par exemple à l’aide de visualisations…

L’erreur serait d’aller directement de l’ingrédient vers son utilisation la plus immédiate. La plupart des réutilisateurs qui se voient proposer un jeu de données sur les horaires de bus font des applications d’informations voyageurs, les plus malins en détournent l’usage (dit autrement : avec des pommes de terre on peut faire autre chose que des frites…). La différenciation, toujours !

Une donnée peut donc être l’ingrédient principal d’un plat, ou simplement un ingrédient parmi d’autres. Une donnée peut être proposée crue, mise en forme, transformée ou cuite avec d’autres … Autant de manières différentes d’utiliser ces ingrédients qui sont à votre disposition.

Le concours Urban Data Challenge fournit une très bonne illustration de ce principe de diversité. A partir d’un même jeu de données historiques sur les transports de San Francisco, Genève et Zurich, les participants ont mis en oeuvre des scénarios très différents. Urban Bus Race propose une course virtuelle entre les bus des 3 villes, TransitVis affiche une représentation des flux en 3 dimensions. D’autres participants ont ajouté une nouvelle donnée, par exemple en calculant un indice de frustration (qui combine la densité du nombre de passagers, le temps d’attente à un arrêt et les retards sur le réseau de bus)…

3 – Varier les supports  et les registres 

Une seconde piste de différenciation est liée aux supports que vous pouvez mettre en oeuvre (mobile, web, autres). J’ai déjà eu l’occasion sur ce blog d’expliquer le lien historique et fécond entre l’open data et les applications mobiles. Mais on peut faire beaucoup d’autres choses avec des données ouvertes : des sites web, des vidéos, des infographies, … Rien ne nous oblige par ailleurs à nous limiter à des médiations numériques, on peut très bien utiliser des données ouvertes pour concevoir des supports papiers (par exemple une lettre d’information à l’entrée d’un jardin public, avec l’aide des données ouvertes).

Enfin, on peut aussi rechercher de la différenciation du côté des registres d’expression. A partir d’un même jeu de données, on peut proposer quelque chose d’utile, de ludique, de décalé, … La variation entre les registres peut aussi être intéressante. Le service BrokenLifts s’appuie sur l’état de fonctionnement des ascenseurs des transports berlinois. La donnée est à la fois présentée sous une forme utile (« est-ce que cet ascenseur fonctionne ? ») mais aussi sur le registre de la  transparence et de l’accountability (« combien de jours de panne sur cet ascenseur géré par cette société ? ».

Un point de vigilance, cependant. La différenciation ne peut pas seulement passer par le choix d’un mode d’expression décalé. Le format « pitch » du hackathon encourage les discours décalés, mais la forme ne remplace pas complètement le fond.

Le site Brigand Futé (réalisé lors du HackIDF 2030) aide à planquer un cadavre en région parisienne, à partir des données du plan d’urbanisme… Le propos est donc décalé, mais la réalisation est d’un très bon niveau.

J’ai beaucoup moins accroché sur le récent lauréat d’un autre hackathon « a place to pee » qui, comme son nom l’indique, permet de localiser les toilettes dans la ville de Paris… Le sujet est pourtant bien réel (Rennes édite par exemple un guide papier très précis, réalisé avec des associations de malades), on aurait pu jouer sur plusieurs registres – et pas uniquement sur les multiples jeux de mots proposés par les concepteurs du service : « let piss a chance », « game of throne », …).

4 – Emprunter des pistes moins balisées

Il reste par ailleurs des pistes qui ont été jusqu’à présent peu explorées par les participants au concours, et notamment la conception d’outils pour les réutilisateurs et les développeurs. L’approche « business-to-developers » (B2D) plutôt que strictement « business-to-business » (B2B) ou « business-to-consumer » (B2C) est aussi une source de création de valeur. On peut citer par exemple la start-up britannique Placr qui a développé une API pour interroger les données des réseaux de transports urbains.

 

 

Animer l’open data ?

Jeu de données recherche réutilisateur H/F – pas sérieux s’abstenir.

Publier un jeu de données ouvertes en ligne n’est que la première étape de l’open data. Encourager la participation et la réutilisation, s’assurer que l’ouverture profite à tous, voilà les objectifs de l’animation. Pourquoi animer l’open data ? Comment le faire ? Ce billet propose quelques pistes. Commençons par une petite fable.

Il était une fois un jeu de données qui se préparait pour le bal du samedi soir. Il avait mis toutes les chances de son côté : paré de ses plus beaux habits (un costume au format .csv) il avait négocié avec ses parents de pouvoir faire ce qui lui plairait, avec qui il le voudrait (une licence ODbL)… Bref il avait mis toutes les chances de son côté pour faire des rencontres, et surtout LA rencontre que tous les jeux de données comme lui attendent : rencontrer un réutilisateur, un développeur Php ou même un journaliste de données – il n’était trop exigeant. Et le soir venu, malheureusement ce pauvre jeu de données resta seul et observa du coin de la piste le seul élu de la soirée : le fichier des horaires de bus qui comme chaque samedi, trouvait toujours quelqu’un pour s’intéresser à lui…

Pourquoi animer ?

Il est indispensable d’animer l’ouverture des données pour :

  • encourager et stimuler la réutilisation des données ouvertes, car la réutilisation spontanée ne concerne bien souvent que les données transports,
  • et s’assurer l’appropriation par tous, pour que l’open data ne reste pas l’affaire de quelques uns.
Ces deux objectifs ne se recoupent pas nécessairement, car ils concernent des publics et des types de données différents, comme l’illustre le schéma suivant (en CC-BY comme tous les contenus de ce site).

1 – Encourager la réalisation de services à partir des données ouvertes

Apps For Democracy : l’un des tous premiers concours open data

Les concours sont des modes d’animation bien connus dans le domaine de l’open data. Ils sont pour la plupart construits sur le modèle de AppsForDemocracy mis en place dès 2007 à Washington et récompensent des applications mobiles ou des services en ligne, parfois des visualisations.

En France, on recense dès fin 2010 plus de 45 participants au concours Rennes Métropole en accès libre. Nantes vient récemment d’annoncer sa compétition « Rendez-moi la ville plus facile« , au moment où le Conseil Général de Saône-et-Loire publie une première liste de participants.

Les concours ont une vertu : ils permettent de produire, concrètement, des services et pas uniquement des idées. Les concours ont aussi une limite majeure : ils ne s’intéressent qu’à une population restreinte, celle de ceux qui savent réutiliser des données ouvertes, et en premier lieu les développeurs.

2 – Imaginer, proposer des idées

Le second type d’animation se concentre non pas sur la production de « services » mais plutôt sur la génération d’idées de réutilisation des données ouvertes. L’avantage est de permettre une plus large participation du public – on peut avoir de bonnes idées sans savoir programmer !

Dans ce domaine, on peut souligner l’initiative de la filiale Transilien de la SNCF avec le concours « Open App : une idée d’appli pour améliorer votre quotidien« . Le principe : chaque participant décrit l’application ou le service dont il aimerait disposer. Un jury les recense et en propose certaines au vote du public. Les idées sont parfois étonnantes : par exemple « C’est ma faute by Transilien » la possibilité d’envoyer automatiquement (à son boss ou à son professeur) un bulletin de retard dès que votre train est immobilisé plus de 10 minutes !

Séminaire Libertic/Stereolux/Grrr (source : actionsopendata.org)

Dans le cadre de l’ouverture des données sur Nantes, Libertic et StereoLux ont organisé un séminaire sur le thème : « l’ouverture des données peut-elle améliorer l’expérience touristique ?« . L’agence Grrr a invité les agents des administrations et des acteurs associatifs et économique du domaine culturel et touristique a réfléchir sur des scénarios d’utilisation à horizon 2015. De fausses coupures de presse ont été utilisées pour sensibiliser les acteurs et les aider à esquisser des usages. La discussion ne se concentre pas uniquement sur les données ouvertes, mais intègre aussi les données collaboratives et les données privées.

3 – Développer une culture de la donnée

Le troisième type d’animation concerne la diffusion à un public encore plus large d’une culture de la donnée. C’est l’une des conditions (nécessaire mais pas suffisante) de l’appropriation de l’open data par tous. De telles actions peuvent aborder notamment la distinction entre une donnée et une information, mais peuvent aussi encourager à porter un regard critique sur les données, les conditions de leur « collecte » et de leur utilisation. A qui et à quoi sert cette donnée à l’origine ? Pourquoi a-t-elle été ouverte et dans quel but ? Que nous apprend-t-elle ? Qu’est-ce qu’elle ne nous dit pas ?

Il est intéressant pour cela de partir d’exemples et de domaines concrets : les déplacements dans la ville, la vie culturelle, la petite enfance, … Il est tout à fait possible de parler des données sans allumer un ordinateur, comme nous l’avons proposé lors du séminaire consacré aux données de mobilité à la Cantine numérique rennaise.