Le process de transformation de l’open data en opportunité d’innovation

Que notre imaginaire ne conçoit-il pas lorsqu’il entend parler de “hackathons”, “hack-days” ou “start-up week-end” : des évènements où des génies de la programmation arrivent à concevoir des applications révolutionnaires ? des catalyseurs de créativité où des digital natives produisent de nouvelles interfaces digitales auxquelles tout utilisateur succombe comme les compagnons d’Ulysse au chant des sirènes ?

Et qu’en est-il en réalité ? Ces évènements sont-ils réellement aussi efficaces qu’on l’imagine ? Dans le monde des data-scientists, aux prises avec les immenses lacs de données du Big Data ou avec les jeux de données publics de l’Open data, la réalité est souvent décevante.

Hack days event : des innovations éphémères à moins que…

En effet, les hackathons et autres évènements encourageant la réutilisation du Big ou Open data, bien qu’ils soient utiles sur le court-terme, ne sont pas à l’origine d’une dynamique pérenne de création de produits ou services.

Certes, ils permettent le temps de quelques journées de fédérer une communauté de développeurs autour des données et peut-être de faire émerger quelques idées sur le futur à donner à ces données. Or, ces initiatives ne survivent généralement pas aux événements qui les ont portées. Un événement se termine et les projets avec.

Face à ce constat, des plateformes comme Hadoop pour le Big Data et Socrata pour l’Open data  se sont développées dans le but de mettre à disposition des outils techniques qui puissent permettre une transformation fertile et constante des jeux de données, permettant ainsi la pérennisation d’innovations issues du Big et de l’Open data.

Dans cet article, nous mettrons à nu toutes les opérations que permettent ces plateformes et qui assurent la transformation des données en innovations. Nous nous inspirons principalement des travaux de Georges Kuk et Tim Davies. Ainsi, il s’agit de décrypter la réalité derrière la grande promesse du Big et de l’Open data, de passer du mythe de la donnée comme nouvel “or noir” aux processus techniques complexes qui nous rappellent que le chemin pour l’atteindre est semé d’embuches.

Les 5 séquences qui permettent de transformer des données en nouveaux services

screen shot 2019-01-11 at 11.09.22

Pour plus de détail, c’est par ici

Le schéma ci-dessus résume les différents assemblages techniques et humains nécessaires à la valorisation des jeux de données. On trouve 5 séquences :

  1. Le nettoyage des données ouvertes
  2. Les croisements entre jeux de données
  3. L’écriture de codes source permettant d’inscrire les croisements de données dans un contexte d’utilisation (par exemple une application)  
  4. La mise en libre accès des codes sources pour permettre à d’autres développeurs de les améliorer
  5. L’intégration des codes sources à certaines solutions technologiques.

Cas d’usage : l’utilisation des données de dépenses publiques COINS  par l’Open Knowledge Foundation

1.Nettoyage des données : le jour de l’ouverture de la base de données COINS, l’Open Knowledge Foundation a collaboré via Etherpad (éditeur de documents open-source) avec d’autres acteurs sur le nettoyage des données

2.Croisements entre jeux de données : les données nettoyées ont ensuite été importées sur les bases de données de l’OKF qui a mis à disposition un API permettant ainsi aux autres acteurs de capitaliser sur ces jeux de données en les croisant avec d’autres jeux de données

3. L’écriture des codes sources : dans ce cas, l’OKF a travaillé avec The Guardian pour crowdsourcer des codes sources qui pourraient faire usage des données COINS avant de réaliser des visualisations des usages de ces données, qui ont trouvé leur apogée dans le projet open-source WhereDoesMyMoneyGo.com

4.La mise en libre accès des codes sources : les codes sources du projet WhereDoesMyMoneyGo.com ainsi que ceux permettant d’exploiter les bases de données COINS ont été partagées en libre accès ; finalement, d’autres projets locaux et nationaux ont utilisé ces artefacts pour mieux visualiser la répartition des dépenses publiques (voir visualisations réalisées par la ville de Seattle ci-dessous)

5.L’intégration des codes sources à certaines solutions technologiques : si aucun cas n’est recensé aujourd’hui, on peut facilement imaginer un service permettant aux contribuables de visualiser où ses impôts seront affectés l’année suivante et ce, dès le remplissage de sa fiche d’impôt.

Le service Wheredoesmymoneygo.com : un exemple de transformation de l’open data

La 2 leçons à retenir de cette modélisation

Selon, Vincent Kober, chef du projet Open data de la métropôle Grenoble-Alptes et auteur de l’ouvrage Open data – Ouverture, exploitation, valorisation des données publiques : “ce schéma montre bien que les portails Open data ne sont que la partie émergée de l’iceberg qui repose sur un long et fastidieux travail de la donnée. Or, ce travail s’effectue dans l’ombre, d’où sa difficile médiatisation et peut-être le manque de considération de la part du grand public”.

En effet la diffusion des jeux de données ouvertes n’est en soi pas un stimulateur de l’innovation de services. La vision de la donnée comme ressource première qu’il s’agirait d’extraire pour en récolter les fruits relève plus du mythe que de la réalité. Au contraire la donnée doit faire l’objet d’un travail fastidieux de nettoyage, croisement, contextualisation et finalement d’intégration à des solutions technologiques existantes avant qu’on puisse véritablement la considérer comme un actif dont les entreprises pourraient disposer.

Ensuite, on observe que l’innovation autour des données nécessite la mise en place de “ structures et de processus interactifs qui s’inscrivent dans une perspective générale d’open innovation, englobant des modèles coopératifs plus ou moins sophistiqués et formalisés” (Djellal et Gallouj, 2012). Dans l’exemple des données COINS, plusieurs développeurs et hackeurs ont participé à la transformation des données, chacun situés à différents endroits du globe et travaillant pour différentes organisations. Leur mise en relation a été rendue possible par la démarche d’open innovation initiée par l’OKF ainsi que par les différents outils techniques open-source disponibles (Etherpad, répertoires de codes sources, etc.). Ce mode d’organisation n’est pas sans poser un véritable challenge. Du fait qu’il n’est pas dirigé par une instance centrale disposant des ressources humaines et techniques nécessaires, la conduite des transformations se fait au gré des intérêts de différents hackeurs et développeurs. Dès lors : comment stimuler les transformations pour atteindre le mythe de donnée comme “or noir” de l’ère numérique ?

La stimulation de la transformation des données : un problème insoluble ?

Nous pouvons reformuler ce challenge de la façon suivante : dès lors que les frontières du cadre d’innovation autour des données sont floues, quelle organisation mettre en place pour concentrer les processus interactifs à l’origine de l’innovation ? Cette question revient à savoir comment harmoniser le chaos pour qu’en émerge des services innovants à forte valeur ajoutée.

Les logiciels Open-source comme Linux ou Wikipédia ont apporté une partie de la réponse en construisant des règles de gouvernance qui permettent d’éviter une désorganisation des différents contributeurs. Or, ces logiciels ne créent pas, du fait de leurs business model, de valeurs économiques sonnante et trébuchante ou plutôt, disons qu’ils créent une valeur économique publique qu’il est très difficile d’évaluer.

Il s’agit plutôt de se tourner vers les modèles économiques des plateformes que l’on ne connaît que trop : Facebook et Apple. Chacune à leur manière, ces entreprises ont réussi à stimuler une innovation ouverte. Grâce à une plateforme comme iTunes sur laquelle se pressent des millions d’acheteurs d’applications, Apple a créé la motivation de créer des applications chez les développeurs et grâce à des kits de développement, Apple peut conduire le développement des applications de façon à harmoniser le chaos. Le Big et l’Open data n’ont pas fini d’apprendre des géants du numérique.

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s