Interview de Jérôme Cukier, un « observ-acteur » de l’opendata en France
26
avril
D’observateur attentif du mouvement opendata en France depuis ses débuts, Jérôme Cukier en est devenu un acteur. Très impliqué dans la rédaction d’un Livre blanc sur l’opendata commandé par le précédent président du Conseil National du Numérique, Gilles Babinet, et dont la sortie est très attendue, il nous livre ses impressions sur le passé, le présent et l’avenir de ce sujet trop peu évoqué pendant la campagne présidentielle.
Data Publica : Qui es-tu Jérôme Cukier et que fais-tu ?
Jérôme Cukier : Je suis consultant en data visualisation. Je ‘dessine les données‘.
Comment en es-tu venu à t’intéresser à l’opendata ?
Je travaille surtout avec des données publiques qu’il faut bien trouver quelque part !
Tu suis ce mouvement opendata depuis ses débuts : quel est pour toi l’évènement qui a marqué son entrée en France ?
Pour moi le temps zéro de l’open data en France c’est l’annonce de la mission Etalab en février 2011. Il y a vraiment eu un avant et un après. Bien sûr il y a eu des initiatives locales et les administrations, individuellement, ont toujours essayé de distribuer leurs données le mieux possible mais c’est la première fois qu’au plus haut niveau, on se saisit de la question.
Mis à part Etalab qui a bénéficié de moyens importants, d’autres initiatives opendata t’auront marqué ?
Data.gouv.fr n’est pas le seul projet open data en France, il y a eu beaucoup d’initiatives locales dont certaines sont bien antérieures à la création d’Etalab. En tant qu’utilisateur, j’espère qu’on va aller vers un catalogue unique qui regroupe toutes les données publiques.
C’est ce que fait Data Publica depuis 2010 pourtant ?
Oui c’est vrai. Il y a beaucoup de gens qui partent du principe que l’open data ça ne concerne que les données du secteur public et comme le livre blanc est axé là-dessus j’ai aussi parfois ces oeillères. Même si j’espère que les initiatives publiques vont converger c’est important qu’il y ait une offre privée. Data.gouv.fr n’a pas vocation à permettre aux sociétés ou aux particuliers de distribuer leurs données et ne pourront pas assurer des services comme la chasse aux données. On pourrait aussi souligner le travail associatif de Regards Citoyens. Au début certains députés ont accueilli plutôt fraîchement l’initiative nosdeputes.fr. Aujourd’hui ça fait partie des règles du jeu.
Et à l’étranger quels sont les moments clés de l’opendata ?
Difficile de ne pas penser à data.gov aux États-Unis ou à data.gov.uk au Royaume-Uni. Mais l’open data commence bien avant. Dans les années 60 et 70, il y a beaucoup de pays (dont la France) qui ont créé un droit à l’information. Un autre grand moment de l’open data, ça a été le lancement de gapminder en 2005. Tous les pays se sont rendu compte qu’ils pouvaient aussi communiquer avec leurs statistiques officielles et beaucoup ont réagi par rapport à ça. Et puis les grandes initiatives de crowdsourcing, wikipedia, openstreetmap… ont plus que prouvé que les données n’étaient pas que l’affaire des administrations.
Ce sont des modèles pour toi ?
Les États-Unis ou l’Angleterre ont des traditions démocratiques qui ne sont pas les nôtres. Par exemple, on parle beaucoup de transparence. Personellement, je ne suis pas sûr que la transparence soit un but en soi. En France, par exemple, la vie privée est beaucoup mieux protégée. Je ne pense pas qu’on place le curseur au même endroit. Je crois à une open data « à la française » qui serait utile, facile, et qui respecterait les personnes.
Aux Etats-Unis, on met sur le même niveau tant les avantages démocratiques que les bénéfices économiques de l’opendata, alors qu’en France, c’est la dimension démocratique (transparence) et juridique (licence et gratuité) qui occupe principalement les débats sur ce sujet. Comment expliques-tu cette différence de points de vue ?
J’ai plutôt l’impression inverse. Les Américains ne justifient jamais leurs initiatives par autre chose qu’un devoir envers leurs citoyens, alors qu’en Europe, on se rapporte fréquemment à la taille supposée de l’économie des données publiques. Le programme « open government initiative« , qui a abouti à data.gov, a été lancé dès le premier jour de la présidence Obama. Autant dire que là-bas c’est un engagement très fort. En France, il n’y a pas la même volonté politique, l’open data n’est pas perçu comme un impératif. C’est pourquoi les partisans de l’open data ressentent toujours le besoin de vendre le concept sur tous les fronts: démocratie, économie et emplois, etc.
On s’est rendu compte que l’annonce du lancement du portail opendata Data.gouv a créé beaucoup d’attentes, des satisfactions et des mécontentements : quels sont selon toi les avantages et les inconvénients de data.gouv.fr ?
Je suis très admiratif du travail qui a été accompli pour réaliser data.gouv.fr en neuf mois seulement. Depuis le lancement des initiatives américaines (début 2009 donc) la France avait été beaucoup critiquée. Mais maintenant, en Europe, seul le Royaume-Uni a un portail d’une taille comparable. Franchement, les polémiques sur le décompte des fichiers ou sur les formats sont anecdotiques. Ce qui est très important c’est d’avoir lancé cette dynamique, mis en branle tous les ministères (et toutes les administrations qui ont voulu participer) et d’avoir créé cette infrastructure. En tant qu’utilisateur je ne trouve pas toujours ce que je cherche, je suis parfois surpris que telle ou telle donnée ne soit pas publiée, et j’ai parfois du mal à jongler avec tous les fichiers, je ne vais pas m’en cacher. Mais je crois que l’open data c’est un processus continu. Il y aura toujours quelque chose à améliorer.
D’observateur tu es toi aussi devenu un acteur de ce mouvement en étant particulièrement impliqué dans la rédaction du Livre Blanc de l’Opendata du Conseil National du Numérique commandé par Gilles Babinet. Pour quelle raison as-tu décidé de t’investir personnellement ?
Gilles [Babinet] savait que j’avais des positions très tranchées sur l’open data. Ca m’a intéressé de les confronter à celles d’autres personnes impliquées dans le mouvement et ça m’a permis de beaucoup évoluer sur la question. Dans le groupe de rédaction, toutes les opinions étaient représentées, c’est ça qui était le plus motivant.
Quelle a été la principale difficulté pour la rédaction de ce livre blanc ?
Le fait d’avoir une grande diversité d’opinion dans le groupe n’a pas que des avantages quand il faut conclure, évidemment. Et forcément, c’est très tentant d’écrire des recommandations qui ne tiennent pas forcément compte de réalités budgétaires, politiques, culturelles,
Sans en dévoiler le contenu, y ferez-vous des propositions importantes ?
Le livre blanc tourne autour d’une idée simple. Dans open data, il y a open- et il y a -data. (eh oui). Open, c’est la manière d’accéder aux données. Il y a un contexte juridique à revisiter. La loi du 17 juillet 1978 qui définit le droit à l’information en France prévoit énormément d’exceptions et de zones grises. Nous proposons d’y apporter des changements radicaux. Le principe doit être celui d’un droit universel à toutes les données publiques.
Data, c’est accompagner la production et la diffusion des données. La plupart des administrations sont de très petite taille, par exemple il n’y a que 0.1% des communes qui ont plus de 100,000 habitants. Et publier des données, c’est un métier. Il faut pouvoir aider tout le monde à participer à l’open data.
Sujet d’échange vigoureux entre Severin Naudet, directeur de la mission Etalab, et Fleur Pellerin, responsable du numérique dans l’équipe de François Hollande, le thème de l’opendata n’échappe pas aux élections. Toutefois, le débat tourne en rond autour de ce qui a été fait ou de ce qui aurait pu être fait. Ne trouves-tu pas que les questions importantes n’ont pas été évoquées : comme par exemple l’importance des formats non propriétaires, la place de l’INSEE ou l’obligation des établissements et entreprises publics comme la RATP, les musées etc.. à se mettre à l’opendata ?
Quand on les lit, Séverin Naudet et Fleur Pellerin sont d’accord sur le fond. Dans la réponse que François Hollande a adressée au collectif du numérique (http://www.collectifdunumerique.fr/img/Reponses/R_Hollande.pdf.zip) son équipe se félicite du succès de la mission Etalab et justifie l’open data dans les mêmes termes qu’emploierait Séverin Naudet. Par contre, il n’y a eu aucun débat sur l’open data lors des élections, ni aucune proposition concrète, ce qui est consternant, parce qu’il y a des choix à faire.
Ce qui se joue en ce moment, c’est rien de moins que la possibilité pour la France de devenir une super puissance du numérique. On a tout ce qu’il faut pour ça et si les bonnes décisions sont prises c’est ce qui va se passer. L’open data fait partie des infrastructures à mettre en place et pour ça il faut une volonté politique très forte.
Excuse-moi mais dans le document dont tu parles, je ne vois nulle par François Hollande se féliciter d’Etalab ?
OK j’interprète un peu mais il dit il faut aller plus loin dans l’ouverture des données publiques à tous les niveaux de la sphère publique. Cela reprend presque verbatim l’intervention de fleur dans 01 informatique : « C’est pourquoi une réelle impulsion devra être donnée à ce qu’on appelle l’open data, c’est-à-dire la manière de rendre les données publiques accessible aux citoyens, à la société civile et aux entreprises. Il en va de la démocratie et de la transparence, mais aussi de la vitalité du tissu d’entreprises innovantes de notre pays, qui sauront exploiter ces données pour apporter de nouveaux services aux Français. » Ensuite Fleur Pellerin écrit : « Plus de huit ans ont séparé l’adoption de la directive communautaire de 2003 rendant obligatoire l’ouverture des données publiques et la mise en place de la mission Etalab. Et l’on ne peut que regretter le manque d’ambition de cette mission : les données présentes sur le portail étaient déjà disponibles pour l’essentiel au sein des administrations concernées et le gouvernement n’a pas su ou voulu convaincre les grands services publics de mettre leurs données à disposition. »
Moi je comprends ça comme ça : le principe d’Etalab est bon et ce que la gauche regrette c’est qu’ils ne soient pas allé plus loin. et je crois que cette réserve est complètement politicienne, puisque en neuf mois c’était déjà énorme et que justement la gauche critiquait l’approche centralisatrice et jacobine d’Etalab. Donc sans trop déformer leurs propos la gauche aurait voulu le modèle d’open data que cherchait à établir Etalab. C’est pour ça que je pense que sur le fond ils sont d’accord : il faut aller plus loin dans l’open data, pour la transparence et l’économie, et il faut faire plus que mettre ce qui existe en ligne.
Que préconises-tu quand tu dis « aller plus loin dans l’opendata » et faire plus que mettre ce qui existe en ligne », tu penses à des données en particulier ?
On trouve peu de données publiques au niveau individuel (ou à un niveau de granularité très fin), et peu de données en temps réel. Pendant la campagne, à défaut de parler du numérique on a beaucoup commenté le projet socialiste de taxer les revenus supérieurs à 1 millions d’euros par an à 75%. ça m’a beaucoup frappé de constater que personne, ni à gauche, ni à droite, ne disposait d’une estimation fiable de leur nombre qui serait entre 3000 à 30000. Au moment où chacun prépare son projet économique ça me paraît insensé que les partis (et d’ailleurs tout le monde) ne puissent pas disposer de données de bonne qualité sur ce sujet.
Dans une interview, Simon Rogers prédit que bientôt « tous les journalistes feront de l’opendata sans s’en rendre compte », crois-tu que de la même manière les administrations feront elles aussi naturellement de l’opendata ?
Aujourd’hui, on en encore loin. Mais si le prochain président commence son mandat comme Obama, ça peut arriver très vite!
Propos recueillis par Benjamin Gans
