Petit Lexique de l’Open Data
Pour vous aider à y voir plus clair dans la terminologie liée au mouvement d’ouverture des données, Data Publica vous a préparé ce petit lexique. Pour toute suggestion, commentaire ou demande d’ajout, n’hésitez pas à nous écrire à contact@data-publica.com
API
Application Programming Interface. Interface à un ou plusieurs jeux de données permettant à un programme ou une application d’y accéder. Les jeux de données peuvent être rendus accessibles soit par téléchargement (pour les jeux de données raisonnablement stables dans le temps) soit par API (pour les jeux de données très volumineux ou très volatiles).
APIE
Agence pour le Patrimoine Immatériel de l’État, créée en 2007 pour valoriser le patrimoine immatériel de l’Etat (brevets, marques, oeuvres d’art, données, etc. Ses missions sont d’optimiser l’impact de la gestion du patrimoine immatériel sur l’économie, de tirer parti d’une meilleure valorisation des actifs pour moderniser les services publics, de soutenir la conduite des politiques publiques au profit des usagers et contribuer au désendettement, et de prémunir l’État et les usagers contre d’éventuels risques de détournement. L’APIE a été initialement chargée de mettre en place le répertoire des données publiques, mission qui a finalement été confiée à Etalab (voir plus bas).
CADA
Commission d’Accès au Documents Administratifs, elle sert de recours aux citoyens qui ont des problèmes pour accéder aux données publiques.
La CADA est une autorité administrative indépendante dont le rôle est consultatif. Elle peut aider un citoyen à obtenir un document administratif individuel qui lui a été refusé. Elle répond aux consultations des administrations qui la saisissent sur le caractère communicable ou réutilisable des documents qu’elles détiennent ou sur les modalités de leur communication ou de leur réutilisation. Elle intervient pour tous les documents détenus par un service de l’Etat, une collectivité territoriale, un établissement public ou un organisme chargé de la gestion d’un service public, que cet organisme soit public ou privé.
Circulaire Fillon du 27 mai 2011
Circulaire publiée par le Premier Ministre sur l’organisation de l’ouverture des données en France. Elle rappelle que les données publiques sont disponibles et énonce que le principe de base est la gratuité, que le paiement éventuel doit être justifié. Une liste des jeux de données payantes sera constituée, date limite juillet 2012. Les administration devront en faire la demande motivée et la liste sera agréée par le COEPIA. Tout ce qui ne sera pas sur la liste à cette date sera gratuit par défaut.
CKAN
Comprehensive Knowledge Archive Network. Logiciel open source pour portail Open Data permettant de publier, de partager et de trouver des données. Il inclut une base de données pour cataloguer et stocker des jeux de données.
Coepia
Conseil d’orientation de l’édition publique et de l’information administrative, créé le 10 janvier 2010, placé auprès du Premier ministre, exerce une fonction d’évaluation, d’expertise et de conseil dans les domaines de l’édition publique et les publications administratives, de l’information et le renseignement administratifs et de la mise à disposition des données publiques. Le Coepia avalisera notamment la liste des jeux de données publiques payantes.
Crowdsourcing
Externalisation de masse : recueil de données par une communauté de volontaires (eg Open Street Map).
Data Journalism
voir “journalisme des données”
Data Tuesday
Réunion mensuellede la communauté Data en France fondée par Data Publica, Captain Dash et MFG Labs, et coorganisée par les pôles de compétitivité Cap Digital et Systematic, le journal Les Echos et l’EIT ICT Lab.
Data.gouv.fr
Site officiel servant de répertoire pour les données publiques du gouvernement français, il a été mis en ligne le lundi 5 décembre 2011 par la Mission Etalab.
Data.gov
Site officiel servant de répertoire pour les données publiques du gouvernement fédéral des Etats Unis.
Data.gov.uk
Site officiel servant de répertoire pour les données publiques du gouvernement du Royaume Uni.
DataLift
Projet de recherche ANR français développant et appliquant de la technologie de type Web Sémantique aux données ouvertes.
Dataviz
Technologies, méthodes et outils de visualisation des données.
DILA
La Direction de l’information légale et administrative (DILA) est une direction d’administration centrale des services du Premier ministre. Issue de la fusion de la direction de la Documentation française et de la direction des Journaux officiels, elle est placée sous l’autorité du Secrétariat général du Gouvernement. La DILA exerce les missions de diffusion légale, d’édition publique et d’information administrative. Elle gère notamment les sites journal-officiel.gouv.fr, ladocumentationfrancaise.fr, service-public.fr, legifrance.gouv.fr (textes de lois), boamp.fr (appels d’offre publics), bodacc.fr (annonces civiles et commerciales) et circulaires.gouv.fr. Elle est l’une ses sources majeures de données publiques en France. Ses données sont payantes ou gratuites.
Dix principes de l’open data
Énoncés par la Sunlight Foundation, ils donnent les critères auxquels les données ouvertes doivent satisfaire. Pour obéir à ces critères, les données doivent être complètes, primaires, fraîches, accessibles électroniquement, lisible par une machine, accessible sans discrimination, respectant les standards ouverts, disponible sous une licence claire, accessibles de façon pérenne et gratuite.
Données publiques
Données collectées, maintenues et utilisées par les organismes publics pour accomplir leur mission.
DSPL
DataSet Publishing Language, langage de description de jeux de données, défini par Google, structurant un jeu de données en des données CSV et un descripteur XML et permettant de visualiser les données grâce à Google Public Data Explorer.
Epsi Platform
Un projet européen, financé par l’Union Européenne fournissant des nouvelles et des informations sur l’Open Data en Europe et dans le monde.
Etalab
Mission rattachée au premier ministre, proposée initialement dans le rapport Riester de novembre 2010, mise en place en 2011, chargée de mettre en oeuvre la politique d’ouverture des données de l’administration française, et de mettre en place un annuaire des données publiques françaises, data.gouv.fr. A défini en octobre 2011 la Licence Ouverte.
GFII
Groupement Français des Industries de l’Information. Réunit des industriels de l’information et certains services publics (DILA, Archives, IGN, etc.). Un groupe de travail « données publiques » y est très actif et publie régulièrement des recommandations.
Google Public Data Explorer
Outil de stockage et de visualisation de données au format DSPL, développé et opéré par Google. Pour visualiser ses données, il faut d’abord les stocker chez Google.
Google Refine
Outil Google de traitement nettoyage et sémantisation de tableaux. Originellement développé par Metaweb, racheté par Google.
Inspire
Directive européenne concernant les données géographique. Elle garantit l’accès à tous des ressources géographiques de chaque pays. Elle définit des standards devant assurer l’interopérabilité des applications géographiques utilisant des données venant de plusieurs pays.
Jeu de données
Unité de publication, peut être un fichier ou un ensemble de fichiers se rapportant au même sujet.
Journalisme des données
(Data Journalism) Nouveau type de journalisme basé essentiellement sur l’utilisation des données, consistant à identifier des données intéressantes, en faire l’analyse, en extraire des informations nouvelles et en présenter les résultats sous la forme d’une visualisation graphique et éventuellement interactives. Le journalisme de données se nourrit notamment des données publiques.
Libertic
Association Nantaise militant pour l’open data, instrumentale dans l’initiative Open Data de Nantes-Métropole.
Licence APIE
Licence pour données ouvertes définie par l’APIE
Licence Ouverte
Licence pour données ouvertes (Open Licence) définie par Etalab.
LIP
NoSQL
Base de Données n’obéissant pas au modèle relationnel, à fonctionnalités réduites, se prêtant bien au traitement massivement parallèle des données. De nombreux catalogues de données sont construits sur une base de données NoSQL.
Notation à cinq étoiles
Notation proposée par Tim Berners Lee pour mesurer le degré qualitatif des données ouvertes.
Odata
Protocole d’accès aux données défini par Microsoft.
OGDI
Open Government Data Initiative. Logiciel open source développé et distribué par Microsoft, fonctionnant sur la plateforme Azure et permettant à un organisme public de mettre en place un portail de mise à disposition de données ouvertes.
OKFN
Open Knowledge Foundation Network, association à but non lucratif britanique oeuvrant pour l’ouverture des données, elle a notamment développé CKan.
Open Data
Voir “ouverture des données”.
Ordonnance du 6 juin 2005
Transposant la Directive 2003 du Parlement européen et du Conseil, du 17 novembre 2003, elle a complété la loi du 17 juillet 1978 en lui ajoutant un chapitre II consacré à la « réutilisation des informations publiques ».
La loi du 17 juillet 1978 trace le cadre juridique de la réutilisation des informations publiques :
- elle autorise toute forme de réutilisation ;
- encadre la réutilisation en définissant des principes généraux applicables en toute circonstance, au nombre desquels figure le respect des données à caractère personnel ;
- permet de subordonner cette réutilisation au paiement d’une redevance couvrant des frais autres que ceux de l’accès aux documentset à la détention d’une licence ;
- limite la possibilité de consentir des droits exclusifs de réutilisation aux nécessités du service public et impose à terme de mettre fin aux droits qui méconnaîtraient ce principe.
Ouverture des données
Principe selon lequel les données publiques (celles recueillies, maintenues et utilisées par les organismes publics) doivent être disponibles pour accès et réutilisation par les citoyens et les entreprises.
PSI
Public Sector Information, voir données publiques.
Regards Citoyens
Groupe militant français oeuvrant pour l’ouverture des données, proposant un accès simplifié au fonctionnement de nos institutions démocratiques et gérant notamment les sites nosdéputés.fr, nossénateurs.fr et nosdonnées.fr.
Réutilisation
Fait de prendre un jeu de données pour le visualiser, le fusionner avec d’autres jeux, l’utiliser dans une application, le modifier, le corriger, le commenter, etc.
SDMX
Statistical Data and Metadata eXchange, langage de description de jeux de données statistiques conçu par un groupe d’utilisateurs incluant l’OCDE, l’ONU, la Banque Mondiale et Eurostat.
Share-PSI
Groupe européen, conduit par le W3C et l’Etsi, qui promeut l’Open Data auprés de la commision européenne.
Sunlight Foundation
Fondation américaine focalisée sur l’e-gouvernenment et la transparence démocratique qui a soutenu plusieurs initiatives Open Data et a défini les dix principes des données ouvertes.
Tim Berners Lee
Co-inventeur du Web, inventeur du Web sémantique, très actif et impliqué dans data.gov.uk, il a notamment défini la notation en cinq étoiles pour mesurer le niveau d’ouverture de Web sémantique d’une mise en ligne de jeu de données.