Les données pour votre business

Bienvenue. S'inscrire ou s'identifier

Petit Lexique de l’Open Data

Pour vous aider à y voir plus clair dans la terminologie liée au mouvement d’ouverture des données, Data Publica vous a préparé ce petit lexique. Pour toute suggestion, commentaire ou demande d’ajout, n’hésitez pas à nous écrire à contact@data-publica.com

 

API Application Programming Interface. Interface à un ou plusieurs jeux de données permettant à un programme ou une application d’y accéder. Les jeux de données peuvent être rendus accessibles soit par téléchargement (pour les jeux de données raisonnablement stables dans le temps) soit par API (pour les jeux de données très volumineux ou très volatiles).
APIE Créée en 2007 pour valoriser le patrimoine immatériel de l’Etat (brevets, marques, oeuvres d’art, données, etc). Ses missions sont d’optimiser l’impact de la gestion du patrimoine immatériel sur l’économie, de tirer parti d’une meilleure valorisation des actifs pour moderniser les services publics, de soutenir la conduite des politiques publiques au profit des usagers et contribuer au désendettement, et de prémunir l’État et les usagers contre d’éventuels risques de détournement. L’APIE a été initialement chargée de mettre en place le répertoire des données publiques, mission qui a finalement été confiée à Etalab (voir plus bas)..
CADA Commission d’Accès au Documents Administratifs, elle sert de recours aux citoyens qui ont des problèmes pour accéder aux données publiques.La CADA est une autorité administrative indépendante dont le rôle est consultatif. Elle peut aider un citoyen à obtenir un document administratif individuel qui lui a été refusé. Elle répond aux consultations des administrations qui la saisissent sur le caractère communicable ou réutilisable des documents qu’elles détiennent ou sur les modalités de leur communication ou de leur réutilisation. Elle intervient pour tous les documents détenus par un service de l’Etat, une collectivité territoriale, un établissement public ou un organisme chargé de la gestion d’un service public, que cet organisme soit public ou privé.
CKAN Comprehensive Knowledge Archive Network. Logiciel open source pour portail Open Data permettant de publier, de partager et de trouver des données. Il inclut une base de données pour cataloguer et stocker des jeux de données.
COEPIA Conseil d’orientation de l’édition publique et de l’information administrative, créé le 10 janvier 2010, placé auprès du Premier ministre, exerce une fonction d’évaluation, d’expertise et de conseil dans les domaines de l’édition publique et les publications administratives, de l’information et le renseignement administratifs et de la mise à disposition des données publiques. Le Coepia a notamment avalisé la liste des jeux de données publiques payantes.
CROWDSOURCING Externalisation de masse : recueil de données par une communauté de volontaires (eg Open Street Map).
DATA TUESDAY Réunion mensuelle de la communauté Data en France fondée par Data Publica, Captain Dash et MFG Labs, et co-organisée par les pôles de compétitivité Cap Digital et Systematic et la société événementielle Cristal Festival.
DATA.GOUV.FR Site officiel servant de répertoire pour les données publiques du gouvernement français, il a été mis en ligne le lundi 5 décembre 2011 par la Mission Etalab
DATA.GOV Site officiel servant de répertoire pour les données publiques du gouvernement fédéral des Etats Unis, mis en place en mai 2009.
DATA.GOV.UK Site officiel servant de répertoire pour les données publiques du gouvernement du Royaume Uni, mis en place en septembre 2009.
DATAJOURNALISME (ou Journalisme de données) Nouveau type de journalisme basé essentiellement sur l’utilisation des données, consistant à identifier des données intéressantes, en faire l’analyse, en extraire des informations nouvelles et en présenter éventuellement les résultats sous la forme d’une visualisation interactive. Le journalisme de données se nourrit notamment des données publiques.
DATALIFT Projet de recherche ANR français développant et appliquant de la technologie de type Web Sémantique aux données ouvertes.
DATAVIZ Technologies, méthodes et outils de visualisation des données.
DILA La Direction de l’information légale et administrative (DILA) est une direction d’administration centrale des services du Premier ministre. Issue de la fusion de la direction de la Documentation française et de la direction des Journaux officiels, elle est placée sous l’autorité du Secrétariat général du Gouvernement. La DILA exerce les missions de diffusion légale, d’édition publique et d’information administrative. Elle gère notamment les sites journal-officiel.gouv.fr, ladocumentationfrancaise.fr, service-public.fr, legifrance.gouv.fr (textes de lois), boamp.fr (appels d’offre publics), bodacc.fr (annonces civiles et commerciales) et circulaires.gouv.fr. Elle est l’une ses sources majeures de données publiques en France. Ses données sont payantes ou gratuites.
DIX PRINCIPES Énoncés par la Sunlight Foundation, ils donnent les critères auxquels les données ouvertes doivent satisfaire. Pour obéir à ces critères, les données doivent être complètes, primaires, fraîches, accessibles électroniquement, lisibles par une machine, accessibles sans discrimination, respectant les standards ouverts, disponibles sous une licence claire, accessibles de façon pérenne et gratuite.
DONNEES PUBLIQUES Données collectées, maintenues et utilisées par les organismes publics pour accomplir leur mission.
DSPL DataSet Publishing Language, langage de description de jeux de données, défini par Google, structurant un jeu de données en des données CSV et un descripteur XML et permettant de visualiser les données grâce à Google Public Data Explorer.
EPSI PLATFORM Un projet européen, financé par l’Union Européenne fournissant des nouvelles et des informations sur l’Open Data en Europe et dans le monde.
ETALAB Mission initiallement rattachée au premier ministre, proposée initialement dans le rapport Riester de novembre 2010, mise en place en 2011, chargée de mettre en oeuvre la politique d’ouverture des données de l’administration française, et de mettre en place un annuaire des données publiques françaises, data.gouv.fr. A défini en octobre 2011 la Licence Ouverte. Etalab, aujourd’hui dirigé par Henri Verdier, a été rattaché en novembre 2012 au Secrétariat Général pour la Modernisation de l’Etat.
GFII Groupement Français des Industries de l’Information. Réunit des industriels de l’information et certains services publics (DILA, Archives, IGN, etc.). Un groupe de travail « données publiques » y est très actif et publie régulièrement des recommandations.
PUBLIC DATA EXPLORER Outil de stockage et de visualisation de données au format DSPL, développé et opéré par Google. Pour visualiser ses données, il faut d’abord les stocker chez Google.
INSPIRE Directive européenne concernant les données géographiques. Elle garantit l’accès à tous des ressources géographiques de chaque pays. Elle définit des standards devant assurer l’interopérabilité des applications géographiques utilisant des données venant de plusieurs pays.
JEU DE DONNEES Unité de publication, peut être un fichier ou un ensemble de fichiers se rapportant au même sujet.
LIBERTIC Association Nantaise militant pour l’open data, instrumentale dans l’initiative Open Data de Nantes-Métropole. Lire l’interview de Claire Gallon.
LICENCE OUVERTE Licence pour données ouvertes (Open Licence) définie par Etalab.
NOSQL Base de Données n’obéissant pas au modèle relationnel, à fonctionnalités réduites, se prêtant bien au traitement massivement parallèle des données. De nombreux catalogues de données sont construits sur une base de données NoSQL.
NOTATION CINQ ETOILES Notation proposée par Tim Berners Lee pour mesurer le degré qualitatif des données ouvertes.
ODATA Protocole d’accès aux données défini par Microsoft.
OGDI Open Government Data Initiative. Logiciel open source développé et distribué par Microsoft, fonctionnant sur la plateforme Azure et permettant à un organisme public de mettre en place un portail de mise à disposition de données ouvertes.
OKFN Open Knowledge Foundation Network, association à but non lucratif britannique oeuvrant pour l’ouverture des données, elle a notamment développé CKan.
OPEN DATA Voir “ouverture des données”.
OPEN DATA INSTITUTE L’Open Data Institute, organisation privée co-financée par le gouvernement britannique pour stimuler l’écosystème autour des données ouvertes, incuber des startups et faciliter la réutilisation des données d’entreprises privées.
ORDONNANCE DU 6/06/05 Transposant la Directive 2003 du Parlement européen et du Conseil, du 17 novembre 2003, elle a complété la loi du 17 juillet 1978 en lui ajoutant un chapitre II consacré à la « réutilisation des informations publiques ».
La loi du 17 juillet 1978 trace le cadre juridique de la réutilisation des informations publiques :
- autorise toute forme de réutilisation ;
- encadre la réutilisation en définissant des principes généraux applicables en toute circonstance, au nombre desquels figure le respect des données à caractère personnel ;
- permet de subordonner cette réutilisation au paiement d’une redevance couvrant des frais autres que ceux de l’accès aux documents et à la détention d’une licence ;
- limite la possibilité de consentir des droits exclusifs de réutilisation aux nécessités du service public et impose à terme de mettre fin aux droits qui méconnaîtraient ce principe.
OUVERTURE DES DONNEES Principe selon lequel les données publiques (celles recueillies, maintenues et utilisées par les organismes publics) doivent être disponibles pour accès et réutilisation par les citoyens et les entreprises.
PSI Public Sector Information, voir données publiques.
REGARDS CITOYENS Groupe militant français oeuvrant pour l’ouverture des données, proposant un accès simplifié au fonctionnement de nos institutions démocratiques et gérant notamment les sites nosdéputés.fr, nossénateurs.fr et nosdonnées.fr. Lire l’interview de Benjamin Ooghe-Tabanou co-fondateur.
REUTILISATION Fait de prendre un jeu de données pour le visualiser, le fusionner avec d’autres jeux, l’utiliser dans une application, le modifier, le corriger, le commenter, etc.
SDMX Statistical Data and Metadata eXchange, langage de description de jeux de données statistiques conçu par un groupe d’utilisateurs incluant l’OCDE, l’ONU, la Banque Mondiale et Eurostat.
SHARE-PSI Groupe européen, conduit par le W3C et l’Etsi, qui promeut l’Open Data auprés de la commision européenne.
SUNLIGHT FOUNDATION Fondation américaine focalisée sur l’e-gouvernenment et la transparence démocratique qui a soutenu plusieurs initiatives Open Data et a défini les dix principes des données ouvertes.
TIM BERNERS-LEE Co-inventeur du Web, inventeur du Web sémantique, très actif et impliqué dans data.gov.uk, il a notamment défini la notation en cinq étoiles pour mesurer le niveau d’ouverture de Web sémantique d’une mise en ligne de jeu de données.