Accueil Open Data Open data – De nouvelles fonctionnalités relatives aux schémas de données sont...

Open data – De nouvelles fonctionnalités relatives aux schémas de données sont disponibles sur data.gouv.fr

Les schémas de données permettent de décrire de manière précise et univoque les différents champs qui composent un jeu de données et les valeurs possibles. Ils permettent de valider qu’un jeu de données se conforme à un schéma, de générer de la documentation automatiquement, de créer des jeux de données d’exemple ou de proposer des formulaires de saisie standardisés. « Les schémas de données permettent ainsi une montée en qualité des données proposées en open data, surtout lorsque plusieurs producteurs de données sont amenés à produire un même jeu de données », indique le site de données publiques français.

Spécifier qu’une ressource respecte un schéma

Il est désormais possible de spécifier de manière déclarative, depuis l’interface d’administration de data.gouv.fr, qu’une ressource d’un jeu de données respecte un schéma de données. Cette nouvelle fonctionnalité permet d’indiquer de manière non ambiguë qu’une ressource est censée respecter un schéma référencé sur schema.data.gouv.fr.

 

Auparavant, les producteurs de données renseignaient cette information dans la description de leur jeu de données ou par l’ajout d’un tag. L’ajout de ce champ permet de fournir une information plus claire et ouvre la possibilité à des intégrations avec d’autres systèmes par le biais de l’API de data.gouv.fr. Il est par exemple possible d’afficher tous les jeux de données avec des ressources répertoriant des infrastructures de recharge pour véhicules électriques.

La spécification de ce champ sur une ressource entraîne l’ajout d’un panneau d’information depuis la page de son jeu de données. Ce panneau permet au lecteur de découvrir la documentation relative au schéma et de vérifier que la ressource est bien conforme au schéma identifié.

De futures fonctionnalités envisagées portent sur la suggestion de schémas, la consolidation de ressources respectant un même schéma, la validation proactive de ressources ou encore l’assistance aux producteurs de données.