Gestion des nomenclatures en RDF avec XKOS
Intervenant⋅e⋅s
Résumé
L'Insee a recours aux vocabulaires RDF pour gérer une grande partie de ses métadonnées relatives aux processus statistiques. Parmi celles-ci, les nomenclatures sont centrales. Elles permettent de définir les concepts et les codes et que l'on retrouve tout au long des processus statistiques : en début de processus, par exemple pour stratifier une base de sondage, ou en diffusion, en tant que grilles d'analyse de tableaux agrégés. Il est requis que les nomenclatures nationales soient cohérentes avec les nomenclatures européennes et internationales pour permettre de passer à l'échelle dans les comparaisons. Les nomenclatures, en particulier lorsqu'elles sont partagées dans un format RDF, permettent également de faciliter l'interopérabilité entre les processus en fournissant une référence pour les codes et leur contenu.
Le standard XKOS, qui est un des produits RDF de la DDI Alliance, se base essentiellement sur le standard SKOS et en propose des extensions pour répondre aux spécificités des nomenclatures statistiques. Il permet de décrire leurs structures hiérarchiques de manière formelle. Il introduit des sous-propriétés qui spécialisent les relations skos:broader et skos:narrower. XKOS complète aussi les notes skos:note et skos:scopeNote par une série de notes typiques des nomenclatures : par exemple xkos:coreContentNote, xkos:inclusionNote ou encore xkos:caseLaw. Enfin, XKOS propose une formalisation les tables de correspondances qui sont nécessaires pour les travaux mettant en oeuvre plusieurs nomenclatures.
Un guide de bonnes pratiques XKOS (un document ReSpec en cours de revue) donne des exemples d'utilisation de ce vocabulaire. Les utilisations attendues des propriétés RDF sont notamment spécifiées via des contraintes SHACL.
Les exemples d'implémentation de nos nomenclatures en XKOS sont accessibles via le SPARQL EndPoint de l'Insee. Ces métadonnées sont gérées en interne avec notre application de gestion des métadonnées, appelée Bauhaus, qui est publiée en open source (cf. le lien ci-dessous).
liens :
- Les bonnes pratiques XKOS : http://linked-statistics.github.io/xkos/xkos-best-practices.html
- La spécification XKOS : https://ddialliance.org/Specification/XKOS/1.2/OWL/xkos.html#sem-props
- GitHub XKOS : https://github.com/linked-statistics/xkos/blob/master/xkos-best-practices.html
- Insee SPARQL Endpoint https://rdf.insee.fr/
- Github Bauhaus https://github.com/InseeFr/Bauhaus