Sparnatural: un composant configurable d'exploration de graphes de connaissance

Intervenant⋅e⋅s

Résumé

Les graphes de connaissances s'appuient souvent sur des modèles conceptuels avec un haut niveau d'abstraction, ce qui les rend difficiles à comprendre pour les utilisateurs non experts. Ils sont souvent cachés derrière des formulaires de recherche, ou des formulaires multicritères, perdant ainsi la flexibilité d'interagir avec le graphe en tant que graphe. Afin de valoriser au mieux les graphes de connaissances, il est nécessaire de proposer des interactions orientées vers l'utilisateur final, dans un réel objectif de service public, faisant ainsi la démonstration de l’apport de ces graphes pour la découverte d’un domaine de connaissance. Sparnatural a été conçu et développé comme un constructeur de requêtes SPARQL visuel, configurable, facilement déployable, open-source et 100% client, permettant aux utilisateurs d'interroger n'importe quel graphe de connaissances RDF. Nous décrirons comment Sparnatural fonctionne, comment il peut être configuré, et nous montrerons comment il a été déployé dans deux démonstrateurs pour les Archives Nationales de France (ANF) et la Bibliothèque Nationale de France (BnF). Le démonstrateur des ANF permet d’interroger un jeu de données RDF conforme à l'ontologie ICA Records In Contexts , constituant la première publication à grande échelle par les ANF de métadonnées archivistiques conformes à cette ontologie. Ces métadonnées décrivent les archives de 40 des 122 études notariales existant à Paris depuis le Moyen Age (soit environ 9 km linéaires de documents), avec les référentiels associés (soit environ 58 millions de triplets). Le démonstrateur de la BnF permet d'interroger facilement la totalité des données RDF déjà disponibles et interrogeables dans data.bnf.fr. Ces données sont conformes à un modèle métier hybride d’inspiration IFLA LRM. Nous montrerons comment Sparnatural a permis de donner accès à des utilisateurs non experts, avec peu d'effort, à ces deux grands graphes. Les ateliers menés avec les utilisateurs finaux ont montré qu'ils étaient enthousiastes, mais aussi surpris par ce nouveau paradigme de recherche. Nous espérons que grâce à la documentation produite , Sparnatural pourra être déployé pour valoriser d’autres graphes de connaissance. La création des démonstrateurs a montré que la configuration avec laquelle le graphe est montré aux utilisateurs finaux est essentielle pour fournir un accès efficace et parlant. La facilité de configuration de Sparnatural est l’une piste de travail pour l’avenir du composant ; les autres pistes sont la hiérarchisation des sélections de classes et de propriétés, l’ajout des fonctions d'agrégation, et de sélection de valeurs sur une carte pour générer du GeoSPARQL.

Références

  • https://tfrancart.github.io/sparnatural-iswc-2022/ article plus complet (en anglais)
  • https://youtu.be/jcfldxjsBkk vidéos longue en anglais, avec explication de la configuration
  • https://www.youtube.com/watch?v=93XV-SZD6tk vidéo courte en français, avec présentation des démonstrateurs.

Auteurs/Autrices

Thomas Francart est consultant sur les graphes de connaissances, fondateur de la société Sparna qui a développé Sparnatural. Thomas modélise, transforme, publie, interroge des graphes de connaissance, des terminologies et des ontologies depuis 20 ans, dans les domaines variés : documentaire, culturels, médical ou encore législatif

Florence Clavaud est conservatrice générale du patrimoine, actuellement responsable du tout nouveau Lab des Archives nationales. Elle travaille depuis longtemps au carrefour des sciences de l'information et de l'archivistique, notamment sur les questions de modélisation, de production et de publication des métadonnées archivistiques. Elle est membre du groupe d'experts de l'International Council on Archives (ICA) chargé d'élaborer la norme Records in Contexts, dans lequel elle pilote le développement de l'ontologie.

Fichiers joints

SWEP22-sparnatural-francart.pdf