FranceArchives : portail de référence pour les archives françaises dans le web de données liées

Intervenant⋅e⋅s

Résumé

Porté par le Service interministériel des Archives de France, FranceArchives est le portail agrégateur national pour les archives françaises depuis 2017 et offre une recherche fédérée dans près de 22 millions de métadonnées archivistiques produites par près de 140 institutions.

À ce titre, il est un acteur évident sinon attendu pour les archives françaises dans le web de données liées. Cependant, l'hétérogénéité des données et la description hiérarchique des archives en font un véritable défi. Le portail a profité des opportunités des technologies du web sémantique pour traiter les entités personnes, institutions, lieux et thèmes, extraites des indexations figurant dans les inventaires d'archives, en les :

  • Désambiguisant grâce à des URI ;
  • Alignant vers les référentiels du Linked Open Data, tels que GeoNames, Wikidata, data.bnf et le thésaurus pour l'indexation matières des archives ;
  • Enrichissant avec des dates, des descriptions et des coordonnées géographiques.

Pour pleinement intégrer FranceArchives au Linked Open Data, les données sont converties, à partir de la base de données CubicWeb, en RDF en utilisant l'ontologie RiC-O version 0.2 publiée en février 2021.

FranceArchives est le premier projet à utiliser ce modèle à grande échelle avec un certain succès.

C'est également l'un des premiers entrepôts de données archivistiques de cette taille sur le Linked Open Data.

Pour assurer une expérience utilisateur optimale, un graphe restreint aux données de qualité est exposé dans l'entrepôt SPARQL et peut être exploré grâce à l'outil Sparnatural. Une ontologie, rédigée spécifiquement pour cette instance de Sparnatural, permet le requêtage des données le plus fin possible tout en s'adaptant à l'hétérogénéité des données.

Enregistrement

Fichiers joints

downloadTélécharger