Un prototype pour la sémantisation, l’interconnexion et la visualisation de jeux de métadonnées archivistiques

Intervenant⋅e⋅s

Résumé

En 2015, les Archives nationales, la Bibliothèque nationale de France, le Service interministériel des Archives de France et un laboratoire de recherche en histoire de l’art de l’Université de Montréal au Québec se sont associés pour réaliser une preuve de concept visant à démontrer qu’il est possible :

  • de représenter en RDF, en veillant à la précision, à l’exactitude et à l’utilisabilité des triplets obtenus, des métadonnées archivistiques produites de différentes manières et selon diverses perspectives (celles d’institutions patrimoniales, celles d’un chercheur) ;
  • d’enrichir les triplets obtenus en créant de nouveaux triplets, qu’il s’agisse de procéder à des alignements ou d’établir de nouvelles relations par inférence ;
  • de produire une interface de recherche et d’exploration analytique et graphique qui soit dynamique, ergonomique et signifiante, sans sacrifier la granularité informationnelle ni la lisibilité.

Il s’agit donc de réaliser un démonstrateur, sous la forme d’une application web dont les sources seront placées sous licence libre.

Cette opération est relativement complexe. Il n’y a pas de réel précédent dans le domaine des archives. De plus, jusqu’à tout récemment, il n’existait pas d’ontologie générique du domaine. Le groupe de travail Experts Group on Archival Description (EGAD) du Conseil International des Archives, après avoir publié en septembre 2016 la première version du modèle conceptuel Records In Contexts-Conceptual Model (RiC-CM, cf. http://www.ica.org/fr/egad-ric), prépare, pour la publier à l’automne, une première version de la transposition de ce modèle en ontologie OWL (RiC- O). Enfin, il n’existe pas de librairie ou logiciel satisfaisant directement la totalité des besoins, notamment pour ce qui concerne la visualisation des jeux de données.

Après une phase de sélection (au sein de corpus plus vastes, issus de projets réels) et de préparation des jeux de métadonnées archivistiques à traiter (notices d’autorité et instruments de recherche archivistiques en XML, vocabulaires au format SKOS), le projet est entré dans sa phase finale ce printemps. La conversion en RDF des fichiers XML, conformément à RiC-O, est quasiment achevée. Le démonstrateur est en cours de réalisation par la société Logilab dans le cadre du marché public défini pour le projet. Tous les travaux seront terminés cet automne.

<p>L’équipe projet et la société Logilab proposent de présenter les enjeux et les étapes du projet, ses résultats en particulier les fichiers RDF et le démonstrateur, ainsi que les premiers éléments d’un bilan détaillé, accompagnés de réflexions sur les suites possibles de cette opération.

Auteurs/Autrices

Florence Clavaud, responsable des référentiels documentaires aux Archives nationales ; membre de l’EA 3624 (Centre Jean-Mabillon) de l’École nationale des chartes ; membre exécutif du groupe EGAD (Experts Group on Archival Description) du Conseil international des Archives, responsable du développement de l’ontologie RiC-O.

Voir : http://www.enc-sorbonne.fr/fr/florence-clavaud Twitter : @FloClavaud Courriel : florence.clavaud@culture.gouv.fr</p>