Mieux exposer des données hétérogènes grâce aux outils du Web sémantique : l’exemple de data.bnf.fr
Intervenant⋅e⋅s
Résumé
La Bibliothèque nationale de France_ conserve des millions d’ouvrages. Il s’agit de livres, mais aussi de manuscrits et de documents divers. Ces ressources sont ouvertes au Web par la numérisation, conduite depuis des années.
Pourtant, elles sont souvent dissimulées dans le "web profond", c’est-à-dire dans le fond des catalogues, ou disséminées sous diverses adresses Internet. Une nouvelle interface de navigation sur le Web a été mise au point par la BnF, pour permettre une diffusion à tous publics, avec des pages HTML faciles à utiliser, mais aussi une exposition des données, ouvertes techniquement (RDF) et juridiquement (Licence Ouverte).
Data.bnf.fr permet de réunir sur une même page toutes les informations relatives à un auteur ou à une œuvre. L’internaute accède ainsi à tous les documents des différents catalogues de la Bibliothèque sur le sujet, à des liens avec les archives et manuscrits, et aux ressources de Gallica. Ce site construit automatiquement comporte plusieurs dizaines de milliers de pages, et sera progressivement élargi.
L’intervention présentera les logiques des catalogues classiques et des fonds d’archives, pour expliquer pourquoi la notion d’identifiants et de vocabulaires est essentielle, en particulier dans le contexte de la numérisation. Sans entrer dans les précisions techniques, il s’agira de montrer comment une publication HTML depuis une entrée de formats hétérogènes utilise les outils du Web sémantique pour rendre un service concret et ouvert.
Auteur : Conservateur des bibliothèques, archiviste-paléographe, Romain Wenz a rejoint en 2009 le département de l'Information Bibliographique et Numérique de la BnF comme expert métadonnées. Il travaille à l'élaboration de l'outil "data.bnf.fr" qui vise notamment à fournir des pages synthétiques sur les auteurs et les œuvres.