Bien (?) recevoir le web sémantique dans sa cuisine interne

Intervenant⋅e⋅s

Résumé

L'Agence Bibliographique de l'Enseignement Supérieur a pour mission principale d'organiser le recensement de toutes les ressources documentaires acquises par les bibliothèques universitaires. De plus en plus d'éditeurs partagent leurs métadonnées, qu'elles concernent les livres, les chapitres ou les articles. Nous nous efforçons de les collecter et de les intégrer dans notre système d'information bibliographique, pour les rendre interrogeables par les utilisateurs du Sudoc et récupérables par chaque bibliothèque de notre réseau pour alimenter son propre catalogue. Au passage, nous essayons d'améliorer la qualité de ces métadonnées, en les rendant plus cohérentes et plus riches. Leur qualité est encore améliorée par le travail des 3 000 catalogueurs du réseau Sudoc.

Ce workflow d'intégration et d'enrichissement des métadonnées des éditeurs scientifiques tourne autour d'une base de données RDF. Les technologies du web sémantique répondent parfaitement à nos besoins : intégrer des métadonnées hétérogènes ; exprimer de l'information en employant des vocabulaires standards différents, voire en forgeant en dernier recours de nouvelles propriétés et classes, sans se laisser enfermer dans un schéma de base de données figé ; enrichir les métadonnées centrales par la sédimentation de données complémentaires de toutes sortes disponibles sur le web.

Mais ce nouveau workflow doit vivre dans un environnement donné, à savoir le système d'information existant et le capital des ressources humaines aujourd'hui disponibles à l'ABES. La base RDF doit coexister et collaborer avec des programmes et des données qui correspondent à des choix et des compétences techniques qui sont les ... moyens du bord. A force de tâtonnements et de compromis pragmatiques, nous avons travaillé à intégrer ce workflow sémantique dans notre environnement. Le résultat est opérationnel, mais il servira également de leçon pour concevoir le prochain SI de l'ABES, qu'il repose en son cœur sur RDF ou pas.

Auteurs/Autrices

Yann NICOLAS est bibliothécaire à l'ABES (Agence Bibliographique de l'enseignement Supérieur) depuis 2003, sur différents projets d'informatique documentaire : calames.abes.fr, idref.fr, theses.fr, API Sudoc, Alignement, Linked data, etc. +Séduit par le Web sémantique en 2006. Praticien depuis 2008, pas à pas.