Construction d’un référentiel taxonomique commun pour des études sur l’histoire de la zoologie, l’archéozoologie et la biologie
Intervenant⋅e⋅s
Résumé
Une des missions du Muséum National d’Histoire Naturelle (MNHN) est d’établir une synthèse de la biodiversité et du patrimoine naturel français. Dans ce contexte, il est en charge de l’élaboration d’un référentiel taxonomique pour la faune, la flore et la fonge, TAXREF. Ce référentiel unique liste et organise les noms scientifiques de l'ensemble des êtres vivants recensés sur les territoires français, métropole et outremer, et constitue la pierre angulaire du Système d’Information sur la Nature et les Paysages (SINP). Il est utilisé par de nombreux acteurs publics, privés et de la société civile (collectivités, conservateurs, cabinets d’architecte, enseignants, citoyens, etc.). TAXREF est de plus aligné avec d'autres référentiels taxonomiques ou nomenclaturaux internationaux.
Le projet de recherche Zoomathia vise à étudier l’histoire de la connaissance zoologique à travers l’Antiquité et le Moyen-Age. Pour cela, il envisage d’utiliser les technologies du web sémantique afin d’intégrer des sources de données hétérogènes, allant d’encyclopédies médiévales à des données de biologie moderne, en passant par des rapports de fouilles archéologiques et des ressources iconographiques. Ce travail passe nécessairement par la sélection et/ou la définition de vocabulaires pouvant servir de référentiels taxonomique, culturel, géographique, chronologique etc. Afin de rendre les données intégrées interopérables sur le web, ces vocabulaires doivent faire l’objet d’un consensus et être liés à d’autres vocabulaires connexes faisant autorité. TAXREF étant le résultat d’un large consensus scientifique, et étant déjà utilisé pour l’intégration de données de biologie moderne et de données archéologiques, il a été sélectionné pour construire un thésaurus supportant l’intégration des données considérées dans le cadre du projet Zoomathia.
Dans cette présentation, je reviendrai sur les motivations exposées ci-dessus, puis je décrirai la modélisation d’un thésaurus exprimé en SKOS (Simple Knowledge Organisation System) afin de produire une version de TAXREF exploitable avec les technologies du web sémantique. J’aborderai notamment la question du lien entre ce "TAXREF-SKOS" et d’autres thésaurus et ontologies existantes. Enfin, je décrirai la méthode utilisée pour produire le résultat en RDF et son exposition sur le web de données sous forme d’URI pérennes déréférençables, et je ferai une courte démonstration via la navigation dans les URI en Linked Data et l’utilisation de requêtes SPARQL. En conclusion, je reviendrai sur le fait que la construction de thésaurus SKOS n’est qu’une étape, un « enabler », visant à encourager les producteurs de données utilisant déjà TAXREF, et les concepteurs d’applications, à utiliser ces technologies et s’appuyer sur TAXREF-SKOS.
Présenté par
Franck Michel
Après avoir travaillé pendant 14 ans dans le secteur privé des télécommunications, Franck Michel a rejoint le CNRS en 2011 comme ingénieur de recherche au laboratoire I3S. Ses travaux de recherche concernent la publication et la fédération de données hétérogènes sur le Web de données. En particulier il étudie des méthodes permettant de traduire en RDF différents types de bases de données, avec un focus sur les bases NoSQL. Dans ce contexte il a développé un prototype permettant d'interroger une base MongoDB en SPARQL (Morph-xR2RML). Franck a participé au projet CNRS MASTODONS Credible sur la fédération de données biomédicales et participe actuellement au projet Zoomathia sur l'étude de la transmission des connaissances zoologiques antiques; il collabore avec le Muséum National d'Histoire Naturelle pour la publication du référentiel taxonomique TAXREF sur le Web de données.
Par ailleurs, Franck est impliqué dans plusieurs activités liées à l'infrastructure de calcul européenne European Grid Infrastructure (EGI). Il assure la coordination technique et le support d'une communauté d'utilisateurs en sciences de la vie, et participe à élaboration et au développement d'outils de monitoring et de gestion de ressources.