Interroger efficacement des bases de données relationnelles avec SPARQL et Ontop

Intervenant⋅e⋅s

Résumé

L’élaboration manuelle de nouvelles requêtes SQL à l’adresse de bases de données relationnelles ayant des schémas complexes est un processus lent et coûteux qui se révèle être critique pour de nombreuses industries. Ce processus nécessite de combiner deux types d’expertise : celle du domaine concerné (exprimer une question pertinente de façon précise) et celle de la base de données (localiser les informations recherchées dans la base de données). L’approche OBDA (Ontology-Based Data Access) vise à automatiser une partie de ce processus en (i) permettant aux utilisateurs d’exprimer les requêtes à partir d’un modèle conceptuel de leur domaine indépendant du schéma relationnel et (ii) en traduisant automatiquement ces requêtes dans le langage supporté par la base de données (SQL). Dans cette présentation, nous nous intéresserons au système OBDA développé à l’Université Libre de Bozen-Bolzano (Italie) dénommé Ontop.

Ce projet, débuté en 2010, repose sur plusieurs standards du Web sémantique : (i) OWL 2 QL pour la modélisation des concepts du domaine, (ii) SPARQL pour la formulation des requêtes utilisateurs et (iii) R2RML pour l’exposition du contenu de la base de données sous forme de graphe RDF virtuel.

Ce logiciel est disponible sous licence libre. Le principal enjeu pour un système OBDA est de générer des requêtes SQL optimisées pouvant être exécutées efficacement par le moteur de base de données.

Ontop propose de nombreuses optimisations sémantiques et structurelles lui permettant d’obtenir une performance suffisamment élevée pour permettre l’exécution de requêtes complexes sur des bases de données de grande taille en un temps acceptable. Ce système intègre également des capacités d’inférence à faible coût ne nécessitant aucune matérialisation des données.

Nous présenterons ensuite son intégration dans la plateforme développée dans le cadre du projet européen Optique et sur son utilisation par les géologues d’un de nos partenaires industriels, Statoil.

À cette occasion, nous reviendrons sur les principaux défis introduits par ce cas d’usage industriel. L’équipe participant au développement d’Ontop au sein de l’Université Libre de Bozen-Bolzano est actuellement composée de Martin Rezk, Guohui Xiao, Sarah Komla Ebri, Elem Güzel, David Lanti, Elena Botoeva et Benjamin Cogrel. Elle est coordonnée par Diego Calvanese.

Quelques liens : http://ontop.inf.unibz.it/ http://optique-project.eu/

Fichiers joints

downloadTélécharger