SaGe: Préemption Web pour les services publics d'évaluation de requêtes SPARQL

Intervenant⋅e⋅s

Résumé

Suivant les principes du Linked Open Data (LOD), les fournisseurs de données hébergent publiquement des millions de triples au format RDF. Cependant, fournir un service public qui permet à n’importe qui d’exécuter n’importe quelle requête SPARQL sur ces données est toujours un problème ouvert. Comme ces services sont soumis à une charge imprévisible de requêtes, le défi est d’assurer qu’ils demeurent stables malgré des variations en termes de taux d’arrivées des requêtes et des ressources nécessaires à leur évaluation. Pour résoudre ce problème, la plupart des fournisseurs de données appliquent une politique d’utilisation équitable des serveurs basée sur des quotas. Ces derniers visent à empêcher les effets convois, c.a.d, une requête longue à exécuter bloque l’évaluation des autres. Le principal défaut de cette politique est qu’elle empêche les requêtes interrompues de délivrer des résultats complets. Cela constitue une limite sérieuse pour les utilisateurs du LOD, qui peuvent vouloir exécuter des requêtes longues.

Nous pensons que le problème lié aux quotas ne réside pas dans l’interruption des requêtes, mais dans l’impossibilité pour les clients de reprendre leur exécution après interruption. Néanmoins, il n’existe pas de modèle de préemption pour le Web qui permet la suspension et la reprise de l’exécution de requêtes SPARQL.

Dans cette présentation, nous présentons SaGe, un moteur d’évaluation de requête SPARQL basé sur la préemption Web. Il permet à un serveur Web de suspendre une requête SPARQL en cours d’exécution après un certain temps, puis de reprendre son exécution ultérieurement. Une fois suspendue, l’état d’une requête est retourné au client, qui peut reprendre son exécution en renvoyant l’état au serveur. L'article de recherche décrivant l'approche générale a été publié au congrès The Web Conference 2019. La présentation abordera le concept général de la préemption Web, les détails techniques du logiciel SaGe et une étude de ses performances. Elle sera accompagnée d'une démonstration.

Références

Lien vers une démonstration: http://sage.univ-nantes.fr/

Auteurs/Autrices

Thomas Minier est doctorant en 3ème année au Laboratoire des Sciences du Numérique de Nantes (LS2N). Ses activités de recherche portent sur le Web Sémantique, le Linked Open Data et l'évaluation de requêtes SPARQL.

Ses travaux ont été publiés dans les conférences ESWC et The Web Conference.