Sparklis : exploration et interrogation de points d'accès SPARQL par interaction et langue naturelle
Intervenant⋅e⋅s
Résumé
Sparklis est une application Web de recherche sémantique qui fonctionne au-dessus de points d'accès SPARQL. Il n'est pas lié à un point d'accès particulier, mais peut fonctionner avec n'importe quel point d'accès public ou privé. Le principe de Sparklis est de permettre aux utilisateurs d'explorer et interroger les données en les guidant dans la construction de requêtes puissantes en langue naturelle (anglais ou français). Une requête SPARQL est construite en même temps mais elle est seulement affichée en bas de la page pour l'utilisateur curieux ou pour l'expert qui souhaite la réutiliser dans un autre outil. Les utilisateurs n'ont pas besoin de connaître le schéma de données ou le vocabulaire car ils le découvrent à la volée en naviguant.
Ils n'ont rien à écrire, à part les valeurs de filtrage (ex., mots-clés, seuils), ce qui exclut toute erreur lexicale, syntaxique ou sémantique. Sparklis couvre un large sous-ensemble de SPARQL : motifs de graphes, OPTIONAL, UNION, NOT EXISTS, tri des résultats, agrégations, filtres principaux (mots clés, inégalités et intervalles, tag de langue et datatype). Enfin, il est conçu pour passer à l'échelle de gros jeux de données et fonctionne par exemple sur DBpedia (plusieurs milliards de triplets).
Sparklis est en ligne depuis avril 2014 et depuis, des centaines d'utilisateurs l'ont utilisé sur des centaines de points d'accès. Sparklis s'appuie sur les standards du W3C : SPARQL pour l'interrogation, HTML5/CSS3 et Javascript pour l'interface et l'interaction.
Une démonstration montrera aux participants comment Sparklis permet de répondre aux questions du challenge QALD sur DBpedia. Ces questions couvrent différents types de recherche : faits de base (Give me the homepage of Forbes), listes d'entités (Which rivers flow into a German lake?), comptages (How many languages are spoken in Colombia), optimums (Which of Tim Burton's films had the highest budget}).
Il est aussi possible de répondre à des questions analytiques plus complexes telles que Give me the total runtime, from highest to lowest, of films per director and per country.