SPARQLing : un agent conversationnel pour explorer les graphes de données RDF
Intervenant⋅e⋅s
Résumé
SPARQLing est un agent conversationnel conçu pour formuler des requêtes SPARQL et explorer efficacement un graphe de données RDF. Notre approche vise à utiliser les grands modèles de langue avec parcimonie et à exploiter l'ontologie via de l’IA symbolique. Nous présenterons les usages de SPARQLing et montrerons comment cet agent peut faciliter l'exploitation des graphes de données.
Ce produit s'adresse à deux types de publics : le grand public, qui ne maîtrise pas SPARQL mais a besoin d'accéder aux données présentes dans la base, et les experts qui trouverons en SPARQLing un moyen rapide de formuler des requêtes prêtes à être adaptées.
L'agent et l'utilisateur discutent pour atteindre un but commun qui est la formulation d'une requête SPARQL. Les ressources utilisées incluent l’ontologie et une base d'exemples de requêtes valides. Après avoir calculé des plongements lexicaux de la question posée, l'agent sélectionne les exemples et la sous-partie de l’ontologie qui semblent pertinents pour répondre à l'utilisateur. L'association entre IA symbolique et IA générative permet d'offrir un dialogue fluide tout en limitant les hallucinations.
SPARQLing a été testé sur des données d'acteurs publics et privés et sera bientôt commercialisé par Logilab. Les défis futurs pour SPARQLing incluent la gestion de l'implicite dans les questions formulées par l'utilisateur, et la capacité à poser des questions pour lever des incertitudes plutôt que de prendre une décision par lui-même.
Intervenant: Simon Chabot est ingénieur en informatique et docteur en mécanique. Il travaille chez Logilab depuis 2018.