Scorebot : utilisation du langage naturel pour interroger un graphe de partitions musicales

Intervenant⋅e⋅s

Résumé

La Médiathèque de la Philharmonie de Paris s’apprête à mettre en ligne un chatbot - appelé “ScoreBot” - destiné à faciliter les recherches dans son fonds de partitions musicales grâce aux technologies du web de données et au deep learning.

L’outil permettra d’effectuer des requêtes dans le catalogue en utilisant des formulations en langage naturel du type : “Je cherche des partitions pour violon, flûte et piano du XIXe siècle” ou “Avez-vous des méthodes pour harpiste débutant ?”. ScoreBot améliorera l’expérience utilisateur tout en permettant d’exploiter la finesse des informations présentes dans la base de données. En effet, peu d’utilisateurs parviennent aujourd’hui à formuler ces requêtes avec le formulaire de recherche avancée ou le moteur à facettes disponibles.

Cette présentation décrit les différentes étapes du projet, de la conversion des notices en RDF au paramétrage de l'interface de recherche. La génération de requêtes SPARQL à partir de questions exprimées en langage naturel n’a été rendue possible que récemment par les technologies de deep learning. Pour ce projet, un modèle de type Transformer a été entraîné à extraire les informations importantes des questions des utilisateurs, pour les insérer dans des requêtes SPARQL pré-rédigées.

ScoreBot est une application pratique du projet de recherche DOREMUS présenté lors d’une précédente conférence SemWeb.Pro. Une fois le projet finalisé, les résultats seront rendus disponibles en opensource.

Interface de test consultable à cette adresse : https://catalogue.philharmoniedeparis.fr/pprd-les-partitions.aspx

Enregistrement

Fichiers joints

05 - ScoreBot - SemWebPro 2023 - v2.pdf