Création Semi-Automatisée d'Ontologies et de Graphes de Connaissances chez Lettria

Intervenant⋅e⋅s

Résumé

Il est généralement coûteux de créer une ontologie pour un domaine et répondant à des besoins spécifique, car il faut à la fois être un expert du domaine visé et en même temps maîtriser les méthodes d'ingénierie des connaissances. De nombreuses ontologies existent déjà pour une large variété de domaines, mais ces ontologies ne sont pas forcément référencées dans des catalogues permettant leur découvrabilité, ni adaptées au cas d'utilisation visé car, soit trop spécifiques, soit trop génériques. Ainsi, il faut souvent un ingénieur de la connaissance dédié pour sélectionner ou mettre à jour une ontologie pour un cas d'utilisation donné. Une fois l'ontologie construite, il n'est pas non plus aisé de l'utiliser pour venir peupler un graphe de connaissances, cette tâche nécessitant souvent des approches du traitement automatique du langage naturel (TALN) telles que l'identification d'entités et l'extraction de relations. Pour les entreprises, il est difficile d'allouer des ressources pour créer une ontologie et de transformer leurs documents internes en graphe de connaissances.

Les grands modèles de langage (LLMs) promettent de s'abstraire en partie de ces contraintes. Ils sont capables de résoudre un certains nombres de tâches de TAL et peuvent être guidé pour construire une ontologie de domaine. Dans cet exposé, nous présenterons l'approche développée par Lettria pour créer une ontologie et peupler un graphe de connaissances à partir de textes, de manière automatisée et adaptable. Pour cela, nous avons défini une orchestration de prompts et de critères afin de donner la possibilité à tout le monde de pouvoir effectuer ces tâches. Chacun des critères générés peut être modifié par l'utilisateur afin d'adapter les résultats et se rapprocher d'un objectif visé. Nous montrerons l'évaluation de cette méthode sur le benchmark académique Text2KG et nous présenterons les premiers retour clients où cette approche a déjà été mise en place avec succès.

Fichiers joints

downloadTélécharger