Le Web Sémantique au service de la cuisine numérique de demain
Intervenant⋅e⋅s
Résumé
Le programme NosRecettes (2013-2016) du projet Open Food System1 (OFS) a pour ambition d’offrir, grâce à une plate-forme numérique, une panoplie de services pour mieux assister les cuisiniers amateurs. Les recettes désormais digitales peuvent devenir un des vecteurs les plus efficaces pour accélérer la démocratisation des usages numériques dans le quotidien domestique.
Nos Recettes vise donc à développer des solutions complètes innovantes, à base de Web Sémantique, qui seront la base des expériences utilisateurs dans la cuisine de demain :
la structuration de données de recettes numériques sur un format de données universel riche ;
la proposition de recettes et de menus grâce à un moteur de recommandation basé sur des profils utilisateurs individualisés ;
la communication, avec des appareils électroménagers automatisés qui sauront comprendre ces recettes, les réussir et les reproduire simplement ;
une communauté d’amateurs de cuisine de dimension internationale.
Pour répondre à ces axes, nous avons développé une chaîne sémantique pour l’enrichissement des recettes numériques. Cette chaîne intègre trois outils : Luxid de Temis pour l’extraction d’information, GraphDB de OntoText pour le raisonnement et le stockage en RDF des recettes enrichies et enfin le Content Augmentation Manager de Mondeca pour orchestrer chacune des étapes, filtrer et désambiguïser les informations extraites et optimiser les raisonnements à réaliser en fonction des scénarios du programme : calcul d’information nutritionnelle, identification de recettes génériques vs recettes variantes, identification de la saisonnalité d’une recette, identification de la complétude d’une recette, structuration fine des instructions de la recette pour identifier des adaptations possibles entre matériels, amélioration des résultats du moteur de recommandation de recettes.
Pour rendre possible chacun de ces scénarios, tous les composants de la chaîne sémantique reposent essentiellement sur une ressource termino-ontologique de la cuisine composée de 6 modules interdépendants (aliments, nutrition, matériels, unité, préparations et cuisine). En effet, elle permet de générer les lexiques utilisés par l’outil d’extraction linguistique pour l’enrichissement des recettes numériques. Mais surtout la définition de nombreuses classes construites permet de classer automatiquement les recettes enrichies tout en permettant l’inférence de nouvelles connaissances sur ces recettes. Un véritable challenge a été relevé pour pouvoir concilier représentation de l’ontologie en OWL2 DL, raisonnements dans le fragment OWL2 QL proposé par GraphDB et performance de l’ensemble de la chaine sémantique pour que les temps de traitement restent acceptables. Ce programme illustre les limites actuelles pour l’implémentation de raisonnements poussés, sur une ontologie conséquente, dans un environnement à visée hautement industrielle.
Autrices
Florence Amardeilh est responsable du département R&D de Mondeca depuis 2007, travaillant dans les domaines de l’acquisition des connaissances et du Web Sémantique depuis 2002. Ingénieur de Recherche en Systèmes d’information et Gestion des Connaissances en 2001, elle a ensuite réalisé une thèse CIFRE chez Mondeca en partenariat avec l’Université Paris 10. La thèse a eu pour objectif de réunir et de combiner les méthodes et outils du Traitement Automatique du Langage avec ceux du Web Sémantique afin de créer des applications pour le peuplement d’ontologies et l’annotation sémantique. Florence participe, en collaboration avec des partenaires industriels et universitaires, au montage, au pilotage et à la réalisation de nombreux projets de recherche européens (IST FP5 - MOSES, IST-FP6 – TAO, IST-FP7 Virtuoso, IST-FP7 SeaBilla) et français (ANR Eiffel, ANR Tecsan VigiTermes, ANR Tecsan InterSTIS, RNTL TerraNumerica, FUI SAMAR, FUI LegiLocal, ANR CSOSG SAIMSI, ANR TecSan TerSan, FUI FIORA, PSPC Open Food System), permettant à Mondeca d'être à la pointe de l'innovation des méthodes et outils existants en Web Sémantique.