Linked Data et description du produit automobile

Intervenant⋅e⋅s

Résumé

Des vocabulaires tels que GoodRelationset schema.org permettent de décrire des produits sur le web de données et, pour des articles tels que livres ou tickets de spectacle, les moteurs de recherche sont capables de retourner des offres commerciales incluant vendeur, prix et évaluations.

Mais supposez que vous vouliez acheter une voiture, une citadine par exemple, avec toit ouvrant, climatisation, et connecteur MP3. Là, les choses se compliquent. Ces choix ne définissent pas complètement un produit, et vous souhaitez probablement comparer les offres sur de multiples critères : leur prix, mais aussi, par exemple, leurs systèmes de navigation ou leurs émissions de CO2.

Plusieurs constructeurs ont entrepris de décrire leur gamme sur le web de données. Cela pose d'intéressantes questions. Vu le nombre de caractéristiques qu'un client peut choisir (type de caisse, motorisation, options, couleur, ...), et les multiples contraintes qui existent entre elles, les gammes automobiles sont en effet non énumérables (plus de 10^20 voitures différentes chez Renault), et complexes. Elles sont donc spécifiées en intention, sous la forme d'une liste de variables, et de contraintes entre ces variables, c'est à dire sous la forme d'un "Constraint Satisfaction Problem".

On peut les représenter en utilisant des langages du Semantic Web. Mais les utilisations pratiques nécessitent des outils puissants de raisonnement automatique. Publier sur le web de données une gamme décrite ainsi n'aurait donc qu'un intérêt limité, parce que la plupart des agents sur le web ne disposent pas de telles capacités de raisonnement.

D'un autre côté, un client peut explorer la gamme et y choisir un produit, de façon interactive, grâce à un "configurateur". Chaque étape du processus de configuration décrit un produit partiellement défini (PPD), avec une liste des choix encore possibles, compte tenu des sélections précédentes. Ces choix sont autant de liens vers d'autres PPD (ou des produits complètement définis, in fine). Le processus peut donc être vu comme le parcours d'un graphe de PPDs : chaque PPD est identifié par une URI, et la gamme se décrit ainsi sous forme de Linked Data. Comme chaque PPD peut être complété en une offre commerciale valide, l'ontologie de configuration correspondante s'intègre naturellement à GoodRelations

Renaulta commencé à publier ainsi la description de sa gamme (par exemple, au format JSON en Allemagne et en Italie. Cette présentation se propose d'expliquer comment, et de décrire les cas d'emploi : partage de PPD entre applications, devices et media, publicité, comparaison de gammes orientée client, SEO.

Lectures supplémentaires :

Auteurs :

François-Paul Servant et Edouard Chevalier

François-Paul Servant a introduit le Semantic Web chez Renault. Il a illustré les bénéfices possibles dans le contexte de l'entreprise au travers de divers prototypes, dont certains furent présentés à l'extérieur ("Semantic Web Technologies in Automotive Repair and Diagnostic Documentation" OWLED 2007, "Linking Enterprise Data", LDOW 2008). Il a conçu et réalisé la première application, basée sur les Linked Data, opérationnelle chez Renault (avril 2010). Il s'est intéressé au Semantic Web d'assez bonne heure, en travaillant à un projet personnel, "Semanlink", un système de tagging basé sur RDF qui permet d'organiser les tags en un graphe de concepts liés.

Edouard Chevalier a développé l'API Renault de configuration, fondée sur les Linked Data, et le service de publication des données de description de la gamme.

Tous deux travaillent pour Renault au sein de l'équipe "Intelligence Artificielle Appliquée", qui développe des outils de raisonnement, basés sur la compilation de contraintes booléennes et probabilistes.

Fichiers joints

downloadTélécharger