City Moove : une plateforme sémantique pour construire et exploiter des bases de connaissances touristiques

Intervenant⋅e⋅s

Résumé

City Moove est une plateforme sémantique permettant de collecter et d'agréger différent type d’information culturelle et touristique. Elle est composée de collecteurs qui traitent des formats de données hétérogènes tels que des flux RSS, des exports XML ou CSV, des réponses à des APIs en JSON, etc. Le modèle de données au coeur de la plate-forme repose sur et étend Schema.org. L’information ainsi agrégée constitue un graphe de connaissances représenté en RDF. La plateforme moissonne en continu des flux d’informations donnés, par exemple, à une fréquence quotidienne permettant ainsi une mise à jour de la base de connaissances. La plateforme dispose d’un module de dédoublonnage, indispensable dès lors que différentes sources décrivant potentiellement les mêmes objets, sont agrégées. Le moteur de dédoublonnage repose sur STEM (https://github.com/enricopal/STEM), un algorithme supervisé permettant d’améliorer à la fois la précision et le rappel concernant l’interconnexion de données RDF calculée à partir de logiciels tels que DUKE ou SILK. La plateforme dispose également d’un module permettant de prédire la catégorie des événements. Au final, la plateforme a été utilisé pour différentes zones géographiques : l’île de St Barthelemy, la région de la côte d’azur, et un certain nombres de grandes villes telles que Milan, Amsterdam ou Londres.

Nous illustrerons le fonctionnement de la plateforme en utilisant la base de connaissances créées couvrant la région de la Côte d’Azur, soit plus de 250 communes s’étalant entre Monaco et St Tropez. Les flux collectés proviennent d’offices de tourisme (Nice, Cannes, Antibes, Mandelieu, Grasse), du comité régional de tourisme, de salles semi-privées (le palais des festivals), de l’open data (Open Agenda, Data Tourisme), de bases de données professionnelles (APIDAE), ou du web (Facebook, Google, Foursquare, Yelp, Eventful, Evensi, Meetup). La base de connaissances contient plus de 335k points d’intérêts, 100k revues et plus de 30k événements collectés depuis 2 ans. Nous montrerons comment ce graphe de connaissances touristiques peut être aussi complété ou corrigé grâce à un outil de contrôle éditorial attaché au système de gestion de contenu WordPress. Des applications clientes peuvent alors consommer les données, soit en interrogeant directement un point d’entrée SPARQL, soit en utilisant l’API City-Moove. Nous montrerons différentes interfaces graphiques Web de type moteur de recherche exploratoire ou des applications mobiles restituant des parties du graphe de connaissances.

Nous avons enfin développé Minotour, un assistant conversationnel intelligent se nourrissant de la base de connaissances. Minotour combine plusieurs moteurs de compréhension du langage naturel (NLU) et repose sur une architecture modulaire construite au dessus de Botkit. Il permet de répondre à toute sorte de question d’ordre touristiques concernant les événements et activités à faire, les lieux à visiter, l’offre d’hébergement ou de restauration disponible, tout en ajoutant des informations contextuelles telles que les prévisions météorologiques ou l’offre de transport public. Minotour est disponible sur de nombreuses applications de messagerie tels que Facebook Messenger, Skype, Telegram ou Slack, ou sur des enceintes connectées (Google Home, Amazon Alexa).

Auteurs/Autrices

Frédéric BOSSARD est président et chargé des relations avec la clientèle Grand Compte de l’Agence de communication digitale WACAN dont la majorité des références sont liés au marché du Tourisme : Communauté Européenne, Communauté d’Agglomération Sophia Antipolis, Ville de Nice, Ville de Saint-Laurent-du-Var, Conseil Régional P.A.C.A., C onseil Général 06, Aéroport de Nice, etc.

C’est à l’issu de cette forte expérience que Monsieur Frédéric Bossard et Mr jean-Claude Guignard ont créé la start-up Data-Moove en identifiant les problématiques rencontrées par les professionnels du tourisme pour la promotion de leurs produits (événements, manifestations, lieux, …) à leurs clients potentiels.

C’est lors de cette activité que Monsieur Bossard a pu définir une solution répondant à ce besoin fortement qualifié de gestion et de diffusion d’une donnée touristique à haute volumétrie provenant de plusieurs sources, utilisée par différents intervenants et supports médias.