DATATOURISME en coulisses : aperçu technique de la plateforme et retoursd’expériences sur les développements

Intervenant⋅e⋅s

Résumé

Projet lauréat de la première tranche du Programme d’investissement d’avenir, DATATOURISME est une plateforme :

  • d’alignement, d’agrégation et de normalisation, des données touristiques françaises. (volet PRODUCTEUR)
  • de requête et d’abonnement à des flux de données de formats variés en vue de leur utilisation par des services tiers. (volet DIFFUSEUR)

Porté par la DGE ainsi que par Tourisme et territoires, le projet à mobilisé tous les savoirs faire de CONJECTO qui fut chargé des développements de la plateforme. Opérationnelle depuis fin 2017, celle-ci accueille (au 14/06/2018) 43 producteurs, 1612 flux diffuseurs actualisés régulièrement pour un total de 218 083 POI représentant 11 336 366 triplets. La volumétrie attendue sur l’ensemble des données est de 400 000 POI.

La présentation mettra l’accent sur la description de plusieurs composants innovants par rapport à l’état de l’art lors du début des développements.

  • Une interface d’alignement XML > RDF ergonomique et ontology driven
  • Un processus robuste d’alignement, normalisation, validation et publication des ressources RDF
  • Une API d’abstraction de requête SPARQL basée sur le langage GraphQL

Nous mettrons également en lumière un certain nombre de freins rencontrés sur ce projet, ainsi que les solutions utilisées pour contourner ceux-ci.

  • Sérialisation vers différents formats (RDF/SPARQL Result) en stream, au travers d’un stockage key-value
  • Optimisation des requêtes SPARQL sur BLAZEGRAPH

Références

Le site du projet : http://www.datatourisme.fr/ La plateforme : https://www.datatourisme.gouv.fr/ (inscription diffuseur possible)

Auteurs/Autrices

Arrivé tôt dans l’informatique, Blaise de CARNÉ démarre sa carrière comme développeur en ESN et gravit rapidement les échelons jusqu'au poste de directeur technique. Il s’intéresse avec enthousiasme aux technologies du Web Sémantique depuis 2012, avec un fort focus sur l’utilisation de ces technologies en production. Il cumula les fonctions de chef de projet et de lead developper sur DATATOURISME.

Après un DEA MIAGE, Serwan CRAVIC a suivi un parcours d’ingénieur logiciel dans diverses sociétés, notamment dans le domaine médical. Passionné par le WebSem et sa philosophie, il a mobilisé ses connaissances sur l’optimisation des temps de réponses de la plateforme. Il fut responsable de l’architecture logicielle de DATATOURISME.