SPARQL-Generate: Génération de RDF et de texte à partir de RDF et flux de documents dans des formats hétérogènes

Intervenant⋅e⋅s

Résumé

<p>SPARQL-Generate est un langage de transformation de RDF qui permet d’interroger des jeux de données RDF et des flux de documents dans des formats hétérogènes, pour générer du RDF ou du texte. La version actuelle de SPARQL-Generate permet d’exprimer des requêtes depuis tout type de CSV, JSON, HTML, GeoJSON, CBOR (version binaire de JSON), ou encore des flux de messages WebSocket ou MQTT.</p><p>SPARQL-Generate est utilisé dans de nombreux cas d’utilisation, notamment: </p><ul> <li>génération de linked data à partir de flux de documents;</li> <li>génération de linked data à partir de gros documents;</li> <li>transformation de jeux de données RDF;</li> <li>génération d’une ontologie à partir de documents;</li> <li>génération de documentation d’ontologies.</li><p>Le langage intègre différentes astuces syntaxiques facilitant la déclaration de transformations de documents en RDF, incluant (1) l’identification des documents sources, (2) la sélection itérative de sous-parties de ces documents, (3) des IRIs et littéraux à variables, (4) l’appel à des requêtes externes, (5) la génération de listes RDF. Il inclue une sous-partie du langage de transformation STTL (SPARQL-Template), qui permet également de générer du texte. De plus, Étant une extension de SPARQL 1.1, le langage présente également les avantages suivants:</p><ul> <li>Ceux qui sont familiers de SPARQL peuvent apprendre facilement SPARQL-Generate.</li> <li>SPARQL-Generate bénéficie de l’expressivité de SPARQL 1.1: agrégats, modificateurs de séquences de solutions, fonctions SPARQL et mécanisme d’extension.</li> <li>SPARQL-Generate s’intègre naturellement avec les standards existants pour consommer le Web des données, comme SPARQL ou les frameworks de programmation Web Sémantique.</li> </ul><p>L’implémentation, basée sur Jena et disponible sous licence Apache 2.0, est utilisable sur un site internet de démonstration, en ligne de commande, ou sous forme de librairie Java.</p> <h5>Références</h5><div> <p>Lien vers présentation format 30min: https://www.slideshare.net/maximelefrancois86/overview-of-the-sparqlgenerate-language-and-latest-developments</p> <p>Lien vers site web de démonstration: https://w3id.org/sparql-generate/</p> </div><h5>Auteurs/Autrices</h5><div> Maxime Lefrançois est Maître de Conférences à MINES Saint-Étienne depuis 2017. Il a étudié la mécanique à l’ENS Cachan, puis le traitement du signal et l’informatique à l’Université de Grenoble. Il a préparé sa thèse à l’INRIA Sophia-Antipolis en représentation des connaissances linguistiques. Il a rejoint MINES Saint-Étienne fin 2014 pour développer le modèle de connaissances du projet EUREKA ITEA 12004 SEAS: une ontologie modulaire et versionnée construite sur le standard OGC&amp;W3C SOSA/SSN, qui consiste en des patrons d’ontologies simples qui peuvent être instanciés pour différents domaines. Maxime est l’un des co-éditeurs de SOSA/SSN, et contribute au développement de ETSI SAREF, le workflow de développement des ontologies SAREF et du portail de publication, via la direction de projets Specialist Task Force financés par l’ETSI. Maxime est l’initiateur et principal contributeur du développement du langage SPARQL-Generate, et des types de données cdt:ucum. </div></ul>