SPARQL-Generate: Génération de RDF et de texte à partir de RDF et flux de
documents dans des formats hétérogènes
Intervenant⋅e⋅s
Résumé
<p>SPARQL-Generate est un langage de transformation de RDF qui permet
d’interroger des jeux de données RDF et des flux de documents dans des
formats hétérogènes, pour générer du RDF ou du texte. La version actuelle
de SPARQL-Generate permet d’exprimer des requêtes depuis tout type de CSV,
JSON, HTML, GeoJSON, CBOR (version binaire de JSON), ou encore des flux de
messages WebSocket ou MQTT.</p><p>SPARQL-Generate est utilisé dans de nombreux cas d’utilisation, notamment:
</p><ul>
<li>génération de linked data à partir de flux de documents;</li>
<li>génération de linked data à partir de gros documents;</li>
<li>transformation de jeux de données RDF;</li>
<li>génération d’une ontologie à partir de documents;</li>
<li>génération de documentation d’ontologies.</li><p>Le langage intègre différentes astuces syntaxiques facilitant la
déclaration de transformations de documents en RDF, incluant (1)
l’identification des documents sources, (2) la sélection itérative de
sous-parties de ces documents, (3) des IRIs et littéraux à variables, (4)
l’appel à des requêtes externes, (5) la génération de listes RDF. Il inclue
une sous-partie du langage de transformation STTL (SPARQL-Template), qui
permet également de générer du texte. De plus, Étant une extension de
SPARQL 1.1, le langage présente également les avantages suivants:</p><ul>
<li>Ceux qui sont familiers de SPARQL peuvent apprendre facilement SPARQL-Generate.</li>
<li>SPARQL-Generate bénéficie de l’expressivité de SPARQL 1.1: agrégats,
modificateurs de séquences de solutions, fonctions SPARQL et mécanisme
d’extension.</li>
<li>SPARQL-Generate s’intègre naturellement avec les standards existants
pour consommer le Web des données, comme SPARQL ou les frameworks de
programmation Web Sémantique.</li>
</ul><p>L’implémentation, basée sur Jena et disponible sous licence Apache 2.0, est
utilisable sur un site internet de démonstration, en ligne de commande, ou
sous forme de librairie Java.</p>
<h5>Références</h5><div>
<p>Lien vers présentation format 30min:
https://www.slideshare.net/maximelefrancois86/overview-of-the-sparqlgenerate-language-and-latest-developments</p>
<p>Lien vers site web de démonstration: https://w3id.org/sparql-generate/</p>
</div><h5>Auteurs/Autrices</h5><div>
Maxime Lefrançois est Maître de Conférences à MINES Saint-Étienne depuis
2017. Il a étudié la mécanique à l’ENS Cachan, puis le traitement du signal
et l’informatique à l’Université de Grenoble. Il a préparé sa thèse à
l’INRIA Sophia-Antipolis en représentation des connaissances linguistiques.
Il a rejoint MINES Saint-Étienne fin 2014 pour développer le modèle de
connaissances du projet EUREKA ITEA 12004 SEAS: une ontologie modulaire et
versionnée construite sur le standard OGC&W3C SOSA/SSN, qui consiste en des
patrons d’ontologies simples qui peuvent être instanciés pour différents
domaines. Maxime est l’un des co-éditeurs de SOSA/SSN, et contribute au
développement de ETSI SAREF, le workflow de développement des ontologies
SAREF et du portail de publication, via la direction de projets Specialist
Task Force financés par l’ETSI. Maxime est l’initiateur et principal
contributeur du développement du langage SPARQL-Generate, et des types de
données cdt:ucum. </div></ul>