Le Dictionnaire des francophones, plateforme open data et contributive
Intervenant⋅e⋅s
- Nicolas Delaforge (Mnémotix)
- Pierre-René Lhérisson (Mnémotix)
- Mylène Leitzelman (Mnémotix)
- Freddy Limpens (Mnémotix)
- Noé Gasparini (Institut International pour la Francophonie (2IF), Université Jean Moulin Lyon 3)
Résumé
Le Dictionnaire Des Francophones (DDF) est un dictionnaire collaboratif en ligne articulant plusieurs ressources lexicographiques décrivant le français, dont le Wiktionnaire. Il est pensé d’emblée comme un nouvel espace numérique donnant non seulement accès à un riche patrimoine culturel international, mais offrant également l’opportunité de recueillir et partager la matière linguistique vivante que pratique au quotidien les francophones du monde entier. Le dictionnaire des Francophones est un projet de la Délégation Générale à la Langue Française et aux Langues de France (DGLFLF) du Ministère de la Culture, dont l’opérateur est l’Institut International de la Francophonie (2IF, Université Jean Moulin Lyon 3) et dont la réalisation a été confiée à Mnémotix. Cette plateforme présente plusieurs aspects innovants que cette présentation s’attachera à montrer et illustrer par une démonstration.
L’ontologie au coeur de cette plateforme propose une extension des modèles lexicographiques existants (Ontolex, Lemon) afin de pouvoir articuler plusieurs dictionnaires entre eux et d’en capturer toutes les subtilités, et aussi d’inclure au coeur du modèle la dimension collaborative et le débat. Par exemple les notes d’étymologie des dictionnaires sources sont conçues comme les premiers messages de fils de discussions pouvant être alimentés par les usagers de la plateforme. La localisation géographique (basée sur Geonames) des définitions ou des formes lexicales permet quant à elle de traduire précisément l’ancrage géographique de mots et de leur usage. Enfin une grande variété de relations sémantiques, décrites dans un thésaurus, peuvent être tissées au sein des mots et des définitions.
En terme d’interaction, la plateforme collaborative que constitue le DDF offre aux usagers la possibilité d’explorer le contenu à travers le prisme de la géolocalisation ou des relations sémantiques, mais les invite également à l’enrichir et à l’améliorer. Tout un chacun peut contribuer à sa manière en ajoutant notamment des entrées, des exemples, en participant aux espaces de discussions, en signalant ou en validant des articles, en enrichissant les définitions existantes, ou simplement en précisant la localisation d’une forme ou d’un sens. La contribution ne peut se faire que par l’ajout d’information. C’est à dire qu’une information déjà présente ne peut être modifiée ou supprimée, ceci pour éviter des corrections abusives qui résulteraient de simples divergences d’opinion.
D’un point de vue technologique, le DDF repose sur Synaptix, le middleware open source développé par Mnémotix dont l’architecture allie la réactivité de solutions big datas à la flexibilité des systèmes de connaissances à base de graphes RDF. Synaptix est un serveurde message basé sur le protocole AMQP. Il gère les échanges entre les différents services qui composent le DDF: un service qui s’occupe du moissonnage des données provenant du dictionnaires intégrés (le Wiktionnaire et l’ Inventaire des particularités lexicales du français en Afrique noire dans un premier temps) et de leur transformation en données RDF; un service qui s’occupe de la mise à jour de ces données sémantiques et de l’alignement des données provenant de sources diverses; enfin un service qui fait l’indexation de ces données afin qu’elles soient servies rapidement à l’applications cliente.
L’interface avec cette application Web cliente se fait via une API GraphQL qui permet de combiner plusieurs requêtes en un seul appel HTTP
La présentation se déroulera en 3 temps:
- présentation de l’ontologie DDF,
- présentation de l’architecture de la plateforme basée sur Synaptix, et
- démonstration.
Références
http://www.dictionnairedesfrancophones.org
Auteurs/Autrices
Nicolas Delaforge Ingénieur en génie informatique, diplômé de l’Université de Technologie de Compiègne, spécialisé dans l’ingénierie des industries culturelles, il a également suivi une formation en sciences cognitives au sein du laboratoire COSTECH de l’UTC. Après un parcours de consultant chez Orange il renoue avec la recherche à l’INRIA de Sophia Antipolis où il devient responsable du projet de recherche pluridisciplinaire ISICIL pendant 3 ans sous la direction de Fabien Gandon. Cette expérience au croisement entre les mondes de la recherche, de l’industrie et de la culture, mêlant technologie, philosophie et sciences cognitives, lui ont donné une vision originale qui a motivé la création de la société Mnémotix en 2013.
Pierre-René Lhérisson Pierre René est titulaire d’un Master en Master Web Intelligence auprès de l’Université Jean Monnet de St Etienne. Ce Master lui a permis d’acquérir des compétences dans l’apprentissage automatique, la fouille de données, la représentation des connaissances, l’analyse et le traitement dans des environnements à grand volume de données hétérogènes et complexes, numériques et/ou symboliques, pour l’élaboration de systèmes intelligents, de solutions d’extraction d’information, d’aide à la décision et de prédiction. Il va passer en avril sa thèse CIFRE cofinancée avec la SCIC 1D Lab auprès du Laboratoire Hubert-Curien (Université Jean Monnet de St Etienne) sur le thème : Systèmes de recommandations équitables pour des parcours de découvertes culturelles alternatives - activité de recherche sur les systèmes de recommandation, la diversité, la nouveauté et la sérendipité. Il intègre Mnémotix en tant que jeune docteur dès sa thèse passée et validée pour venir renforcer les compétences de l’équipe dans toute la partie analyse sémantique, TAL, extraction et modélisation de connaissances.
Mylène Leitzelman En charge au sein de Mnémotix de l’animation des relations avec la recherche et l’industrie, du montage et du suivi des projets R&D, je suis également conseillère scientifique sur les questions des usages et des sciences de l’information. Ma démarche professionnelle est directement inspirée d'une citation de François Bloch Lainé : "Toute décision résulte de la conjonction d'une compétence et d'une information", ce que je mets en pratique en participant à l'élaboration d'outils et de plateformes technologiques intelligentes au service des humains. Entrepreneur, ingénieur de recherche, je m’intéresse en particulier à la manière dont les collectifs en ligne se constituent et comment ils créent, transfèrent et actualisent les savoirs pour organiser une “intelligence collective”.
Freddy Limpens Ingénieur UTC, avec une spécialisation en sciences de l’information et arts numérique, Freddy a réalisé sa thèse en ingénierie sémantique sous la direction de Fabien Gandon (Wimmics-Inria). Après 10 ans d'expérience dans la recherche, la conception, et le développement de solutions collaboratives, systèmes à base de connaissances, et applications e-learning, il intègre Mnemotix pour s’occuper de la branche consulting.
Noé Gasparini Il conçoit et coordonne le développement du Dictionnaire des francophones au sein de l’Institut International pour la Francophonie. Sa formation en linguistique l’a amené à réaliser un projet de documentation d’une langue d’Amazonie. Il s’est ensuite intéressé au Wiktionnaire francophone, explorant les enjeux lexicographiques et organisant diverses actions de médiation et de valorisation.