Les registres de la Comédie-Française sur le Web de données liées : de l'hétérogénéité aux données RDF quantitatives

Intervenant⋅e⋅s

Résumé

Depuis que le théâtre de la Comédie-Française existe, c'est-à-dire depuis 1680, des registres sont produits par la troupe : ils recensent, entre autres, les dépenses, les recettes et les feux (la distribution) des différentes représentations. Parce qu'ils permettent de se rendre compte du quotidien de la troupe, ces documents sont très précieux pour mieux comprendre l'organisation de la vie théâtrale parisienne depuis le XVIIe siècle : ils constituent un apport notable à l'histoire du spectacle vivant. Néanmoins, il n'était jusqu'à présent pas possible de proposer une analyse quantitative de ces données, dans la mesure où ces registres n'étaient disponibles que dans un format papier, celui de l'archive telle qu'elle est conservée à la Bilbiothèque-Musée de la Comédie-Française. C'est donc pour diffuser une source précieuse mais méconnue et difficile d'accès que le projet RCF (Registres de la Comédie-Française) est né : numériser ces registres, les transcrire dans des bases de données et promouvoir ces données pour en faciliter l'exploitation sont les objectifs que s'est fixée l'équipe de RCF. Dans ce cadre, nous souhaitons présenter le travail qui a été fait spécifiquement sur la base de données des dépenses. Il s'agira de rendre compte de la complexité du travail de transcription que nous avons dû réaliser sur cette base, car les données à transcrire se sont révélées particulièrement hétérogènes et, à certains égards, discontinues. Nous verrons en quoi transcrire des données hétérogènes comporte une part de subjectivité que les technologies du Web Sémantiques permettent, en partie, de pallier. Nous verrons ensuite comment nous avons tiré parti de ces technologies pour fusionner cette base de données de transcription des dépenses, nouvellement créée, avec deux bases qui ont été générées il y a quelques années, celle des recettes et celle des feux. Enfin, nous montrerons comment nous avons exploité les technologies du Web Sémantique pour promouvoir la réutilisation de ces données et contribuer, de ce fait, au Web de données liées dans le champ des humanités numériques. Nous concluerons sur l'intérêt que présente, en complément d'une approche quantitative, une approche qualitative des données provenant de l'expertise de spécialistes.

Références :

  • https://cfregisters.org/ = site du projet
  • https://flipbooks.cfregisters.org/ = les registres transcrits
  • https://rcf-sparql.demo.logilab.fr/ = entreprôt SPARQL contenant les donnée
  • https://upnd.pages.logilab.fr/rcf-ui-expense/ = application de visualisation des données des dépenses
  • https://forge.extranet.logilab.fr/UPND/rcf-expense = entrepôt contenant le code de l'application de transcription des données des dépenses
  • https://forge.extranet.logilab.fr/upnd/rcf-ui-expense = entrepôt contenant le code de l'application de visualisation des données des dépenses

Auteurs/Autrices

  • Charline Granger - Charline est docteure en études théâtrales de l'Université Paris Nanterre et actuellement attachée temporaire de recherche et d'enseignement à l'Ecole Normale Supérieure de Lyon. Ses travaux portent sur l'histoire du théâtre et de sa réception, ainsi que sur le rapport entre archives et humanités numériques.

  • Fabien Amarger - Fabien est un docteur ingénieur en informatique, spécialiste des technologies du Web Sémantique. Travaillant à Logilab depuis maintenant 4 ans, il est particulièrement investi dans les sujets qui concernent la recherche, notamment en Web Sémantique.

Enregistrement

Fichiers joints

downloadTélécharger