Système de recommandation sémantique de news économiques pour la veille économique
Intervenant⋅e⋅s
Résumé
De nos jours dans les secteurs commerciaux et financiers, la veille électronique d’articles économiques est cruciale. Maintenir une veille efficace implique de cibler les articles à consulter, car la charge d’information est importante. Pour répondre à cette problématique, nous proposons un système novateur de recommandation d’articles, car il s’appuie sur l’intégration d’une description sémantique des items et des profils basés sur une modélisation ontologique des connaissances. Notre approche s’établit sur l’adéquation de la recommandation aux besoins des utilisateurs. Pour cela, nous avons mené une enquête auprès des clients-lecteurs pour définir les critères qui pourraient permettre la personnalisation du contenu de la revue. Les résultats de l’enquête ainsi que la connaissance des experts du domaine ont permis de mettre en avant les trois critères principaux suivants : les Thèmes (principaux évènements économiques traités dans l’article), les secteurs économiques dont traitent l’article, et les Localisations. Les développements réalisés dans le cadre de ce projet se composent des trois axes suivants.
Le premier axe se caractérise par le développement d’une architecture sémantique pour l’annotation, l’indexation de documents, le profilage des clients, et finalement la recommandation de revues économiques.
Le deuxième axe résident dans l’ontologie de domaine réalisée en coopération avec les documentalistes de la société Actualis. Cette ontologie constitue la connaissance métier permettant l’annotation et l’indexation des articles économiques.
Le dernier axe se compose du moteur de recommandation exploitant la connaissance métier afin de calculer une similarité asymétrique entre chaque article économique indexé et chaque profil utilisateur. Suites au retour d’expériences fournies par le prototype développé l’année précédente, nous avons pu mettre en production un outil fonctionnel commercialisé depuis début février. Les technologies employées dans l’architecture technique de la solution en production se composent de triplestores pour stocker les connaissances, les documents, les profils, et interaction utilisateurs, etc. Le modèle de données sémantiques se traduit par l’usage des langages RDF et OWL-DL. Les contraintes logiques de ce second sont exploitées à son maximum dans le processus de classification hiérarchique multiétiquette et automatique des documents dans un modèle prédictif ontologique.