R&D : DoXa (du grec ancien « opinion »)

DoXa est un projet du pôle de compétitivité Cap digital qui vise à mettre en place une plateforme de technologies liées au traitement automatique des sentiments et opinions dans des corpus de données multilingues (français et anglais). Il se situe dans la continuité des travaux réalisés dans le cadre du projet INFOM@GIC. Les corpus traités intègrent de grands volumes de données à la fois non-structurées - issues du web 2.0 (blogs, forums, réseaux sociaux etc.) - mais aussi des données structurées provenant de bases de données clients.

Pertimm est responsable du sous-projet portant sur la recherche d'opinions et de sentiments dans l'ensemble des données, regroupant une tâche de crawling, pré-traitement et filtrage de ces données et une tâche de couplage du moteur de recherche avec les ontologies sur les opinions et sentiments.

Doxa se structure en 8 sous-projets coordonnés par Thales et réunit 11 partenaires industriels (EDF, Arisem etc.), académiques (Lip6/CNRS, Limsi/CNRS, IGM etc.) et des PME (Pertimm, ILObjets etc.).

Programme
Fonds Unique Interministériel - AAP 6
Labellisation par Cap Digital

Financement Pertimm
DGCIS

Période
2009 - 2011