Code
Le système d'annotation de polarité d'opinion
Résumé

Ce système Web d'annotation d'opinion a été créé pour l'étiquetage manuel de textes. Bien que le système a été conçu pour la tâche d'analyse de polarité d'opinion, il peut être facilement adapté à d'autres tâches, notamment celles concernant le Traitement Automatique de la Langue (Natural language processing). Cette plate-forme a été développée au Laboratoire Informatique d'Avignon (LIA) en partenariat avec:

dans le cadre du projet de l'Agence nationale de la recherche (ANR) : ImagiWeb, d'après la description de la tâche (T3) « Modèles et algorithmes pour traiter les images sur le Web ».

Architecture du système

La plate-forme est assez flexible pour l'adapter pour d'autres types d'annotation telles que la résolution d'anaphores (Anaphora resolution), la désambiguïsation textuelle (Text disambiguation), la reconnaissance d'entités nommées (Named-entity recognition), la compression de phrases (Sentence compression) et le résumé automatique (Automatic summarization). Cependant, la première version a été construite d'après les « Spécifications pour l'annotation de polarité d'opinion » (.doc) du projet ImagiWeb.

architecture à trois couches

Figure 1. Architecture de la plate-forme d'annotation de polarité d'opinion

L'architecture à trois couches (Figure 1) devrait permettre d'adapter facilement le code selon les besoins d'annotation d'autres projets. Les deux aspects les plus rentables sont la division claire du travail entre le client (le navigateur Web) et le serveur ainsi que le contrôle de la manipulation du corpus qui n'est possible que sous validation de la couche intermédiaire.

Code source

Le code source du système est disponible sous les conditions de la Licence publique générale GNU (GPL). Vous pouvez télécharger les codes sources, ainsi que le guide d'installation de la version 1.0.

Remerciements

À tous les partenaires du projet ImagiWeb, au Ministère de Sciences du Mexique Conacyt pour le financement du projet doctoral de M. Alejandro Molina (bourse 211963).