FrenchSentiClass : un Système Automatisé pour la Classification de Sentiments en Français

Résumé : Ce papier décrit le système FrenchSentiClass que nous avons utilisé pour les tâches du défi de fouilles de texte (DEFT 2017). Cette treizième édition du défi a porté sur l'analyse de l'opinion et du langage figuratif dans des tweets rédigés en Français. Le défi propose trois tâches : (i) la première concerne la classification des tweets non figuratifs selon leur polarité ; (ii) la deuxième concerne l'identification du langage figuratif et (iii) la troisième concerne la classification des tweets figuratifs et non figuratifs selon leur polarité. Nous avons proposé un système automatisé basé sur les Machines à Vecteurs de Support (SVM). Le système choisit automatiquement à chaque niveau les meilleurs prétraitements, descripteurs syntaxiques et lexiques de sentiments en validation croisée sur l'ensemble d'apprentissage. Il effectue aussi une évaluation de l'apport de la sélection d'attributs et un tuning du paramètre de complexité du modèle SVM. Par conséquent, ce système permet de réduire considérablement le temps d'exploration des données et du choix de la meilleur représentation de descripteurs.
Type de document :
Communication dans un congrès
TALN 2017, Jun 2017, Orléans, France. Actes de l’atelier DEFT de la conférence TALN 2017
Liste complète des métadonnées

Littérature citée [31 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01583567
Contributeur : Mike Donald Tapi Nzali <>
Soumis le : jeudi 7 septembre 2017 - 15:35:40
Dernière modification le : jeudi 26 octobre 2017 - 13:44:16

Fichier

deft2017-frenchsenticlass Equi...
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01583567, version 1

Citation

Mike Donald Tapi Nzali, Amine Abdaoui, Jérôme Azé, Sandra Bringay, Christian Lavergne, et al.. FrenchSentiClass : un Système Automatisé pour la Classification de Sentiments en Français. TALN 2017, Jun 2017, Orléans, France. Actes de l’atelier DEFT de la conférence TALN 2017. 〈hal-01583567〉

Partager

Métriques

Consultations de la notice

35

Téléchargements de fichiers

20