Adéquation des Modèles de Représentation aux Méthodes de Catégorisation - LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier Accéder directement au contenu
Article Dans Une Revue Revue des Nouvelles Technologies de l'Information Année : 2005

Adéquation des Modèles de Représentation aux Méthodes de Catégorisation

Simon Jaillet
  • Fonction : Auteur
Gérard Dray

Résumé

Cet article s’interesse à la problématique de la catégorisation de documents et plus particulièrement à l’impact de la méthode de représentation des documents dans le processus de catégorisation. A partir de différents jeux de documents représentés dans un espace vectoriel tout d’abord basé sur les concepts puis basé sur une approche de type TF-IDF, nous évaluons les méthodes de catégorisation SVM et Rocchio. Nous comparons ensuite les deux méthodes précédentes avec une méthode de clustering flou. Nous dressons ensuite le bilan des différentes représentations des textes en terme de qualité des résultats de classification.
Fichier non déposé

Dates et versions

lirmm-00105358 , version 1 (11-10-2006)

Identifiants

  • HAL Id : lirmm-00105358 , version 1

Citer

Simon Jaillet, Maguelonne Teisseire, Gérard Dray. Adéquation des Modèles de Représentation aux Méthodes de Catégorisation. Revue des Nouvelles Technologies de l'Information, 2005, FDC'2005: Fouille de Données Complexes, RNTI-E-4, pp.191-210. ⟨lirmm-00105358⟩
67 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More