Adéquation des Modèles de Représentation aux Méthodes de Catégorisation - LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier Access content directly
Journal Articles Revue des Nouvelles Technologies de l'Information Year : 2005

Adéquation des Modèles de Représentation aux Méthodes de Catégorisation

Simon Jaillet
  • Function : Author
Gérard Dray

Abstract

Cet article s’interesse à la problématique de la catégorisation de documents et plus particulièrement à l’impact de la méthode de représentation des documents dans le processus de catégorisation. A partir de différents jeux de documents représentés dans un espace vectoriel tout d’abord basé sur les concepts puis basé sur une approche de type TF-IDF, nous évaluons les méthodes de catégorisation SVM et Rocchio. Nous comparons ensuite les deux méthodes précédentes avec une méthode de clustering flou. Nous dressons ensuite le bilan des différentes représentations des textes en terme de qualité des résultats de classification.
No file

Dates and versions

lirmm-00105358 , version 1 (11-10-2006)

Identifiers

  • HAL Id : lirmm-00105358 , version 1

Cite

Simon Jaillet, Maguelonne Teisseire, Gérard Dray. Adéquation des Modèles de Représentation aux Méthodes de Catégorisation. Revue des Nouvelles Technologies de l'Information, 2005, FDC'2005: Fouille de Données Complexes, RNTI-E-4, pp.191-210. ⟨lirmm-00105358⟩
67 View
0 Download

Share

Gmail Facebook X LinkedIn More