Adéquation des Modèles de Représentation aux Méthodes de Catégorisation

Simon Jaillet Maguelonne Teisseire 1 Gérard Dray
1 TATOO - Fouille de données environnementales
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
Abstract : Cet article s’interesse à la problématique de la catégorisation de documents et plus particulièrement à l’impact de la méthode de représentation des documents dans le processus de catégorisation. A partir de différents jeux de documents représentés dans un espace vectoriel tout d’abord basé sur les concepts puis basé sur une approche de type TF-IDF, nous évaluons les méthodes de catégorisation SVM et Rocchio. Nous comparons ensuite les deux méthodes précédentes avec une méthode de clustering flou. Nous dressons ensuite le bilan des différentes représentations des textes en terme de qualité des résultats de classification.
Document type :
Journal articles
Complete list of metadatas

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00105358
Contributor : Christine Carvalho de Matos <>
Submitted on : Wednesday, October 11, 2006 - 7:51:31 AM
Last modification on : Thursday, February 7, 2019 - 3:57:53 PM

Identifiers

  • HAL Id : lirmm-00105358, version 1

Collections

Citation

Simon Jaillet, Maguelonne Teisseire, Gérard Dray. Adéquation des Modèles de Représentation aux Méthodes de Catégorisation. Revue des Nouvelles Technologies de l'Information, Hermann, 2005, FDC'2005: Fouille de Données Complexes, RNTI-E-4, pp.191-210. ⟨lirmm-00105358⟩

Share

Metrics

Record views

118