Adéquation des Modèles de Représentation aux Méthodes de Catégorisation

Simon Jaillet Maguelonne Teisseire 1 Gérard Dray
1 TATOO - Fouille de données environnementales
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
Abstract : Cet article s’interesse à la problématique de la catégorisation de documents et plus particulièrement à l’impact de la méthode de représentation des documents dans le processus de catégorisation. A partir de différents jeux de documents représentés dans un espace vectoriel tout d’abord basé sur les concepts puis basé sur une approche de type TF-IDF, nous évaluons les méthodes de catégorisation SVM et Rocchio. Nous comparons ensuite les deux méthodes précédentes avec une méthode de clustering flou. Nous dressons ensuite le bilan des différentes représentations des textes en terme de qualité des résultats de classification.
Type de document :
Article dans une revue
Revue des Nouvelles Technologies de l'Information, Hermann, 2005, FDC'2005: Fouille de Données Complexes, RNTI-E-4, pp.191-210
Liste complète des métadonnées

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00105358
Contributeur : Christine Carvalho de Matos <>
Soumis le : mercredi 11 octobre 2006 - 07:51:31
Dernière modification le : jeudi 24 mai 2018 - 15:59:22

Identifiants

  • HAL Id : lirmm-00105358, version 1

Collections

Citation

Simon Jaillet, Maguelonne Teisseire, Gérard Dray. Adéquation des Modèles de Représentation aux Méthodes de Catégorisation. Revue des Nouvelles Technologies de l'Information, Hermann, 2005, FDC'2005: Fouille de Données Complexes, RNTI-E-4, pp.191-210. 〈lirmm-00105358〉

Partager

Métriques

Consultations de la notice

84