Mesurer la proximité entre corpus par de nouveaux méta-descripteurs - LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier Accéder directement au contenu
Communication Dans Un Congrès Année : 2015

Mesurer la proximité entre corpus par de nouveaux méta-descripteurs

Résumé

Given the number of existing classification algorithms, finding the most appropriate for classifying a new corpus is a difficult task. Meta-classification appears today very useful to help to determine, by using past experiences, what should be the most suitable algorithm compared to our corpus. The underlying idea is that "if an algorithm was particularly suitable for a corpus, it should have the same behavior on a quite similar corpus.". In this paper, we propose new meta-descriptors based on the concept of similarity to improve the meta-classification step. Conducted experiments on real dataset show the relevance of our new meta-descriptors.
Devant le nombre d'algorithmes de classification existants, trouver l'algorithme qui sera le plus adapté pour classer un corpus de documents est une tâche difficile. La méta-classification apparaît aujourd'hui très utile pour aider à déterminer, en fonction des expé-riences passées, quel devrait être l'algorithme le plus pertinent par rapport à notre corpus. L'idée sous jacente est que "si un algorithme s'est montré particulièrement adapté pour un corpus , il devrait avoir le même comportement sur un corpus assez similaire". Dans cet article, nous proposons de nouveaux méta-descripteurs reposant sur les notions de similarités pour améliorer l'étape de méta-classification. Les expérimentations menées sur différents jeux de données réelles montrent la pertinence de nos nouveaux descripteurs.
Fichier principal
Vignette du fichier
37.pdf (230.04 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

lirmm-01184560 , version 1 (16-08-2015)

Identifiants

  • HAL Id : lirmm-01184560 , version 1

Citer

Flavien Bouillot, Pascal Poncelet, Mathieu Roche. Mesurer la proximité entre corpus par de nouveaux méta-descripteurs. CORIA: Conférence en Recherche d’Information et Applications, Mar 2015, Paris, France. pp.369-383. ⟨lirmm-01184560⟩
281 Consultations
195 Téléchargements

Partager

Gmail Facebook X LinkedIn More