S²MP : Une mesure de similarité pour les motifs séquentiels

Résumé : Dans le domaine de l'extraction de connaissances, comparer la similarité des objets est une tâche essentielle, par exemple pour identifier des régularités ou pour construire des classes d'objets homogènes. Ce problème est très important pour les données séquentielles présentes dans divers domaines d'application (e.g. séries d'achats de clients, navigations d'internautes). Il existe des mesures de similarité comme Edit distance et LCS adaptées aux séquences simples. Cependant elles ne sont pas pertinentes dans le cas des séquences complexes composées de séries d'ensembles, comme les motifs séquentiels. Dans cet article, nous proposons une nouvelle mesure de similarité (S2 MP - Similarity Measure for Sequential Patterns) prenant en compte les caractéristiques des motifs séquentiels. S2 MP est une mesure paramétrable en fonction de l'importance accordée à chaque caractéristique des motifs séquentiels selon le contexte d'application, ce qui n'est pas le cas des mesures existantes. La qualité sémantique de notre mesure ainsi que son efficacité a été validée grâce à des expérimentations sur différents jeux de données. Les expérimentations montrent que les clusters obtenus en utilisant S2MP sont plus homogènes, plus précis et plus complets que ceux obtenus avec Edit distance.
Type de document :
Communication dans un congrès
EvalECD: Évaluation des méthodes d'Extraction de Connaissances dans les Données, Jan 2009, Strasbourg, France. pp.A5-35/A5-46, 2009, 〈http://www.lirmm.fr/~bechet/EvalECD/〉
Liste complète des métadonnées

Littérature citée [17 références]  Voir  Masquer  Télécharger

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00364929
Contributeur : Hassan Saneifar <>
Soumis le : vendredi 27 février 2009 - 16:58:30
Dernière modification le : jeudi 24 mai 2018 - 15:59:23
Document(s) archivé(s) le : vendredi 12 octobre 2012 - 12:40:31

Fichier

EvalECD09-EGC-S2MP-Saneifar.pd...
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : lirmm-00364929, version 1

Collections

Citation

Hassan Saneifar, Sandra Bringay, Anne Laurent, Maguelonne Teisseire. S²MP : Une mesure de similarité pour les motifs séquentiels. EvalECD: Évaluation des méthodes d'Extraction de Connaissances dans les Données, Jan 2009, Strasbourg, France. pp.A5-35/A5-46, 2009, 〈http://www.lirmm.fr/~bechet/EvalECD/〉. 〈lirmm-00364929〉

Partager

Métriques

Consultations de la notice

200

Téléchargements de fichiers

222