S²MP : Une mesure de similarité pour les motifs séquentiels - LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier
Conference Papers Year : 2009

S²MP : Une mesure de similarité pour les motifs séquentiels

Abstract

Dans le domaine de l'extraction de connaissances, comparer la similarité des objets est une tâche essentielle, par exemple pour identifier des régularités ou pour construire des classes d'objets homogènes. Ce problème est très important pour les données séquentielles présentes dans divers domaines d'application (e.g. séries d'achats de clients, navigations d'internautes). Il existe des mesures de similarité comme Edit distance et LCS adaptées aux séquences simples. Cependant elles ne sont pas pertinentes dans le cas des séquences complexes composées de séries d'ensembles, comme les motifs séquentiels. Dans cet article, nous proposons une nouvelle mesure de similarité (S2 MP - Similarity Measure for Sequential Patterns) prenant en compte les caractéristiques des motifs séquentiels. S2 MP est une mesure paramétrable en fonction de l'importance accordée à chaque caractéristique des motifs séquentiels selon le contexte d'application, ce qui n'est pas le cas des mesures existantes. La qualité sémantique de notre mesure ainsi que son efficacité a été validée grâce à des expérimentations sur différents jeux de données. Les expérimentations montrent que les clusters obtenus en utilisant S2MP sont plus homogènes, plus précis et plus complets que ceux obtenus avec Edit distance.
Fichier principal
Vignette du fichier
EvalECD09-EGC-S2MP-Saneifar.pdf (267.89 Ko) Télécharger le fichier
Origin Files produced by the author(s)
Loading...

Dates and versions

lirmm-00364929 , version 1 (27-02-2009)

Identifiers

  • HAL Id : lirmm-00364929 , version 1

Cite

Hassan Saneifar, Sandra Bringay, Anne Laurent, Maguelonne Teisseire. S²MP : Une mesure de similarité pour les motifs séquentiels. EvalECD: Évaluation des méthodes d'Extraction de Connaissances dans les Données, Jan 2009, Strasbourg, France. pp.A5-35/A5-46. ⟨lirmm-00364929⟩
139 View
292 Download

Share

More