Motifs Séquentiels Multidimensionnels Etoilés - LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier Access content directly
Conference Papers Year : 2005

Motifs Séquentiels Multidimensionnels Etoilés

Marc Plantevit
Yeow Wei Choong
  • Function : Author
  • PersonId : 838141
Anne Laurent

Abstract

L'extraction de motifs séquentiels est un do-maine de la fouille de données permettant de rechercher des corrélations fréquentes entre des valeurs en prenant en compte leur chronolo-gie d'apparition. Dans le contexte du panier de la ménagère, ce type de méthodes per-met par exemple l'extraction de r` egles de la forme (T V, DV D)(magneto numerique), indi-quant qu'un nombre suffisamment important (au sens du support) de clients ont acheté d'abord un téléviseur et un lecteur DVD puis un magnétoscope numérique. Si de nombreux travaux permettent l'ex-traction de tels motifs, il n'en reste pas moins que ces motifs sont parfois très pauvres par rapport aux bases de données qu'ils décrivent. En effet, il n'existe pasàpas`pasà l'heure actuelle de méthode permettant de mettre en exergue des corrélations entre valeurs de différents attributs, par exemple pour découvrir des r` egles de la forme {(surf, N Y), (housse, N Y)}, {(combi, SF)}} indi-quant qu'un nombre important de personnes ont acheté leur planche de surf et la houssè a New York avant de se rendrè a San Francisco o` u ils ont acheté une combinaison. Si la littérature re-cense des contributions liées aux motifs séquentiels multidimensionnels proposées par l'´ equipe de Jia-wei Han, celles-ci ne permettent pas de combi-ner plusieurs attributs au sein des motifs extraits. Dans cet article, nous montrons donc les limites des approches existantes et proposons une approche compì ete d'extraction de motifs multidimensionnels multi-attributs. Nous définissons les concepts as-sociéssociés`sociésà ces motifs et décrivons les algorithmes per-mettant leur extraction. Ces algorithmes sont va-lidés par des expérimentations montrant l'intérêt de notre approche.
Fichier principal
Vignette du fichier
b6635a8e7ac5b2956438bd3710e10e8fd528.pdf (268.59 Ko) Télécharger le fichier
Origin : Files produced by the author(s)
Loading...

Dates and versions

lirmm-00106086 , version 1 (21-11-2018)

Identifiers

  • HAL Id : lirmm-00106086 , version 1

Cite

Marc Plantevit, Yeow Wei Choong, Anne Laurent, Dominique Laurent, Maguelonne Teisseire. Motifs Séquentiels Multidimensionnels Etoilés. BDA: Bases de Données Avancées, Oct 2005, Saint-Malo, France. ⟨lirmm-00106086⟩
110 View
59 Download

Share

Gmail Facebook X LinkedIn More