Motifs Séquentiels Multidimensionnels Etoilés - LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier Access content directly
Conference Papers Year : 2005

Motifs Séquentiels Multidimensionnels Etoilés

Marc Plantevit
Yeow Wei Choong
  • Function : Author
  • PersonId : 838141
Anne Laurent

Abstract

L'extraction de motifs séquentiels est un do-maine de la fouille de données permettant de rechercher des corrélations fréquentes entre des valeurs en prenant en compte leur chronolo-gie d'apparition. Dans le contexte du panier de la ménagère, ce type de méthodes per-met par exemple l'extraction de r` egles de la forme (T V, DV D)(magneto numerique), indi-quant qu'un nombre suffisamment important (au sens du support) de clients ont acheté d'abord un téléviseur et un lecteur DVD puis un magnétoscope numérique. Si de nombreux travaux permettent l'ex-traction de tels motifs, il n'en reste pas moins que ces motifs sont parfois très pauvres par rapport aux bases de données qu'ils décrivent. En effet, il n'existe pasàpas`pasà l'heure actuelle de méthode permettant de mettre en exergue des corrélations entre valeurs de différents attributs, par exemple pour découvrir des r` egles de la forme {(surf, N Y), (housse, N Y)}, {(combi, SF)}} indi-quant qu'un nombre important de personnes ont acheté leur planche de surf et la houssè a New York avant de se rendrè a San Francisco o` u ils ont acheté une combinaison. Si la littérature re-cense des contributions liées aux motifs séquentiels multidimensionnels proposées par l'´ equipe de Jia-wei Han, celles-ci ne permettent pas de combi-ner plusieurs attributs au sein des motifs extraits. Dans cet article, nous montrons donc les limites des approches existantes et proposons une approche compì ete d'extraction de motifs multidimensionnels multi-attributs. Nous définissons les concepts as-sociéssociés`sociésà ces motifs et décrivons les algorithmes per-mettant leur extraction. Ces algorithmes sont va-lidés par des expérimentations montrant l'intérêt de notre approche.
Fichier principal
Vignette du fichier
b6635a8e7ac5b2956438bd3710e10e8fd528.pdf (268.59 Ko) Télécharger le fichier
Origin Files produced by the author(s)
Loading...

Dates and versions

lirmm-00106086 , version 1 (21-11-2018)

Identifiers

  • HAL Id : lirmm-00106086 , version 1

Cite

Marc Plantevit, Yeow Wei Choong, Anne Laurent, Dominique Laurent, Maguelonne Teisseire. Motifs Séquentiels Multidimensionnels Etoilés. BDA: Bases de Données Avancées, Oct 2005, Saint-Malo, France. ⟨lirmm-00106086⟩
110 View
59 Download

Share

Gmail Mastodon Facebook X LinkedIn More