Motifs Séquentiels Multidimensionnels Etoilés

Résumé : L'extraction de motifs séquentiels est un do-maine de la fouille de données permettant de rechercher des corrélations fréquentes entre des valeurs en prenant en compte leur chronolo-gie d'apparition. Dans le contexte du panier de la ménagère, ce type de méthodes per-met par exemple l'extraction de r` egles de la forme (T V, DV D)(magneto numerique), indi-quant qu'un nombre suffisamment important (au sens du support) de clients ont acheté d'abord un téléviseur et un lecteur DVD puis un magnétoscope numérique. Si de nombreux travaux permettent l'ex-traction de tels motifs, il n'en reste pas moins que ces motifs sont parfois très pauvres par rapport aux bases de données qu'ils décrivent. En effet, il n'existe pasàpas`pasà l'heure actuelle de méthode permettant de mettre en exergue des corrélations entre valeurs de différents attributs, par exemple pour découvrir des r` egles de la forme {(surf, N Y), (housse, N Y)}, {(combi, SF)}} indi-quant qu'un nombre important de personnes ont acheté leur planche de surf et la houssè a New York avant de se rendrè a San Francisco o` u ils ont acheté une combinaison. Si la littérature re-cense des contributions liées aux motifs séquentiels multidimensionnels proposées par l'´ equipe de Jia-wei Han, celles-ci ne permettent pas de combi-ner plusieurs attributs au sein des motifs extraits. Dans cet article, nous montrons donc les limites des approches existantes et proposons une approche compì ete d'extraction de motifs multidimensionnels multi-attributs. Nous définissons les concepts as-sociéssociés`sociésà ces motifs et décrivons les algorithmes per-mettant leur extraction. Ces algorithmes sont va-lidés par des expérimentations montrant l'intérêt de notre approche.
Document type :
Conference papers
Complete list of metadatas

Cited literature [8 references]  Display  Hide  Download

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00106086
Contributor : Christine Carvalho de Matos <>
Submitted on : Wednesday, November 21, 2018 - 2:54:59 PM
Last modification on : Tuesday, February 26, 2019 - 4:15:56 PM
Long-term archiving on : Friday, February 22, 2019 - 2:37:36 PM

File

b6635a8e7ac5b2956438bd3710e10e...
Files produced by the author(s)

Identifiers

  • HAL Id : lirmm-00106086, version 1

Citation

Marc Plantevit, Yeow Wei Choong, Anne Laurent, Dominique Laurent, Maguelonne Teisseire. Motifs Séquentiels Multidimensionnels Etoilés. BDA: Bases de Données Avancées, Oct 2005, Saint-Malo, France. ⟨lirmm-00106086⟩

Share

Metrics

Record views

126

Files downloads

17