Motifs Séquentiels Multidimensionnels Etoilés

Résumé : L'extraction de motifs séquentiels est un do-maine de la fouille de données permettant de rechercher des corrélations fréquentes entre des valeurs en prenant en compte leur chronolo-gie d'apparition. Dans le contexte du panier de la ménagère, ce type de méthodes per-met par exemple l'extraction de r` egles de la forme (T V, DV D)(magneto numerique), indi-quant qu'un nombre suffisamment important (au sens du support) de clients ont acheté d'abord un téléviseur et un lecteur DVD puis un magnétoscope numérique. Si de nombreux travaux permettent l'ex-traction de tels motifs, il n'en reste pas moins que ces motifs sont parfois très pauvres par rapport aux bases de données qu'ils décrivent. En effet, il n'existe pasàpas`pasà l'heure actuelle de méthode permettant de mettre en exergue des corrélations entre valeurs de différents attributs, par exemple pour découvrir des r` egles de la forme {(surf, N Y), (housse, N Y)}, {(combi, SF)}} indi-quant qu'un nombre important de personnes ont acheté leur planche de surf et la houssè a New York avant de se rendrè a San Francisco o` u ils ont acheté une combinaison. Si la littérature re-cense des contributions liées aux motifs séquentiels multidimensionnels proposées par l'´ equipe de Jia-wei Han, celles-ci ne permettent pas de combi-ner plusieurs attributs au sein des motifs extraits. Dans cet article, nous montrons donc les limites des approches existantes et proposons une approche compì ete d'extraction de motifs multidimensionnels multi-attributs. Nous définissons les concepts as-sociéssociés`sociésà ces motifs et décrivons les algorithmes per-mettant leur extraction. Ces algorithmes sont va-lidés par des expérimentations montrant l'intérêt de notre approche.
Type de document :
Communication dans un congrès
BDA: Bases de Données Avancées, Oct 2005, Saint-Malo, France. 21èmes Journées Bases de Données Avancées, 2005
Liste complète des métadonnées

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00106086
Contributeur : Christine Carvalho de Matos <>
Soumis le : mercredi 21 novembre 2018 - 14:54:59
Dernière modification le : jeudi 22 novembre 2018 - 01:10:05

Fichier

b6635a8e7ac5b2956438bd3710e10e...
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : lirmm-00106086, version 1

Collections

Citation

Marc Plantevit, Yeow Wei Choong, Anne Laurent, Dominique Laurent, Maguelonne Teisseire. Motifs Séquentiels Multidimensionnels Etoilés. BDA: Bases de Données Avancées, Oct 2005, Saint-Malo, France. 21èmes Journées Bases de Données Avancées, 2005. 〈lirmm-00106086〉

Partager

Métriques

Consultations de la notice

88

Téléchargements de fichiers

7