Spams, une nouvelle approche incrémentale pour l'extraction de motifs séquentiels fréquents dans les Data streams

Lionel Vinceslas 1 Jean-Émile Symphor 1 Alban Mancheron 2 Pascal Poncelet 3
2 SEQUOIA - Sequential Learning
LIFL - Laboratoire d'Informatique Fondamentale de Lille, Inria Lille - Nord Europe
3 TATOO - Fouille de données environnementales
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
Résumé : L'extraction de motifs séquentiels fréquents dans les data streams est un enjeu important traité par la communauté des chercheurs en fouille de données. Plus encore que pour les bases de données, de nombreuses contraintes supplémentaires sont à considérer de par la nature intrinsèque des streams. Dans cet article, nous proposons un nouvel algorithme en une passe : SPAMS, basé sur la construction incrémentale, avec une granularité très fine par transaction, d'un automate appelé SPA, permettant l'extraction des motifs séquentiels dans les streams. L'information du stream est apprise à la volée, au fur et à mesure de l'insertion de nouvelles transactions, sans pré-traitement a priori. Les résultats expérimentaux obtenus montrent la pertinence de la structure utilisée ainsi que l'efficience de notre algorithme appliqué à différents jeux de données.
Type de document :
Communication dans un congrès
EGC'09 : Extraction et Gestion des Connaissances, Jan 2009, Strasbourg, France. pp.205-216, 2009, 〈https://lsiit.u-strasbg.fr/egc09/index.php/Accueil〉
Liste complète des métadonnées

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00345563
Contributeur : Pascal Poncelet <>
Soumis le : mardi 9 décembre 2008 - 12:58:43
Dernière modification le : jeudi 24 mai 2018 - 15:59:23

Identifiants

  • HAL Id : lirmm-00345563, version 1

Citation

Lionel Vinceslas, Jean-Émile Symphor, Alban Mancheron, Pascal Poncelet. Spams, une nouvelle approche incrémentale pour l'extraction de motifs séquentiels fréquents dans les Data streams. EGC'09 : Extraction et Gestion des Connaissances, Jan 2009, Strasbourg, France. pp.205-216, 2009, 〈https://lsiit.u-strasbg.fr/egc09/index.php/Accueil〉. 〈lirmm-00345563〉

Partager

Métriques

Consultations de la notice

309