Des séquences aux tendances
Résumé
Temporal data can be handled by different techniques for discovering specific knowl- edge. Sequential pattern mining allows discovering frequent sequences embedded in temporally annotated records. In the access data of a Web site, one may, for instance, discover that “5% of the users request the page register.php and then request the page help.html”. However, se- quential patterns do not allow extracting temporal tendencies. By means of temporal tendency mining, one may discover in the same access data that “An increasing number of requests to registration.php during a short period preceeds an increasing number of requests to faq.html, after a very short period”. In this paper, we define evolution patterns that allow discovering such knowledge. We define evolution patterns and introduce our algorithms TED and EVA.
Les données temporelles peuvent être traitées de nombreuses façons afin d'en extraire des connaissances. La découverte de motifs séquentiels met en évidence des sous-séquences fréquentes contenues dans des séquences d'enregistrements annotés temporellement. L'analyse des accès à un site web permet par exemple de découvrir que "5% des utilisateurs accèdent à la page register.php puis à la page help.html". Cependant, les motifs séquentiels ne permettent pas d'extraire des tendances temporelles, du type "une augmentation du nombre de requêtes au formulaire d'inscription précède souvent une augmentation des requêtes à la page d'aide quelques secondes plus tard". Dans cet article, nous proposons d'extraire des motifs caractérisant ces évolutions fréquentes grâce à deux algorithmes, TED et EVA. Nous présentons notre approche, implémentée et testée sur des données réelles.
Origine | Fichiers produits par l'(les) auteur(s) |
---|
Loading...