Détection de séquences atypiques basée sur un modèle de Markov d'ordre variable

Cécile Low-Kam 1 Anne Laurent 2 Maguelonne Teisseire 2
2 TATOO - Fouille de données environnementales
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
Résumé : Récemment, le nombre et le volume des bases de données séquentielles biologiques ont augmenté de manière considérable. Dans ce contexte, l'identification des anomalies est essentielle. La plupart des approches pour les extraire se fondent sur une base d'apprentissage ne contenant pas d'outlier. Or, dans de très nombreuses applications, les experts ne disposent pas d'une telle base. De plus, les méthodes existantes demeurent exigeantes en mémoire, ce qui les rend souvent impossibles à utiliser. Nous présentons dans cet article une nouvelle approche, basée sur un modèle de Markov d'ordre variable et sur une mesure de similarité entre objets séquentiels. Nous ajoutons aux méthodes existantes un critère d'élagage pour contrôler la taille de l'espace de recherche et sa qualité, ainsi qu'une inégalité de concentration précise pour la mesure de similarité, conduisant à une meilleure détection des outliers. Nous démontrons expérimentalement la validité de notre approche.
Type de document :
Communication dans un congrès
EGC'09 : Extraction et Gestion de Connaissances, Jan 2009, pp.12, 2009, 〈https://lsiit.u-strasbg.fr/egc09/index.php/Accueil〉
Liste complète des métadonnées

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00363993
Contributeur : Cécile Low-Kam <>
Soumis le : mercredi 25 février 2009 - 08:42:30
Dernière modification le : jeudi 11 janvier 2018 - 06:26:17

Identifiants

  • HAL Id : lirmm-00363993, version 1

Citation

Cécile Low-Kam, Anne Laurent, Maguelonne Teisseire. Détection de séquences atypiques basée sur un modèle de Markov d'ordre variable. EGC'09 : Extraction et Gestion de Connaissances, Jan 2009, pp.12, 2009, 〈https://lsiit.u-strasbg.fr/egc09/index.php/Accueil〉. 〈lirmm-00363993〉

Partager

Métriques

Consultations de la notice

92