Skip to Main content Skip to Navigation
Conference papers

Détection de séquences atypiques basée sur un modèle de Markov d'ordre variable

Cécile Low-Kam 1 Anne Laurent 2 Maguelonne Teisseire 2 
2 TATOO - Fouille de données environnementales
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
Résumé : Récemment, le nombre et le volume des bases de données séquentielles biologiques ont augmenté de manière considérable. Dans ce contexte, l'identification des anomalies est essentielle. La plupart des approches pour les extraire se fondent sur une base d'apprentissage ne contenant pas d'outlier. Or, dans de très nombreuses applications, les experts ne disposent pas d'une telle base. De plus, les méthodes existantes demeurent exigeantes en mémoire, ce qui les rend souvent impossibles à utiliser. Nous présentons dans cet article une nouvelle approche, basée sur un modèle de Markov d'ordre variable et sur une mesure de similarité entre objets séquentiels. Nous ajoutons aux méthodes existantes un critère d'élagage pour contrôler la taille de l'espace de recherche et sa qualité, ainsi qu'une inégalité de concentration précise pour la mesure de similarité, conduisant à une meilleure détection des outliers. Nous démontrons expérimentalement la validité de notre approche.
Document type :
Conference papers
Complete list of metadata

Cited literature [14 references]  Display  Hide  Download

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00363993
Contributor : Cécile Low-Kam Connect in order to contact the contributor
Submitted on : Friday, September 20, 2019 - 4:30:55 PM
Last modification on : Friday, August 12, 2022 - 3:50:29 AM
Long-term archiving on: : Sunday, February 9, 2020 - 2:42:03 AM

File

1000766.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : lirmm-00363993, version 1

Citation

Cécile Low-Kam, Anne Laurent, Maguelonne Teisseire. Détection de séquences atypiques basée sur un modèle de Markov d'ordre variable. EGC: Extraction et Gestion des Connaissances, Jan 2009, Strasbourg, France. pp.217-228. ⟨lirmm-00363993⟩

Share

Metrics

Record views

115

Files downloads

30