Détection de séquences atypiques basée sur un modèle de Markov d'ordre variable

Résumé : Récemment, le nombre et le volume des bases de données séquentielles biologiques ont augmenté de manière considérable. Dans ce contexte, l'identification des anomalies est essentielle. La plupart des approches pour les extraire se fondent sur une base d'apprentissage ne contenant pas d'outlier. Or, dans de très nombreuses applications, les experts ne disposent pas d'une telle base. De plus, les méthodes existantes demeurent exigeantes en mémoire, ce qui les rend souvent impossibles à utiliser. Nous présentons dans cet article une nouvelle approche, basée sur un modèle de Markov d'ordre variable et sur une mesure de similarité entre objets séquentiels. Nous ajoutons aux méthodes existantes un critère d'élagage pour contrôler la taille de l'espace de recherche et sa qualité, ainsi qu'une inégalité de concentration précise pour la mesure de similarité, conduisant à une meilleure détection des outliers. Nous démontrons expérimentalement la validité de notre approche.
Document type :
Conference papers
Complete list of metadatas

Cited literature [14 references]  Display  Hide  Download

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00363993
Contributor : Cécile Low-Kam <>
Submitted on : Friday, September 20, 2019 - 4:30:55 PM
Last modification on : Monday, September 23, 2019 - 6:18:23 PM

File

1000766.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : lirmm-00363993, version 1

Citation

Cécile Low-Kam, Anne Laurent, Maguelonne Teisseire. Détection de séquences atypiques basée sur un modèle de Markov d'ordre variable. EGC: Extraction et Gestion des Connaissances, Jan 2009, Strasbourg, France. pp.217-228. ⟨lirmm-00363993⟩

Share

Metrics

Record views

166

Files downloads

3