SPoID : Extraction de motifs séquentiels pour les bases de données incomplètes

Résumé : Les bases de données issues du monde réel contiennent souvent de nombreuses informations non renseignées. Durant le processus d'extraction de connaissances dans les bases de données, une phase de traitement spécifique de ces données est souvent nécessaire, permettant de les supprimer ou de les compléter. Lors de l'extraction de séquences fréquentes, ces données incomplètes sont la plupart du temps occultées. Ceci conduit parfois à l'élimination de plus de la moitié de la base et l'information extraite n'est plus représentative. Nous proposons donc de ne plus éliminer les enregistrements incomplets, mais d'utiliser l'information partielle qu'ils contiennent. Laméthode proposée ignore en fait temporairement certaines données incomplètes pour les séquences recherchées. Les expérimentations sur jeux de données synthétiques montrent la validité de notre proposition aussi bien en terme de qualité des motifs extraits que de robustesse aux valeurs manquantes.
Complete list of metadatas

Cited literature [17 references]  Display  Hide  Download

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00128965
Contributor : Celine Fiot <>
Submitted on : Monday, September 23, 2019 - 3:54:13 PM
Last modification on : Monday, September 23, 2019 - 5:44:13 PM

File

1001460.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : lirmm-00128965, version 1

Collections

Citation

Céline Fiot, Anne Laurent, Maguelonne Teisseire. SPoID : Extraction de motifs séquentiels pour les bases de données incomplètes. EGC: Extraction et Gestion des Connaissances, Jan 2007, Namur, Belgique. pp.715-726. ⟨lirmm-00128965⟩

Share

Metrics

Record views

165

Files downloads

4