SPoID : Extraction de motifs séquentiels pour les bases de données incomplètes - LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier
Journal Articles Revue des Nouvelles Technologies de l'Information Year : 2007

SPoID : Extraction de motifs séquentiels pour les bases de données incomplètes

Abstract

Les bases de données issues du monde réel contiennent souvent de nombreuses informations non renseignées. Durant le processus d'extraction de connaissances dans les bases de données, une phase de traitement spécifique de ces données est souvent nécessaire, permettant de les supprimer ou de les compléter. Lors de l'extraction de séquences fréquentes, ces données incomplètes sont la plupart du temps occultées. Ceci conduit parfois à l'élimination de plus de la moitié de la base et l'information extraite n'est plus représentative. Nous proposons donc de ne plus éliminer les enregistrements incomplets, mais d'utiliser l'information partielle qu'ils contiennent. Laméthode proposée ignore en fait temporairement certaines données incomplètes pour les séquences recherchées. Les expérimentations sur jeux de données synthétiques montrent la validité de notre proposition aussi bien en terme de qualité des motifs extraits que de robustesse aux valeurs manquantes.
Fichier principal
Vignette du fichier
1001460.pdf (119.58 Ko) Télécharger le fichier
Origin Files produced by the author(s)
Loading...

Dates and versions

lirmm-00128965 , version 1 (23-09-2019)

Identifiers

  • HAL Id : lirmm-00128965 , version 1

Cite

Céline Fiot, Anne Laurent, Maguelonne Teisseire. SPoID : Extraction de motifs séquentiels pour les bases de données incomplètes. Revue des Nouvelles Technologies de l'Information, 2007, Extraction et gestion des connaissances (EGC'2007), Actes des cinquièmes journées Extraction et Gestion des Connaissances, Namur, Belgique, 23-26 janvier 2007, 2 Volumes, RNTI-E-9, pp.715-726. ⟨lirmm-00128965⟩
174 View
44 Download

Share

More