SPoID : Extraction de motifs séquentiels pour les bases de données incomplètes

Résumé : Les bases de données issues du monde réel contiennent souvent de nombreuses informations non renseignées. Durant le processus d'extraction de connaissances dans les bases de données, une phase de traitement spécifique de ces données est souvent nécessaire, permettant de les supprimer ou de les compléter. Lors de l'extraction de séquences fréquentes, ces données incomplètes sont la plupart du temps occultées. Ceci conduit parfois à l'élimination de plus de la moitié de la base et l'information extraite n'est plus représentative. Nous proposons donc de ne plus éliminer les enregistrements incomplets, mais d'utiliser l'information partielle qu'ils contiennent. Laméthode proposée ignore en fait temporairement certaines données incomplètes pour les séquences recherchées. Les expérimentations sur jeux de données synthétiques montrent la validité de notre proposition aussi bien en terme de qualité des motifs extraits que de robustesse aux valeurs manquantes.
Type de document :
Communication dans un congrès
RNTI. Extraction et Gestion des Connaissances, Jan 2007, Namur, Belgique, Cepadues, 2 (9), pp.715-726, 2007, E
Liste complète des métadonnées

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00128965
Contributeur : Celine Fiot <>
Soumis le : lundi 5 février 2007 - 11:14:45
Dernière modification le : vendredi 19 octobre 2018 - 01:14:12

Identifiants

  • HAL Id : lirmm-00128965, version 1

Collections

Citation

Céline Fiot, Anne Laurent, Maguelonne Teisseire. SPoID : Extraction de motifs séquentiels pour les bases de données incomplètes. RNTI. Extraction et Gestion des Connaissances, Jan 2007, Namur, Belgique, Cepadues, 2 (9), pp.715-726, 2007, E. 〈lirmm-00128965〉

Partager

Métriques

Consultations de la notice

136