Motifs séquentiels et approximation des valeurs manquantes

Résumé : Les bases de données issues du monde réel contiennent souvent de nombreuses informations non renseignées. Durant le processus d'extraction de connaissances dans les bases de données, une phase de traitement spécifique de ces données est souvent nécessaire, permettant de les supprimer ou de les compléter. Plus particulièrement lors de l'extraction de séquences fréquentes, ces données incomplètes sont la plupart du temps supprimées. Ceci conduit parfois à l'élimination de plus de la moitié de la base et l'information extraite n'est plus représentative. Nous proposons donc d'estimer la présence d'un item dans une transaction incomplète en modélisant celle-ci par une distribution de valeurs. Le degré d'appartenance indique alors pour chaque item à quel point il peut appartenir à la transaction. On tient ensuite compte de l'estimation par distribution lors du calcul de la fréquence d'apparition de chaque séquence. Pour cela, nous avons conçu un algorithme qui a été implémenté. Nous présentons ici les résultats de nos expérimentations.
Type de document :
Communication dans un congrès
Inforsid'07 : XXVème Congrès Informatique des organisations et systèmes d'information et de décision, May 2007, Perros-Guirec, France, pp.193-208, 2007
Liste complète des métadonnées

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00160527
Contributeur : Celine Fiot <>
Soumis le : vendredi 6 juillet 2007 - 11:17:40
Dernière modification le : jeudi 24 mai 2018 - 15:59:20

Identifiants

  • HAL Id : lirmm-00160527, version 1

Collections

Citation

Céline Fiot. Motifs séquentiels et approximation des valeurs manquantes. Inforsid'07 : XXVème Congrès Informatique des organisations et systèmes d'information et de décision, May 2007, Perros-Guirec, France, pp.193-208, 2007. 〈lirmm-00160527〉

Partager

Métriques

Consultations de la notice

92