Motifs séquentiels et approximation des valeurs manquantes - LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier Accéder directement au contenu
Communication Dans Un Congrès Année : 2007

Motifs séquentiels et approximation des valeurs manquantes

Résumé

Les bases de données issues du monde réel contiennent souvent de nombreuses informations non renseignées. Durant le processus d'extraction de connaissances dans les bases de données, une phase de traitement spécifique de ces données est souvent nécessaire, permettant de les supprimer ou de les compléter. Plus particulièrement lors de l'extraction de séquences fréquentes, ces données incomplètes sont la plupart du temps supprimées. Ceci conduit parfois à l'élimination de plus de la moitié de la base et l'information extraite n'est plus représentative. Nous proposons donc d'estimer la présence d'un item dans une transaction incomplète en modélisant celle-ci par une distribution de valeurs. Le degré d'appartenance indique alors pour chaque item à quel point il peut appartenir à la transaction. On tient ensuite compte de l'estimation par distribution lors du calcul de la fréquence d'apparition de chaque séquence. Pour cela, nous avons conçu un algorithme qui a été implémenté. Nous présentons ici les résultats de nos expérimentations.
Fichier non déposé

Dates et versions

lirmm-00160527 , version 1 (06-07-2007)

Identifiants

  • HAL Id : lirmm-00160527 , version 1

Citer

Céline Fiot. Motifs séquentiels et approximation des valeurs manquantes. Inforsid'07 : XXVème Congrès Informatique des organisations et systèmes d'information et de décision, May 2007, Perros-Guirec, France, pp.193-208. ⟨lirmm-00160527⟩
77 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More