Motifs séquentiels et approximation des valeurs manquantes - LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier Access content directly
Conference Papers Year : 2007

Motifs séquentiels et approximation des valeurs manquantes

Abstract

Les bases de données issues du monde réel contiennent souvent de nombreuses informations non renseignées. Durant le processus d'extraction de connaissances dans les bases de données, une phase de traitement spécifique de ces données est souvent nécessaire, permettant de les supprimer ou de les compléter. Plus particulièrement lors de l'extraction de séquences fréquentes, ces données incomplètes sont la plupart du temps supprimées. Ceci conduit parfois à l'élimination de plus de la moitié de la base et l'information extraite n'est plus représentative. Nous proposons donc d'estimer la présence d'un item dans une transaction incomplète en modélisant celle-ci par une distribution de valeurs. Le degré d'appartenance indique alors pour chaque item à quel point il peut appartenir à la transaction. On tient ensuite compte de l'estimation par distribution lors du calcul de la fréquence d'apparition de chaque séquence. Pour cela, nous avons conçu un algorithme qui a été implémenté. Nous présentons ici les résultats de nos expérimentations.
No file

Dates and versions

lirmm-00160527 , version 1 (06-07-2007)

Identifiers

  • HAL Id : lirmm-00160527 , version 1

Cite

Céline Fiot. Motifs séquentiels et approximation des valeurs manquantes. Inforsid'07 : XXVème Congrès Informatique des organisations et systèmes d'information et de décision, May 2007, Perros-Guirec, France, pp.193-208. ⟨lirmm-00160527⟩
77 View
0 Download

Share

Gmail Facebook X LinkedIn More