Skip to Main content Skip to Navigation
Conference papers

Motifs séquentiels et approximation des valeurs manquantes

Résumé : Les bases de données issues du monde réel contiennent souvent de nombreuses informations non renseignées. Durant le processus d'extraction de connaissances dans les bases de données, une phase de traitement spécifique de ces données est souvent nécessaire, permettant de les supprimer ou de les compléter. Plus particulièrement lors de l'extraction de séquences fréquentes, ces données incomplètes sont la plupart du temps supprimées. Ceci conduit parfois à l'élimination de plus de la moitié de la base et l'information extraite n'est plus représentative. Nous proposons donc d'estimer la présence d'un item dans une transaction incomplète en modélisant celle-ci par une distribution de valeurs. Le degré d'appartenance indique alors pour chaque item à quel point il peut appartenir à la transaction. On tient ensuite compte de l'estimation par distribution lors du calcul de la fréquence d'apparition de chaque séquence. Pour cela, nous avons conçu un algorithme qui a été implémenté. Nous présentons ici les résultats de nos expérimentations.
Document type :
Conference papers
Complete list of metadatas

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00160527
Contributor : Celine Fiot <>
Submitted on : Friday, July 6, 2007 - 11:17:40 AM
Last modification on : Thursday, May 24, 2018 - 3:59:20 PM

Identifiers

  • HAL Id : lirmm-00160527, version 1

Collections

Citation

Céline Fiot. Motifs séquentiels et approximation des valeurs manquantes. Inforsid'07 : XXVème Congrès Informatique des organisations et systèmes d'information et de décision, May 2007, Perros-Guirec, France, pp.193-208. ⟨lirmm-00160527⟩

Share

Metrics

Record views

124