Motifs séquentiels et approximation des valeurs manquantes

Céline Fiot

Communication Dans Un Congrès Année : 2007

Motifs séquentiels et approximation des valeurs manquantes

(1)

Céline Fiot

Fonction : Auteur
PersonId : 835134

Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier

Résumé

Les bases de données issues du monde réel contiennent souvent de nombreuses informations non renseignées. Durant le processus d'extraction de connaissances dans les bases de données, une phase de traitement spécifique de ces données est souvent nécessaire, permettant de les supprimer ou de les compléter. Plus particulièrement lors de l'extraction de séquences fréquentes, ces données incomplètes sont la plupart du temps supprimées. Ceci conduit parfois à l'élimination de plus de la moitié de la base et l'information extraite n'est plus représentative. Nous proposons donc d'estimer la présence d'un item dans une transaction incomplète en modélisant celle-ci par une distribution de valeurs. Le degré d'appartenance indique alors pour chaque item à quel point il peut appartenir à la transaction. On tient ensuite compte de l'estimation par distribution lors du calcul de la fréquence d'apparition de chaque séquence. Pour cela, nous avons conçu un algorithme qui a été implémenté. Nous présentons ici les résultats de nos expérimentations.

Mots clés

Motifs séquentiels approximation valeurs manquantes base de données incomplètes fouille de données

Domaines

Base de données [cs.DB]

Celine Fiot : Connectez-vous pour contacter le contributeur

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00160527

Soumis le : vendredi 6 juillet 2007-11:17:40

Dernière modification le : vendredi 24 mars 2023-14:52:49

Dates et versions

lirmm-00160527 , version 1 (06-07-2007)

Identifiants

HAL Id : lirmm-00160527 , version 1

Citer

Céline Fiot. Motifs séquentiels et approximation des valeurs manquantes. Inforsid'07 : XXVème Congrès Informatique des organisations et systèmes d'information et de décision, May 2007, Perros-Guirec, France, pp.193-208. ⟨lirmm-00160527⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS LIRMM MIPS UNIV-MONTPELLIER

77 Consultations

0 Téléchargements

Motifs séquentiels et approximation des valeurs manquantes

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager