Motifs sequentiels pour la completion des valeurs manquantes

Résumé : Les bases de données issues du monde réel contiennent souvent de nombreuses informations non renseignées. Durant le processus d'extraction de connaissances dans les bases de données, une phase d'élimination des données non complètement renseignées est souvent nécessaire. Lors de cette phase, les données incomplètes peuvent être supprimées ou complétées. Ces deux solutions sont lourdes de conséquences pour la connaissance qui sera ensuite extraite. En effet, la suppression peut parfois conduire à l'élimination de plus de la moitié de la base, aussi l'information extraite n'est plus représentative. La complétion introduit un biais dans les données. Certaines méthodes permettent de choisir des valeurs afin de compléter au mieux des données incomplètes, mais elles ne conduisent pas toujours à des résultats satisfaisants. Afin de gérer cette phase de complétion, nous proposons d'améliorer une méthode de complétion basée sur les règles d'association en utilisant les motifs séquentiels, qui prennent en compte la notion d'ordre pouvant exister entre les enregistrements d'une base de données.
Type de document :
Communication dans un congrès
4ème MAnifestation des Jeunes Chercheurs STIC (MajecStic'06), Nov 2006, pp.8, 2006
Liste complète des métadonnées

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00117016
Contributeur : Celine Fiot <>
Soumis le : mercredi 29 novembre 2006 - 14:56:39
Dernière modification le : jeudi 24 mai 2018 - 15:59:20

Identifiants

  • HAL Id : lirmm-00117016, version 1

Collections

Citation

Céline Fiot. Motifs sequentiels pour la completion des valeurs manquantes. 4ème MAnifestation des Jeunes Chercheurs STIC (MajecStic'06), Nov 2006, pp.8, 2006. 〈lirmm-00117016〉

Partager

Métriques

Consultations de la notice

83