Skip to Main content Skip to Navigation
Conference papers

Motifs sequentiels pour la completion des valeurs manquantes

Résumé : Les bases de données issues du monde réel contiennent souvent de nombreuses informations non renseignées. Durant le processus d'extraction de connaissances dans les bases de données, une phase d'élimination des données non complètement renseignées est souvent nécessaire. Lors de cette phase, les données incomplètes peuvent être supprimées ou complétées. Ces deux solutions sont lourdes de conséquences pour la connaissance qui sera ensuite extraite. En effet, la suppression peut parfois conduire à l'élimination de plus de la moitié de la base, aussi l'information extraite n'est plus représentative. La complétion introduit un biais dans les données. Certaines méthodes permettent de choisir des valeurs afin de compléter au mieux des données incomplètes, mais elles ne conduisent pas toujours à des résultats satisfaisants. Afin de gérer cette phase de complétion, nous proposons d'améliorer une méthode de complétion basée sur les règles d'association en utilisant les motifs séquentiels, qui prennent en compte la notion d'ordre pouvant exister entre les enregistrements d'une base de données.
Document type :
Conference papers
Complete list of metadatas

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00117016
Contributor : Celine Fiot <>
Submitted on : Wednesday, November 29, 2006 - 2:56:39 PM
Last modification on : Thursday, May 24, 2018 - 3:59:20 PM

Identifiers

  • HAL Id : lirmm-00117016, version 1

Collections

Citation

Céline Fiot. Motifs sequentiels pour la completion des valeurs manquantes. 4ème MAnifestation des Jeunes Chercheurs STIC (MajecStic'06), Nov 2006, pp.8. ⟨lirmm-00117016⟩

Share

Metrics

Record views

146