Entity Resolution for Probabilistic Data

Ayat Naser 1, * Reza Akbarinia 2 Hamideh Afsarmanesh 1 Patrick Valduriez 2, 3
* Auteur correspondant
2 ZENITH - Scientific Data Management
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier, CRISAM - Inria Sophia Antipolis - Méditerranée
Abstract : Entity resolution is the problem of identifying the tuples that represent the same real world entity. In this paper, we address the problem of entity resolution over probabilistic data (ERPD), which arises in many ap-plications that have to deal with probabilistic data. To deal with the ERPD problem, we distinguish between two classes of similarity functions, i.e. context-free and context-sensitive. We propose a PTIME algorithm for context-free similarity functions, and a Monte Carlo approximation algorithm for context-sensitive similarity functions. We also propose improvements over our proposed algorithms. We validated our algorithms through experiments over both synthetic and real datasets. Our extensive performance evaluation shows the effectiveness of our algorithms.
Type de document :
Article dans une revue
Information Sciences, Elsevier, 2014, 277, pp.492-511. 〈10.1016/j.ins.2014.02.135〉
Liste complète des métadonnées

Littérature citée [41 références]  Voir  Masquer  Télécharger

https://hal-lirmm.ccsd.cnrs.fr/lirmm-01076096
Contributeur : Reza Akbarinia <>
Soumis le : lundi 12 janvier 2015 - 10:58:28
Dernière modification le : jeudi 11 janvier 2018 - 15:49:57
Document(s) archivé(s) le : lundi 13 avril 2015 - 10:07:44

Fichiers

2014 - Information_sciences.pd...
Fichiers produits par l'(les) auteur(s)

Identifiants

Citation

Ayat Naser, Reza Akbarinia, Hamideh Afsarmanesh, Patrick Valduriez. Entity Resolution for Probabilistic Data. Information Sciences, Elsevier, 2014, 277, pp.492-511. 〈10.1016/j.ins.2014.02.135〉. 〈lirmm-01076096〉

Partager

Métriques

Consultations de la notice

327

Téléchargements de fichiers

288