Approaches of anonymisation of an SMS corpus

Namrata Patel 1 Pierre Accorsi 2 Diana Inkpen 3 Cédric Lopez 4 Mathieu Roche 5
1 GRAPHIK - Graphs for Inferences on Knowledge
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier, CRISAM - Inria Sophia Antipolis - Méditerranée
5 TEXTE - Exploration et exploitation de données textuelles
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
Abstract : This paper presents two anonymisation methods to process an SMS corpus. The first one is based on an unsupervised approach called Seek&Hide. The implemented system uses several dictionaries and rules in order to predict if a SMS needs anonymisation process. The second method is based on a supervised approach using machine learning techniques. We evaluate the two approaches and we propose a way to use them together. Only when the two methods do not agree on their prediction, will the SMS be checked by a human expert. This greatly reduces the cost of anonymising the corpus.
Type de document :
Communication dans un congrès
CICLing: Conference on Intelligent Text Processing and Computational Linguistics, Mar 2013, Samos, Greece. Springer-Verlag, 14th International Conference on Intelligent Text Processing and Computational Linguistics, LNCS (7816), pp.77-88, 2013, 〈http://www.cicling.org/2013/〉. 〈10.1007/978-3-642-37247-6_7〉
Liste complète des métadonnées

Littérature citée [15 références]  Voir  Masquer  Télécharger

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00816285
Contributeur : Mathieu Roche <>
Soumis le : vendredi 24 février 2017 - 18:22:43
Dernière modification le : jeudi 24 mai 2018 - 15:59:23
Document(s) archivé(s) le : jeudi 25 mai 2017 - 14:20:30

Fichier

Approaches_of_anonymisation_of...
Fichiers produits par l'(les) auteur(s)

Identifiants

Collections

Citation

Namrata Patel, Pierre Accorsi, Diana Inkpen, Cédric Lopez, Mathieu Roche. Approaches of anonymisation of an SMS corpus. CICLing: Conference on Intelligent Text Processing and Computational Linguistics, Mar 2013, Samos, Greece. Springer-Verlag, 14th International Conference on Intelligent Text Processing and Computational Linguistics, LNCS (7816), pp.77-88, 2013, 〈http://www.cicling.org/2013/〉. 〈10.1007/978-3-642-37247-6_7〉. 〈lirmm-00816285〉

Partager

Métriques

Consultations de la notice

396

Téléchargements de fichiers

166