How to exploit paralinguistic features to identify acronyms in texts?

Mathieu Roche 1, 2
1 ADVANSE - ADVanced Analytics for data SciencE
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
Abstract : This paper addresses the issue of acronym dictionary building. The first step of the process identifies acronym/definition candidates, the second one selects candidates based on a letter alignment method. This approach has two advantages because it enables (1) to annotate documents, (2) to build specific dictionaries. More precisely, this paper discusses the use of a specific linguistic concept, the gloss, in order to identify candidates. The proposed method based on paralinguistic markers is independent of languages.
Type de document :
Communication dans un congrès
LREC: International Conference on Language Resources and Evaluation, May 2014, Reykjavik, Iceland. pp.69-72, 2014, 〈http://www.lrec-conf.org/proceedings/lrec2014/index.html〉
Liste complète des métadonnées

Littérature citée [12 références]  Voir  Masquer  Télécharger

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00974797
Contributeur : Mathieu Roche <>
Soumis le : lundi 7 avril 2014 - 14:36:27
Dernière modification le : jeudi 24 mai 2018 - 15:59:25
Document(s) archivé(s) le : lundi 7 juillet 2014 - 11:26:46

Fichier

identification_Acronyms.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : lirmm-00974797, version 1

Citation

Mathieu Roche. How to exploit paralinguistic features to identify acronyms in texts?. LREC: International Conference on Language Resources and Evaluation, May 2014, Reykjavik, Iceland. pp.69-72, 2014, 〈http://www.lrec-conf.org/proceedings/lrec2014/index.html〉. 〈lirmm-00974797〉

Partager

Métriques

Consultations de la notice

634

Téléchargements de fichiers

275