PP Attachment Ambiguity Resolution with Corpus-Based Pattern Distributions and Lexical Signatures

Nuria Gala 1 Mathieu Lafourcade 2
2 TEXTE - Exploration et exploitation de données textuelles
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
Abstract : In this paper, we propose a method combining unsupervised learning of lexical frequencies with semantic information aiming at improving PP attachment ambiguity resolution. Using the output of a robust parser, i.e. the set of all possible attachments for a given sentence, we query the Web and obtain statistical information about the frequencies of the attachments distributions as well as lexical signatures of the terms on the patterns. All this information is used to weight the dependencies yielded by the parser.
Type de document :
Article dans une revue
ECTI-CIT Transactions on Computer and Information Technology, ECTI, 2006, 2 (2), pp.116-120. 〈http://ecti.en.kku.ac.th/ejournal/index.php/ECTI-CIT〉
Liste complète des métadonnées

Littérature citée [8 références]  Voir  Masquer  Télécharger

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00200910
Contributeur : Mathieu Lafourcade <>
Soumis le : vendredi 21 décembre 2007 - 20:11:45
Dernière modification le : jeudi 24 mai 2018 - 15:59:23
Document(s) archivé(s) le : jeudi 27 septembre 2012 - 13:20:30

Identifiants

  • HAL Id : lirmm-00200910, version 1

Collections

Citation

Nuria Gala, Mathieu Lafourcade. PP Attachment Ambiguity Resolution with Corpus-Based Pattern Distributions and Lexical Signatures. ECTI-CIT Transactions on Computer and Information Technology, ECTI, 2006, 2 (2), pp.116-120. 〈http://ecti.en.kku.ac.th/ejournal/index.php/ECTI-CIT〉. 〈lirmm-00200910〉

Partager

Métriques

Consultations de la notice

177

Téléchargements de fichiers

249