Automatic Titling of Articles Using Position and Statistical Information

Cédric Lopez 1 Violaine Prince 1 Mathieu Roche 1, *
* Auteur correspondant
1 TEXTE - Exploration et exploitation de données textuelles
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
Abstract : This paper describes a system facilitating information retrieval in a set of textual documents by tackling the automatic titling and subtitling issue. Automatic titling here consists in extracting relevant noun phrases from texts as candidate titles. An original approach combining statistical criteria and noun phrases positions in the text helps collecting relevant titles and subtitles. So, the user may benefit from an outline of all the subjects evoked in a mass of documents, and easily find the information he/she is looking for. An evaluation on real data shows that the solutions given by this automatic titling approach are relevant.
Type de document :
Communication dans un congrès
RANLP'11: Recent Advances in Natural Language Processing, Dec 2011, Hissar, Bulgaria. pp.727-732, 2011, 〈http://lml.bas.bg/ranlp2011/start3.php〉
Liste complète des métadonnées

Littérature citée [16 références]  Voir  Masquer  Télécharger

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00637975
Contributeur : Cédric Lopez <>
Soumis le : jeudi 3 novembre 2011 - 14:04:08
Dernière modification le : jeudi 11 janvier 2018 - 06:26:53
Document(s) archivé(s) le : samedi 4 février 2012 - 02:25:50

Fichier

ranlp2011_ok.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : lirmm-00637975, version 1

Collections

Citation

Cédric Lopez, Violaine Prince, Mathieu Roche. Automatic Titling of Articles Using Position and Statistical Information. RANLP'11: Recent Advances in Natural Language Processing, Dec 2011, Hissar, Bulgaria. pp.727-732, 2011, 〈http://lml.bas.bg/ranlp2011/start3.php〉. 〈lirmm-00637975〉

Partager

Métriques

Consultations de la notice

148

Téléchargements de fichiers

125