Skip to Main content Skip to Navigation
Conference papers

Approche de construction automatique de titres courts par des méthodes de Fouille du Web

Cédric Lopez 1 Mathieu Roche 1, *
* Corresponding author
1 TEXTE - Exploration et exploitation de données textuelles
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
Résumé : Le titrage automatique de documents textuels est une tâche essentielle pour plusieurs applications (titrage de mails, génération automatique de sommaires, synthèse de documents, etc.). Cette étude présente une méthode de construction de titres courts appliquée à un corpus d'articles journalistiques via des méthodes de Fouille du Web. Il s'agit d'une première étape cruciale dans le but de proposer une méthode de construction de titres plus complexes. Dans cet article, nous présentons une méthode proposant des titres tenant compte de leur cohérence par rapport au texte, par rapport au Web, ainsi que de leur contexte dynamique. L'évaluation de notre approche indique que nos titres construits automatiquement sont informatifs et/ou accrocheurs.
Document type :
Conference papers
Complete list of metadata

Cited literature [14 references]  Display  Hide  Download

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00637965
Contributor : Cédric Lopez <>
Submitted on : Thursday, November 3, 2011 - 1:39:37 PM
Last modification on : Thursday, May 24, 2018 - 3:59:23 PM
Long-term archiving on: : Saturday, February 4, 2012 - 2:25:21 AM

File

TALN2011.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : lirmm-00637965, version 1

Collections

Citation

Cédric Lopez, Mathieu Roche. Approche de construction automatique de titres courts par des méthodes de Fouille du Web. TALN: Traitement Automatique des Langues Naturelles, Jun 2011, Montpellier, France. pp.39-50. ⟨lirmm-00637965⟩

Share

Metrics

Record views

289

Files downloads

240