Conference Papers Year : 2010

Titrage automatique de documents électroniques par extraction de syntagmes nominaux

Abstract

Le titrage automatique est un des domaines clé de l'accessibilité des sites WEB tel que défini. Nous proposons dans cet article une approche permettant le titrage automatique de textes (messages de type mails, forum, etc.). À partir de l'étude morpho-syntaxique des titres de notre corpus, nous proposons une approche de titrage automatique. Celle-ci se compose de quatre étapes : l'acquisition du corpus, la détermination des phrases candidates pour le titrage, l'extraction des syntagmes nominaux parmi les phrases candidates et enfin le choix du titre (ChTITRES). Les résultats de l'évaluation par une dizaine d'utilisateurs montrent que les titres déterminés par notre approche sont pertinents.
Fichier principal
Vignette du fichier
IC2010.pdf (161) Télécharger le fichier
Origin Files produced by the author(s)
Loading...

Dates and versions

lirmm-00588696 , version 1 (26-04-2011)

Identifiers

  • HAL Id : lirmm-00588696 , version 1

Cite

Cédric Lopez, Violaine Prince, Mathieu Roche. Titrage automatique de documents électroniques par extraction de syntagmes nominaux. IC@PFIA 2010 - 21es Journées francophones d'Ingénierie des Connaissances, Jun 2010, Nîmes, France. pp.17-28. ⟨lirmm-00588696⟩
185 View
152 Download

Share

More