Recherche documentaire par titrage automatique - LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier
Conference Papers Year : 2011

Recherche documentaire par titrage automatique

Abstract

Nous proposons dans cet article un système facilitant la recherche d'information dans un ensemble de documents textuels, basé sur le titrage (et sous-titrage) automatique. Ce dernier peut se révéler crucial, par exemple, dans le cadre de la problématique de l'accessibilité des pages web (norme W3C). Notre processus de titrage automatique consiste à extraire des syntagmes nominaux pertinents dans les textes, pouvant constituer des titres ou sous-titres candidats. Une approche originale combinant des critères statistiques et de placement des mots dans le texte permet alors de proposer des titres et sous-titres pertinents à un utilisateur sous forme de sommaire. L'utilisateur peut donc facilement prendre connaissance de l'ensemble des sujets évoqués dans une masse de documents, et aisément retrouver le document l'intéressant le cas échéant. Une évaluation sur des données réelles montre que les solutions fournies par notre approche de titrage automatique se révèlent tout à fait pertinentes.
Fichier principal
Vignette du fichier
Titrage.pdf (343.2 Ko) Télécharger le fichier
Origin Files produced by the author(s)
Loading...

Dates and versions

lirmm-00637968 , version 1 (03-11-2011)

Identifiers

  • HAL Id : lirmm-00637968 , version 1

Cite

Cédric Lopez, Violaine Prince, Mathieu Roche. Recherche documentaire par titrage automatique. INFORSID'11 - 29ème Edition, May 2011, Lille, France. pp.217-232. ⟨lirmm-00637968⟩
199 View
75 Download

Share

More