Skip to Main content Skip to Navigation
Conference papers

ExpLSA et classification de textes

Nicolas Béchet 1 Mathieu Roche 2, 1 Jacques Chauché 3, 1
1 TEXTE - Exploration et exploitation de données textuelles
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
Résumé : L'analyse sémantique latente (LSA - Latent Semantic Analysis) est une méthode statistique qui peut être utilisée pour des tâches de classification de textes. La quantité des données textuelles (taille des documents à classer) est souvent un critère déterminant pour de telles tâches. Ainsi, cet article propose une méthode d'expansion des phrases des textes afin d'enrichir les données textuelles et améliorer les méthodes de classification. Les résultats expérimentaux obtenus à partir d'un corpus de dépêches d'actualité ont permis de caractériser les types de textes pour lesquels notre méthode améliore LSA.
Complete list of metadatas

Cited literature [18 references]  Display  Hide  Download

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00335878
Contributor : Nicolas Béchet <>
Submitted on : Friday, November 14, 2008 - 7:00:04 AM
Last modification on : Wednesday, September 16, 2020 - 4:51:28 PM
Long-term archiving on: : Monday, June 7, 2010 - 8:50:40 PM

File

jadt08_NB_MR_JC.pdf
Publisher files allowed on an open archive

Identifiers

  • HAL Id : lirmm-00335878, version 1

Collections

Citation

Nicolas Béchet, Mathieu Roche, Jacques Chauché. ExpLSA et classification de textes. JADT'08: Journées internationales d'Analyse statistique des Données Textuelles, Mar 2008, Lyon, France. pp.167-177. ⟨lirmm-00335878⟩

Share