Skip to Main content Skip to Navigation
Conference papers

Découverte de nouvelles entités et relations spatiales à partir d’un corpus de SMS

Résumé : Dans le contexte des masses de données aujourd’hui disponibles, de nombreux travaux liés à l’analyse de l’information spatiale s’appuient sur l’exploitation des données textuelles. La communication médiée (SMS, tweets, etc.) véhiculant des informations spatiales prend une place prépondérante. L’objectif du travail présenté dans cet article consiste à extraire ces informations spatiales à partir d’un corpus authentique de SMS en français. Nous proposons un processus dans lequel, dans un premier temps, nous extrayons de nouvelles entités spatiales (par exemple, motpellier, montpeul à associer au toponyme Montpellier). Dans un second temps, nous identifions de nouvelles relations spatiales qui précèdent les entités spatiales (par exemple, sur, par, pres, etc.). La tâche est difficile et complexe en raison de la spécificité du langage SMS qui repose sur une écriture peu standardisée (apparition de nombreux lexiques, utilisation massive d’abréviations, variation par rapport à l’écrit classique, etc.). Les expérimentations qui ont été réalisées à partir du corpus 88milSMS mettent en relief la robustesse de notre système pour identifier de nouvelles entités et relations spatiales.
Document type :
Conference papers
Complete list of metadatas

Cited literature [18 references]  Display  Hide  Download

https://hal-lirmm.ccsd.cnrs.fr/lirmm-01944710
Contributor : Isabelle Gouat <>
Submitted on : Tuesday, December 4, 2018 - 6:37:28 PM
Last modification on : Thursday, July 2, 2020 - 2:01:03 PM

Identifiers

  • HAL Id : lirmm-01944710, version 1

Citation

Sarah Zenasni, Eric Kergosien, Mathieu Roche, Maguelonne Teisseire. Découverte de nouvelles entités et relations spatiales à partir d’un corpus de SMS. TALN: Traitement Automatique des Langues Naturelles, Jul 2016, Paris, France. ⟨lirmm-01944710⟩

Share

Metrics

Record views

415

Files downloads

68