OPILAND : identification de la perception des territoires par la fouille de texte

Eric Kergosien 1, 2 Bernard Laval 2 Mathieu Roche 1, 3 Maguelonne Teisseire 1, 3
2 TEXTE - Exploration et exploitation de données textuelles
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
3 ADVANSE - ADVanced Analytics for data SciencE
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
Résumé : De nombreux travaux ont été réalisés en extraction d'informations et plus particulièrement en fouille de données d'opinions dans des contextes spécifiques tels que les critiques de films, les évaluations de produits commerciaux, les discours électoraux... Dans le cadre du projet SENTERRITOIRE, nous nous posons la question de l'adéquation de ces méthodes pour des documents associés à l'aménagement des territoires. Ces documents renferment différents types d'informations se rapportant à des acteurs, des opinions, des informations géographiques, et tout autre aspect lié plus généralement à la notion de territoire. Cependant, il est extrêmement difficile d'identifier puis de lier les opinions à ces informations. Après avoir souligné les limites des propositions actuelles et les verrous soulevés par les données textuelles associées, nous proposons la mé- thode semi-automatique nommée OPILAND (OPinion mIning from LAND-use planning documents) combinant une chaîne de Traitement Automatique du Lan- gage Naturel et des techniques de Fouilles de Textes pour (1) détecter les entités nommées de type lieu et organisation, (2) construire un vocabulaire d'opinions relatif au domaine d'application, et (3) identifier les opinions relatives aux entités nommées traitées. Les expérimentations sont menées sur des données du bassin de Thau (France), puis appliquées sur trois corpus relatifs à d'autres domaines afin de mettre en avant la généricité de notre approche.
Complete list of metadatas

Cited literature [50 references]  Display  Hide  Download

https://hal-lirmm.ccsd.cnrs.fr/lirmm-01054916
Contributor : Mathieu Roche <>
Submitted on : Thursday, April 18, 2019 - 8:05:20 PM
Last modification on : Wednesday, September 18, 2019 - 4:04:05 PM

File

46679998.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : lirmm-01054916, version 1

Citation

Eric Kergosien, Bernard Laval, Mathieu Roche, Maguelonne Teisseire. OPILAND : identification de la perception des territoires par la fouille de texte. Revue des Nouvelles Technologies de l'Information, Hermann, 2014, MASHS'2014: Fouille de Données et Humanités Numériques, RNTI-SHS-2, pp.185-212. ⟨lirmm-01054916⟩

Share

Metrics

Record views

462

Files downloads

12