D'une hiérarchie figée de concepts vers une hiérarchie évolutive de notions de base

Alain Joubert 1 Mathieu Lafourcade 1
1 TEXTE - Exploration et exploitation de données textuelles
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
Abstract : In the construction of a thematic representation system of knowledge in Natural Language Processing, it became current to use a thesaurus. Essentially, a thesaurus consists of a set of concepts, often organized in an arborescent structure : it is a fundamental, but relatively fixed tool. But concepts (and language!) are evolving, and this, more and more quickly, particularly in technical fields. We propose a system which makes possible for the notion of concept to evolve by the introduction of the "Basic Notions". Those, necessarily definite on the vector space of the concepts of the thesaurus, constitute another generating system of the space of thematic representation of knowledge. Contrary to the concepts of the thesaurus, the basic notions evolve progressively with the analysis of new texts. We discuss the optimal value of the dimension of the space of representation generated by the basic notions, then of the determination of the acceptions allowing to express them. Lastly, we consider the differentiation between basic notions of general space and those of a specialized field.
Type de document :
Communication dans un congrès
JADT'06: Journées Internationales d'Analyse Statistique des Données Textuelles, Apr 2006, Besançon (France), pp.551-558, 2006
Liste complète des métadonnées

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00112442
Contributeur : Martine Peridier <>
Soumis le : mercredi 8 novembre 2006 - 16:15:51
Dernière modification le : jeudi 24 mai 2018 - 15:59:23
Document(s) archivé(s) le : mardi 6 avril 2010 - 21:55:20

Identifiants

  • HAL Id : lirmm-00112442, version 1

Collections

Citation

Alain Joubert, Mathieu Lafourcade. D'une hiérarchie figée de concepts vers une hiérarchie évolutive de notions de base. JADT'06: Journées Internationales d'Analyse Statistique des Données Textuelles, Apr 2006, Besançon (France), pp.551-558, 2006. 〈lirmm-00112442〉

Partager

Métriques

Consultations de la notice

112

Téléchargements de fichiers

203