Fonctions de Rang et Fouille du Web pour l'identification et la catégorisation d'Entités Nommées - LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier Accéder directement au contenu
Communication Dans Un Congrès Année : 2012

Fonctions de Rang et Fouille du Web pour l'identification et la catégorisation d'Entités Nommées

Résumé

Cet article décrit des méthodes de Fouille du Web afin d'identifier et de catégoriser les Entités Nommées. Les méthodes proposées s'appuient sur des mesures statistiques fondées sur des connaissances syntaxiques et/ou sémantiques. La combinaison de ces approches se révèle particulièrement pertinente. Les expérimentations de nos méthodes, qui s'appuient sur l'étude de près de 500 entités nommées, ont nécessité l'exécution de près de 2800 requêtes à partir d'un moteur de recherche. Les résultats montrent l'intérêt d'utiliser des méthodes de Fouille du Web pour ce type de tâche et ouvrent des perspectives tout à fait encourageantes.
Fichier principal
Vignette du fichier
Roche_Mathieu_-_Fonctions_de_Rang_et_Fouille_du_Web.pdf (318.81 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

lirmm-00723569 , version 1 (10-08-2012)

Identifiants

  • HAL Id : lirmm-00723569 , version 1

Citer

Mathieu Roche. Fonctions de Rang et Fouille du Web pour l'identification et la catégorisation d'Entités Nommées. JADT'2012: 11ièmes Journées internationales d'analyse statistique des données textuelles, Belgique. pp.859-870. ⟨lirmm-00723569⟩
106 Consultations
128 Téléchargements

Partager

Gmail Facebook X LinkedIn More