Fonctions de Rang et Fouille du Web pour l'identification et la catégorisation d'Entités Nommées - LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier Access content directly
Conference Papers Year : 2012

Fonctions de Rang et Fouille du Web pour l'identification et la catégorisation d'Entités Nommées

Abstract

Cet article décrit des méthodes de Fouille du Web afin d'identifier et de catégoriser les Entités Nommées. Les méthodes proposées s'appuient sur des mesures statistiques fondées sur des connaissances syntaxiques et/ou sémantiques. La combinaison de ces approches se révèle particulièrement pertinente. Les expérimentations de nos méthodes, qui s'appuient sur l'étude de près de 500 entités nommées, ont nécessité l'exécution de près de 2800 requêtes à partir d'un moteur de recherche. Les résultats montrent l'intérêt d'utiliser des méthodes de Fouille du Web pour ce type de tâche et ouvrent des perspectives tout à fait encourageantes.
Fichier principal
Vignette du fichier
Roche_Mathieu_-_Fonctions_de_Rang_et_Fouille_du_Web.pdf (318.81 Ko) Télécharger le fichier
Origin : Publisher files allowed on an open archive
Loading...

Dates and versions

lirmm-00723569 , version 1 (10-08-2012)

Identifiers

  • HAL Id : lirmm-00723569 , version 1

Cite

Mathieu Roche. Fonctions de Rang et Fouille du Web pour l'identification et la catégorisation d'Entités Nommées. JADT'2012: 11ièmes Journées internationales d'analyse statistique des données textuelles, Belgique. pp.859-870. ⟨lirmm-00723569⟩
106 View
128 Download

Share

Gmail Facebook X LinkedIn More