Fonctions de Rang et Fouille du Web pour l'identification et la catégorisation d'Entités Nommées - LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier
Conference Papers Year : 2012

Fonctions de Rang et Fouille du Web pour l'identification et la catégorisation d'Entités Nommées

Abstract

Cet article décrit des méthodes de Fouille du Web afin d'identifier et de catégoriser les Entités Nommées. Les méthodes proposées s'appuient sur des mesures statistiques fondées sur des connaissances syntaxiques et/ou sémantiques. La combinaison de ces approches se révèle particulièrement pertinente. Les expérimentations de nos méthodes, qui s'appuient sur l'étude de près de 500 entités nommées, ont nécessité l'exécution de près de 2800 requêtes à partir d'un moteur de recherche. Les résultats montrent l'intérêt d'utiliser des méthodes de Fouille du Web pour ce type de tâche et ouvrent des perspectives tout à fait encourageantes.
Fichier principal
Vignette du fichier
Roche_Mathieu_-_Fonctions_de_Rang_et_Fouille_du_Web.pdf (318.81 Ko) Télécharger le fichier
Origin Publisher files allowed on an open archive
Loading...

Dates and versions

lirmm-00723569 , version 1 (10-08-2012)

Identifiers

  • HAL Id : lirmm-00723569 , version 1

Cite

Mathieu Roche. Fonctions de Rang et Fouille du Web pour l'identification et la catégorisation d'Entités Nommées. JADT 2012 - 11es Journées Internationales d'Analyse Statistique des données Textuelles, Jun 2012, Liège, Belgique. pp.859-870. ⟨lirmm-00723569⟩
111 View
129 Download

Share

More