Choix du taux d'élagage pour l'extraction de la terminologie. Une approche fondée sur les courbes ROC

Mathieu Roche 1 Yves Kodratoff 2
1 TEXTE - Exploration et exploitation de données textuelles
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
Résumé : Le choix du taux d'élagage est crucial dans le but d'acquérir une terminologie de qualité à partir de corpus de spécialité. Cet article présente une étude expérimentale consistant à déterminer le taux d'élagage le plus adapté. Plusieurs mesures d'évaluation peuvent être utilisées pour déterminer ce taux tels que la précision, le rappel et le Fscore. Cette étude s'appuie sur une autre mesure d'évaluation qui semble particulièrement bien adaptée pour l'extraction de la terminologie : les courbes ROC (Receiver Operating Characteristics).
Type de document :
Communication dans un congrès
EGC'06 : Extraction et Gestion des Connaissances, Jan 2006, Villeneuve d'Ascq (France), pp.205-216, 2006
Liste complète des métadonnées

Littérature citée [23 références]  Voir  Masquer  Télécharger

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00087576
Contributeur : Isabelle Gouat <>
Soumis le : mardi 25 juillet 2006 - 15:16:05
Dernière modification le : jeudi 11 janvier 2018 - 06:26:53
Document(s) archivé(s) le : mardi 18 septembre 2012 - 16:27:55

Identifiants

  • HAL Id : lirmm-00087576, version 1

Citation

Mathieu Roche, Yves Kodratoff. Choix du taux d'élagage pour l'extraction de la terminologie. Une approche fondée sur les courbes ROC. EGC'06 : Extraction et Gestion des Connaissances, Jan 2006, Villeneuve d'Ascq (France), pp.205-216, 2006. 〈lirmm-00087576〉

Partager

Métriques

Consultations de la notice

154

Téléchargements de fichiers

302