Skip to Main content Skip to Navigation
Conference papers

Choix du taux d'élagage pour l'extraction de la terminologie. Une approche fondée sur les courbes ROC

Mathieu Roche 1 Yves Kodratoff 2
1 TEXTE - Exploration et exploitation de données textuelles
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
Résumé : Le choix du taux d'élagage est crucial dans le but d'acquérir une terminologie de qualité à partir de corpus de spécialité. Cet article présente une étude expérimentale consistant à déterminer le taux d'élagage le plus adapté. Plusieurs mesures d'évaluation peuvent être utilisées pour déterminer ce taux tels que la précision, le rappel et le Fscore. Cette étude s'appuie sur une autre mesure d'évaluation qui semble particulièrement bien adaptée pour l'extraction de la terminologie : les courbes ROC (Receiver Operating Characteristics).
Document type :
Conference papers
Complete list of metadatas

Cited literature [23 references]  Display  Hide  Download

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00087576
Contributor : Isabelle Gouat <>
Submitted on : Tuesday, July 25, 2006 - 3:16:05 PM
Last modification on : Wednesday, September 16, 2020 - 4:52:16 PM
Long-term archiving on: : Tuesday, September 18, 2012 - 4:27:55 PM

Identifiers

  • HAL Id : lirmm-00087576, version 1

Collections

Citation

Mathieu Roche, Yves Kodratoff. Choix du taux d'élagage pour l'extraction de la terminologie. Une approche fondée sur les courbes ROC. EGC: Extraction et Gestion des Connaissances, Jan 2006, Lille, France. pp.205-216. ⟨lirmm-00087576⟩

Share

Metrics

Record views

264

Files downloads

327