Description d'un protocole d'évaluation automatique comme alternative à l'évaluation humaine. Application à la validation de relations syntaxiques induites

Nicolas Béchet 1
1 TEXTE - Exploration et exploitation de données textuelles
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
Résumé : Cet article propose un protocole d'évaluation afin de valider la qualité d'approches, visant à évaluer et à ordonner automatiquement des relations syntaxiques dites induites. Les approches évaluées se fondent sur l'interrogation d'un moteur de recherche sur le Web. Les résultats du moteur de recherche sont alors couplés avec diverses mesures statistiques : l'information mutuelle, l'information mutuelle au cube, le coefficient de Dice et la fréquence, ou popularité. Le protocole d'évaluation propose d'utiliser deux corpus, le premier de test et le second de validation, appartenant tous deux au même domaine. Le principe est de retrouver dans le second corpus les relations syntaxiques induites, non présentes originalement dans le premier corpus. Il est alors étudié la taille minimale du corpus d'évaluation afin de permettre une évaluation pertinente.
Type de document :
Communication dans un congrès
Evaluation des Méthodes d'Extraction de Connaissances dans les Données, Atelier de EGC'09, France. pp.A525-A534, 2009
Liste complète des métadonnées

Littérature citée [17 références]  Voir  Masquer  Télécharger

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00370815
Contributeur : Nicolas Béchet <>
Soumis le : mercredi 25 mars 2009 - 14:47:26
Dernière modification le : jeudi 24 mai 2018 - 15:59:23
Document(s) archivé(s) le : vendredi 12 octobre 2012 - 14:20:36

Fichier

NB_EvalECD.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : lirmm-00370815, version 1

Collections

Citation

Nicolas Béchet. Description d'un protocole d'évaluation automatique comme alternative à l'évaluation humaine. Application à la validation de relations syntaxiques induites. Evaluation des Méthodes d'Extraction de Connaissances dans les Données, Atelier de EGC'09, France. pp.A525-A534, 2009. 〈lirmm-00370815〉

Partager

Métriques

Consultations de la notice

177

Téléchargements de fichiers

184