Bilan du premier défi francophone de Fouille de Textes

Résumé : Le DÉ Fouille de Textes (DEFT) a consisté à supprimer les phrases non pertinentes dans un corpus de discours politiques en français. Il a eu lieu en 2005 et réuni onze équipes, totalisant une trentaine de participants. Cet article décrit les prétraitements eectués sur les corpus de F. Mitterrand et de J. Chirac dans le cadre de ce dé. Notamment, la conversion au format texte, le découpage en phrases, le classement des discours, l'introduction de phrases de F. Mitterrand dans les discours de J. Chirac et l'identication des dates et noms de personnes. Les résultats obtenus par les onze équipes participantes sont aussi présentés.
Type de document :
Article dans une revue
Revue des Nouvelles Technologies de l'Information, Hermann, 2007, DEFT'2007: Défi Fouille de Textes : reconnaissance automatique des auteurs de discours - Campagne DEFT'05 (TALN'05), RNTI-E-10, pp.15-38
Liste complète des métadonnées

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00138129
Contributeur : Mathieu Roche <>
Soumis le : vendredi 23 mars 2007 - 14:25:15
Dernière modification le : jeudi 24 mai 2018 - 15:59:23

Identifiants

  • HAL Id : lirmm-00138129, version 1

Citation

Jérôme Azé, Mathieu Roche, Erick Alphonse, Ahmed Amrani, Thomas Heitz, et al.. Bilan du premier défi francophone de Fouille de Textes. Revue des Nouvelles Technologies de l'Information, Hermann, 2007, DEFT'2007: Défi Fouille de Textes : reconnaissance automatique des auteurs de discours - Campagne DEFT'05 (TALN'05), RNTI-E-10, pp.15-38. 〈lirmm-00138129〉

Partager

Métriques

Consultations de la notice

375