Bilan du premier défi francophone de Fouille de Textes - LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier
Article Dans Une Revue Revue des Nouvelles Technologies de l'Information Année : 2007

Bilan du premier défi francophone de Fouille de Textes

Jérôme Azé
Erick Alphonse
  • Fonction : Auteur
  • PersonId : 839013
Ahmed Amrani
  • Fonction : Auteur
  • PersonId : 839014
Thomas Heitz
  • Fonction : Auteur
  • PersonId : 836597
Amar-Djalil Mezaour
  • Fonction : Auteur
  • PersonId : 836598

Résumé

Le DÉ Fouille de Textes (DEFT) a consisté à supprimer les phrases non pertinentes dans un corpus de discours politiques en français. Il a eu lieu en 2005 et réuni onze équipes, totalisant une trentaine de participants. Cet article décrit les prétraitements eectués sur les corpus de F. Mitterrand et de J. Chirac dans le cadre de ce dé. Notamment, la conversion au format texte, le découpage en phrases, le classement des discours, l'introduction de phrases de F. Mitterrand dans les discours de J. Chirac et l'identication des dates et noms de personnes. Les résultats obtenus par les onze équipes participantes sont aussi présentés.
Fichier non déposé

Dates et versions

lirmm-00138129 , version 1 (23-03-2007)

Identifiants

  • HAL Id : lirmm-00138129 , version 1

Citer

Jérôme Azé, Mathieu Roche, Erick Alphonse, Ahmed Amrani, Thomas Heitz, et al.. Bilan du premier défi francophone de Fouille de Textes. Revue des Nouvelles Technologies de l'Information, 2007, DEFT'2007: Défi Fouille de Textes : reconnaissance automatique des auteurs de discours - Campagne DEFT'05 (TALN'05), RNTI-E-10, pp.15-38. ⟨lirmm-00138129⟩
206 Consultations
0 Téléchargements

Partager

More