Bilan du premier défi francophone de Fouille de Textes - LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier
Journal Articles Revue des Nouvelles Technologies de l'Information Year : 2007

Bilan du premier défi francophone de Fouille de Textes

Jérôme Azé
Erick Alphonse
  • Function : Author
  • PersonId : 839013
Ahmed Amrani
  • Function : Author
  • PersonId : 839014
Thomas Heitz
  • Function : Author
  • PersonId : 836597
Amar-Djalil Mezaour
  • Function : Author
  • PersonId : 836598

Abstract

Le DÉ Fouille de Textes (DEFT) a consisté à supprimer les phrases non pertinentes dans un corpus de discours politiques en français. Il a eu lieu en 2005 et réuni onze équipes, totalisant une trentaine de participants. Cet article décrit les prétraitements eectués sur les corpus de F. Mitterrand et de J. Chirac dans le cadre de ce dé. Notamment, la conversion au format texte, le découpage en phrases, le classement des discours, l'introduction de phrases de F. Mitterrand dans les discours de J. Chirac et l'identication des dates et noms de personnes. Les résultats obtenus par les onze équipes participantes sont aussi présentés.
No file

Dates and versions

lirmm-00138129 , version 1 (23-03-2007)

Identifiers

  • HAL Id : lirmm-00138129 , version 1

Cite

Jérôme Azé, Mathieu Roche, Erick Alphonse, Ahmed Amrani, Thomas Heitz, et al.. Bilan du premier défi francophone de Fouille de Textes. Revue des Nouvelles Technologies de l'Information, 2007, DEFT'2007: Défi Fouille de Textes : reconnaissance automatique des auteurs de discours - Campagne DEFT'05 (TALN'05), RNTI-E-10, pp.15-38. ⟨lirmm-00138129⟩
206 View
0 Download

Share

More