Le Défi fouilles de textes : quels paradigmes pour la reconnaissance d'auteurs ?

Violaine Prince 1 Yves Kodratoff 2
1 TEXTE - Exploration et exploitation de données textuelles
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
Résumé : Les campagnes d'évaluation en traitement automatique du langage naturel et en informatique documentaire sont devenues un passage obligé pour la reconnaissances des différentes techniques employées. Le Défi Fouille de Texte a pour objectif de permettre aux chercheurs du monde francophone de confronter leurs travaux avec un problème, plus que primer une équipe, une méthode, ou un outil. Dans cet article nous évoquons les diverses problématiques de la fouille de texte, à savoir la recherche d'information, l'extraction ou l'enrichissement de connaissances, la classificiation/catégorisation de documents, la segmentation de textes, le profilage. La reconnaissance d'auteur, objet de ce premier défi, est une tâche complexe et composite qui nécessite de traiter simultanément de la segmentation, de la catégorisation et du profilage. L'idée générale est que la mise en place des défis est un outil de cartographie des diverses avancées en fouille de textes, et également un instrument scientifique de compréhension de problèmes de nature complexe.
Type de document :
Article dans une revue
Revue des Nouvelles Technologies de l'Information, Hermann, 2007, E (10), pp.001-014
Liste complète des métadonnées

Littérature citée [16 références]  Voir  Masquer  Télécharger

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00171291
Contributeur : Violaine Prince-Barbier <>
Soumis le : mercredi 12 septembre 2007 - 10:58:53
Dernière modification le : mardi 4 décembre 2018 - 15:12:02
Document(s) archivé(s) le : lundi 24 septembre 2012 - 12:20:36

Identifiants

  • HAL Id : lirmm-00171291, version 1

Collections

Citation

Violaine Prince, Yves Kodratoff. Le Défi fouilles de textes : quels paradigmes pour la reconnaissance d'auteurs ?. Revue des Nouvelles Technologies de l'Information, Hermann, 2007, E (10), pp.001-014. 〈lirmm-00171291〉

Partager

Métriques

Consultations de la notice

261

Téléchargements de fichiers

530