Le Défi fouilles de textes : quels paradigmes pour la reconnaissance d'auteurs ?
Abstract
Les campagnes d'évaluation en traitement automatique du langage naturel et en informatique documentaire sont devenues un passage obligé pour la reconnaissances des différentes techniques employées. Le Défi Fouille de Texte a pour objectif de permettre aux chercheurs du monde francophone de confronter leurs travaux avec un problème, plus que primer une équipe, une méthode, ou un outil. Dans cet article nous évoquons les diverses problématiques de la fouille de texte, à savoir la recherche d'information, l'extraction ou l'enrichissement de connaissances, la classificiation/catégorisation de documents, la segmentation de textes, le profilage. La reconnaissance d'auteur, objet de ce premier défi, est une tâche complexe et composite qui nécessite de traiter simultanément de la segmentation, de la catégorisation et du profilage. L'idée générale est que la mise en place des défis est un outil de cartographie des diverses avancées en fouille de textes, et également un instrument scientifique de compréhension de problèmes de nature complexe.
Domains
Document and Text Processing
Loading...