Présentation de DEFT'06 (DEfi Fouille de Textes)
Abstract
Après le succès de DEFT'05 organisé en 2005 dans le cadre de la conférence TALN, une nouvelle édition de DEFT (DÉfi Fouille de Textes) a été mise en oeuvre. Le thème général de ce nouveau défi concerne la reconnaissance automatique de segments thématiques de textes écrits en français dans différents domaines. La segmentation thématique peut être utilisée pour différents objectifs. Elle permet, par exemple, d'isoler des zones répondant précisément à une requête. Ceci est particulièrement utile dans un système de recherche d'informations. La segmentation peut également être utilisée pour l'indexation de textes. Des méthodes de classification de documents peuvent également s'appuyer sur la segmentation de textes. Enfin, les approches de résumés de textes peuvent utiliser les informations liées à la segmentation thématique. Cet article présente le défi dans sa globalité, les corpus utilisés et les difficultés spécifiques à chacun des corpus étudiés.