Présentation de DEFT 06 (DÉfi Fouille de Textes)
Abstract
Après le succès de DEFT 05 organisé en 2005 dans le cadre de la conférence TALN, une nouvelle édition de DEFT (DÉfi Fouille de Textes) a été mise en Suvre. Le thème général de ce nouveau défi concerne la reconnaissance automatique de segments thématiques de textes écrits en français dans différents domaines. La segmentation thématique peut être utilisée pour différents objectifs. Elle permet, par exemple, d isoler des zones répondant précisément à une requête. Ceci est particulièrement utile dans un système de recherche d informations. La segmentation peut également être utilisée pour l indexation de textes. Des méthodes de classification de documents peuvent également s appuyer sur la segmentation de textes. Enfin, les approches de résumés de textes peuvent utiliser les informations liées à la segmentation thématique. Cet article présente le défi dans sa globalité, les corpus utilisés et les difficultés spécifiques à chacun des corpus étudiés.
Domains
Document and Text ProcessingOrigin | Publisher files allowed on an open archive |
---|