Comparaison de méthodes lexicales et syntaxico-sémantiques dans la segmentation thématique de texte non supervisée
Abstract
Cet article présente une méthode basée sur des calculs de distance et une analyse sémantique et syntaxique pour la segmentation thématique de texte. Pour évaluer cette méthode nous la comparons à un un algorithme lexical très connu : c99. Nous testons les deux méthodes sur un corpus de discours politique français et comparons les résultats. Les deux conclusions qui ressortent de notre expérience sont que les approches sont complémentaires et que les protocoles d'évaluation actuels sont inadaptés.
Domains
Document and Text ProcessingOrigin | Files produced by the author(s) |
---|
Loading...