Compression de phrases par élagage de leur arbre morpho-syntaxique. Une première application sur les phrases narratives.
Abstract
Nous proposons une technique de contraction de phrases qui se fonde sur l'étude de la fonction syntaxique et de la position dans l'arbre syntaxique des constituants des phrases. Nous définissons et analysons la perte de contenu et de cohérence discursive que la suppression de constituants engendre. Notre méthode de contraction s'oriente vers les textes narratifs. Nous sélectionnons les constituants à supprimer avec un système de règles utilisant les arbres et variables de l'analyse morpho-syntaxique de SYGFRAN. Nous commentons les résultats obtenus sur un texte narratif court, totalement analysé, ce qui nous mène à poser le problème de l'évaluation quantitative des résultats d'une telle approche, par opposition à des résultats qualitatifs. La technique dépendant très fortement de la qualité de l'analyse, la question de la compression par élagage apparaît comme intimement subordonnée à l'évaluation de l'analyse syntaxique. Abstract: We propose a sentence compression technique which uses constituents syntactic function and position in the sentence syntactic tree. We analyze contents and discourse consistency losses caused by deleting such constituents. We explain why our method works best with narrative texts. With a rule-based system using SYGFRAN's morpho-syntactic analysis for French, we select removable constituents. We discuss the results obtained on a short narrative text, which has been completely analyzed. This rises the problem of quantitative versus qualitative evaluation. Since our technique is highly dependant on the quality of syntactic analysis, summarizing through pruning seems intimately intermeshed with parsing evaluation.
Loading...