Compression de phrases par élagage de leur arbre morpho-syntaxique. Une première application sur les phrases narratives.

Résumé : Nous proposons une technique de contraction de phrases qui se fonde sur l'étude de la fonction syntaxique et de la position dans l'arbre syntaxique des constituants des phrases. Nous définissons et analysons la perte de contenu et de cohérence discursive que la suppression de constituants engendre. Notre méthode de contraction s'oriente vers les textes narratifs. Nous sélectionnons les constituants à supprimer avec un système de règles utilisant les arbres et variables de l'analyse morpho-syntaxique de SYGFRAN. Nous commentons les résultats obtenus sur un texte narratif court, totalement analysé, ce qui nous mène à poser le problème de l'évaluation quantitative des résultats d'une telle approche, par opposition à des résultats qualitatifs. La technique dépendant très fortement de la qualité de l'analyse, la question de la compression par élagage apparaît comme intimement subordonnée à l'évaluation de l'analyse syntaxique. Abstract: We propose a sentence compression technique which uses constituents syntactic function and position in the sentence syntactic tree. We analyze contents and discourse consistency losses caused by deleting such constituents. We explain why our method works best with narrative texts. With a rule-based system using SYGFRAN's morpho-syntactic analysis for French, we select removable constituents. We discuss the results obtained on a short narrative text, which has been completely analyzed. This rises the problem of quantitative versus qualitative evaluation. Since our technique is highly dependant on the quality of syntactic analysis, summarizing through pruning seems intimately intermeshed with parsing evaluation.
Type de document :
Article dans une revue
Revue des Sciences et Technologies de l'Information - Série TSI : Technique et Science Informatiques, Lavoisier, 2006, 25 (4), pp.437-468
Liste complète des métadonnées

Littérature citée [41 références]  Voir  Masquer  Télécharger

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00122842
Contributeur : Violaine Prince-Barbier <>
Soumis le : vendredi 5 janvier 2007 - 11:03:56
Dernière modification le : jeudi 11 janvier 2018 - 06:26:53
Document(s) archivé(s) le : vendredi 21 septembre 2012 - 09:53:04

Identifiants

  • HAL Id : lirmm-00122842, version 1

Collections

Citation

Mehdi Yousfi-Monod, Violaine Prince. Compression de phrases par élagage de leur arbre morpho-syntaxique. Une première application sur les phrases narratives.. Revue des Sciences et Technologies de l'Information - Série TSI : Technique et Science Informatiques, Lavoisier, 2006, 25 (4), pp.437-468. 〈lirmm-00122842〉

Partager

Métriques

Consultations de la notice

269

Téléchargements de fichiers

1281