La quête du Graal et la réalité numérique
Résumé
Cet article présente un processus de fouille de données afin d'extraire des connaissances associées au motif de la parenté et de la famille dans un corpus en ancien français de la première moitié du XIIIe siècle. Après une numérisation puis un prétraitement des données fondé sur des techniques de TAL (Traitement Automatique du Langage), il a été procédé à une extraction de motifs séquentiels (enchaînements de voisinages de mots liés à la thématique traitée). Dans cet article, nous présentons les problèmes liés à la numérisation et aux traitements du texte. Puis, nous détaillons ce processus automatique et exhaustif et analysons les premiers résultats obtenus en procédant à l'étude précise d'un motif séquentiel dans différents textes du cycle Lancelot-Graal.
Origine | Fichiers produits par l'(les) auteur(s) |
---|
Loading...