La quête du Graal et la réalité numérique

Claire Serp 1 Anne Laurent 2 Mathieu Roche 3 Maguelonne Teisseire 2
2 TATOO - Fouille de données environnementales
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
3 TEXTE - Exploration et exploitation de données textuelles
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
Résumé : Cet article présente un processus de fouille de données afin d'extraire des connaissances associées au motif de la parenté et de la famille dans un corpus en ancien français de la première moitié du XIIIe siècle. Après une numérisation puis un prétraitement des données fondé sur des techniques de TAL (Traitement Automatique du Langage), il a été procédé à une extraction de motifs séquentiels (enchaînements de voisinages de mots liés à la thématique traitée). Dans cet article, nous présentons les problèmes liés à la numérisation et aux traitements du texte. Puis, nous détaillons ce processus automatique et exhaustif et analysons les premiers résultats obtenus en procédant à l'étude précise d'un motif séquentiel dans différents textes du cycle Lancelot-Graal.
Complete list of metadatas

Cited literature [11 references]  Display  Hide  Download

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00321406
Contributor : Mathieu Roche <>
Submitted on : Sunday, September 14, 2008 - 12:44:28 AM
Last modification on : Thursday, June 6, 2019 - 2:46:24 PM
Long-term archiving on : Thursday, June 3, 2010 - 9:24:30 PM

File

Serp-revu9.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : lirmm-00321406, version 1

Citation

Claire Serp, Anne Laurent, Mathieu Roche, Maguelonne Teisseire. La quête du Graal et la réalité numérique. Corpus, Bases, Corpus, Langage - UMR 7320, 2008, 7, pp.173-189. ⟨lirmm-00321406⟩

Share

Metrics

Record views

257

Files downloads

287