Une Méthode Incrémentale d'Extraction de Connaissances Didactiques sur le Web (Version Longue)

Pierre Pompidor 1 Michel Sala 1 Danièle Hérin 1
1 TATOO - Fouille de données environnementales
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
Résumé : Introduction Bien que les méthodes d'indexation de pages Web se soient notablement améliorées ces dernières années [GOOGLE 02], la pertinence des réponses fournies est loin d'être au niveau des attentes des internautes, et notamment des enseignants essayant d'y puiser matière pour leurs cours. Travaillant sur un projet de synthèse semi-automatique de connaissances extraites du Web, (et non préalablement annotées pour créer de nouveaux documents électroniques [LEVY 93]), nous nous sommes rapidement confrontés au double problème posé par l'imprécision, d'une part des requêtes que nous essayons de formuler, et d'autre part, par celle des réponses fournies par les moteurs de recherche interrogés. Dans ce but, nous avons développé un prototype qui interroge automatiquement, (et non manuellement comme dans [BLONDEL et al 02]), un ou plusieurs moteurs de recherche en utilisant des listes de mots clefs de plus en plus élaborées. Ces mots clefs sont incrémentalement intégrés dans une ontologie [GRUBER 93] qui représente également l'ossature du cours en cours de réalisation. Ces mots clefs sont extraits incrémentalement des pages analysées, hormis les tous premiers qui doivent être manuellement insérés dans l'ontologie initiale. L'analyse effectuée pour extraire ces mots clefs est réalisée à partir d'une base de patrons syntaxiques extraits de l'analyse de milliers de définitions de différents dictionnaires en ligne, et ne concerne que des motifs de définitions ou de spécialisations. Un brouillon de cours final est généré lorsque plus aucun nouveau mot clef n'est intégré à l'ontologie.
Document type :
Conference papers
Complete list of metadatas

Cited literature [4 references]  Display  Hide  Download

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00269621
Contributor : Christine Carvalho de Matos <>
Submitted on : Wednesday, September 4, 2019 - 1:47:21 PM
Last modification on : Wednesday, September 4, 2019 - 1:55:37 PM

File

Une_Methode_Incrementale_dExtr...
Files produced by the author(s)

Identifiers

  • HAL Id : lirmm-00269621, version 1

Collections

Citation

Pierre Pompidor, Michel Sala, Danièle Hérin. Une Méthode Incrémentale d'Extraction de Connaissances Didactiques sur le Web (Version Longue). SETIT: Sciences ElectroniquesTechnologies de l'Information et des Télécommunications, Mar 2003, Sousse, Tunisie. ⟨lirmm-00269621⟩

Share

Metrics

Record views

92

Files downloads

5