Une Méthode Incrémentale d'Extraction de Connaissances Didactiques sur le Web (Version Longue)

Pierre Pompidor; Michel Sala; Danièle Hérin

Communication Dans Un Congrès Année : 2003

Une Méthode Incrémentale d'Extraction de Connaissances Didactiques sur le Web (Version Longue)

(1) , (1) , (1)

Pierre Pompidor

Fonction : Auteur
PersonId : 170558
IdHAL : pierre-pompidor
ORCID : 0000-0001-5466-5137

Fouille de données environnementales

Michel Sala

Fonction : Auteur
PersonId : 938397

Fouille de données environnementales

Danièle Hérin

Fonction : Auteur
PersonId : 938400

Fouille de données environnementales

Résumé

Introduction Bien que les méthodes d'indexation de pages Web se soient notablement améliorées ces dernières années [GOOGLE 02], la pertinence des réponses fournies est loin d'être au niveau des attentes des internautes, et notamment des enseignants essayant d'y puiser matière pour leurs cours. Travaillant sur un projet de synthèse semi-automatique de connaissances extraites du Web, (et non préalablement annotées pour créer de nouveaux documents électroniques [LEVY 93]), nous nous sommes rapidement confrontés au double problème posé par l'imprécision, d'une part des requêtes que nous essayons de formuler, et d'autre part, par celle des réponses fournies par les moteurs de recherche interrogés. Dans ce but, nous avons développé un prototype qui interroge automatiquement, (et non manuellement comme dans [BLONDEL et al 02]), un ou plusieurs moteurs de recherche en utilisant des listes de mots clefs de plus en plus élaborées. Ces mots clefs sont incrémentalement intégrés dans une ontologie [GRUBER 93] qui représente également l'ossature du cours en cours de réalisation. Ces mots clefs sont extraits incrémentalement des pages analysées, hormis les tous premiers qui doivent être manuellement insérés dans l'ontologie initiale. L'analyse effectuée pour extraire ces mots clefs est réalisée à partir d'une base de patrons syntaxiques extraits de l'analyse de milliers de définitions de différents dictionnaires en ligne, et ne concerne que des motifs de définitions ou de spécialisations. Un brouillon de cours final est généré lorsque plus aucun nouveau mot clef n'est intégré à l'ontologie.

Domaines

Informatique [cs]

Fichier principal

Une_Methode_Incrementale_dExtraction_de_Connaissa.pdf (132.99 Ko)

Origine	Fichiers produits par l'(les) auteur(s)

Christine Carvalho De Matos : Connectez-vous pour contacter le contributeur

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00269621

Soumis le : mercredi 4 septembre 2019-13:47:21

Dernière modification le : vendredi 24 mars 2023-14:53:12

Archivage à long terme le : jeudi 6 février 2020-09:26:04

Dates et versions

lirmm-00269621 , version 1 (04-09-2019)

Identifiants

HAL Id : lirmm-00269621 , version 1

Citer

Pierre Pompidor, Michel Sala, Danièle Hérin. Une Méthode Incrémentale d'Extraction de Connaissances Didactiques sur le Web (Version Longue). SETIT: Sciences ElectroniquesTechnologies de l'Information et des Télécommunications, Mar 2003, Sousse, Tunisie. ⟨lirmm-00269621⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS LIRMM MIPS UNIV-MONTPELLIER

87 Consultations

23 Téléchargements

Une Méthode Incrémentale d'Extraction de Connaissances Didactiques sur le Web (Version Longue)

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager