Processus d'extraction et de validation de la terminologie issue de logs

Hassan Saneifar 1, 2 Stéphane Bonniol 2 Anne Laurent 3 Pascal Poncelet 3 Mathieu Roche 4
3 TATOO - Fouille de données environnementales
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
4 TEXTE - Exploration et exploitation de données textuelles
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
Résumé : Les fichiers logs issus des systèmes numériques contiennent des informations importantes concernant les conditions et les configurations de système. Dans le domaine de la conception de circuits intégrés, des fichiers logs sont produits par les outils de conception mais ne sont pas exploités de façon optimale. Les fichiers logs sont des données textuelles multi-source et multi-format qui ont des ont des structures hétérogènes et évolutives. Pour extraire de l'information à partir des logs, la création d'une ontologie du domaine est indispensable. Pourtant, selon les particularités de telles données textuelles, l'application des méthodes classiques de TALN afin d'extraire des termes du domaine qui seront utilisés dans l'ontologie n'est pas une tâche facile. Dans cet article, nous présentons notre approche Exterlog qui extrait la terminologie à partir des logs. Ici, nous étudions comment adapter les méthodes du TALN aux logs. Afin d'augmenter la précision des termes extraits, nous les favorisons en leur donnant un score basé sur le Web. Les expérimentations montrent que Exterlog obtient des résultats satisfaisants.
Type de document :
Communication dans un congrès
JFO'09 : 3èmes Journées Francophones sur les Ontologies, Poitiers, France. pp.1-10, 2009
Liste complète des métadonnées

Littérature citée [21 références]  Voir  Masquer  Télécharger

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00423951
Contributeur : Hassan Saneifar <>
Soumis le : mercredi 14 octobre 2009 - 16:49:11
Dernière modification le : jeudi 24 mai 2018 - 15:59:23
Document(s) archivé(s) le : mercredi 16 juin 2010 - 00:42:28

Fichier

JFO09-Saneifar.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : lirmm-00423951, version 1

Collections

Citation

Hassan Saneifar, Stéphane Bonniol, Anne Laurent, Pascal Poncelet, Mathieu Roche. Processus d'extraction et de validation de la terminologie issue de logs. JFO'09 : 3èmes Journées Francophones sur les Ontologies, Poitiers, France. pp.1-10, 2009. 〈lirmm-00423951〉

Partager

Métriques

Consultations de la notice

289

Téléchargements de fichiers

312