Processus d'extraction et de validation de la terminologie issue de logs - LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier
Conference Papers Year : 2009

Processus d'extraction et de validation de la terminologie issue de logs

Abstract

Les fichiers logs issus des systèmes numériques contiennent des informations importantes concernant les conditions et les configurations de système. Dans le domaine de la conception de circuits intégrés, des fichiers logs sont produits par les outils de conception mais ne sont pas exploités de façon optimale. Les fichiers logs sont des données textuelles multi-source et multi-format qui ont des ont des structures hétérogènes et évolutives. Pour extraire de l'information à partir des logs, la création d'une ontologie du domaine est indispensable. Pourtant, selon les particularités de telles données textuelles, l'application des méthodes classiques de TALN afin d'extraire des termes du domaine qui seront utilisés dans l'ontologie n'est pas une tâche facile. Dans cet article, nous présentons notre approche Exterlog qui extrait la terminologie à partir des logs. Ici, nous étudions comment adapter les méthodes du TALN aux logs. Afin d'augmenter la précision des termes extraits, nous les favorisons en leur donnant un score basé sur le Web. Les expérimentations montrent que Exterlog obtient des résultats satisfaisants.
Fichier principal
Vignette du fichier
JFO09-Saneifar.pdf (245.3 Ko) Télécharger le fichier
Origin Files produced by the author(s)
Loading...

Dates and versions

lirmm-00423951 , version 1 (14-10-2009)

Identifiers

  • HAL Id : lirmm-00423951 , version 1

Cite

Hassan Saneifar, Stéphane Bonniol, Anne Laurent, Pascal Poncelet, Mathieu Roche. Processus d'extraction et de validation de la terminologie issue de logs. JFO 2009 - 3e Journées Francophones sur les Ontologies, Dec 2009, Poitiers, France. pp.1-10. ⟨lirmm-00423951⟩
211 View
331 Download

Share

More