Processus d'extraction et de validation de la terminologie issue de logs

Hassan Saneifar 1, 2 Stéphane Bonniol 2 Anne Laurent 3 Pascal Poncelet 3 Mathieu Roche 4
3 TATOO - Fouille de données environnementales
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
4 TEXTE - Exploration et exploitation de données textuelles
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
Résumé : Les fichiers logs issus des systèmes numériques contiennent des informations importantes concernant les conditions et les configurations de système. Dans le domaine de la conception de circuits intégrés, des fichiers logs sont produits par les outils de conception mais ne sont pas exploités de façon optimale. Les fichiers logs sont des données textuelles multi-source et multi-format qui ont des ont des structures hétérogènes et évolutives. Pour extraire de l'information à partir des logs, la création d'une ontologie du domaine est indispensable. Pourtant, selon les particularités de telles données textuelles, l'application des méthodes classiques de TALN afin d'extraire des termes du domaine qui seront utilisés dans l'ontologie n'est pas une tâche facile. Dans cet article, nous présentons notre approche Exterlog qui extrait la terminologie à partir des logs. Ici, nous étudions comment adapter les méthodes du TALN aux logs. Afin d'augmenter la précision des termes extraits, nous les favorisons en leur donnant un score basé sur le Web. Les expérimentations montrent que Exterlog obtient des résultats satisfaisants.
Document type :
Conference papers
Complete list of metadatas

Cited literature [21 references]  Display  Hide  Download

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00423951
Contributor : Hassan Saneifar <>
Submitted on : Wednesday, October 14, 2009 - 4:49:11 PM
Last modification on : Friday, October 19, 2018 - 1:14:11 AM
Long-term archiving on : Wednesday, June 16, 2010 - 12:42:28 AM

File

JFO09-Saneifar.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : lirmm-00423951, version 1

Collections

Citation

Hassan Saneifar, Stéphane Bonniol, Anne Laurent, Pascal Poncelet, Mathieu Roche. Processus d'extraction et de validation de la terminologie issue de logs. JFO'09 : 3èmes Journées Francophones sur les Ontologies, Poitiers, France. pp.1-10. ⟨lirmm-00423951⟩

Share

Metrics

Record views

337

Files downloads

364