Terminology Extraction from Log Files

Hassan Saneifar 1, 2 Stéphane Bonniol 2 Anne Laurent 3 Pascal Poncelet 3 Mathieu Roche 4, *
* Auteur correspondant
3 TATOO - Fouille de données environnementales
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
4 TEXTE - Exploration et exploitation de données textuelles
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
Abstract : In many domains, the log files generated by digital systems contain important information on the conditions and configurations of systems. Information Extraction from these log files is an essential phase in information systems, which manage the production line. In the case of Integrated Circuit designs, log files generated by design tools are not exhaustively exploited. Although these log files are written in English, they usually do not respect the grammar and the structures of natural language. Moreover, such logs have a heterogeneous and evolving structure. According to features of such textual data, applying the classical methods of information extraction is not an easy task, more particularly for terminology extraction. In this paper, we thus introduce our approach Exterlog to extract the terminology from such log files. We also aim at knowing if POS tagging of such log files is a relevant approach for terminology extraction.
Liste complète des métadonnées

Littérature citée [12 références]  Voir  Masquer  Télécharger

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00383046
Contributeur : Mathieu Roche <>
Soumis le : vendredi 4 mai 2012 - 10:22:23
Dernière modification le : vendredi 19 octobre 2018 - 01:14:13
Document(s) archivé(s) le : dimanche 5 août 2012 - 02:20:09

Fichier

RR09010.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : lirmm-00383046, version 1

Collections

Citation

Hassan Saneifar, Stéphane Bonniol, Anne Laurent, Pascal Poncelet, Mathieu Roche. Terminology Extraction from Log Files. RR-09010, 2009, pp.16. 〈lirmm-00383046〉

Partager

Métriques

Consultations de la notice

293

Téléchargements de fichiers

231