Processus d'extraction et de validation de la terminologie issue de logs
Abstract
Les fichiers logs issus des systèmes numériques contiennent des informations importantes concernant les conditions et les configurations de système. Dans le domaine de la conception de circuits intégrés, des fichiers logs sont produits par les outils de conception mais ne sont pas exploités de façon optimale. Les fichiers logs sont des données textuelles multi-source et multi-format qui ont des ont des structures hétérogènes et évolutives. Pour extraire de l'information à partir des logs, la création d'une ontologie du domaine est indispensable. Pourtant, selon les particularités de telles données textuelles, l'application des méthodes classiques de TALN afin d'extraire des termes du domaine qui seront utilisés dans l'ontologie n'est pas une tâche facile. Dans cet article, nous présentons notre approche Exterlog qui extrait la terminologie à partir des logs. Ici, nous étudions comment adapter les méthodes du TALN aux logs. Afin d'augmenter la précision des termes extraits, nous les favorisons en leur donnant un score basé sur le Web. Les expérimentations montrent que Exterlog obtient des résultats satisfaisants.
Origin | Files produced by the author(s) |
---|
Loading...