Enrichissement d'ontologie : Quand les motifs séquentiels labellisent des relations
Résumé
Le développement du Web et l'explosion de la quantité d'informations stockées ont conduit à l'adoption de formalismes destinés à faciliter la gestion des connaissances. Ainsi, les ontologies sont devenues les méta-données de référence dans le contexte du Web Sémantique. Cependant, la pertinence des informations qu'elles contiennent repose sur une mise-à-jour régulière sous peine d'obsolescence. Actuellement, ces enrichissements sont souvent réalisés de façon manuelle et posent le problème de la subjectivité de l'expert. Plusieurs travaux se sont donc intéressés au développement d'outils pour l'ajout de connaissances dans ce type de structure grâce à l'analyse de documents textuels. Toutefois, aucune de ces propositions ne permet d'identifier précisément certaines connaissances spécifiques : les relations pouvant exister entre des éléments de l'ontologie. C'est pourquoi nous proposons d'utiliser des techniques de fouille de données et plus particulièrement la recherche de motifs séquentiels afin de mettre en oeuvre une démarche automatique. Celle-ci est basée sur l'identification des termes des documents sources et la définition de règles d'association labellisées extraites obtenues à partir des motifs séquentiels. Dans cet article, nous décrivons l'ensemble du processus et nous définissons des mesures de pertinence et de voisinage. Nous présentons également les algorithmes associés. Les expérimentations sur un jeu de données réelles soulignent la pertinence de notre proposition et ouvrent de nombreuses perspectives.