Intégration de données hétérogènes et imprécises guidée par une ressource termino-ontologique
Abstract
In this paper we present some issues of knowledge engineering in the field of life sciences and, as an illustration, a data integration system opened on the Web, called ONDINE (Ontology based Data INtEgration), which proposes a complete workflow to extract, to seman- tically annotate and to query data from tables found in scientific documents from the Web. The core and key element of ONDINE is an Ontological and Terminological Resource (OTR) allo- wing the modeling of n-ary relations; concepts from this OTR are used to annotate tables. First we present the OTR model, then the semi-automatic method for semantic annotation of tables guided by this OTR, and finally our software system, @Web (Annotating Tables from the Web), designed to semantically annotate tables.
Cet article présente les enjeux de l'ingénierie des connaissances dans le domaine des sciences du vivant et, à titre d'illustration, un système d'intégration de données thématiques ouvert sur le Web, appelé ONDINE (Ontology based Data INtEgration). Ce système propose un processus complet d'acquisition, d'annotation sémantique et d'interrogation de données à partir de tableaux trouvés dans des documents scientifiques issus du Web. L'élément central du système ONDINE est une Ressource Termino-Ontologique (RTO) qui permet la représentation de relations n-aires et dont les concepts sont utilisés pour annoter des tableaux de données. Nous présentons le modèle de la RTO, la méthode d'annotation semi-automatique de tableaux de données guidée par cette RTO, puis le logiciel @Web (Annotating Tables from the Web) d'annotation sémantique de tableaux.
Loading...