Un problème d'identification d'entités nommées dans des bases de donnés documentaires - LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier Access content directly
Reports (Research Report) Year : 2015

Un problème d'identification d'entités nommées dans des bases de donnés documentaires

Michel Chein
  • Function : Author
  • PersonId : 934405
Alain Gutierrez
Michel Leclère

Abstract

Ce rapport concerne la construction, la vérification et la réparation de liens d'égalité et de différence entre entités nommées dans des bases de données documentaires. Nous proposons une méthode générale que nous précisons dans le cas où les entités nommées sont des personnes. Le problème étudié peut être considéré comme un cas simple d'un problème fondamental du web sémantique ce-lui de la construction ou de la vérification de liens owl :sameAs et owl :differentFrom entre identifiants représentant des entités du monde extérieur. Un prototype, SudoQual, a été construit et a été évalué sur la base sudoc qui est le catalogue collectif de l'enseignement supérieur géré par l'Agence Bibliographique de l'Enseignement Supérieur.
Fichier principal
Vignette du fichier
SudoQual_1.pdf (901.62 Ko) Télécharger le fichier
Origin Files produced by the author(s)
Loading...

Dates and versions

lirmm-01187747 , version 1 (27-08-2015)

Identifiers

  • HAL Id : lirmm-01187747 , version 1

Cite

Michel Chein, Alain Gutierrez, Michel Leclère. Un problème d'identification d'entités nommées dans des bases de donnés documentaires. [Rapport de recherche] LIRMM. 2015. ⟨lirmm-01187747⟩
334 View
510 Download

Share

Gmail Mastodon Facebook X LinkedIn More