Un problème d'identification d'entités nommées dans des bases de donnés documentaires

Michel Chein 1 Alain Gutierrez 1 Michel Leclère 1
1 GRAPHIK - Graphs for Inferences on Knowledge
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier, CRISAM - Inria Sophia Antipolis - Méditerranée
Résumé : Ce rapport concerne la construction, la vérification et la réparation de liens d'égalité et de différence entre entités nommées dans des bases de données documentaires. Nous proposons une méthode générale que nous précisons dans le cas où les entités nommées sont des personnes. Le problème étudié peut être considéré comme un cas simple d'un problème fondamental du web sémantique ce-lui de la construction ou de la vérification de liens owl :sameAs et owl :differentFrom entre identifiants représentant des entités du monde extérieur. Un prototype, SudoQual, a été construit et a été évalué sur la base sudoc qui est le catalogue collectif de l'enseignement supérieur géré par l'Agence Bibliographique de l'Enseignement Supérieur.
Complete list of metadatas

Cited literature [7 references]  Display  Hide  Download

https://hal-lirmm.ccsd.cnrs.fr/lirmm-01187747
Contributor : Michel Chein <>
Submitted on : Thursday, August 27, 2015 - 3:23:16 PM
Last modification on : Wednesday, June 5, 2019 - 11:58:13 AM
Long-term archiving on : Saturday, November 28, 2015 - 10:33:28 AM

File

SudoQual_1.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : lirmm-01187747, version 1

Collections

Citation

Michel Chein, Alain Gutierrez, Michel Leclère. Un problème d'identification d'entités nommées dans des bases de donnés documentaires. [Rapport de recherche] LIRMM. 2015. ⟨lirmm-01187747⟩

Share

Metrics

Record views

413

Files downloads

672