Rapport (Rapport De Recherche) Année : 2015

Un problème d'identification d'entités nommées dans des bases de donnés documentaires

Résumé

Ce rapport concerne la construction, la vérification et la réparation de liens d'égalité et de différence entre entités nommées dans des bases de données documentaires. Nous proposons une méthode générale que nous précisons dans le cas où les entités nommées sont des personnes. Le problème étudié peut être considéré comme un cas simple d'un problème fondamental du web sémantique ce-lui de la construction ou de la vérification de liens owl :sameAs et owl :differentFrom entre identifiants représentant des entités du monde extérieur. Un prototype, SudoQual, a été construit et a été évalué sur la base sudoc qui est le catalogue collectif de l'enseignement supérieur géré par l'Agence Bibliographique de l'Enseignement Supérieur.

Fichier principal
Vignette du fichier
SudoQual_1.pdf (901.62 Ko) Télécharger le fichier
Origine Fichiers produits par l'(les) auteur(s)
Licence
Loading...

Dates et versions

lirmm-01187747 , version 1 (27-08-2015)

Licence

Identifiants

  • HAL Id : lirmm-01187747 , version 1

Citer

Michel Chein, Alain Gutierrez, Michel Leclère. Un problème d'identification d'entités nommées dans des bases de donnés documentaires. [Rapport de recherche] LIRMM. 2015. ⟨lirmm-01187747⟩
491 Consultations
712 Téléchargements

Partager

  • More