Indexation et apprentissage de termes et de relations à partir de comptes rendus de radiologie - LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier
Thèse Année : 2016

Indexation and learning of terms and relations from reports of radiology

Indexation et apprentissage de termes et de relations à partir de comptes rendus de radiologie

Résumé

In the medical field, the computerization of health professions and the development of the personal medical file (DMP) results in a fast increase in the volume of medical digital information. The need to convert and manipulate all this information in a structured form is a major challenge. This is the starting point for the development of appropriate tools where the methods from the natural language processing (NLP) seem well suited. The work of this thesis are within the field of analysis of medical documents and address the issue of representing biomedical information (especially the radiology area) and its access. We propose to build a knowledge base dedicated to radiology within a general knowledge base (lexical-semantic network JeuxDeMots). We show the interest of the hypothesis of no separation between different types of knowledge through a document analysis. This hypothesis is that the use of general knowledge, in addition to specialized, significantly improves the analysis of medical documents. At the level of lexical-semantic network, manual and automated addition of meta information on annotations (frequency information, pertinence, etc.) is particularly useful. This network combines weight and annotations on typed relationships between terms and concepts as well as an inference mechanism which aims to improve quality and network coverage. We describe how from semantic information in the network, it is possible to define an increase in gross index built for each records to improve information retrieval. We present then a method on extracting semantic relationships between terms or concepts. This extraction is performed using lexical patterns to which we added semantic constraints. The results show that the hypothesis of no separation between different types of knowledge improves the relevance of indexing. The index increase results in an improved return while semantic constraints improve the accuracy of the extraction of relations.
Dans le domaine médical, l’informatisation des professions de santé et le développement du dossier médical personnel (DMP) entraîne une progression rapide du volume d’information médicale numérique. Le besoin de convertir et de manipuler toute ces informations sous une forme structurée constitue un enjeu majeur. C’est le point de départ de la mise au point d’outils d’interrogation appropriés pour lesquels, les méthodes issues du traitement automatique du langage naturel (TALN) semblent bien adaptées. Les travaux de cette thèse s’inscrivent dans le domaine de l’analyse de documents médicaux et traitent de la problématique de la représentation de l’information biomédicale et de son accès. Nous proposons de construire une base de connaissances dédiée à la radiologie à l’intérieur d’une base de connaissance générale (réseau lexico-sémantique JeuxDeMots). Nous montrons l’intérêt de l’hypothèse de non séparation entre les différents types de connaissances dans le cadre d’une analyse de documents. Cette hypothèse est que l’utilisation de connaissances générales, en plus de celles de spécialité, permet d’améliorer significativement l’analyse des documents médicaux. Au niveau du réseau lexico-sémantique, l’ajout manuel et automatisébndes méta-informations sur les annotations est particulièrement utile. Ce réseau combine poids et annotations sur des relations typées entre des termes et des concepts ainsi qu’un mécanisme d’inférence dont l’objet est d’améliorer la qualité et la couverture du réseau. Nous décrivons comment à partir d’informations sémantiques présentes dans le réseau, il est possible de définir une augmentation des index bruts construits pour chaque comptes rendus afin d’améliorer la recherche documentaire. Nous présentons, ensuite, une méthode d’extraction de relations sémantiques entre des termes ou concepts. Cette extraction est réalisée à l’aide de patrons linguistiques auxquels nous avons rajouté des contraintes sémantiques. Les résultats des évaluations montrent que l’hypothèse de non séparation entre les différents types de connaissances améliore la pertinence de l’indexation.
Fichier principal
Vignette du fichier
these finale.pdf (3.77 Mo) Télécharger le fichier

Dates et versions

tel-01479769 , version 1 (28-02-2017)
tel-01479769 , version 2 (05-06-2018)

Identifiants

  • HAL Id : tel-01479769 , version 1

Citer

Lionel Ramadier. Indexation et apprentissage de termes et de relations à partir de comptes rendus de radiologie. Intelligence artificielle [cs.AI]. Université de Montpellier, 2016. Français. ⟨NNT : ⟩. ⟨tel-01479769v1⟩
399 Consultations
1089 Téléchargements

Partager

More