Prediction of Missing Semantic Relations in Lexical-Semantic Network using Random Forest Classifier - LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier Accéder directement au contenu
Communication Dans Un Congrès Année : 2019

Prediction of Missing Semantic Relations in Lexical-Semantic Network using Random Forest Classifier

Résumé

This study focuses on the prediction of missing six semantic relations (such as is_a and has_part) between two given nodes in RezoJDM a French lexical-semantic network. The output of this prediction is a set of pairs in which the first entries are semantic relations and the second entries are the probabilities of existence of such relations. Due to the statement of the problem we choose the random forest (RF) predictor classifier approach to tackle this problem. We take for granted the existing semantic relations, for training/test dataset, gathered and validated by crowdsourcing. We describe how all of the mentioned ideas can be followed after using the node2vec approach in the feature extraction phase. We show how this approach can lead to acceptable results.
Cette étude porte sur la prédiction de six relations sémantiques manquantes (telles que is_a et has_part) entre deux noeuds de RezoJDM, un réseau lexico-sémantique pour le français. Le résultat de cette prédiction est un ensemble de paires dans lesquelles les premières entrées sont des relations sémantiques et les secondes sont les probabilités d'existence de la relation. En raison de l'énoncé du problème, nous avons choisi d'utiliser un classifieur de forêt aléatoire pour le résoudre. Nous exploitons RezoJDM pour en extraire les relations sémantiques et construire nos données d'entraînement/test. Nous expliquons en quoi les idées développées peuvent être utilisées après l'utilisation de l'approche node2vec dans la phase de feature extraction. Nous montrons finalement comment cette approche conduit à des résultats prometteurs. Mots-clés. Apprentissage automatique, apprentissage supervisé, prédiction de relations sémantiques, classifieur de forêts aléatoires, réseau lexico-sémantique, traitement du langage naturel.
Fichier principal
Vignette du fichier
paper_Cousot__Mirzapour_Ragheb_PRAXILING2019.pdf (393.95 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-02356649 , version 1 (08-11-2019)

Identifiants

Citer

Kévin Cousot, Mehdi Mirzapour, Waleed Ragheb. Prediction of Missing Semantic Relations in Lexical-Semantic Network using Random Forest Classifier. CJC PRAXILING 2019, Nov 2019, Montpellier, France. ⟨hal-02356649⟩
85 Consultations
42 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More