Extraction automatique des mots-clés à partir de publications scientifiques pour l’indexation et l’ouverture des données en agronomie

Résumé : Dans le contexte des masses de données textuelles liées à l’agriculture aujourd’hui disponibles, leur indexation devient un enjeu crucial pour les organismes de recherche. Une manière d’indexer au mieux les documents consiste à en extraire la terminologie. Cet article explore l’utilisation et la combinaison de méthodologies de fouille de textes afin de mettre en exergue, puis de publier dans des systèmes d’open data, les termes les plus adaptés issus de documents. Des expérimentations menées sur des données du CIRAD (Centre de coopération internationale en recherche agronomique pour le développement), montrent le bien-fondé de la démarche qui a permis d’extraire des termes à la fois nouveaux et pertinents.
Liste complète des métadonnées

Littérature citée [16 références]  Voir  Masquer  Télécharger

https://hal-lirmm.ccsd.cnrs.fr/lirmm-01228700
Contributeur : Mathieu Roche <>
Soumis le : vendredi 13 novembre 2015 - 15:52:58
Dernière modification le : lundi 22 octobre 2018 - 09:54:03
Document(s) archivé(s) le : vendredi 28 avril 2017 - 20:30:48

Fichier

Roche_CA_2015.pdf
Fichiers éditeurs autorisés sur une archive ouverte

Identifiants

Citation

Mathieu Roche, Sophie Fortuno, Juan Antonio Lossio-Ventura, Amira Akli, Salim Belkebir, et al.. Extraction automatique des mots-clés à partir de publications scientifiques pour l’indexation et l’ouverture des données en agronomie. Cahiers Agricultures, EDP Sciences, 2015, 24 (5), pp.313-320. 〈http://www.jle.com/fr/revues/agr/e-docs/extraction_automatique_des_mots_cles_a_partir_de_publications_scientifiques_pour_lindexation_et_louverture_des_donnees_en_agronomie_305587/article.phtml〉. 〈10.1684/agr.2015.0773〉. 〈lirmm-01228700〉

Partager

Métriques

Consultations de la notice

301

Téléchargements de fichiers

232