Une étude comparative diachronique du féminisme
Résumé
L'analyse des corpus de l'oral transcrit note une série de phénomènes qui perturbe le traitement automatique. Cet article présente une contribution qui vise à identifier automatiquement des phénomènes complexes qui composent une interaction (remerciements, conflits, plaisanteries familières, ...). L'objectif de ce travail est de proposer de nouveaux instruments permettant d'enrichir les outils d'analyse et d'interrogation en ligne de CLAPI (Corpus de Langue parlée en Interaction). Les difficultés de l'analyse de l'oral afin d'en extraire les séquences nous ont conduit à mettre en œuvre et à nous approprier de nombreuses techniques informatiques très diverses: fouille de données, traitement de la langue naturelle etc. Ces techniques ont été intégrées au sein d'une architecture de traitement originale qui a permis de détecter les séquences argumentatives pour l'oral transcrit. Ces résultats ont été évalués et validés par un expert linguistique du domaine.