Une grande collecte de SMS authentiques en français : démarche, remarques et conseils

Résumé : En 2011, à Montpellier, un groupe de six universitaires linguistes et informaticiens (Rachel Panckhurst, Catherine Détrie, Cédric Lopez, Claudine Moïse, Mathieu Roche et Bertrand Verine) a décidé d'effectuer un recueil de SMS authentiques, en français, auprès du grand public, dans le respect des règles juridiques en vigueur. La collecte, qui a duré trois mois, s'est déroulée dans le cadre d'un projet intitulé sud4science LR (www.sud4science.org) et a permis de recueillir plus de 90 000 SMS (Panckhurst et al., 2013; Panckhurst, 2013; Panckhurst & Moïse, 2014). Après un travail très important de vérification, d'épuration et d'anonymisation des données par 8 stagiaires étudiants (à partir de soutiens de la MSH-M [Maison des Sciences de l'Homme de Montpellier], de la DGLFLF [Délégation générale à la langue française et aux langues de France] et du CNRS [PEPS ECOMESS, HuMaIn]), sur une période conséquente de 21 mois, les quelque 88 000 SMS restants ont été organisés en un corpus, intitulé 88milSMS. Depuis fin juin 2014, notre corpus est disponible sur la grille de services d'Huma-Num : http://88milsms.huma-num.fr/ (Panckhurst et al. 2014a, 2014b). Notre projet fait partie d'un grand projet international lancé en Belgique en 2004, sms4science, (www.sms4science.org, Fairon et al., 2006 ; Cougnon, 2014 ; Cougnon et Fairon, éd. 2014), qui avait un triple objectif : recueillir, organiser et analyser des SMS authentiques.
Type de document :
Article dans une revue
Le français à l'université, Agence universitaire de la Francophonie, 2014, 19 (3), 〈http://www.bulletin.auf.org/index.php?id=1865〉
Liste complète des métadonnées

https://hal-lirmm.ccsd.cnrs.fr/lirmm-01068084
Contributeur : Mathieu Roche <>
Soumis le : mercredi 24 septembre 2014 - 18:59:53
Dernière modification le : lundi 22 octobre 2018 - 09:54:03

Identifiants

  • HAL Id : lirmm-01068084, version 1

Citation

Rachel Panckhurst, Catherine Détrie, Cédric Lopez, Claudine Moïse, Mathieu Roche, et al.. Une grande collecte de SMS authentiques en français : démarche, remarques et conseils. Le français à l'université, Agence universitaire de la Francophonie, 2014, 19 (3), 〈http://www.bulletin.auf.org/index.php?id=1865〉. 〈lirmm-01068084〉

Partager

Métriques

Consultations de la notice

291