Paralléliser sur un processeur à beaucoup de coeurs

Djallal Rahmoune 1 Bernard Goossens 1 David Parello 1 Katarzyna Porada 1
1 DALI - Digits, Architectures et Logiciels Informatiques
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier, UPVD - Université de Perpignan Via Domitia
Résumé : Cet article montre que la parallélisation actuelle des applications par l'OS, à base de threads, est inefficace. Le coût architectural de la parallélisation pthread est mesuré et comparé au coût d'une parallélisation par le matériel. De plus, l'article montre aussi que les caches ne sont pas adaptés à la répartition des données que suppose la parallélisation. Il compare l'inefficacité de l'accès à une mémoire partagée à l'efficacité de l'élimination du stockage au profit du cal-cul redondant et du renommage total des sources et destinations. Enfin, l'article compare la complexité d'une parallélisation basée sur des threads non déterministes à la simplicité d'une parallélisation matérielle basée sur le déterminisme de l'ordre d'exécution séquentielle. Mots-clés : Parallélisation matérielle, processeur à beaucoup de coeurs, déterminisme, calcul redondant, renommage total.
Type de document :
Pré-publication, Document de travail
2016
Liste complète des métadonnées

Littérature citée [4 références]  Voir  Masquer  Télécharger

https://hal-lirmm.ccsd.cnrs.fr/lirmm-01330908
Contributeur : David Parello <>
Soumis le : lundi 13 juin 2016 - 11:00:06
Dernière modification le : mardi 10 octobre 2017 - 11:01:51

Fichier

compas2016_paper_2.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : lirmm-01330908, version 1

Collections

Citation

Djallal Rahmoune, Bernard Goossens, David Parello, Katarzyna Porada. Paralléliser sur un processeur à beaucoup de coeurs. 2016. 〈lirmm-01330908〉

Partager

Métriques

Consultations de
la notice

87

Téléchargements du document

175