Paralléliser sur un processeur à beaucoup de coeurs - LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier
Pré-Publication, Document De Travail Année : 2016

Paralléliser sur un processeur à beaucoup de coeurs

Résumé

Cet article montre que la parallélisation actuelle des applications par l'OS, à base de threads, est inefficace. Le coût architectural de la parallélisation pthread est mesuré et comparé au coût d'une parallélisation par le matériel. De plus, l'article montre aussi que les caches ne sont pas adaptés à la répartition des données que suppose la parallélisation. Il compare l'inefficacité de l'accès à une mémoire partagée à l'efficacité de l'élimination du stockage au profit du cal-cul redondant et du renommage total des sources et destinations. Enfin, l'article compare la complexité d'une parallélisation basée sur des threads non déterministes à la simplicité d'une parallélisation matérielle basée sur le déterminisme de l'ordre d'exécution séquentielle. Mots-clés : Parallélisation matérielle, processeur à beaucoup de coeurs, déterminisme, calcul redondant, renommage total.
Fichier principal
Vignette du fichier
compas2016_paper_2.pdf (149.94 Ko) Télécharger le fichier
Origine Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

lirmm-01330908 , version 1 (13-06-2016)

Identifiants

  • HAL Id : lirmm-01330908 , version 1

Citer

Djallal Rahmoune, Bernard Goossens, David Parello, Katarzyna Porada. Paralléliser sur un processeur à beaucoup de coeurs. 2016. ⟨lirmm-01330908⟩
231 Consultations
544 Téléchargements

Partager

More