Paralléliser sur un processeur à beaucoup de coeurs
Abstract
Cet article montre que la parallélisation actuelle des applications par l'OS, à base de threads, est inefficace. Le coût architectural de la parallélisation pthread est mesuré et comparé au coût d'une parallélisation par le matériel. De plus, l'article montre aussi que les caches ne sont pas adaptés à la répartition des données que suppose la parallélisation. Il compare l'inefficacité de l'accès à une mémoire partagée à l'efficacité de l'élimination du stockage au profit du cal-cul redondant et du renommage total des sources et destinations. Enfin, l'article compare la complexité d'une parallélisation basée sur des threads non déterministes à la simplicité d'une parallélisation matérielle basée sur le déterminisme de l'ordre d'exécution séquentielle. Mots-clés : Parallélisation matérielle, processeur à beaucoup de coeurs, déterminisme, calcul redondant, renommage total.
Origin | Files produced by the author(s) |
---|
Loading...