Implementation and Efficiency of Reproducible Level 1 BLAS - LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier Accéder directement au contenu
Rapport (Rapport De Recherche) Année : 2015

Implementation and Efficiency of Reproducible Level 1 BLAS

Résumé

Numerical reproducibility failures appear in massively parallel floating-point computations. One way to guarantee this reproducibility is to extend the IEEE-754 correct rounding to larger computing sequences, e.g. to the BLAS. Is the extra cost for numerical reproducibility acceptable in practice? We present solutions and experiments for the level 1 BLAS. We detail optimized implementations and we conclude about their efficiency.
Fichier principal
Vignette du fichier
15 pages.pdf (453.11 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

lirmm-01179986 , version 1 (23-07-2015)

Identifiants

  • HAL Id : lirmm-01179986 , version 1

Citer

Chemseddine Chohra, Philippe Langlois, David Parello. Implementation and Efficiency of Reproducible Level 1 BLAS. [Research Report] DALI - UPVD/LIRMM, UCD. 2015. ⟨lirmm-01179986⟩
233 Consultations
669 Téléchargements

Partager

Gmail Facebook X LinkedIn More