Implementation and Efficiency of Reproducible Level 1 BLAS

Chemseddine Chohra 1 Philippe Langlois 1 David Parello 1
1 DALI - Digits, Architectures et Logiciels Informatiques
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier, UPVD - Université de Perpignan Via Domitia
Abstract : Numerical reproducibility failures appear in massively parallel floating-point computations. One way to guarantee this reproducibility is to extend the IEEE-754 correct rounding to larger computing sequences, e.g. to the BLAS. Is the extra cost for numerical reproducibility acceptable in practice? We present solutions and experiments for the level 1 BLAS. We detail optimized implementations and we conclude about their efficiency.
Liste complète des métadonnées


https://hal-lirmm.ccsd.cnrs.fr/lirmm-01179986
Contributeur : Philippe Langlois <>
Soumis le : jeudi 23 juillet 2015 - 16:43:08
Dernière modification le : vendredi 9 juin 2017 - 10:41:44
Document(s) archivé(s) le : samedi 24 octobre 2015 - 11:44:20

Fichier

15 pages.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : lirmm-01179986, version 1

Collections

Citation

Chemseddine Chohra, Philippe Langlois, David Parello. Implementation and Efficiency of Reproducible Level 1 BLAS. [Research Report] DALI - UPVD/LIRMM, UCD. 2015. <lirmm-01179986>

Partager

Métriques

Consultations de
la notice

145

Téléchargements du document

591