Cas d’études de calculs parallèles numériquement reproductibles
Résumé
La non-associativité de l'addition de l'arithmétique à virgule flottante IEEE-754 est la cause principale de non-reproductibilité numérique du calcul parallèle. Ainsi le debugging, la validation ou la certification, de la simulation numérique de phénomènes physiques complexes réalisée sur calculateurs massivement parallèles, sont remis en question. En tant qu'arithméticiens des ordinateurs, nous traitons deux questions : l'une relative à la faisabilité d'une correction de ce problème, l'autre à son efficacité.
- Est-ce que les techniques existantes permettent de retrouver la reproductibilité numérique de codes de simulation numérique d'échelle industrielle ?
- Est-ce les algorithmes de sommation correctement arrondies permettent d'obtenir des BLAS parallèle reproductible et efficaces ?
Nous montrons comment des techniques de compensation arithmétiques permettent d'obtenir la reproductibilité de deux modules du code d'hydrodynamique open Telemac-Mascaret basés sur des éléments finis, de la décomposition de domaine et une résolution par gradient conjugué.
Nous illustrons comment des algorithmes récents permettent d'implanter des BLAS 1 pour un sur-coût en temps de calcul très raisonnable par rapport aux meilleures solutions non reproductibles (Intel MKL).
Origine | Fichiers produits par l'(les) auteur(s) |
---|
Loading...