Skip to Main content Skip to Navigation
Theses

Supporting User Steering In Large-Scale Workflows With Provenance Data

Renan Souza 1, 2, 3
3 ZENITH - Scientific Data Management
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier, CRISAM - Inria Sophia Antipolis - Méditerranée
Résumé : Les workflows en Computational Science and Engineering (CSE) sont à grande échelle, nécessitent de hautes performances en HPC, et ont le caractère exploratoire de la science. Pendant l'exécution, qui dure souvent des heures ou des jours, l'utilisateur doit diriger le workflow en l'analysant dynamiquement et en l'adaptant pour en améliorer la qualité des résultats ou pour réduire le temps d'exécution. Toutefois, pour piloter le workflow, les utilisateurs effectuent généralement plusieurs interactions (appelées actions de pilotage de l'utilisateur), qui ont besoin d'être suivies. Sinon, les utilisateurs ont des difficultés à comprendre comment et ce qu'il faut faire. Et il peut être difficile d'expliquer les résultats qui étaient les conséquences de leurs actions, et il peut être impossible de reproduire les résultats. Cette thèse aborde ce problème en proposant une approche qui définit les concepts fondamentaux pour l'action de pilotage de l'utilisateur ; introduit la notion de provenance d'actions de pilotage ; et propose un diagramme de données conforme au W3C PROV. De plus, on présente le système pour permettre la gestion des données d'action de pilotage par la capture, établir un lien explicite entre les actions et le reste des données du workflow, et stocker celles-ci de manière efficace. Deux exemples de cette approche ont été conçus et construits : l'un est un outil léger à brancher dans des scripts parallèles et l'autre est à utiliser dans un système de gestion de workflow parallèle, qui sont les deux façons typiques de mener des expériences en CSE dans le domaine du calcul haute performance. Avec des cas d'utilisation réels dans l'industrie pétrolière et gazière, les expériences montrent que l'approche proposée permet aux utilisateurs de comprendre comment leurs actions affectent directement les résultats du workflow au moment de l'exécution et que les principes de conception sont essentiels pour obtenir un surcout négligeable.
Document type :
Theses
Complete list of metadatas

Cited literature [135 references]  Display  Hide  Download

https://hal-lirmm.ccsd.cnrs.fr/tel-02418022
Contributor : Patrick Valduriez <>
Submitted on : Friday, January 17, 2020 - 3:42:51 PM
Last modification on : Monday, May 4, 2020 - 11:39:06 AM

File

tese_tex_Jan16-02.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : tel-02418022, version 3

Citation

Renan Souza. Supporting User Steering In Large-Scale Workflows With Provenance Data. Databases [cs.DB]. UFRJ, Rio de Janeiro, 2019. English. ⟨tel-02418022v3⟩

Share

Metrics

Record views

101

Files downloads

254