Bereiche | Tage | Auswahl | Suche | Aktualisierungen | Downloads | Hilfe
T: Fachverband Teilchenphysik
T 99: Grid-Computing II
T 99.4: Vortrag
Donnerstag, 12. März 2015, 17:30–17:45, K.11.10 (K8)
Erfahrungen der Echtzeit-Produktionsvalidierung mit Hilfe von JEM — •Frank Volkmer und Peter Mättig — Bergische Universität Wuppertal, Wuppertal, Deutschland
Fehler in der Monte Carlo Massenproduktion wurden oft übersehen oder zu spät erkannt da ein automatisches System zur Qualitätsauswertung fehlte. Dies führte zur Verschwendung von Resourcen, besonders wenn die Fehler erst spät erkannt werden. Probleme entstehen wenn neue Softwareversionen eingesetzt werden deren Ergebnisse nicht ausreichend validiert sind oder wenn Massenproduktion mit falschen Konfigurationdateien gestartet wird.
Der Job Execution Monitor (JEM) ist eine, an der Bergischen Universität Wuppertal entwickelte, Software zur Überwachung von Grid-Jobs. Als nachladbares Modul des Pilot wird JEM genutzt um die Massenproduktion zu validieren. Die zu validierenden Tasks werden dem JEM Activation Service übergeben, welcher dann automatisch solange die entsprechende Anzahl Jobs mit JEM instrumentiert.
Den instrumentierten Jobs wird das Kommando übergeben, Qualitätshistogramme zusätzlich zum normalen Output zu erzeugen und diese an einen zentralen Server zu übertragen. Dort werdem sie mit den Histogrammen anderer Jobs zusammengefasst und dann mit den zugehörigen Referenzen verglichen. Die Ergebnisse werden dann automatisch auf einer Webseite zur Verfügung gestellt.
Mit JEM konnte die Qualität der Monte Carlo Massenproduktion gezielt überprüft und verbessert werden. Die zusätzliche Integration von Rivet und die operativen Erfahrungen werden vorgestellt.