Heidelberg 2007 – wissenschaftliches Programm
Bereiche | Tage | Auswahl | Suche | Downloads | Hilfe
T: Fachverband Teilchenphysik
T 516: Grid Computing I
T 516.7: Vortrag
Freitag, 9. März 2007, 15:35–15:50, HS Mathematik
Ein Job Execution Monitor für das LHC Computing Grid — Torsten Harenberg, Peter Mättig, •Markus Mechtel und David Meder-Marouelli — Bergische Universität Wuppertal
Für die Analyse der Daten des ATLAS Detektors wird eine enorme Rechenleistung benötigt, die nur durch verteiltes Rechnen im Grid erbracht werden kann. Mit mehr als 28000 CPUs an über 180 Instituten ist das LHC Computing Grid der weltweit größte Rechnerverbund. Da die Grid Software nur zwei mögliche Endzustände für abgearbeitete Jobs kennt (success/failed), hat der Benutzer keine Informationen über die Ursache eines aufgetretenen Job-Abbruchs. Der vorgestellte Job Execution Monitor ermöglicht die Überwachung und befehlsweise Ausführung von Script Dateien. Dadurch erhält der Benutzer detaillierte Informationen über den aktuellen Status seiner Jobs. Ausgeführte Befehle können zur Laufzeit überwacht werden. Damit besteht die Möglichkeit, Fehlerursachen schnell zu entdecken und zu korrigieren. Der Vortrag gibt einen Einblick in die Funktionsweise des Job Execution Monitors.