Göttingen 2012 – scientific programme
Parts | Days | Selection | Search | Updates | Downloads | Help
T: Fachverband Teilchenphysik
T 76: Computing 1
T 76.6: Talk
Wednesday, February 29, 2012, 18:00–18:15, VG 0.111
Überwachung von Festplattenlesefehlern an einem Tier-2-Zentrum — Jennifer Stoll1, •Andreas Nowack1 und Achim Burdziak2 — 1III. Phys. Institut B, RWTH Aachen — 2I. Phys. Institut B, RWTH Aachen
Die RWTH Aachen ist ein Tier-2-Zentrum im Worldwide LHC Computing Grid (WLCG). Das Grid-Cluster verfügt über mehr als 1500 Festplatten, auf denen Daten gespeichert und abgerufen werden können.
Gelegentlich treten auf einigen dieser Festplatten Lesefehler auf, die vorerst nicht kritisch sind, da die Daten durch RAID-Systeme redundant gespeichert sind. Kritisch wird es erst, wenn für diese Festplatten ein besonders schneller Anstieg der Lesefehler zu verzeichnen ist.
Für die Vorbeugung von Datenverlusten und die Überwachung der Festplatten ist es nützlich zu wissen, wie sich die Lesefehler einer oder mehrere Festplatten entwickeln. Hierfür wird ein Programm vorgestellt, welches die Eigenschaften der einzelnen Festplatten -- z.B. Seriennummer, Hostname, Größe, SATA-Version, Firmware -- sowie die Historie der Lesefehlerzahl, der Lesezugriffe und der Betriebszeiten der Festplatte in eine Datenbank schreibt. Diese Datenbank kann graphisch ausgewertet werden und zur Prognose von Festplattenausfällen verwendet werden.