Monitoring im Rechenzentrum

Betriebs- und Ausfallsicherheit als Erfolgsfaktor

Seite: 2/2

Firmen zum Thema

Internationale Richtlinien und Standards

Die Integrationstests legen nach der Inbetriebnahme offen, ob die hochkomplexe technische Gebäudeausrüstung zuverlässig funktioniert – eine zentrale Voraussetzung für die Abnahme von neu errichteten Rechenzentren. Der „Elchtest“ von TÜV Rheinland simuliert verschiedene Störungen und Umschaltszenarien und nimmt währenddessen die betroffenen Komponenten aus Elektrotechnik, Kälteversorgung und Sicherheitstechnik ins Visier.

Zum Beispiel mit dem „Black Building“-Test, bei dem die Hauptstromzufuhr unterbrochen wird. Läuft der Notstrom automatisch an? Werden die Schaltvorgänge fehlerfrei übernommen? Und wechselt das System zurück in den Normalbetrieb, sobald der Hauptstrom wieder verfügbar ist? Lautet die Antwort auf eine dieser ­Fragen „nein“, besteht Handlungsbedarf.

Ein weiterer Test: Fällt eine von zwei redundanten Klimaanlagen aus, muss die andere die vorgegebene Temperatur allein halten ­können. Schafft sie das nicht, gilt es dringend nachzubessern.

Mit dem „Elchtest“ können frühzeitig Fehler im Rechenzentrum aufgedeckt werden, die bei einer herkömmlichen Inbetriebnahme unter Umständen verborgen bleiben und die sich später massiv auf den regulären Betrieb auswirken könnten.

Willkommener Nebeneffekt: Das Personal des Rechenzentrum-­Betreibers erhält ein effektives Training on the Job und kann seine Anlagenkenntnisse enorm erweitern. Letztlich tragen die Tests von TÜV Rheinland also entscheidend dazu bei, mögliche Ausfallzeiten zu reduzieren und die Verfügbarkeit zu verbessern – und ­damit die Zukunftsfähigkeit der Organisation zu sichern.

Handlungsbedarf ­erkennen

Es gibt einige Indikatoren, die Handlungsbedarf im Bereich Betriebssicherheit von Rechenzen­tren aufzeigen können. Hier ein kleiner Fragenkatalog für den Quick-Check:

  • Sind eventuelle Risiken im Rechenzentrum klar definiert?
  • Testen Sie regelmäßig eine Lastübernahme durch den Generator?
  • Gab es in der Vergangenheit eventuelle Störfälle, deren Hergang und Ursache sich nicht ­eindeutig klären ließen?
  • Existieren Verfahrensanwei­sungen für Störfälle und werden diese regelmäßig geübt?
  • Sind den Verantwortlichen die Inhalte von Wartungsverträgen rund um das Rechenzentrum klar?
  • Gibt es ein Monitoring darüber, welche Geräte wann den End-of-Life (EOL) -Status erreicht haben?
  • Ist dem RZ-Verantwortlichen bewusst, durch welche Maßnahmen sich Energie einsparen lässt?
  • Ist das Personal in der Bedienung der Klimageräte ausreichend geschult (z. B. neuer Controller des Klimagerätes)?
  • Gibt es Gewissheit darüber, dass die Betriebsparameter optimal aufeinander abgestimmt sind?

Wer die eine oder andere Frage negativ beantworten muss, der hat Handlungsbedarf und sollte sich im Zweifelsfall Rat bei Experten holen. Wenn Bauherrn planen, externes Know-how hinzuziehen, sollte das in einer frühen Phase des Rechenzentrum-Neubaus erfolgen. Denn zu diesem Zeitpunkt lassen sich typische Fehlerquellen mit dem entsprechenden Know-how leicht identifizieren und ausschalten. Nachträgliche bauliche Änderungen hingegen sind oftmals ­aufwendig.

Übrigens: Wer einen externen Dienstleister einschaltet, sollte darauf achten, dass dieser über alle Phasen hinweg als zentraler Ansprechpartner zur Verfügung steht: von der ersten Planung des Rechenzentrums bis zur Inbetriebnahme.

Der Autor: Rolf Walter
Der Autor: Rolf Walter
(Bild: TÜV Rheinland)

Know-how

Hintergründe und Informationsblätter zum Thema Rechenzentrum bietet TÜV Rheinland online HIER.

*Der Autor: Rolf Walter, Leiter des Teams Data Center Services bei TÜV Rheinland

(ID:45335028)