Mit Power gegen den Blackout

Disaster Recovery richtig gemacht

Seite: 2/2

Anbieter zum Thema

Automatisch gesteuerter Shutdown

Um Murphys Gesetz im Ernstfall widerlegen zu können, ist ein geregeltes Herunterfahren aller Server, Systeme und Applikationen gefragt, damit Schäden und Datenverluste verhindert werden können. Das alleine reicht jedoch noch nicht, wie etwa eine Firma im Rahmen ihres jährlichen Disaster-Tests samt Stromabschaltung feststellen musste: Bei mehreren 100 Servern und einer USV-Dauer von maximal einer Stunde war der Shutdown manuell nicht durchführbar.

Die maximal tolerierbare Ausfallzeit sollte bei der Disaster-Recovery-Strategie genau kalkuliert sein.
Die maximal tolerierbare Ausfallzeit sollte bei der Disaster-Recovery-Strategie genau kalkuliert sein.
(Bild: iQSol)

Dies lässt sich nur mit einer automatischen Steuerung, die ebenso das geregelte Hochfahren der Systeme beherrscht, erfolgreich bewerkstelligen. Denn im Notfall muss die IT-Abteilung binnen Minuten richtige Entscheidungen treffen können. Gerade das gezielte Wiederanlaufen der IT-Infrastruktur ist in weiterer Folge eine besondere Herausforderung. Mitunter muss das System dabei zunächst davon abgehalten werden, sich wieder zu aktivieren: Gibt es mehrere Stromausfälle etwa kurz hintereinander, wäre ein zwischenzeitliches Hochfahren vermutlich „tödlich“.

Wichtiges von Unwichtigem zu trennen, ist ein weiterer Aspekt. In einem Unternehmen sorgt zum Beispiel ein heißer Sommer für Probleme mit der nötigen Klimatisierung. Deshalb sollen beim Ausfall der Klimaanlage alle unwichtigen Server heruntergefahren werden. Die entscheidenden Server jedoch müssen in ein zweites Rechenzentrum verschoben werden.

Das funktioniert nur mit einem zentralen Power-Management, das physikalische Kontakte und Sensoren genauso im Griff hat wie USV-Geräte und virtuelle Anwendungen – mit einem logikbasierten Failover-Ablauf als Hauptbestandteil. Denn um die oft bestehenden Abhängigkeiten der unterschiedlichen Server-Systeme zueinander berücksichtigen zu können, bedarf es eines ausgeklügelten Shutdown-Procederes.

Eine instabile Stromversorgung erfordert in einem Betrieb etwa den Einsatz der USV-Anlage. Nach einigen Stunden muss jedoch alles heruntergefahren werden. Ist die Stromversorgung wieder kontinuierlich verfügbar, sollen die IT-Systeme automatisch in der umgekehrten Reihenfolge des Shutdowns hochgefahren werden.

Zentraler Überblick, autarke Außenstellen

Niederlassungen in den Ländern Osteuropas bedeuten mitunter immer noch ein gewisses Abenteuer, regelmäßige Stromausfälle inklusive. Weil die Bandbreite der Standleitungen oft limitiert ist, betreibt ein dort engagiertes Unternehmen in seinen Außenstellen lokale Server. Der Plan: Wenn nötig, sollen die Systeme von der Zentrale aus herunter- und bei Bedarf wieder hochgefahren werden. Und dies ohne Rücksicht darauf, ob die Standleitung verfügbar ist oder nicht.

Das lässt sich mit jeweils autark arbeitenden Anwendungen erreichen. Änderungen an deren Konfiguration werden nur in der Zentrale vorgenommen und periodisch mit den Außenstellen synchronisiert. Die jeweiligen Logs werden hingegen an die Zentrale übertragen, damit man von dort aus einen generellen Überblick hat. Permanent wird der Status von der Außenstelle an die Zentrale übermittelt.

Schaltet die Niederlassung auf Batteriebetrieb, wird dort der Shutdown-Prozess gestartet. Völlig autark, wenn etwa die Standleitung ausgefallen ist. Um Redundanz zu erzielen, lassen sich die unabhängigen Applikationen zweier Außenstellen miteinander verbinden. Fällt so eine aus, übernimmt die andere die Führung.

Umfassende Sicherheit ist nicht billig

Umfassende, intelligente Sicherheitslösungen für die Unternehmens-IT sind nicht unbedingt günstig. Deren Einsatz um Vorfälle zu verhindern, die vielleicht gar nie eintreten wären, muss dem Management erst plausibel gemacht werden.

Bestes Argument dafür bleibt wohl der Hinweis, dass im Krisenfall ein geordnetes Handeln und ein schnelles Wiederanlaufen des IT-Systems entscheidend für das Überleben des ganzen Betriebes sein können. Wie das Stehaufmännchen, dass sich nach dem Sturm wieder auf die Beine stellt, als sei nichts gewesen.

* Alexander Graf ist Managing Director bei der Iqsol GmbH.

(ID:43088652)