Anbieter zum Thema
Investitionen, die sich lohnen
Ein dritter Punkt ist das Betriebspersonal. Die IT-Teams müssen die implementierte Infrastruktur kennen und über entsprechendes Know-how verfügen. Das bedeutet Investitionen in die Qualifikation der Mitarbeiter und lückenlose Dokumentation der Prozesse mit der damit verbundenen Hard- und Software.
Merksatz Nummer vier: Einheitliche Schulungsstandards für alle mit abgestuften Qualifizierungslevels. Das dafür entwickelte Schulungsprogramm bedeutet zwar auf den ersten Blick mehr Aufwand und Kosten, für den Betriebsablauf rechnen sich solche Ausgaben spätestens mit einem stabilen Uptime-Niveau.
Damit eng verbunden ist Fehler Nummer fünf. Wer Qualifizierungsmaßnahmen aus Kostengründen scheut, verkennt den Wert rundum trainierter operativer IT-Professionels. Vor allem im Notfall. Dann nämlich kommt es auf die richtige Vorgehensweise und den schnellen Eingriff an. Zeit zum Schließen von Kenntnislücken bleibt bei Downtime nicht mehr.
Informationen in Schwarz auf Weiß
Rechenmaschinen in Rack-Reihen sind technische Sensibelchen, die bei unzureichender Klimatisierung den Dienst versagen. Zu modernen Hightech-Racks gehören Zugangskontrolle ebenso, wie Stromzuführung und -verteilung sowie Kabelmanagement und Überwachungstechnik. Wer hier auf der sicheren Seite stehen will, kommt um eine detaillierte Dokumentation der Hard- und Software, aber auch von deren Betriebsdaten nicht herum.

Transparenz in der Arbeitsweise eines Data Center aber auch der gesamten IT-Facility gehört zu den Top-Themen des Betreiber-Managements. Genauso sollten schriftliche Guidelines für jeden Eingriff in die IT-Infrastruktur, die technischen Betriebsanlagen und Operating-Bereiche vorhanden sein.
Downtime planen und minimieren
Neben der von Events ausgelösten Wartung sollte jede Infrastrukturkomponente über einen Wartungsplan verfügen. Die Wartungspläne aller Komponenten müssen dabei so aufeinander abgestimmt sein, dass es im Fall einer Intervention zu möglichst wenigen Abschaltungen kommt. Jede Abschaltung wirkt sich auf die verbleibende Redundanz und damit auf das Ausfallrisiko während der Wartungszeit aus.
Fehler Nummer sieben sind folglich Lücken in den Betriebsanleitungen, die vor allem bei anstehenden Systemänderungen den gesamten IT-Betrieb aushebeln können. Hinterlegt sein sollten Informationen über den Referenzzustand von Standardprozessen ebenso wie eine Library zu der Vorgehensweise bei Neuinstallationen oder bei Routinewartungen. Ebenfalls wichtig ist die genannte Emergency Operating Procedure (EOP) zu der auch die Fehlerprotokolle im laufenden IT-Betrieb gehören.
Oftmals unterschätzt, deshalb Fehler Nummer acht: Ein lückenhaft verwaltetes und implementiertes Qualitäts-Management. Rechenzentren sind die Nervenzentralen der Unternehmen.
(ID:37682610)