Stolpersteine im Betriebskonzept

10 Fehler im Betrieb von Rechenzentren, die richtig Geld kosten

Seite: 2/3

Anbieter zum Thema

Investitionen, die sich lohnen

Ein dritter Punkt ist das Betriebspersonal. Die IT-Teams müssen die implementierte Infrastruktur kennen und über entsprechendes Know-how verfügen. Das bedeutet Investitionen in die Qualifikation der Mitarbeiter und lückenlose Dokumentation der Prozesse mit der damit verbundenen Hard- und Software.

Merksatz Nummer vier: Einheitliche Schulungsstandards für alle mit abgestuften Qualifizierungslevels. Das dafür entwickelte Schulungsprogramm bedeutet zwar auf den ersten Blick mehr Aufwand und Kosten, für den Betriebsablauf rechnen sich solche Ausgaben spätestens mit einem stabilen Uptime-Niveau.

Damit eng verbunden ist Fehler Nummer fünf. Wer Qualifizierungsmaßnahmen aus Kostengründen scheut, verkennt den Wert rundum trainierter operativer IT-Professionels. Vor allem im Notfall. Dann nämlich kommt es auf die richtige Vorgehensweise und den schnellen Eingriff an. Zeit zum Schließen von Kenntnislücken bleibt bei Downtime nicht mehr.

Informationen in Schwarz auf Weiß

Rechenmaschinen in Rack-Reihen sind technische Sensibelchen, die bei unzureichender Klimatisierung den Dienst versagen. Zu modernen Hightech-Racks gehören Zugangskontrolle ebenso, wie Stromzuführung und -verteilung sowie Kabelmanagement und Überwachungstechnik. Wer hier auf der sicheren Seite stehen will, kommt um eine detaillierte Dokumentation der Hard- und Software, aber auch von deren Betriebsdaten nicht herum.

Die Betriebsprozesse, wie sie im Branchenverband Bitkom definert werden.
Die Betriebsprozesse, wie sie im Branchenverband Bitkom definert werden.
(Bild: Bitkom)
Protokollierte Ist- und Soll-Analysen sind für den laufenden Rechenbetrieb wichtig. Noch mehr erfreut über aussagekräftige Systembeschreibungen aber sind Wartungstechniker, die eingreifen müssen. Selbst regelmäßige Betriebsbegehungen oder Prüfzyklen der Brandschutzanlagen liefern Informationen, die man festhalten sollte. Daher Fehler Nummer sechs: Schlampige oder unvollständige Dokumentationen.

Transparenz in der Arbeitsweise eines Data Center aber auch der gesamten IT-Facility gehört zu den Top-Themen des Betreiber-Managements. Genauso sollten schriftliche Guidelines für jeden Eingriff in die IT-Infrastruktur, die technischen Betriebsanlagen und Operating-Bereiche vorhanden sein.

Downtime planen und minimieren

Neben der von Events ausgelösten Wartung sollte jede Infrastrukturkomponente über einen Wartungsplan verfügen. Die Wartungspläne aller Komponenten müssen dabei so aufeinander abgestimmt sein, dass es im Fall einer Intervention zu möglichst wenigen Abschaltungen kommt. Jede Abschaltung wirkt sich auf die verbleibende Redundanz und damit auf das Ausfallrisiko während der Wartungszeit aus.

Fehler Nummer sieben sind folglich Lücken in den Betriebsanleitungen, die vor allem bei anstehenden Systemänderungen den gesamten IT-Betrieb aushebeln können. Hinterlegt sein sollten Informationen über den Referenzzustand von Standardprozessen ebenso wie eine Library zu der Vorgehensweise bei Neuinstallationen oder bei Routinewartungen. Ebenfalls wichtig ist die genannte Emergency Operating Procedure (EOP) zu der auch die Fehlerprotokolle im laufenden IT-Betrieb gehören.

Oftmals unterschätzt, deshalb Fehler Nummer acht: Ein lückenhaft verwaltetes und implementiertes Qualitäts-Management. Rechenzentren sind die Nervenzentralen der Unternehmen.

(ID:37682610)