Verloren im Labyrinth der IT-Begriffe? Hier finden Sie Definitionen und Basiswissen zu Rechenzentrums-IT und -Infrastruktur.

Ununterbrochen rechnen Was sind Verfügbarkeitsklassen?

Von lic.rer.publ. Ariane Rüdiger 6 min Lesedauer

Anbieter zum Thema

Wer zuverlässig verfügbare Rechenzentren bauen, betreiben oder nutzen will, orientiert sich heute meist an Verfügbarkeitsklassen. Sie beschreiben die technischen Voraussetzungen dafür, dass zertifizierte Rechenzentren nur einen klar definierten Anteil der Zeit ausfallen dürfen.

Verfügbarkeitsklassen geben an, mit wie viel Ausfallzeit eines Rechenzentrums zu rechnen ist.(Bild:  frei lizenziert/wokandapix /  Pixabay)
Verfügbarkeitsklassen geben an, mit wie viel Ausfallzeit eines Rechenzentrums zu rechnen ist.
(Bild: frei lizenziert/wokandapix / Pixabay)

Wie sicher ist es, dass das eigene oder das extern genutzte Rechenzentrum tatsächlich ständig verfügbar ist? Darüber geben Verfügbarkeitsklassen Auskunft. Erstmalig definiert wurden sie als Tier 1 bis 4 vom US-amerikanischen Beratungs- und Zertifizierungsunternehmen Uptime Institute Mitte der 90er Jahre.

Leicht abweichende Definitionen, die sich aber meist an die ursprünglichen Definitionen des Uptime Institute von Mitte der 90er Jahre anlehnen, finden sich sowohl in den Zertifizierungsvorgaben des TÜV Nord (TSI-Zertifizierungsklassen der TÜV-IT) für Rechenzentren und schließlich in der derzeit geltenden Europanorm DIN EN 50600. Die aktuelle Form des TSI-Kriterienkatalogs ist Version 4.4. Sie wurde weitgehend an die entsprechenden Regeln der DIN EN 50600 angepasst.

Nachfolger ISO/IEC 22237

Abgelöst wird EN 50600 demnächst durch die weltweit gültige Norm ISO/IEC 22237, die sich an DIN EN 50600 anlehnt. Im Unterschied zu der Europa-Norm werden bei ihr mehr Informationen zu den Themen Nachhaltigkeit und Energie-Effizienz ergänzt, die aber in diesem Artikel nicht dargestellt werden.

In allen Klassifikationen von Zuverlässigkeitsklassen bauen die einzelnen Klassen aufeinander auf. Das heißt: Die jeweils höheren Klassen erfüllen alle Anforderungen der Klassen darunter und fügen weitere hinzu. Jede Klasse hat eigene Vorgaben für Wartung, Stromversorgung, Kühlung und Fehlertoleranz sowie die verwendeten Managementpraktiken.

Ausreichend Verfügbarkeit für den angestrebten Zweck

Ziel ist die Tauglichkeit von Rechenzentren für bestimmte geschäftliche Zwecke angesichts der sie bedrohenden Risiken. Das heißt: Je kritischer die ständige Verfügbarkeit des Rechenzentrums für die Erfüllung des jeweiligen Geschäftszwecks ist und je mehr und ernstere Risiken abzuwehren sind, desto höher ist die Tier-Klassifikation, die ein Rechenzentrum erfüllen muss. Dies gilt insbesondere dann, wenn ein Rechenzentrum zur so genannten Kritischen Infrastruktur (KRITIS) gehört.

Tier-Klassifikationen schreiben zu erreichende Ziele vor, aber nicht die Technologien, mit denen diese Ziele erreicht werden. Das lässt den Weg offen, die angestrebten Vorgaben in Zukunft mit neu entwickelten, besser geeigneten Technologien anzustreben.

Internationale Normen

Unternehmen, deren Datacenter-Ressourcen sich ausschließlich in Europa befinden, die Vorgaben der EN50600 oder der TSI-Klassifikation von TÜV Nord erfüllen. Firmen, die Rechenzentren außerhalb Europas betreiben, sollten, bis sich ISO/IEC 22237 durchgesetzt hat, die US-amerikanischen Tier-Vorgaben des Uptime-Instituts einhalten.

Technische Vorgaben für die vier Verfügbarkeitsklassen enthalten die Normen EN 50600 und ISO/IEC 22237 vor allem in den Abschnitten EN50600-2-2/ISO/IEC 22237-3 (Energieverteilung), EN 50600-2-3/IEO/IEC22237-4 (Umweltkontrolle) und EN 50600-2-4 (ISO/IEC TS 22237-5 (Telekommunikationskabel-Infrastruktur). Grundsätzliche Konzepte werden jeweils in Teil 1 der Normen beschrieben.

Wie man Verfügbarkeit misst

Die Norm EN 50600 beschreibt fünf Verfügbarkeitsklassen, jeweils mit klar definierten maximalen Ausfallzeiten pro Monat und Jahr Die Angabe des Zeitrahmens ist wichtig, denn wenn ein Rechenzentrum beispielsweise 28 Stunden jährlich ausfallen darf, macht es einen großen Unterschied, ob diese Ausfälle jeweils nur wenige Stunden dauern und sich auf viele Monate verteilen, oder ob das Rechenzentrum einen ganzen Tag nicht verfügbar ist.

Verfügbarkeit ist dabei definiert als Ausfallzeit im Verhältnis zu Gesamtbetriebszeit eines Systems. Die Verfügbarkeit in Prozent ist also 1-Ausfallzeit/(Produktivzeit + Ausfallzeit). Wichtig ist die Bezugszeitspanne, also hier ein Jahr. Die Rate sagt nichts darüber, ob der Ausfall an einem Stück oder in mehreren kleinen Ausfällen hintereinander stattfindet.

Die Verfügbarkeitsklassen der EN 50600

Der Branchenverband Bitkom hat seinerseits an dieses Verfügbarkeitsklassen Datacenter-Kategorien definiert, die hier ebenfalls angegeben werden.

Die Verfügbarkeitsklassen der EN 50600 im Einzelnen:

  • Verfügbarkeitsklasse 0: ohne zugesicherte Verfügbarkeit. In der betrieblichen Praxis dürften solche Rechenzentren kaum noch vorkommen, schon allein wegen der Datenschutzerfordernisse.
  • Verfügbarkeitsklasse 1 (Bitkom Kategorie A), normale Verfügbarkeit. Mindestverfügbarkeit 99 Prozent, Ausfallzeit pro Monat <8 Stunden, Ausfallzeit pro Jahr <88 Stunden. Keine Redundanzen – alle Aggregate, die zur Energieversorgung, Klimatisierung/Kühlung und Telekommunikationsanbindung vorhanden sind, müssen nur einfach ausgelegt sein. In der betrieblichen Praxis spielt auch diese Verfügbakeitsklasse kaum eine Rolle.
  • Verfügbarkeitsklasse 2 (Bitkom Kategorie B), erhöhte Verfügbarkeit, Mindestverfügbarkeit 99,9 Prozent, maximale Ausfallzeit pro Monat < 44 Minuten, maximale Ausfallzeit pro Jahr < 9 Stunden. Die Stromversorgung muss redundante Quellen besitzen, die Stromverteilung und Klimatisierung redundante Einzelpfade und die Telekommunikationsverkabelung Einzelpfade bei fest installierter Infrastruktur mit mehreren Verbindungen zu Zugangsnetzen. Geeignet für nicht geschäftskritische Anwendungen.

Der Aufbau eines Rechenzentrums der verbreiteten Verfügbarkeitsklasse 3 (Bitkom: C): Zahlreiche Komponenten sind redundant ausgelegt und garantieren Hochverfügbarkeit.(Bild:  dc-intelligence/BITKOM)
Der Aufbau eines Rechenzentrums der verbreiteten Verfügbarkeitsklasse 3 (Bitkom: C): Zahlreiche Komponenten sind redundant ausgelegt und garantieren Hochverfügbarkeit.
(Bild: dc-intelligence/BITKOM)

  • Verfügbarkeitsklasse 3 (Bitkom Kategorie C), hochverfügbar. Mindestverfügbarkeit 99,99 Prozent („Vier Neunen“). Maximale Ausfallzeit pro Monat < 5 Minuten, maximale Ausfallzeit pro Jahr < 53 Minuten. Die Primärverteilungspfade der Stromversorgung missen über mehrere Pfade erreichbar sein, dazu muss es redundante Quellen geben. Die Stromverteilung braucht mehrere Pfade und eine Lösung für Instandsetzung im laufenden Betrieb genau wie Kühlung und Klimatisierung. Auch die TK-Verkabelung muss über mehrere Pfade erfolgen, fest installierte Infrastruktur mit unterschiedlichen Kabelwegen und mehreren Verbindungen zu Zugangsnetzen nutzen. Diese Infrastrukturen eignen sich für gängige auch geschäftskritische Zwecke. Sie sind auch der Standard-Infrastrukturtyp bei kommerziellen Cloud-Rechenzentren.
  • Verfügbarkeitsklasse 4, (Bitkom Kategorie D), höchstverfügbar. Mindestverfügbarkeit 99,999 Prozent („fünf Neunen“), Ausfallzeit pro Monat <26 Sekunden, Ausfallzeit pro Jahr < 6 Minuten. Der Unterschied zur Verfügbarkeitsklasse 3 besteht darin, dass die Stromverteilung und die Kühlung/Klimatisierung unter allen Bedingungen außer bei Wartung fehlertolerant sein müssen. Die TK-Verkabelung braucht außer den Vorgaben für die Klasse 3 auch noch redundant ausgelegte Verteilerbereiche. Rechenzentren dieser Verfügbarkeitsklasse eignen sich für Anwendungen mit den höchsten Anforderungen an die Datenhaltung und die Zuverlässigkeit der Server. Geeignet für alle geschäfts- und systemkritischen Anwendungen, für Großunternehmen, den Staat und besonders schützenswerte Daten.
  • Nicht formell als Klasse definiert wurden Rechenzentren, bei denen zusätzlich die Kühlung und Klimatisierung während Wartungsvorgängen weiterlaufen kann und das Rechenzentrum ansonsten fehlertolerant ist. Die Rechenzentrumsberatung Prior 1 bezeichnet dies als Verfügbarkeitsklasse 4+.

Aggregate für Stromversorgung und Klimatisierung

Wegen der großen Bedeutung der Verfügbarkeitsklasse 3 für die inhouse oder ausgelagert betriebene Unternehmens-Datacenter sei hier noch einmal aufgeführt, welche Aggregate dazugehören: Nötig sind zwei Mittel- und zwei Niederspannungshauptanlagen (MSHV/NSHV), zwei USV-Anlagen mit entsprechender Batterieausrüstung, zwei Unterverteilungen, zwei Klimaanlagen und zwei Kälte-Erzeuger.

Leicht abweichend davon die Konzepte und Kriterien der vom TÜV Süd verwendeten TSI-Zertifizierung. Da viele Rechenzentren nach älteren TSI-Kriterienkatalogen zertifiziert wurden, werden die älteren TSI-Kriterien bezüglich der Verfügbarkeit hier dargestellt.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Die TSI-Kriterien

Einbezogen in die Prüfung werden jeweils Standort, Bauweise, Brandschutz, organisatorisches und anlagentechnisches Sicherheits-Management, die Versorgungswege, die Lüftungsanlagen, ob Co-Llokation oder andere externe Redundanzkonzepte vorgesehen sind sowie wie all das dokumentiert ist und verwaltet wird.

TSI definiert Level 1 als mittlere Verfügbarkeit (keine Redundanz, einfache Brandschutzmaßnahmen, funktionaler Zutrittsschutz). Level 2 (erweiterte Verfügbarkeit) umfasst grundlegende Teilredundanzen (Energieversorgung/Klimatisierung), Berücksichtigung lokaler Risiken, besserer Zutritts- und Brandschutz als in Klasse 1. Level 3 schließt Single Points of Failure bei Versorgungskomponenten aus, verlangt hohen Schutz vor Einbruch, unbefugtem Zutritt und Brandereignissen, verlangt redundante und gesicherte Versorgungswege und ständige Zustandskontrolle. Bei Höchstverfügbarkeit (Level 4) muss Wartung beim Betrieb möglich sei. Auch das Vorfeld des Rechenzentrums wird gesichert, doppelte Versorgungswege sind selbstverständlich.

Hochverfügbarkeit erhöht Kosten, Energieverbrauch und PUE

Hohe Verfügbarkeitsklassen sorgen dafür, dass Ausfälle minimiert werden. Aber sie haben auch einen Preis. Denn Fehlertoleranz führt wegen der doppelt vorhandenen Komponenten zu erheblich erhöhten Energie- und Materialverbräuchen. Spitzen-PUEs lassen sich mit einer fehlertoleranten Infrastruktur deshalb logischerweise schwerer erzielen. Dafür produzieren sie möglicherweise mehr Abwärme.

Außerdem ist Fehlertoleranz selbstredend teuer, denn jede Komponente muss beschafft, betrieben und gewartet sowie irgendwann erneuert werden. Höchstverfügbarkeit sollte schon deshalb nur dort umgesetzt werden, wo dies aus Sicherheitsgründen unumgänglich ist. In vielen Fällen wird auch Tier 3 ausreichen.

Nicht-technische Voraussetzungen für Hochverfügbarkeit

Zudem reicht die nötige Technik allein nicht aus. Weitere nichttechnische Voraussetzungen für Hochverfügbarkeit sind ausreichendes Personal, Ersatzteilbevorratung, ausreichende Wartungsvereinbarungen, eine umfassende Dokumentation von Prozessen und Ereignissen, professionelle Kommunikation nicht nur, aber vor allem bei Zwischenfällen nebst entsprechenden prozeduralen Vorgaben für solche Zwischenfälle. Zertifizieren lassen sich diese Kriterien insbesondere mit ISO/IEC 27001 und ISO/IEC 9001.

Wer also bei einem externen Rechenzentrum auf Fehlertoleranz und entsprechendes Management angewiesen ist, sollte nicht nur auf die Tier-Klassifikation achten, sondern auch auf entsprechende andere Zertifizierungen.

(ID:49036154)