Ausfälle und Zuverlässigkeit Vast Data: Was ist die „Nines“-Regel der Verfügbarkeit?

Von Martin Hensel |

Anbieter zum Thema

Wenn es um die Zuverlässigkeit von Speichersystemen geht, kommt häufig die „Nines“-Regel zum Einsatz. Der Storage-Spezialist Vast Data erklärt, wie diese Regel zu interpretieren ist.

Die "Nines"-Regel der Verfügbarkeit von Speichersystemen lässt Interpretationsspielraum.
Die "Nines"-Regel der Verfügbarkeit von Speichersystemen lässt Interpretationsspielraum.
(Bild: 3D Animation Production Company / Pixabay)

In der Theorie sind Speichersysteme auf 100-prozentige Zuverlässigkeit ausgelegt. Doch in der Praxis wird dieses Ziel meist nicht ganz erreicht. So meldeten die rund 150 Cluster, die ihre Telemetriedaten an „Vast Insight“ senden, in den vergangenen 180 Tagen eine Verfügbarkeit von 99,9995 Prozent.

Aber was bedeutet die Anzahl der Neunen in diesem Wert für die Speicherbetreiber? Für ein Einzelsystem bedeuten fünf Neunen laut Vast Data etwas über fünf Minuten Ausfallzeit pro Jahr. Jede weitere Neun stellt eine Verzehnfachung der Zuverlässigkeit und ein Zehntel der zulässigen Ausfallzeit dar, da sich die Zuverlässigkeit asymptotisch auf 100 Prozent zubewegt.

Demnach stehen laut dem Storage-Spezialisten 99,999 Prozent Verfügbarkeit für 5,2 Minuten Ausfallzeit pro Jahr. Bei 99,9999 Prozent sind es bereits nur noch 31,4 Sekunden und bei 99,99999 Prozent Verfügbarkeit sogar nur 3,14 Sekunden pro Jahr.

Verfügbarkeit in Cluster-Systemen

Bereits eine Verfügbarkeit von 99,999 Prozent ist in der Praxis für Speichersysteme ein beeindruckender Wert – insbesondere in Clustern. Sie wird in diesen Fällen berechnet, indem die Gesamtzahl der Ausfallstunden für jeden Cluster durch die Gesamtzahl der Cluster-Stunden geteilt wird. Ein wichtiger Faktor ist dabei unter anderem der große Umfang der Cluster: Bei herkömmlichen Systemen mit mehreren Petabyte Speicherkapazität müssen häufiger Komponenten getauscht werden, von der SSD bis hin zum x86-Serverknoten.

Zudem gibt es etliche Softwarekomponenten, um Daten zu schützen und Caches aktuell zu halten. Jeder Moment an Ausfallzeit kann erheblichen Einfluss auf den Prozentsatz der Gesamtverfügbarkeit haben.

Vast Data nennt ein Rechenbeispiel: Eine Verfügbarkeit von 99,9995 Prozent würde bei 150 Clustern bedeuten, dass es bei allen Kunden und Clustern insgesamt weniger als vier Stunden Ausfallzeit gab. Der Prozentwert gibt das Ausmaß nicht umfassend wieder: So macht es für Unternehmen einen großen Unterschied, ob ein Ausfall zehn Minuten, zwei Stunden oder drei Tage dauert.

Vast nennt hierzu ein weiteres Beispiel: Bei einem großen Anbieter mit 3.000 Speichersystemen lässt sich bei einer Verfügbarkeit von fünfeinhalb Neunen nicht sagen, ob die rechnerisch 80 Stunden Ausfallzeit beispielsweise von 20 Kunden mit jeweils vierstündigen Ausfällen oder wenigen katastrophalen Ausfällen stammen.

DASE als Lösung

Vast Data selbst setzt bei seinen Hochverfügbarkeitslösungen auf die DASE-Architektur („Distributed, Shared-E“erything“). Sie nutzt zustandslose Protokollserver („Cnodes“) und hochverfügbare Speichergehäuse („Dboxes“), um Daten, System-Metadaten und Zustände zu speichern. Jede Cnode hat direkten Zugriff auf alle Daten und Zustandsinformationen in den Dboxes. Auf diese Weise kann jeder C-Knoten für einen anderen C-Knoten einspringen, der offline geht.

Der DASE-Ansatz bietet nicht nur Redundanz für jede Komponente auf jeder Ebene des Systems, sondern vereinfacht auch die Arbeit der Vast-Software. Da jeder C-Knoten direkten Zugriff auf die gemeinsam genutzten SCM-SSDs („Storage-Class Memory“) hat, können sie direkt auf dem SCM lesen und schreiben.

Dadurch entfallen die Komplexität von NVRAM-Caches, die Aufrechterhaltung der Cache-Kohärenz und die Koordinierung von Schreibvorgängen über Knoten hinweg. Wenn ein C-Knoten neue Daten empfängt, schreibt er diese Daten direkt auf ein Paar SCM-SSDs, was ein wesentlich einfacheres Verfahren darstellt.

(ID:48393333)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung