Verloren im Labyrinth der IT-Begriffe? Hier finden Sie Definitionen und Basiswissen zu Rechenzentrums-IT und -Infrastruktur.

Automatische Stellvertreter Was ist Failover im Datacenter?

Von Martin Hensel |

Anbieter zum Thema

In Zeiten von fast schon obligatorischer Hochverfügbarkeit sind Ausfälle im Rechenzentrum kein Beinbruch mehr. Eine der genutzten Absicherungsmaßnahmen ist Failover: Fällt ein Primärsystem aus, springt automatisch ein Backup-System ein und ermöglicht den nahezu nahtlosen Weiterbetrieb.

Failover schützt im Rechenzentrum unter anderem Komponenten, Systeme und Dienste vor Ausfällen.
Failover schützt im Rechenzentrum unter anderem Komponenten, Systeme und Dienste vor Ausfällen.
(Bild: Colossus Cloud / Pixabay)

Der Begriff Failover steht für Ausfallsicherung. Er umschreibt im IT-Bereich Sicherheitsverfahren, die beim Ausfall beispielsweise einer Komponente, eines Dienstes oder eines ganzen Systems selbstständig auf bereitstehenden Ersatz wechseln und so den Betrieb aufrechterhalten. Dabei nennt man das zu schützende Objekt meist Primärsystem, während der Ersatz oft als Backup- oder Standby-System bezeichnet wird. Die manuelle Auslösung eines solchen Umschaltvorgangs ist als Switchover bekannt.

Im Rechenzentrumsumfeld sind vor allem kritische und hochverfügbare Server, Datenbanken und Netzwerke durch Failover-Implementierungen abgesichert. Um einen möglichst nahtlosen Umschaltvorgang zu gewährleisten, werden die Daten zwischen Primär- und Backup-Systemen kontinuierlich synchronisiert.

Im Falle eines Failover werden eingehende Anfragen und Verbindungen an das Backup-System umgeleitet. Der gesamte Vorgang funktioniert im Idealfall in so kurzer Zeit und so reibungslos, dass Anwender davon kaum etwas bemerken. Ist das Primärsystem wieder einsatzfähig, erfolgt nach einer Synchronisierung der Daten die Zurückschaltung, auch Failback genannt.

Einsatzszenarien und Ziele

Failover ist besonders für sensible und geschäftskritische Produktivsysteme von Vorteil, darunter etwa Datenbanken, Online-Shops, ERP-Systeme sowie IoT- oder Industrie-4.0-Anwendungen. Die entsprechen Implementierungen sorgen insbesondere dafür, dass Systeme und Verbindungen hochverfügbar sind und sicher zur Verfügung stehen.

Vollständige Ausfälle werden im besten Fall komplett verhindert oder zumindest abgefedert. Dienstunterbrechungen sind damit nur noch sehr selten der Fall. Treten doch einmal trotz Failover spürbare Probleme auf, ist dies meist auf die Menge der von der Umschaltung betroffenen Daten oder die verfügbare Bandbreite zurückzuführen. Grundsätzlich sollte die Datenreplizierung vom Primär- auf das Backup-System so erfolgen, dass im Ernstfall eine möglichst kurze Umschaltzeit erreicht wird.

Failover-Implementierungen erleichtern zudem Wartungsmaßnahmen an Systemen, Netzwerkverbindungen oder Datenbanken. So ist zum Beispiel eine automatisierte Umschaltung während geplanter Software-Updates möglich. Failover-Verfahren finden sich nicht nur in großen Systemen und IT-Umgebungen, sondern schützen mitunter auch einzelne PCs oder mobile Geräte vor Ausfällen.

Dabei registrieren Software- oder Hardware-basierte Trigger mögliche Defekte oder Ausfälle und leiten im Ernstfall die Umschaltung auf redundante Ersatzkomponenten oder Backup-Systeme ein. Auf diese Weise lassen sich unterschiedlichste Komponenten und Dienste absichern, von Prozessoren über Datenspeicher und Netzwerkverbindungen bis hin zu ganzen Servern, Datenbanken und Anwendungen.

Am Herzschlag des Servers

Im Rechenzentrumsbereich kommen häufig Failover-Cluster zum Einsatz, die auch als Aktiv/Passiv-Cluster bezeichnet werden. Gemeint ist ein Verbund aus mindestens zwei Systemen, die in Primär- und Backup-Systeme geteilt sind. Die Kommunikation zwischen diesen Systemen erfolgt meist per Heartbeat („Herzschlag“) oder ähnlichen Verfahren.

Dabei handelt es sich um eine physische oder kabellose Netzwerkverbindung, über die sich die verbundenen Server ihre aktuelle Betriebs- und Funktionsbereitschaft mitteilen. Fällt dieser „Herzschlag“ des Primärsystems aus oder wird eine Funktionsstörung gemeldet, springt ein Ersatzsystem ein. Mehrere Pfade, redundante Komponenten sowie die Integration von Offsite- oder Cloud-Ressourcen erhöhen die Belastbarkeit solcher Failover-Cluster zusätzlich.

Für die Durchführung eines Failovers sind entsprechende Lösungen erforderlich. Dank Virtualisierung ist das Verfahren nicht mehr von spezifischer Hardware abhängig. So lässt sich beispielsweise ein in einer virtuellen Maschine laufendes System im Notfall einfach von einem Host auf einen anderen übertragen, um den Betrieb weiterzuführen. Failover ist zudem ein wichtiges Element der Disaster-Recovery-Strategie von Unternehmen. Sind die entsprechenden Maßnahmen korrekt implementiert, lässt sich ein nahezu vollständiger Ausfallschutz realisieren.

(ID:48519138)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung