Eine IP-Konfiguration war schuld

Autsch! Die Google Compute Engine offline

| Redakteur: Ulrike Ostler

Das passiert auch den ganz Großen: Software- und Denkfehler knocken Google aus.
Das passiert auch den ganz Großen: Software- und Denkfehler knocken Google aus. (Bild: cirquedesprit/Fotolia.com /Google)

„Wir haben daraus gelernt“, sagt Benjamin Treynor Sloss, Vice President 24x7 bei Google. Jetzt hat sich der Konzern für den 18minütigen Systemausfall am 11. April bei seinen Kunden entschuldigt die Serie von Softwarefehlern identifiziert.

Das Problem begann am Montag, den 11. April, kurz nach 19:00 Uhr (Pacific Time), als sich eine fehlerhafte IP-Konfiguration in den Netzen der Google-Rechenzentren ausbreitete. Zuvor, um 14:50 Uhr Ortszeit hatte man einen Block an IP-Adressen ausgemustert, der aufgrund einer Zeitdifferenz bei Anstoß nachfolgender Prozesse allerdings noch von der Google Compute Engine (GCE) benutzt wurde, so dass das Manöver fehlschlug.

Letztlich führte das zur Instabilität des Netzes. Die Änderung der IP-Adressen steht in Zusammenhang mit dem Wechsel auf das Internet BGP Protokoll, das Google proagiert, um für andere Internet-Nutzer auffindbar zu sein.

Dazu kam, dass ein zuvor unbekannter Fehler verhinderte, dass das System den zuvor stabilen Zustand wiederherstellen konnte. Doch selbst zu diesem Punkt, hätte es noch einen Rollback gegeben, immerhin schlug die Systemüberwachung Alarm. Doch es gab einen weiteren Software-Bug. So wurden stattdessen alle GCE’s IP Blocks abgeschaltet, ein Vorgang, der sich auf die gesamte Google-Infrastruktur ausweitete und GCE unerreichbar machte.

Zurücksetzen und neu starten

Google ckeckte das Problem um 18:14 PT, als die GCE-Antwortzeiten nach oben gingen, weil mehr und mehr Nutzer von den Routern auf die verbliebenen Seiten geleitet wurden. Zur selben Zeit fiel das Cloud VPN in der Zone Ostasien 1 aus. Die Techniker konnten zwar nicht sofort die Fehler finden, setzten die Infrastruktur aber auf die alte Konfiguration zurück, so dass die Google-Services letztlich für 18 Minuten offline waren.

Wir sehen die die Schwere dieses Ausfalls und entschuldigen uns bei allen Kunden, die dadurch Schwierigkeiten hatten“, so Sloss. Google gewährt GCE-Kunden10 Prozent Nachlass bei der nächsten Rechnung und Nutzer des „Google Cloud VPN“ bekommen einen 25prozentigen Nachlass. Die „Google App Engine”, “Google Cloud Storage” und weitere Cloud-Angebote waren von dem Ausfall nicht betroffen.

Was meinen Sie zu diesem Thema?

Schreiben Sie uns hier Ihre Meinung ...
(nicht registrierter User)

Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
Kommentar abschicken
copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 44000386 / Software)