Protokolle der Wiederbelebung nach Hitzetod Londoner Hitze knockt Datacenter von Oracle und Google aus

Von Ulrike Ostler |

Anbieter zum Thema

Londoner Rechenzentren, die von Google und der Oracle Corp. genutzt werden, waren am Dienstag in der Hitzewelle von 40 Grad k.o. gegangen. Einige Websites lahmten. Beide Unternehmen meldeten Probleme mit den Kühlsystemen als Ursache für die Ausfälle.

Diese bunten Rohrleitungen befinden sich nicht in London, sondern im Kühlraum des Google-Rechenzentrums in Singapur.
Diese bunten Rohrleitungen befinden sich nicht in London, sondern im Kühlraum des Google-Rechenzentrums in Singapur.
(Bild: Google)

Die erste Meldung Meldung am späten Vormittag New Yorker Zeit ist auf seiner Service-Seite von Oracle erschienen: „Nach ungewöhnlich hohen Temperaturen in der Region Großbritannien-Süd (London) kam es zu einem Ausfall von zwei Kühleinheiten im Rechenzentrum, die über ihre Auslegungsgrenzen hinaus arbeiten mussten. Infolgedessen begannen die Temperaturen im Rechenzentrum anzusteigen, was dazu führte, dass eine Teilmenge der Compute-Infrastruktur schützend abgeschaltet wurde.“

Offenbar war das Problem nicht so schnell lösbar wie gewünscht. Sieben Stunden nach den Notabschaltungen erreichten die Temperaturen im Datenzentrum wieder "brauchbare Temperaturen". Nach neun Stunden war ein Teil der kaputten Kühlanlagen repariert, nach elf Stunden alle. So hieß es für den Folgetag, um kurz vor 4:00 Uhr UTC im Protokoll: „Die Kühlungsinfrastruktur des Rechenzentrums wurde wiederhergestellt und die Temperaturen sind auf ein normales Betriebsniveau zurückgekehrt. Alle Dienste und Kundenressourcen wurden wiederhergestellt. Virtuelle Maschineninstanzen, die sich nicht selbst wiederhergestellt haben, wurden von Servicetechnikern manuell wieder in Betrieb genommen. Eine Teilmenge der Oracle Integration Cloud-Ressourcen ist jedoch weiterhin betroffen. Die Techniker arbeiten aktiv daran, diese verbleibenden Service-Ressourcen zu entschärfen.“

Erst um 11:00 Uhr am Nachmittag UTC folgte die Entwarnung: „Zum jetzigen Zeitpunkt sind alle Dienste und die damit verbundenen Ressourcen wiederhergestellt und die Kunden sollten nun eine Erholung erleben.“

Ergänzendes zum Thema
Die Hitzewelle in Großbritannien

Die bislang höchsten Temperaturen wurden in Großbritannien 2022 mit 40,3 Grad im Ort Coningsby, Lincolnshire, gemessen. Im Londoner St. James‘s Park und London Heathow waren es 40,2 Grad, in Gringley On The Hill, Nottinghamshire 40,1 Grad wie auch in Kew Gardens, London. Und in Notholt, West-London, kletterte das Termometer auf 40 Grad.
Die bislang höchsten Temperaturen wurden in Großbritannien 2022 mit 40,3 Grad im Ort Coningsby, Lincolnshire, gemessen. Im Londoner St. James‘s Park und London Heathow waren es 40,2 Grad, in Gringley On The Hill, Nottinghamshire 40,1 Grad wie auch in Kew Gardens, London. Und in Notholt, West-London, kletterte das Termometer auf 40 Grad.
(Bild: Google Maps)

Wie der britische Sender BBC gestern berichtete, wurden insgesamt wurden an sechs Orten Temperaturen von über 40 Grad gemessen, während an 28 weiteren Orten der bisherige Rekord von 38,7 Grad gebrochen wurde.

Nach Angaben des Deutschen Wetterdienstes liegt der Hitzerekord in Deutschland bei 41,2 Grad - gemessen am 25. Juli 2019 in Duisburg.

Bei Google

„Zum jetzigen Zeitpunkt können wir noch keinen Termin für die Behebung der Störung nennen“, hieß es bei Google noch am 19. Juli abends um 10:29 Uhr UTC, nachdem das Problem etwa zwei Stunden nach den Oracle-Ausfällen aufgetreten war.

Google konnte dann am 20. Juli gegen 3:45 UTC berichten: „In einem unserer Gebäude, in dem ein Teil der Kapazität der Zone 'europe-west2-a' für die Region 'europe-west2' gehostet wird, kam es zu einem Ausfall der Kühlung, der jetzt behoben ist. Die Auswirkungen auf die Google Cloud Engine (GCE), Persistent Disk und das Autoscaling wurden behoben. Kunden können nun die VMs in allen Zonen von europa-west2 starten.“ Zuvor waren bei Kunden anormale VM-Löschungen für eine kleine Gruppe ihrer VMs festgestellt worden.

Die Einschränkung: „Bei einer kleinen Anzahl von HDD-gesicherten Persistent Disk-Volumes treten noch Nachwirkungen auf und es werden IO-Fehler angezeigt.“

(ID:48489061)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung