Electronics Manufacturing Services im Cloud-Rechenzenrum

EMS-Anbieter hilft Hyperscale-Datacenter beim Kostensparen

| Autor / Redakteur: Gelston Howell* / Ulrike Ostler

Hyperscaler kaufen keine einzelnen Server oder Switsches oder Storage-Devices, sie geben das Design vor, ganz oder zumindest teilweise. Für den Einbau, die Tests und die Vernetzung holen sie sich Electronics Manufacturing Services, etwa von Sanmina, zur Hilfe.
Hyperscaler kaufen keine einzelnen Server oder Switsches oder Storage-Devices, sie geben das Design vor, ganz oder zumindest teilweise. Für den Einbau, die Tests und die Vernetzung holen sie sich Electronics Manufacturing Services, etwa von Sanmina, zur Hilfe. (Bild: Strato AG)

Google, Amazon und weitere große Internet-Unternehmen entwickeln längst ihre eigene Geräte-Architektur. Hard- und Software werden maßgeschneidert. Beispielsweise Netflix und Shutterfly aber verfolgen einen anderen Ansatz. Sie nutzen Semi-Custom Storage Hardware. In jedem Fall aber braucht es ein Management der Montage und der Funktionstests zur Qualitätssicherung. Hier kommt etwa Sanmina ins Spiel.

Rechenzentren müssen Servicekontinuität garantieren, während sie gleichzeitig zur Erhöhung der Geschwindigkeit, Verbesserung der Energie-Effizienz und Steigerung der Speicherkapazitäten ihre Technologie modernisieren. Steigende Nachfrage nach Internet-Diensten, sowie die explosionsartige Zunahme sozialer Medien und Cloud-Storage, erhöhen den Wachstumsdruck weiter.

Um den zunehmenden Bedarf an Speicherkapazität und Bandbreite zu decken, gestalten insbesondere Hyperscale-Datenzentren ihr Wachstum durch den Einsatz neuer Geschäftsmodelle. Das führt auch zur Zusammenarbeit mit neuen, nicht traditionellen Partner-Unternehmen, um die zunehmende Komplexität des Upgrade- und Instandhaltungs-Managements für ihre Rack-Systeme erfolgreich zu gestalten. Zu diesen neuen Partnern gehören EMS-Anbieter.

Die IT- und Qualitätssysteme, die in der globalen Fertigung stark regulierter Industriezweige zum Einsatz kommen, bieten eine Infrastruktur, die ein effizientes Management der Montage und des Funktionstests zur Qualitätssicherung großer Rack-Systeme für Datenzentren ermöglicht. Die dort zum Einsatz gebrachten Methoden zur Betreuung komplexer Fertigungs- und Testprozesse, können nahtlos zur effizienten Montage, für einen automatisierten Funktionstest, Installation, sowie Inbetriebnahme und Instandhaltung großer Rack-Systeme in Hyperscale-Datenzentren eingesetzt werden.

Neue Dimensionen

Betrachten wir zum Beispiel ein großes Datenzentrum mit 10.000 Racks, 300.000 Servern und über 20.000 RAID-Speicher Systemen… Um mit der technischen Entwicklung und der steigenden Nachfrage Schritt halten zu können, benötigt ein derartiges Datenzentrum bis zu 300 neue Rack-Systeme pro Quartal.

Google: „Im Zuge unserer Selbstverpflichtung, die Daten unserer Nutzer zu schützen, zerstören wir alle defekten Festplatten vor Ort.“
Google: „Im Zuge unserer Selbstverpflichtung, die Daten unserer Nutzer zu schützen, zerstören wir alle defekten Festplatten vor Ort.“ (Bild: Google (St. Ghislain, Belgien))

Die Konfigurationen der Racks umfassen neben Hochgeschwindigkeits- und „Cold“-Storage, auch Web-Server und Benutzerdatenbanken. Neue Technik ermöglicht dabei immer effizientere Designs und stellt naturgemäß das Management eines Datenzentrums dieser Größe vor große Herausforderungen.

Zunächst muss die Installation und Inbetriebnahme von Hunderten neuen Racks jedes Quartal nahtlos und ohne Auswirkungen auf die Server-Verfügbarkeit erfolgen. Im Weiteren muss es möglich sein, fehlerhafte Hardware im Datenzentrum effizient zu lokalisieren und schnell zu ersetzen.

Ein Fallbeispiel

Folgendes Beispiel dokumentiert den Rationalisierungs-Effekt, der durch den strukturellen Ansatz eines großen EMS-Anbieters erzielt werden kann.

Das Upgrade des Rechenzentrums eines Unternehmens erforderte die nahtlose Installation großer Rack-Systeme während des Betriebes. Eingesetzt wurde existierende, kommerzielle „Off-The-Shelf“-Hardware; die Basis-Boot-Software-Images und die Systemkonfiguration wurden vom Betreiber des Rechenzentrums vorgegeben.

Das Unternehmen wählte Sanmina als Partner, einen führenden Anbieter von Fertigungsdienstleistungen für die Elektronikbranche. Ausschlaggebend war nach Unternehmensangaben die umfassende Erfahrung mit RAID-Technologie, System Rack Integration von High-End-Servern, 10/100G-Netzwerken und Systemintegration. Die Fertigungsinfrastruktur musste als Leistungsanforderungen das Management der gleichzeitigen Tests von 70 Rack-Systemen mit bis zu 2.000 Servern und 5.000 Speichereinheiten ermöglichen.

Die Umsetzung

Die Anforderung bestand in der termingerechten Lieferung mehrerer hundert, getesteter, fehlerfreier Systeme je Quartal. Ein sehr enges Zeitfenster war während des System Builds und der Installation einzuhalten und der laufende Betrieb der existierenden Infrastruktur musste dabei unbedingt gewährleistet bleiben. Eine effektive und präzise Planung des Projekts, sowie eine fehlerfreie Durchführung, waren dabei unabdingbar – und das einmal pro Quartal.

Das Programm wurde in drei Hauptschritten umgesetzt:

  • Implementierung eines effizienten Assemblierungsprozesses
  • Entwicklung eines modularen und hochskalierbaren Testsystems
  • Planung eines flexiblen Logistiksystems

Der Montageprozess wird effektiviert

Sanmina nutzte seine BTO/CTO Erfahrung komplexer Computer- und Telekommunikations-Hardware, um die Fertigung der Rack-Systeme innerhalb eines engen Zeitplans in jedem Quartal zu optimieren. Zur Bewältigung des Strombedarfs von 72 gleichzeitig betriebenen Racks, wurde ein effizientes Stromversorgungs- und Klimasteuerungssystem konzipiert. Eine 1-MW-Trafostation lieferte die nötige Leistung, die für die Rack-Systeme während der Konfiguration und der Testphase erforderlich war.

Dies ermöglichte Paralleltests aller Racks und reduzierte so die benötigte Zeit für den Systemtest. Für die Konfiguration und Lokalisierung jedes Racks im System wurde ein eigener Prozess entwickelt. Dieser bestimmte die exakte Position im Rechenzentrum und ermöglichte eine effiziente und zügige Installation. Während der Montage, Integration und Test waren Zulieferer im Integrationswerk anwesend, um den unverzüglichen Austausch von Komponenten (FRUs) einschließlich Mainboards, NIC-Controllern und Treibern zu ermöglichen.

Google: „Wir haben alle Daten gesichert, falls jemals etwas damit passieren sollte. Wir sichern Daten unter anderem in dieser Bandbibliothek. Roboterarme wie die am Ende des Ganges helfen uns beim Einordnen und Herausnehmen der Bänder, wenn wir darauf zugreifen müssen.“
Google: „Wir haben alle Daten gesichert, falls jemals etwas damit passieren sollte. Wir sichern Daten unter anderem in dieser Bandbibliothek. Roboterarme wie die am Ende des Ganges helfen uns beim Einordnen und Herausnehmen der Bänder, wenn wir darauf zugreifen müssen.“ (Bild: Google (Berkeley County, South Carolina))

Das Testsystem ist modulares und hochskalierbar

Besonders wichtig war die Konzipierung eines modularen, hochskalierbaren Testsystems, um zeitgleich Tests einer großen Anzahl von Racks durchzuführen. Hinzu kam die beträchtliche Anzahl an RAID-Technik, SAS-Schnittstellen, Festplatten, SDS, 100-Gigabit-Switches, NICs und Hochleistungsprozessoren.

Tausende zu testende Server wurden mit zentralen Servern verbunden, jedem Server-Typ wurden dabei automatische Netzwerk-Bootp-Pozesse über das iPXE-Protokoll und spezifische Software-Images bereitgestellt. Linux-Shell-Skripte wurden zur Automatisierung des Test-Prozesses entwickelt.

Die Monitoring-Software Nagios lieferte eine grafische Benutzeroberfläche zum visuellen Management der Tausenden im Test befindlichen FRUs. Für jeden einzelnen Switch, jede Storage- und Compute-Unit wurden sämtliche Testdaten auf einem zentralen Server protokolliert und für die Lebensdauer der betreffenden Einheit gespeichert.

Zudem wurde der Teststatus durch eine durchgängige Kommunikation mit dem Betreiber des Datenzentrums in Echtzeit übertragen, um die Produktimplementierung zu verbessern. Dies beschleunigte die Inbetriebnahme-Prozesse und erhöhte das Vertrauen in den Testvorgang und den Burn-In-Prozess.

Die Logistik arbeitet flexibel

Um eine effiziente Multi-Rack-Installation zu gewährleisten, wurde eigens für diesen Kunden ein Logistiksystem entwickelt. Ein umfassendes Kennzeichnungssystem für jede Transportkiste wurde entwickelt. Dieser Prozess ermöglichte die Lieferung designierter Racks innerhalb eines Zeitfensters von vier Stunden zum Standort im Rechenzentrum.

Das Zeitfenster von vier Stunden stellte den kontinuierlichen Service der redundanten Systeme des Datenzentrums sicher. Wiederverwendbare Verpackungen zum sicheren Transport der Racks wurden entworfen und getestet. Das Design machte zudem spezielle Ausrüstungen und Werkzeuge zum Entladen der Systeme im Datenzentrum überflüssig und ermöglichte so ein effizientes Liefern und Auspacken.

Ein Asset-Registrierungs-Softwaresystem wurde entwickelt, um die einfache Lokalisierung fehlerhafter Einheiten unter Hunderttausenden Servern, Festplatten und SSDs innerhalb des Datenzentrums auch lange nach Lieferung und Installation zu ermöglichen. Auch die notwendige Einrichtung einer Datenbank mit Teilenummern, Seriennummern und MAC-Adressen wurde umgesetzt.

Signifikante Verringerung der Kosten und der Ausfälle

Während der Rack-Montage wurde der Einbauort jedes Switches, jedes Prozessors und jeder Speichereinheit innerhalb jedes Racks aufgezeichnet. Mit Hilfe dieser Datenbank konnten fehlerhafte Einheiten lokalisiert werden. Ein akkurates Arbeiten war hierbei unerlässlich. Ein Barcode-Scan-Prozess wurde über ein integriertes Shell-Skript-Programm zur Prüfung der Standort- und technischen Daten eingesetzt.

Sanmina lieferte jedes Quartal mindestens 200 Systeme in einem Zeitrahmen von nur zwei Wochen. Das Datacenter konnte die Ausfallraten und die gesamten Systemkosten signifikant reduzieren.

Gelston Howell, SeniorVice President Marketing bei der Sanmina Corporation: „Sanminas Expertise und globale Struktur ermöglichen eine erfolgreiche Umsetzung des neuen Geschäftsmodells von Hyperscalern.“
Gelston Howell, SeniorVice President Marketing bei der Sanmina Corporation: „Sanminas Expertise und globale Struktur ermöglichen eine erfolgreiche Umsetzung des neuen Geschäftsmodells von Hyperscalern.“ (Bild: Sanmina Corporation)

Die mitgebrachte Erfahrung in den Disziplinen Systemintegration, Test-Skripts, Burn-In und Logistik waren besonders entscheidend für den Erfolg dieses Projektes. Die erhöhte Test-Tiefe für die Systeme sowie ein erweiterter Burn-In-Prozess reduzierten frühe Ausfälle ein einem hohen Maß, eliminierten Dead-On-Arrival und verringerten so die Gesamtkosten.

Eine erhebliche Steigerung der Effizienz des Installations-Prozesses, sowie die Reduktion der laufenden Kosten der Instandhaltung im Datenzentrum waren messbare Erfolge.

* Gelston Howell ist Senior Vice President Marketing bei der Sanmina Corporation.

Was meinen Sie zu diesem Thema?

Schreiben Sie uns hier Ihre Meinung ...
(nicht registrierter User)

Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
Kommentar abschicken
copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 44579311 / Services)