Neues aus der Open-Source-Küche OCP Summit 2023: Im Mittelpunkt stehen Connectivity, Chiplets, Hardware und Kühlung
Anbieter zum Thema
Mit dem Aufkommen von AI-tauglichen Systemen steigen die Anforderungen an Kommunikationssysteme und die Kühlung der Hochleistungs-Racks. Beide Themen standen im Zentrum des „OCP Summit 2023“. Außerdem wurden weitere wichtige Kooperationen verkündet.

Mehr als 4.000 Besucher und Besucherinnen kamen vom 17. bis zum 19. Oktober persönlich zum weltweiten Summit des OCP (OPC = Open Compute Project). Das waren noch einmal rund ein Viertel mehr als im vergangenen Jahr, dem ersten nach der Corona-bedingten Zwangspause. DIe Zahlen zeigen, dass die Open-Bewegung Freunde gewinnt.
Aber: Die OCP ist auch weiterhin bestrebt, ihre Kooperationen zu intensivieren. Darauf deuten mehrere Ankündigungen zur Veranstaltung hin.
Standard-Beschreibungssprache für Chiplets
So hat die OCP eine Kooperationsabkommen mit der Mikroelektronik-Standardisierungsorganisation JEDEC (Joint Electronic Devices Engineering Council) Solid State Technology Association unterzeichnet. Gemeinsam sollen neue Standards für für neuartige Devices (Chiplets) entwickelt werden.
Für Entwurf und Aufbau von aus Chiplets bestehenden Systems in Package (SiP) soll eine einheitliche Beschreibungssprache (CDXML) für die Arbeit mit elektronischen Designsystemen soll entstehen und von der OCP herausgegeben werden. Die Beschreibungen enthalten thermische, Physikalisch-mechanische, Verhaltens-, Stromverbrauchs-, Test- und Sicherheitsangaben.
Dann können die Beteiligten an einer Produktionskette standardisierte elektronische Beschreibungen untereinander austauschen. Die OCP-Entwicklung CDXML soll kostenlos in Jedec JEP30, einen Standard für die Teile von Modellen, einfließen.
Insgesamt soll eine offene Chiplet-Ökonomie entstehen. Sie ermöglicht auf bestimmte Anwendungsfelder zugeschnittene elektronische Komponenten und mehr Herstellerunabhängigkeit und soll den Aufbau der nächsten Computergeneration beflügeln.
"Total Design" von ARM
In Richtung Individualisierung weist auch ARMs Neoverse-Initiative. Sie wurde jetzt zu „ARM Total Design“ erweitert und soll nun sämtliche Produktionsstufen umfassen.
Dazu gehört die Validierung des intellektuellen Eigentums von Drittpartein und Design-Expertise. Zudem werden führende 3D Design- und Herstellungsprozesse verwendet.
Ethernet-FInetuning für AI und HPC
Eine weitere Kooperation verbindet die OCP Foundation mit dem Ultra Ethernet Consortium (UEC). Die UEC passt Ethernet an spezifische Workloads an, wobei es derzeit insbesondere um AI und HPC geht. Die OCP bringt Know-how zu Spezifikationen auf der Systemebene und zum Aufbau neuer Märkte nichts.
Entstehende Technologien sollen große Bandbreite, niedrige Latenz und einen geringen Stromverbrauch verbinden. Als Lösung kommt hier optische Verbindungstechnik in Frage, die als Silizium-Chiplet realisierrt wird.
Außerdem ist geplant, große Speicherpools mit CXL und speziellen Memory-Appliances zugänglich zu machen. Dazu gehören auch neuartige Kühllösungen.
Außerdem muss Ethernet besser mit großen Sprachmodellen (LLM) fertig werden. Her stellen sich Probleme bei der Größe des zugreifbaren Speicher und dem Aufbau der Backend-Fabric von AI-Clustern. Die erarbeiteten Verbesserungen sollen schnell in am Markt erhältliche Systeme einfließen.
Mehr Sicherheit für Datacenter-Hardware und -Firmware
Zudem kündigte die OCP ein neues Programm für verbesserte Sicherheit von Datacenter-Hardware und Firmware an. Es soll das bestehende OCP Emerging Market Program ergänzen, dem sich bislang mehr als 50 OCP-Hersteller angeschlossen haben.
"S.A.F.E" (Security Appraisal Framework and Enablement) umfasst die Erstellung Device-spezifischer Audit-Checklisten und Kriterien für die Auswahl von Drittunternehmen für die Zertifizierung. Beides wird als Open Source bereitgestellt. Qualifizierte Auditoren werden als OCP Security Review Providers (SRP) bezeichnet.
Geplant ist, nicht nur jedes Device, sondern auch jede neue Version zu zertifizieren. Zertifizierte Produkte erhalten ein Label und werden auf dem OCP-Marktplatz gekennzeichnet. Wegen der standardisierten Kriterien und weil die Dokumente einmal vorgenommener Zertifizierungen öffentlich zugänglich sind, sollen in Zukunft Doppelzertifizierungen unterbleiben. Außerdem können sich Firmen so ohne die Kostenrisiken eines eigenen Zertifizierungsprozesses darauf verlassen, sichere Produkte einzusetzen.
Neue Hardware von Pegatron
Daneben gab es eine Reihe von Produktankündigungen, viele von ihnen aus den Bereichen Kommunikation und Kühlung. Aber mit Pegatron ist auch ein neuer taiwanesischer Hersteller mit einem kompletten Portfolio an OCP-kompatiblen Servern mit Intel- AMD- und Ampere-Prozessoren, Storage-Hardware und Netzkomponenten der OCP beigetreten.
Unter anderem präsentiert Pegatron die 5 U-Storage-Einheit „Dino“ für maximal 112 Harddrives. Der Server „Luigi“, derzeit das leistungsdichteste Ampere-System, fasst bis zu 168 Cores pro Knoten auf zwei Höheneinheiten. Mit „Jimbo“ hat Pegatron auch ein System auf Basis des Nvidia-Chips „Grace Hopper“ im Programm.
Wellenlängen nahtlos switchen
Eine Herausforderung bei AI-Umgebungen ist, dass Inferenz, Lernen und Edge sehr unterschiedliche Anforderungen an die Vernetzung stellen. Sie basiert in der Regel aus WDM (Wavelength Diverse Multiplex)-Systemen. Jeder Wellenlängenwechsel bedeutet bisher unerwünschte Zeitverluste. Xscape Photonics, ein Startup aus New York, hat hierfür eine Lösung gefunden.
„CombX“ kann mit einer Geschwindigkeit von 64 GBit/s pro Wellenlänge und ohne physische EIngriffe ins Netzwerk zwischen unterschiedlichen Wellenlängen umschalten. Das könnte ein völlig neues Design der Backend-Fabrics in AI-Umgebungen möglich machen.
Astera Labs: Umstellung auf aktuelle Technologie
Astera Labs, marktführend bei DSP-Retimern für GPU-Cluster, AI- und Cloud-Infrastrukturen stellt zur OCP sein gesamtes Portfolio auf die aktuelle Technologiebasis um. Der CXL Memory Cotroller erlaubt den Anschluss von 56 statt 24 DDR5-DIMM-Memory-Modulen.
Die PCI-Produkte kommen jetzt auch mit PCI 5.0 zurecht. Zudem stellte das Unternehmen mit Evernet das längste aktive Kupferkabel vor, das es in verschiedenen Formen (über Kreuz, linear, Verzweigung) gibt.
Molex stellte mit dem „Kickstart Connector“ ein OCP-konformes Kabelset zur Anbindung von Boot-Drives vor, das Stromkabel, ein schnelles und ein langsames Datenkabel umfasst und Pin-kompatibel zum EDSFF-Format ist.
Flüssigkühlung auf dem Vormarsch
Außerdem wirft das AI-Zeitalter auch hinsichtlich der Kühlmethoden deutlich seinen Schatten voraus: Die leistungsstarken Maschinen machen einen Umstieg auf Flüssigkühlmethoden nötig. Luft ist einfach nicht imstande, die Wärmemengen von Racks mit 18 und mehr kW Leistungsdichte wegzukühlen.
:quality(80)/p7i.vogel.de/wcms/71/a8/71a8ca2b8c8bdde448d21659fd8c9152/0114682655.jpeg)
Nachfrage nach Wärme-Management für Datacenter und die Flüssigkühlung
IDtechex vergleicht Kühlmethoden und -flüssigkeiten
So wundert es nicht, wenn gleich mehrere Firmen neue entsprechende Lösungen präsentierten. Dabei stach besonders das Startup-Unternehmen Accelsius heraus. Celsius stellt eine Lösung für die Kühlung leistungsstarker AI-Cluster vor.
Dielektrikum on-Chip
Das patentierte System „Neucool“ verwendet ein zweiphasiges Dielektrikum als Kühlflüssigkeit, wie man es aus der Immersionskühlung kennt. Solche Flüssigkeiten reagieren nicht mit ihrer elektrisch leitfähigen Umgebung. Neucool bringt es direkt auf die erhitzten Chips auf, wo es verdampft.
Wegen der Eigenschaften der Flüssigkeit können Leckagen keinen Schaden an den Geräten anrichten. Die Flüssigkeitsverteilleitungen bis zum Chip (Manifolds) erfüllen die strengen Standards der Automotive-Industrie. Die CDUs (Coolant Distribution Units).kommen mit allen nötigen Kommunikationseinheiten und Software.
Die Kühlleistung des Dielektrikums ist größer als die von Wasser. Außerdem sind die Pumpen der Lösung kleiner und effizienter. EInige PoCs laufen bereits.
Noch mehr Liquid-Cooling-Produkte
Wiwynn zeigte die Demonstration seines Produkts „Aqualoop“. Es besteht aus Komponenten für die Chip-, Server- oder Rack-Kühlung und einem Leckagedetektor. Die Komponenten sind zu „Open Rack V3“ kompatibel. Für das Kühlen von Racks ist entweder eine Kühltür oder ein seitlicher Anbau (Sidecar) möglich.
Auch Auras zeigte eine kombinierte Wasser-Luft- und eine konsequente Flüssigkühleinrichtung. Erstere eignet sich zur Umrüstung von Serverumgebungen, die nicht gänzlich auf Flüssigkühlung umstellen können. Sie setzt eine rückwärtige Kühltür ein, um die Wärme abzuführen. Letztere ist für Neuinstallationen auf der grünen Wiese gedacht.
Delta Electronic präsentierte mit „AALC“ ebenfalls ein Open-Rack-V3-kompatibles Rack mit intregrierter Flüssigkühllösung. Auch hier werden Luft- und Flüssigkühlung kombiniert. Rohre und Doppelböden im Rechenzentrum sollen damit überflüssig werden. Die Lüfter leisten 20 Prozent mehr bei zehn Prozent weniger Stromverbrauch.
(ID:49760486)