News vom OCP Global Summit im Silicon Valley ARM gehört jetzt zum Vorstand des Open Computer Project

Von lic.rer.publ. Ariane Rüdiger 4 min Lesedauer

Anbieter zum Thema

Vom jüngst vergangenen „OCP Global Summit“ gibt es Vieles zu berichten. Unter anderem ist AMD in die Reihen des OCP-Vorstands aufgerückt. Aber auch technisch signalisiert die Organisation große Fortschritte. AI prägt alle Debatten.

Das Open Compute Priject definiert heute die Spezifikationen für die leistungsfähigen AI-Rechenzentren von morgen. (Bild:  ARM)
Das Open Compute Priject definiert heute die Spezifikationen für die leistungsfähigen AI-Rechenzentren von morgen.
(Bild: ARM)

Beim weltweiten OCP Summit in San José im Oktober hat die Organisation viele Neuigkeiten im Gepäck gehabt. Die Open-Source-Organisation entwickelt sich mit ihren Spezifikationen immer mehr zum Schrittmacher für zukunftsgerichtete, nachhaltige Hardware- und Infrastrukturentwicklungen, zumindest der westlichen Hemisphäre.

Eine der wichtigsten Neuerungen im Jahr 2025 ist wohl die von ARM präsentierte Architektur-Blaupause, im Branchensprech 'Framework' genannt, für ein offenes, konvergentes AI-Datenzentrum. Das werde, so die ARM-These, nicht mehr aus Commodity-Chips bestehen, sondern aus eigens designten Chiplets in 2,5- und 3D-Technologie. Damit können Spezialisten jeweils möglichst leistungsfähige Komponenten beisteuern.

Die Chiplet-Architektur von ARM FCSA verbindet heterogene Komponenten

Zu dieser Idee passend, bringt ARM weiterhin seine herstellerunabhängige 'Foundation Chiplet System Architecture' (FCSA), in die OCP ein. Sie baut, nun ISA-agnostisch, auf seine bereits 2023 vorgestellte CSA auf. Diese Architektur beschreibt, wie in einem Package Chiplets verschiedener Hersteller nahtlos zusammenarbeiten können.

Dabei bezieht das Design Speicher, Ein-/Ausgabe und Beschleuniger wie GPUs ein. Von Elian kommt eine Erweiterung zur 'Open Chiplet Interconnect'-Spezifikation (BoW 2.0). Diese Spezifikation unterstützt höhere Bandbreiten. Wichtigstes Anwendungsgebiet dafür sind HPC, Gaming und Automotive-Workloads.

ARM im OCP-Vorstand

Für seine Anstrengungen ist ARM gleich einmal mit einem Vorstandssitz in der OCP belohnt. Dort sitzt der Chipdesigner nun neben AMD und Nvidia und hilft, die offenen Standards für die konvergente AI-Welt zu definieren.

Die „Foundation Chiplet System Architecture“ (FCSA) von ARM dient als Blaupause für den Aufbau von Systemen aus maßgefertigten Chiplets.(Bild:  ARM)
Die „Foundation Chiplet System Architecture“ (FCSA) von ARM dient als Blaupause für den Aufbau von Systemen aus maßgefertigten Chiplets.
(Bild: ARM)

Das scheint gerechtfertigt; denn mehr als 50 Prozent der Hyperscaler-Hardware, so ARM, stamme aus dem eigenen Designhaus. Die Ankündigung ordnet sich ein in die Etablierung eines neuen OCP Arbeitsbereichs „AI Datacenter Infrastructure Standards“.

Open Data Center for AI

Er gehört zu der strategischen AI-Initiative „Open Data Center for AI“. Arbeitsgruppen entstehen hier für eine Reihe von Themen, etwa für passende Hochspannungs-Gleichstromsysteme und weitere Aspekte der Stromversorgung.

Weitere Punkte sind standardisierte CDUs (Cooling Distribution Units). Auch ein besseres Verständnis der physischen Parameter wie Gewicht, Dimensionierung der Racks soll gewonnen werden.

Zudem soll ein Standard-Messprotokoll für Messungen an den physischen Systemen entstehen. Schließlich ist für ein autonomes Steuerungssystem geplant, das zwischen Stromverbrauch und Lastschwankungen ausgleichen sollen.

CDU für 2 MW Kühlkapazität

Wie beispielsweise entsprechende CDUs aussehen könnten, hat Google mit Deschutes demonstriert. Die neuartige CDU (Coolant Distribution Unit) kann bis zu 2 MW Wärme kühlen. Die hydraulischen Kapazitätsziele liegen bei etwa 1900 Litern/Minute mit 5,4 bis 6,1 atm Überdruck.

Die Komponenten kommen von mehreren Herstellern. Auch Wartung und Installation wird von mehreren Firmen gemeinsam erledigt, um die Aufstellung zu beschleunigen.

Meta: Spezifikation für neuartigen Compute-Tray für AI-Umgebungen

Meta hat „Clemente“, seine Spezifikation eines Compute-Trays für AI vorgestellt. Es ist das erste derartige Modul, das konform zur Spezifikation OCP ORv3 (Open Rack) HPR (High Power Rack) ist. Open Rack definiert eine Breite von 21 Zoll.

Der rasante Anstieg der Prozessorleistung erfordert Anpassungen in Datacenter-Architektur und dem Energie-Managment. (Bild:  Semi)
Der rasante Anstieg der Prozessorleistung erfordert Anpassungen in Datacenter-Architektur und dem Energie-Managment.
(Bild: Semi)

Darauf montiert sind zwei „Nvidia GB3000“ Host Prozessor Module. Die Peripherie ist auf AI/ML-Trainings- und Inferenzaufgaben bei Meta abgestimmt. Das Modul hat luft- und wassergekühlte Komponenten und steht damit für den Trend, beide Kühltechnologien in ein und demselben Schrank zu implementieren.

Vernetzung für AI-Cluster

Auf der OCP wurde auch eine neues Kooperationsprojekt zum Thema Vernetzung verkündet. Wichtig ist dieses für ESUN (Ethernet Scale-up Networking) den Aufbau von AI-Clustern.

Für die Inter-Prozessor-Kommunikation soll eine Open-Transport-Schicht mit Ethernet als Transportmechanismus entstehen. Wichtigstes Ziel ist die Erleichterung der Partitionierung von Workloads, der Lastverteilung und der Speicheranforderung.

Protokoll-Header werden verändert

Im Mittelpunkt steht der Transport von Datenpaketen. Gearbeitet wird beispielsweise an den Protokoll-Headern, der Fehlerbehandlung und dem verlustfreien Datentransport.

Ein neuartiges, OCP-Spezifikationen-konformes Compute-Tray mit zwei Nvidia-Prozessoren mit dem Projektnamen „Clemente“ stellt Meta vor.(Bild:  Meta)
Ein neuartiges, OCP-Spezifikationen-konformes Compute-Tray mit zwei Nvidia-Prozessoren mit dem Projektnamen „Clemente“ stellt Meta vor.
(Bild: Meta)

Wann die ersten Ergebnisse vorliegen werden, ist noch unbekannt.Beteiligt sind an dem Projekt derzeit viele wichtige Branchengrößen, darunter AMD, Broadcom, Arista, Cisco, HPE, Meta, Microsoft, Nvidia und Marvell.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Kooperationen mit SNIA, ASHRAE und OIX

OCP hat die Kooperation mit anderen Organisationen wesentlich erweitert. Mehr Zusammenarbeit gibt es mit SNIA (Storage Networking Interface Association), ASHRAE (American Society of Heating, Refrigerating and Air-Conditioning Engineers) und OIX (Open-IX).

Die Organsiation SNIA befasst sich mit Storage-Vernetzung. ASHRAE definiert die Temperatur- und Feuchtigkeitsrahmen, die für Rechenzentren gelten. OIX definiert einheitliche Spezifikationen für Datentransfer und die physische Verbindungsschicht zwischen Rechenzentren. Der Direkttransport, der so genannte Interconnect-Verkehr, zwischen Rechenzentren wird immer wichtiger.

SNIA entwickelt gemeinsam mit OCP an offenen AI-Systemen

Das SNIA-Projekt Storage AI arbeitet am selben Thema wie das OCP-Projekt „Open Systems for AI“. Gemeinsam will man an unter anderem an Storage, Management und Networking arbeiten, etwa durch Workshops oder übergreifende Iniatiativen. Mit ASHRAE kooperiert die OCP, um die eigenen Spezifikationen an die ASHRAE-Specs anzugleichen.

Der OIX-2-Standard für Rechenzentren soll mit der Spezifikation „OCP-Spec Ready v2“ harmonisiert werden. OCP Ready ist eine Spezifikation für Co-Location-Rechenzentren. Im Fokus stehen eine hohe Leistungsdichte, leistungsfühige Kühlung und Infrastruktur, wie sie Hyperscaler brauchen.

Neue Spezifikation für Kohlendioxid-Messungen

Auch beim Thema Umwelt tut sich was: Die OCP hat eine Basisspezifikation für die Messung von Kohlendioxid-Emissilonen veröffentlicht. Sie etabliert ein gemeinsames, offenes Framework, um diese Emissionen zu berichten.

Dabei kooperierte sie mit ICA (iMasons Climate Accord). Dieser Vereinigung gehören unter anderem Digital Realty, Google, Meta und Schneider Electric an.

OCP weitet ihren Einfluss aus

Mit der OCP Academy eröffnet die OCP eine eigene Weiterbildungsplattform einschließlich der Fernlern-Plattform „Docebo“. Angeboten werden bislang Kurse über Datacenter-Infrastruktur und die OCP-Strukturen und Arbeitsweisen.

Dass die OCP ihren Einfluss ausweitet, zeigt auch eine auf dem Summit präsentierte IDC-Studie. Danach repräsentieren die Unternehmen, die das Open Compute Project tragen, einen Umsatz von 132 Milliarden Dollar. Dieser Wert soll bis 2029 auf 295 Milliarden Dollar steigen. Dabei vereinnahmen die USA den Löwenanteil. Das wichtigste Tätigkeitsfeld von OCP-Rechenzentren ist AI, gefolgt von digitalen Services und geschäftlichen Anwendungen.

Kühl- und Stromversorgungskonzepte für Datacenter gehören in die Revision

Texas Instruments stellt Energie-Management für skalierbare KI-Infrastrukturen vor

Open Compute treibt Nachhaltigkeit von Rechenzentren voran

Wer kennt schon das Open Compute Project?

(ID:50613490)