Intel Xeon Max und GPU Max CPU und GPU von Intel für High Performance Computing

Von Klaus Länger Lesedauer: 3 min |

Anbieter zum Thema

Der lang erwartete Server-Prozessor „Xeon Sapphire Rapids“ soll für Intel verlorene Marktanteile zurückerobern. Mit „Xeon Max“ kommt eine eigene HBM-Variante der CPU für HPC-Anwendungen. Als passende GPU für das High Performance Computing bringt Intel die „GPU Max“ auf den Markt.

Ab Januar 2023 werden Intels Xeon Max und die GPU Max zunächst für den Bau von Supercomputern verwendet. Danach sind OEMs und der Channel an der Reihe.
Ab Januar 2023 werden Intels Xeon Max und die GPU Max zunächst für den Bau von Supercomputern verwendet. Danach sind OEMs und der Channel an der Reihe.
(Bild: Intel)

Die kommende „Xeon-Scalable“-CPU der vierten Generation ist ebenfalls aus mehreren Chiplets aufgebaut, die Intel als 'Tiles' bezeichnet. Ansonsten beschreitet der Prozessor technisch andere Wege als der Konkurrent „Genoa“ von AMD.

Die vier im Intel-7-Verfahren gefertigten Tiles enthalten bis zu 60 Golden-Cove-Cores mit Hyperthreading. Insgesamt 20 Intel Accelerator Engines sollen bestimmte Aufgaben mit besonders hoher Performance erledigen. Im Vorfeld der Supercomputing-Konferenz SCC22 hat ­Intel Details zu der für High Performace Computing (HPC) ausgelegten Version von Sapphire Rapids präsentiert, die den Namen Xeon Max tragen wird.

Der Prozessor verfügt über bis zu 56 Cores und hat zusätzlich bis zu 64 GB HBM2e integriert, also Speicher mit einer besonders hohen Bandbreite von bis zu einem TB/s. Die 64 GB sollen laut Intel für viele gängige HPC-Workloads ausreichen. Zusätzlich verfügt der Prozessor über acht DDR5-Speicherkanäle. Möglich sind bis zu 16 DRR5-4800-DIMMs pro CPU-­Sockel. Ohne Änderung am Programmcode der HPC-Anwendungen wird der HBM dann als Cache für die DDR5-Module genutzt.

Bildergalerie
Bildergalerie mit 12 Bildern

Der HBM Flat Mode, der DDR und HBM kombiniert, erfordert Änderungen an der Software für eine optimale Performance. Die Beschränkung auf maximal 56 Cores rührt daher, dass so eine höhere Taktrate möglich ist, ohne die 350 Watt TDP zu überschreiten. Zudem bietet Intel Xeon Max nur für maximal Dual-CPU-Konfigurationen an. Die Sapphire-Rapids-CPUs ohne HBM werden in Varianten für bis zu acht Sockel verfügbar sein. Alle Modelle der neuen CPU unterstützen PCI-Express Gen5 mit 80 Lanes sowie CXL 1.1.

Beschleuniger für mehr Rechenleistung

Für KI- und HPC-Aufgaben sind vier Accelerator Engines besonders relevant: AVX-512, Deep Learning Boost, der Data Streaming Accelerator (DSA) für die Entlastung der CPU-Corers bei Speicheroperationen sowie die Advanced Matrix Extensions (AMX). Für Letztere verspricht Intel etwa die dreifache Performance bei Deep-Learning-Workloads im Vergleich zum 40-„Core-Ice-Lake-SP“-Prozessor „Xeon 8380 SP“ bei Nutzung von AVX-512.

Die höhere Leistung soll laut Intel auch für einen geringeren Stromverbrauch im Rechenzentrum sorgen, da ein Xeon-Max-Node mit zwei CPUs bei Anwendungen wie dem CFD-Tool (Computational Fluid Dynamics) „Altair Acusolve“ vier Nodes mit insgesamt acht Ice-Lake-SP-Xeons ersetzen kann und dabei etwa 700 Watt statt mehr als 1.600 Watt konsumiert.

Die für Intel-CPUs optimierte Software-Sammlung OneAPI wird im kommenden Relase für Xeon Max und die Intel-Max-GPUs optimiert. Xeon Max ist zunächst für Supercomputer wie Argonne Aurora reserviert und soll im zweiten Halbjahr 2023 allgemein verfügbar sein.

Aus Ponte Vecchio wird GPU Max

Ergänzt wird Xeon Max durch die Max ­Series GPUs. Intels Datacenter-GPUs der „Ponte-Vecchio“-Serie sind nun ebenfalls endlich fertig und sollen ab Januar 2023 ausgeliefert werden. Die erste Charge der Max-GPUs wird in Supercomputern eingesetzt, dann sind OEMs und Handel an der Reihe.

Die Serie besteht aus der 300-Watt-PCIe-Karte Max 1100 GPU mit 56 Xe-Cores und 48 GB HBM2e als Speicher sowie den OAM-Modulen 1350 (450 Watt) sowie 1550 (600 Watt). Bei letzteren sitzen 112 beziehungsweise 128 Xe-Cores auf dem aus bis zu 47 Tiles aufgebauten Chip, der über bis zu 408 MB Rambo-L2-Cache und 64 MB L1-Cache verfügt. Dazu kommen 96 beziehungsweise 128 GB HBM. Zudem wird Intel aus vier OAM-Modulen bestehende Subsystem-Boards anbieten. Über „Xe“-Links und eine Xe-Link-Bridge lassen sich bis zu vier Max-1100-Karten und bis zu acht OAMs mit hoher Bandbreite koppeln.

Als nächste Stufe von GPU Max folgt „Rialto Bridge“ mit bis zu 160 Xe-HPC-Cores. Mit „Falcon Shores“ steht eine Art Universalchip für HPC auf der Roadmap, den Intel als „XPU“ bezeichnet. Er soll ab 2024 in Intels 20A-Prozess gefertigt werden und kann aus ganz unterschiedlichen Tiles aufgebaut sein: Nur CPU, nur GPU, CPU und GPU kombiniert oder CPU und Custom-Tiles. So können die Deep-Learning-Chips der Intel-Tochter Habana als Tiles in Falcon-Shore-XPUs verwendet werden oder auch spezialisierte Designs anderer Hersteller, die Intel im Auftrag fertigt.

Für den HPC-Sektor ist Intel gut aufgestellt. Bei Standard-Prozessoren mit vielen Cores wird der Hersteller gegenüber AMD dagegen noch längere Zeit hinterherhinken. Denn erst Granite Rapids wird ähnlich viele CPU-Kerne wie AMDs neue „Epyc-9000“-Prozessoren bieten – ab Ende 2024.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

(ID:49036420)