AMD Epyc-Prozessoren mit 3D V-Cache 3D-Die-Stacking steigert Cache-Leistung und damit die Performance enorm

Von Ulrike Ostler

Seit heute liefert AMD den Datacenter-Prozessor „AMD Epyc“ mit dem Codenamen „Milan X“ aus. Es ist nach Unternehmensangaben die erste Datacenter-CPU mit 3D-Die-Stacking und das macht sie zu dem derzeit leistungsstärksten x86-Serverprozessor für technische Berechnungen. Er bietet einen Leistungszuwachs von bis zu 66 Prozent gegenüber vergleichbaren, nicht gestapelten Epyc-Prozessoren.

Anbieter zum Thema

Die ersten CPUs für Rechenzentren mit 3D-Die-Stacking sind mit der 3. Generation „AMD Epyc“, früher bekannt unter dem Codenamen „Milan-X”, ab heute verfügbar.
Die ersten CPUs für Rechenzentren mit 3D-Die-Stacking sind mit der 3. Generation „AMD Epyc“, früher bekannt unter dem Codenamen „Milan-X”, ab heute verfügbar.
(Bild: AMD)

Auch Milan X basiert auf der „Zen 3“-Kernarchitektur. Damit bieten die neuen Prozessoren denselben Sockel, dieselbe Softwarekompatibilität und dieselben Sicherheitsfunktionen wie die Epyc-CPUs der 3. Generation, verfügen laut AMD aber über den branchenweit größten L3-Cache.

Der L3-Cache bietet eine enorme Leistung für technische Rechenaufgaben wie Computational Fluid Dynamics (CFD), Finite-Elemente-Analyse (FEA), Electronic Design Automation (EDA) und Strukturanalyse.
Der L3-Cache bietet eine enorme Leistung für technische Rechenaufgaben wie Computational Fluid Dynamics (CFD), Finite-Elemente-Analyse (FEA), Electronic Design Automation (EDA) und Strukturanalyse.
(Bild: AMD)

Damit steigt die Leistung für technische Berechnungen wie Computational Fluid Dynamics (CFD), Finite-Elemente-Analysen (FEA), Electronic Design Automation (EDA) und Strukturanalysen. Diese Workloads sind wichtige Design-Tools für Unternehmen, die die Komplexität der physikalischen Welt modellieren müssen, um Simulationen zu erstellen, mit denen technische Designs für einige der innovativsten Produkte der Welt getestet und validiert werden.

Spitzenleistung bei technischen Rechenaufgaben

  • Um genau zu sein, haben die Milan-X-Prozessoren Zugriff auf 768 Megabyte L3-Cache. Das ist dreimal mehr als der 3rd Gen Epyc ohne 3D V-Cache:
  • Die „7373X“-CPU kann im Vergleich zur „73F3“-CPU bis zu 66 Prozent mehr Leistung für EDA-RTL-Simulationen, wie „Synopsys VCS“, liefern.
  • Bei „Altair Radioss“-Simulationsanwendungen kann der 64-Kern-Prozessor 7773X im Vergleich zum Top-of-Stack-Prozessor der Konkurrenz durchschnittlich etwa 44 Prozent mehr Leistung liefern.

Raj Hazra, Senior Vice President und General Manager der Compute and Networking Business Unit bei Micron, bestätigt die Berechnungen: „Die zunehmende Nutzung von datenintensiven Anwendungen durch Kunden erfordert einen neuen Ansatz für die Datacenter-Infrastruktur. Micron und AMD haben die gemeinsame Vision, die volle Leistungsfähigkeit von führenden DDR5-Speicher für Hochleistungs-Rechenzentrumsplattformen zu liefern. Unsere Zusammenarbeit mit AMD umfasst die Vorbereitung von AMD-Plattformen für die neuesten DDR5-Lösungen von Micron sowie die Einführung von Epyc-Prozessoren der dritten Generation mit AMD 3D V-Cache-Technologie in unseren eigenen Rechenzentren, wo wir bei ausgewählten EDA-Workloads bereits eine Leistungssteigerung von bis zu 40 Prozent gegenüber den Epyc-Prozessoren der dritten Generation ohne das 3-D-Die-Stacking feststellen.“

  • Zudem könne der neue Prozessor mit 32 Kernen bis zu 118 Prozent mehr CFD-Probleme pro Tag lösen kann als der 32-Kern-Prozessor der Konkurrenz, während ANSYS CFX läuft, so AMD.

Die Erhöhung der Cache-Größe ist für die Leistungsverbesserung ganz wesentlich, insbesondere bei technischen Datenverarbeitungslasten, die stark auf große Datensätze angewiesen sind. Allerdings gibt es bei 2D-Chip-Designs physikalische Beschränkungen. Die AMD 30 V-Cache Technologie soll diese physikalischen Herausforderungen läsen, indem sie den AMD Zen 3-Kern mit dem Cache-Modul verbindet und so die L3-Anteil bei gleichzeitiger Minimierung der Latenz und Erhöhung des Durchsatzes nutzt.

Eine höhere Effizienz

Diese Leistungsmerkmale ermöglichten es den Kunden zudem, weniger Server einzusetzen und den Stromverbrauch im Rechenzentrum zu reduzieren. Das wiederum führe auch zu einer Senkung der Gesamtbetriebskosten (TCO).

In einem typischen Rechenzentrumsszenario, in dem täglich 4.600 Jobs des „Ansys CF X cfx-50“-Testfälle ausgeführt werden, lässt sich durch den Einsatz von 2P 32-Core Epyc 7573X CPU-basierten Servern die geschätzte Anzahl der benötigten Rechner von 20 auf 10 reduzieren und damit der Stromverbrauch um 49 Prozent senken, wenn zum Vergleich die jüngsten 2P 32-Core Prozessor-basierten Server der Konkurrenz herangezogen würden, rechnet AMD vor.

Dies bedeute, in anderen Worten: Die Wahl von Epyc-Prozessoren der 3. Generation mit dem 3D V-Cache hatten einen vergleichbaren Nutzen wie die Kohlenstoffsequestrierung bei mehr als 81 Hektar US-Wald pro Jahr. Zudem führe dies zu einer prognostizierten Senkung der Gesamtbetriebskosten (TCO) um 51 Prozent bei einem Zeitraum von drei Jahren.

Cores Model # CCD TDP (W) cTDP-Bereich (W) Base Freq (GHz) Max Boost Freq (bis zu GHz)* L3 Cache (MB) DDR Preis (1KU - Angaben in Dollar)
64 7773X 8 280 225 - 280 2,20 3,50 768 8 8.800
32 7773X 8 280 225 - 280 2,80 3,60 768 8 5.590
24 7473X 8 240 225 - 280 2,80 3,70 768 8 3.900
16 7373X 8 240 225 - 280 3,05 3,80 768 8 4.185
*Der maximale Boost für AMD-Epyc-Prozessoren ist die maximale Frequenz, die von einem einzelnen Kern des Prozessors unter normalen Betriebsbedingungen für Seriensysteme erreicht werden kann.

Die Verfügbarkeit

Die AMD-Epyc-Prozessoren der 3. Generation mit der 3D V-Cache Technologie sind ab sofort bei verschiedenen OEM-Partnern erhältlich, darunter Atos, Cisco, Dell Technologies, Gigabyte, HPE, Lenovo, QCT und Supermicro. Auch Software-Partner haben bereits Unterstützung zugesagt, darunter Altair, Ansys, Cadence, Dassault Systemes, Siemens und Synopsys.

Umgestellt hat bereits Microsoft Azure: Die virtuellen Maschinen „HBv3“ sind mit der „Milan-X-Technik aktualisiert worden. Ab kommender Woche sind neuen HBv3-Maschinen verfügbar. Laut Microsoft zeigen sie im Vergleich zu den bisherigen VMs der HBv3-Serie Leistungssteigerungen um bis zu 80 Prozent beim CFD und eine um 60 Prozent höhere Leistung für EDA RTL.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

Benchmarks wurden mit WRF v. 4.15, OpenFOAM v. 1912 und Ansys Fluent 2021 R1 durchgeführt.
Benchmarks wurden mit WRF v. 4.15, OpenFOAM v. 1912 und Ansys Fluent 2021 R1 durchgeführt.
(Bild: Microsoft)

Nidhi Chappell, General Manager, Azure HPC, Al, SAP und Confidential Computing, sagt: „ Microsoft und AMD teilen eine Vision für die moderne HPC-Kundenerfahrung - kontinuierliche Verbesserungen der Leistung und Kosteneffizienz von Kunden-Workloads, die alle in einer skalierbaren, sicheren, global zugänglichen und vertrauenswürdigen Cloud bereitgestellt werden. Azure HBv3 Virtual Machines, die jetzt vollständig auf AMD-Epyc-Prozessoren der 3. Generation mit AMD 3D V-Cache Technologie aufgerüstet sind, verkörpern diese gemeinsame Vision.“

Und auf der Microsoft-Azure-Ebsite ist zu lesen: „Die Verwendung von 'Nvidia Quantum Infiniband' Networking von unseren Partnern ermöglicht Kunden bereits die Skalierung von MPI-Workloads in Supercomputer-Höhen. Die Milan-X-Prozessoren in den VMs der HBv3-Serie legen die Messlatte noch einmal höher, da sie über eine Reihe von MPI-Workloads und -Modellen hinweg eine über lineare Skalierungseffizienz bieten.“

Ansys Fluent und der kanonischen Simulation F1_racerar_140m: HBv3-VMs mit Milan-X-Prozessoren bieten eine fast 200-prozentige Skalierungseffizienz, indem sie eine 127-mal höhere Leistung für nur 64 VMs an Rechenleistung liefern.
Ansys Fluent und der kanonischen Simulation F1_racerar_140m: HBv3-VMs mit Milan-X-Prozessoren bieten eine fast 200-prozentige Skalierungseffizienz, indem sie eine 127-mal höhere Leistung für nur 64 VMs an Rechenleistung liefern.
(Bild: Microsoft)

Das bedeute, dass Kunden durch die drastisch verkürzte Time-to-Solution tatsächlich Azure-Rechenkosten einsparen können (siehe: Abbildung oben).

Die Kommentare

Und weiter: „HBv3 VMs sind die am schnellsten angenommene Ergänzung der Azure HPC-Plattform aller Zeiten. [...] Wir gratulieren AMD zur Einführung seiner innovativen neuen Prozessortechnologie und freuen uns auf die Fortsetzung unserer technologischen Partnerschaft im Dienste von HPC-Kunden auf der ganzen Welt.“

Auch Joe Sawicki, stellvertretender Geschäftsführer, IC-EDA, Siemens Digital lndustries Software, äußert sich angetan: Im Rahmen dieser Zusammenarbeit mit AMD habe das Unternehmen kürzlich eine Reihe von Siemens EDA-Tools auf den neuen Prozessoren getestet. Das Ergbenis: 13 Pzozent schnellere Läufen für die „Tessent ATPG“-Systeme von Siemens.

„Darüber hinaus haben wir bei unseren eigenen Tests bis zu 50 Prozent schnellere Laufzeiten für das Siemens-Simulationsangebot 'Questa RTL' festgestellt“, setzt der Manager hinzu.

(ID:48107209)