AMD-Prozessoren bei AWS und im Cray-Supercomputer Neue Umgebungen für die AMD-Server-CPU Epyc

Autor Ulrike Ostler

Ab sofort gibt es „AMD-Epyc“-basierte Instanzen auf der „Amazon Elastic Compute Cloud“ (EC2. Außerdem verleihen die Prozessoren der „Shasta“ Supercomputing-Plattform von Cray die Leistung, mit der „Perlmutter“, der jüngste Superrechner des National Energy Research Scientific Computing (NERSC) Center am Lawrence Berkeley National Laboratory, betrieben wird.

Anbieter zum Thema

„Shasta", die neue Computing-Architektur von Cray lässt sich mit deiversen CPUs und GPUs bestücken; das System „Perlmutter“ für NERSC allerdings nutzt AMD Epyc.
„Shasta", die neue Computing-Architektur von Cray lässt sich mit deiversen CPUs und GPUs bestücken; das System „Perlmutter“ für NERSC allerdings nutzt AMD Epyc.
(Bild: Cray)

Die neuen prozessorgesteuerten Angebote von AMD Epyc gehören zu den beliebtesten AWS-Instanzfamilien und bieten branchenführende Kerndichte und Speicherbandbreite. Dies führt nach Angaben der Anbieter „zu einer außergewöhnlichen Leistung pro Dollar“ für allgemeine Zwecke und speicheroptimierte Workloads.

Erreicht werde dies durch die Kerndichte der AMD-Prozessoren, die den Kunden von „M5“-und „T3“-Instanzen ein „ausgewogenes Verhältnis“ von Rechen-, Speicher- und Netzwerkressourcen für Web- und Anwendungs-Server, Backend-Server für Unternehmensanwendungen und Test- sowie Entwicklungsumgebungen mit nahtloser Anwendungsmigration bieten. „R5“-Kunden können den Speicherbandbreitenvorteil der AMD Epyc-Prozessoren für In-Memory-Verarbeitung, Data Mining und dynamische Datenverarbeitung nutzen.

Forrest Norrod, Senior Vice President und General Manager, Datacenter and Embedded Solutions Business Group bei AMD, siht die Verfügbarkeit mehrerer Epyc-basierter Instanzen auf Amazon EC2 als einen „wichtigen Meilenstein“ in einer wachsenden Akzeptanz der CPUs bei Cloud-Service-Providern.

Die neuen Instanzen

Die neuen Instanzen sind als Varianten der Instanzfamilien von Amazon EC2 erhältlich. AMD-basierte R5- und M5-Instanzen können über die „AWS Management Console“ oder das „AWS Command Line Interface“ gestartet werden. Sie sind- Stand heute - in den Regionen USA-Ost (Ohio, N. Virginia), USA-West (Oregon), Europa (Irland) und Asien-Pazifik verfügbar. Allerdings sind Verfügbarkeiten in weiteren Regionen geplant. AMD-basierte T3-Instanzen werden in den kommenden Wochen verfügbar sein.

AMD-basierte M5- und R5-Instanzen sind in sechs Größen mit bis zu 96 vCPUs und bis zu 768 Gigabyte Speicher erhältlich. AMD-basierte T3-Instanzen werden in sieben Größen mit bis zu 8 vCPUs und 32 Gigabyte Speicher verfügbar sein. Die neuen Instanzen können als On-Demand-, Reservierungs- oder Spot-Instanzen erworben werden.

Epyc im Supercomputer

Die Epyc-Prozessoren stecken auch in der Supercomputing-Plattform „Shasta“ von Cray, die im „NERSC-9“-System stecken soll, das vermutlich Ende 2020 ausgeliefert wird. Perlmutter, benannt nach dem mit dem Nobelpreis ausgezeichneten Astrophysiker Saul Perlmutter, wird zudem Nvidia-GPUsenthalten, die zusammen eine Spitzenleistung von rund 100 Petaflops bieten, beziehungsweise eine dauerhafte Anwendungsleistung, die etwa dem 3-fachen der des „Cray Cori“ (NERSC-8) entspricht. Der Auftrag, der damit verbunden an Cray ging und das Cray Speichersystem „Clusterstor“ umfasst, beläuft sich auf eine Summe von 146 Millionen Dollar – es ist damit einer der größten Aufträge in der Cray-Firmengeschichte.

„Perlmutter“ aus dem Cray-System mit dem Codenamen „Shasta"“ soll ein heterogenes System sein, das sowohl CPU- als auch GPU-beschleunigte Knoten umfasst. Die Leistung soll auf mehr als dem Dreifachen von „Cori“, der aktuellen NERSC.Plattform steigen.
„Perlmutter“ aus dem Cray-System mit dem Codenamen „Shasta"“ soll ein heterogenes System sein, das sowohl CPU- als auch GPU-beschleunigte Knoten umfasst. Die Leistung soll auf mehr als dem Dreifachen von „Cori“, der aktuellen NERSC.Plattform steigen.
(Bild: NERSC)

Es handelt sich um eine Architektur der Exascale-Klasse, die Ende 2019 auf den Markt kommt. Laut Hersteller vereint Cray seine Supercomputer- und Cluster-Produktlinien und bringt eine neue, selbst entwickelte Systemverbindung mit der Bezeichnung „Slingshot“ heraus. Shasta soll die erste Cray-Architektur sein, die mehrere Schranktypen unterstützt - ein luft- oder flüssigkeitsgekühltes 19"-Rack und ein hochdichtes, flüssigkeitsgekühltes Rack, das 64 Blades mit mehreren Prozessoren pro Blade aufnehmen kann. Beide Optionen lässt laut Cray eine Skalierung auf weit mehr als 100 Schränke zu.

Derzeit bietet Cray eine „CS“-Linie - die auf die Appro-Akquisition zurückgeht und Commodity-Software, einen Drittanbieter-Interconnect und ein Standard-19"-Rack enthält. Außerdem gibt es die „XC“-Marke, das für dichte, maßstabsoptimierte, flüssigkeitsgekühlte Racks, Aries-Interconnect und einen eigenen Software-Stack integriert.

Die neue Cray-Architektur

Shasta bricht ermöglicht es nun den Anwendern, den „Cray Custom Interconnect“ und den Software-Stack in beiden Formfaktoren zu verwenden. Shasta kann im selben System zudem Prozessoren von Intel und AMD unterstützen, Arm (Marvell) und GPUs von Nvidia sowie AMD sowie System-Verbindungen von Cray (Slingshot), Intel (Omnipath) und Mellanox (Infiniband). Cray unterstützt zudem den Einsatz von FPGAs und erwartet, und kündigt für die kommenden ein bis zwei Jahre Unterstützung für einen oder mehrere Machine-Learning-Beschleuniger an.

Für das neue System greift Cray zu direkter Flüssigkeitskühlung und unterstützt die Warmwasserkühlung der W4-Klasse - bis zu 45 Grad Celsius. Die Kühlung pro Schrank erreicht zunächst 250 Kilowatt und steigt laut Cray innerhalb des ersten Jahres nach dem Start auf 300 Kilowatt pro Schrank.

Slingshot wurde so konzipiert, dass das System bis zu einer Exascale-Leistung und sogar darüber hinaus skalieren kann, so Cray. Die Technik erlaubt die Unterstützung von über 250.000 Endpunkten.

Perlmutter bei DOE

Das Herzstück ist ein 64-Port-Switch mit 200 Gbps-Ports (basierend auf der 50-Gbps-Signalisierungstechnologie), der eine Bandbreite von 12,8 Tbps pro Switch bereitstellt. Slingshot implementiert die „Dragonfly“-Topologie, die Cray 2008 erfunden hat. Allerdings reduziert Cray den Netzwerkdurchmesser von fünf Hops in der aktuellen Cray XC Generation auf drei Hops, mit einer Latenzzeit von rund 300 Nanosekunden.

Perlmutter soll von mehr als 7.000 Wissenschaftlern für mehr als 600 Projekte pro Jahr eingesetzt werden, die nicht nur die hochkomplexe Wissenschaft fördern und neue Energiequellen entwickeln, sondern auch die Energieeffizienz verbessern, neue Materialien entdecken und umfangreiche Datensätze aus wissenschaftlichen Laboratorien analysieren sollen.

(ID:45593967)