Fugaku bekleidet erneut den ersten Rang Platzwechsel unter den Top Ten der Top500-Superrechner

Autor / Redakteur: Michael Matzer / Ulrike Ostler

Auf der International Supercomputing Conference (ISC) 2021 hat die Organisation Top500 die Spitzenreiter unter den 500 schnellsten Superrechnern vorgestellt. Während Fugaku seine Spitzenposition im 57. Ranking halten kann, steigt auf Platz 5 der Rechner „Perlmutter“ ein, der am Lawrence Berkeley National Laboratory seine Arbeit für das US-Energieministerium verrichtet. Unter den Green500-Rechnern gibt es Gerangel um den Spitzenplatz.

Der Fugaku-Supercomputer von Fujitsu steht in Tokio am Riken Center for Computational Science. Er landet bereits das dritte Mal auf Platz 1 der Top500-Liste
Der Fugaku-Supercomputer von Fujitsu steht in Tokio am Riken Center for Computational Science. Er landet bereits das dritte Mal auf Platz 1 der Top500-Liste
(Bild: © RIKEN)

Die Juni-2021-Rangliste wird mithilfe des Linpack-Benchmarks erstellt. Da er von einigen Community-Vertretern als veraltet betrachtet wird, gibt es auch HPCG-Benchmark-Listen (siehe: Abbildung 1) sowie auf Graphen (Graph500) und KI (HPL-AI) ausgerichtete Benchmarks.

In allen Benchmarks hält Fugaku immer noch die Spitzenposition mit 442 Linpack PetaFlops (1 Flops = Gleitkommaoperationen pro Sekunde). Die am Riken Center for Computational Science installierte Maschine basiert auf Fujitsu-ARM-Prozessoren und hat sich in der Covid-19-Forschung bewährt.

Ein neuer Rivale ist auf Platz 5 unter die Top Ten gelangt: „Perlmutter“ ein, der im National Energy Research Scientific Computing Center des Lawrence Berkeley National Laboratory (Nersc) konstruiert wurde, leistet 65,69 Linpack Petaflops (Spitzenleistung rPeak: 93,75 Pflops). Perlmutter, das „AMD Milan“ CPUs nutzt, ist das umfangreichste „Nvidia A100 GP“-System und zugleich das größte „HPE Cray EX“ System – zumindest unter den veröffentlichten. Das Militär, ganz gleich wo, ist nicht bekannt dafür, seine Rechenkapazitäten an die große Glocke zu hängen.

Die Rechenboliden „Summit“ und „Sierra“ (IBM/Mellanox/Nvidia, USA), an denen IBM maßgeblich beteiligt ist, behaupten ihre Plätze 2 und 3. Summit am Oak Ridge National Lab leistet 148,6 Petaflops, während Sierra am Lawrence Livermore National Lab 94,6 Petaflops liefert. Der einstige Spitzenreiter „Sunway Taihulight“ (VR China) schlägt sich mit 93 Petaflops wacker auf dem vierten Platz.

Nvidias „Selene“-System ist durch Perlmutter verdrängt worden und liegt nun auf Position 6. Die Nvidia-Konstruktion liefert 63,46 Linpack PFlops bei einem potentiellen rPeak von 79,22 PFlops. Die Effizienz liegt also bei rund 80 Prozent. Nvidia hat in Selene sein „Superpod A100 DGX“ implementiert und sie mit „AMD Epyc“-CPUs sowie 80GB-A100-GPUs kombiniert.

Bildergalerie
Bildergalerie mit 7 Bildern

„Tianhe-2“, die Nummer 7 steht am National Super Computer Center in Guangzhou und liefert mit „Intel Xeon“ CPUs 61,4 Linpack-PFlops. An der achten Position taucht der erste deutsche Mitbewerber auf: Am Forschungszentrum Jülich (FZJ) liefert das von Atos gebaute „Juwels Booster Modul“ 44,12 Linpack-PFlops – der schnellste europäische Rechner. Hier sind „AMD Epyc Rome“ CPUs und Nvidia A100 GPUs verbaut.

Die Positionen 9 und 10 belegen Dell-Konstruktionen: „HPC 5/Eni“ und „Frontera/TACC“. HPC-5 ist eine Nvidia-GPU-gestützte Maschine, die 34,5 PFlops liefert, und Frontera (23,4 PFlops) beruht auf einem x86 „Intel Cascade Lake“-System. Beide Systeme nutzen HDR Infiniband als Interconnect.

Die Plätze 10 bis 20

In den folgenden zehn Positionen finden sich gleich drei Neuzugänge, die nicht ignoriert werden dürfen. „ABCI 2.0“ auf Platz 12 ist, wie Fugaku, ein Fujitsu-basiertes System. Lieferte v1.0 noch 19,9 PFlops, so kann v2.0 schon 22,2 PFlops vorweisen. Jedes Petaflop zählt!

Auch von Fujitsu kommt das „Odyssey“-System, das Platz 13 belegt. An der Uni von Tokio auf der Basis von „A64FX-ARM“-Rechenkernen errichtet, liefert es beachtliche 25,95 Linpack-PFlops.

National gesehen

Zahlenmäßig liegt Deutschland mit elf Systemen hinter Spitzenreiter China (186), den USA (123) und Japan mit 19 Systemen. Das ist ein wirklich schöner Erfolg für das Gauss Centre for Supercomputing (siehe auch: „Die Fäden sind gespannt; Europäisches Supercomputer-Kompetenznetz soll Wissen verweben“). In München (SuperMUC), Stuttgart (HLRS) und Jülich (FZJ) stehen ein paar der leistungsfähigsten Rechnersysteme der Welt.

Von den acht geplanten „EuroHPC“-Systemen hat Atos inzwischen vier planmäßig fertiggestellt, in Tschechien („Karolina“, Slowenien, Luxemburg und Bulgarien.

Es sollen noch Portugal („Deucalion“), Italien („Leonardo“), Finnland („Lumi“) und Spanien („Marenostrum“) folgen. Diese Systeme stehen an der Schwelle zur Exascale-Kapazität.

Die Green500

Das „MN-3“ System von Preferred Networks hat die Nase wieder nachdem, nachdem es im Januar durch Nvidias DGX-Superpod vom Thron gestoßen worden war. Es liefert nun 29,70 GigaFlops-pro-Watt, nach anfänglich 26,0 GigaFlops-pro-Watt. Mit einer Linpack-Leistung von 1,8 Petaflops rangiert es auf Platz 337.

Zertifikat für einen Superrechnern der Green Top500 Liste. Nicht in die Bewertung fließen die Facility-Komponenten eines Datacenter ein, etwa Adsorbtions-, Wasser- und Immersionskühlung beispielsweise oder gar die Nutzung von Abwärme.
Zertifikat für einen Superrechnern der Green Top500 Liste. Nicht in die Bewertung fließen die Facility-Komponenten eines Datacenter ein, etwa Adsorbtions-, Wasser- und Immersionskühlung beispielsweise oder gar die Nutzung von Abwärme.
(Bild: © Top500)

Die Nummer 2 unter den Green500 ist „Hipergator AI“ an der University of Florida, der eine Leistung von 29,52 GigaFlops-pro-Watt erbringt. Das System basiert auf Nvidia DGX A100. Es dürfte nicht überraschen, dass 17 der Top 20 unter dem Green500 mit Akzeleratoren arbeiten, die drei übrigen sind ARM-basiert und stehen in Japan: Fugaku, der Fugaku-Prototyp und das Odyssey-System.

Cloud Cluster

Nvidia & Co. sind auch in der Cloud zu finden. Die Plätze 26 bis 29 unter den Top500 werden von Microsoft belegt. Die vier Maschinen mit jeweils 16,6 PetaFlops Leistung basiert auf „Azure NDv4“-Cluster. Dabei handelt es sich um ein „Nvidia-HGX“-Design, das Nvidia A100 GPUs, zwei AMD Epyc Rome 48-Core-CPUs und einen Interconnect mit 200 Gigabit pro Sekunde HDR Infiniband nutzt.

Microsofts Rivale Amazon Web Services (AWS) arbeitete mit seinem Kunden Descartes Lab, einem Spezialisten für Erderkundung, zusammen, um das System zu erstellen, das Rang 41 erreicht hat. Der Cluster, der theoretisch auch 15,11 Petaflops erzielen könnte, nutzt „AWS EC2 xlarge R5“-Instanzen, die Xeon 24-core Cascade Lake CPUs und 25G Ethernet verwenden.

Das ist Stand der AWS-Technik von 2019. Inzwischen würde der Kunde wohl Gravitron2-Instanzen nutzen, was einen PowerZzuschlag zwischen 20 und 40 Prozent bringen könnte.

Die Central Processing Units

Intel stellt den Löwenanteil der von den Top500-Systemen verwendeten CPUs, nämlich 86,2 Prozent. Vor einem Jahr waren es noch 94 Prozent – ein dramatischer Rückgang. Stand der Technik ist Intel Ice Lake, das sein Debüt in der aktuellen Liste in acht Systemen feierte.

Der Chiphersteller hat jedoch auf der ISC 2021 mit Sapphire Lake bereits die nächste Generation seiner CPUs angekündigt. Sie weisen die Leistungsmerkmale High Bandwith Memory (HBM), die Xe HPC-GPUs („Ponte Vecchio“) und „Daos“ (Distrbuted Application Object Storage) auf.

Intel-Hauptrivale AMD hat offenbar Marktanteile gewonnen. Es liefert CPU für 49 Systeme, was einem Anteil von 9,8 Prozent entspricht. Vor einem halben Jahr reklamierte AMD erst 4,2 Prozent und vor zwölf Monaten erst 2 Prozent.

AMD Epyc-Prozessoren sind in der Hälfte der 58 Neuzugänge in der Top500-Liste vom Juni 2021 vertreten. Zu den vier Epyc-Milan-Systemen gehört auch Perlmutter, die neue Nr. 5, und Selene (auf Platz 6) sowie Juwels in Jülich (Nr. 8).

Bildergalerie
Bildergalerie mit 7 Bildern

Die meisten AMD-Systeme werden mit „Instinct“-Akzeleratoren versehen, was ihren Erfolg gegenüber Nvidia-verstärkten Systemen plausibel macht. Mit dem FPGA-Hersteller Xilinx will sich AMD für 35 Milliarden Dollar verstärken, doch dafür fehlen momentan noch ein paar Genehmigungen, so etwa von China.

Artikelfiles und Artikellinks

(ID:47491008)

Über den Autor