Kommentare von Listenautor Erich Strohmaier Die neue Hitliste der Supercomputer ist ein Meilenstein
Die 53. Ausgabe des TOP500 der amtierenden Supercomputer wurde gestern veröffentlicht. Auf der ISC High Performance Conference in Frankfurt kommentierte sie einer der Autoren der Liste, Erich Strohmaier vom NERSC/Lawrence Berkeley National Laboratory..

Seine Botschaft während einer „Focus Session“ kurz nach 11 Uhr: Das Ende von Moores Law und neue Architekturen setzen die bisherigen Messungen für die Top500 außer Kraft. Für die Zukunft muss man nach neuen Möglichkeiten des Kräftemessens von Supercomputern suchen. Angedacht sind neue Verfahren beim Messen, neue Benchmarks, oder vielleicht eine Kombination aus verschiedenen Messverfahren...
Bezüglich der aktuellen Liste fand Strohmeier es einerseits bemerkenswert, dass IBM die ersten zwei Plätze innehält, andererseits, dass die Nummer fünf erstens neu und zweitens ein System von Dell ist, noch dazu ein „traditionelles“ System ohne GPUs.
Ansonsten wurde die Liste als Meilenstein in ihrer 26-jährigen Geschichte gefeiert. Zum ersten Mal liefern nämlich alle 500 Systeme einen Petaflop oder mehr auf dem High Performance Linpack (HPL) Benchmark, wobei die Einstiegsstufe in die Liste jetzt bei 1.022 Petaflops liegt.
Reihenfolge
Die Spitze der Liste bleibt weitgehend unverändert, es gibt nur zwei neue Einträgen in den Top 10. Bei einem davon handelt es sich um ein bestehendes System, das mit zusätzlicher Kapazität aufgerüstet wurde.
Wie gesagt halten zwei von IBM gebaute Supercomputer, Summit und Sierra, die im Oak Ridge National Laboratory (ORNL) des Department of Energy in Tennessee sowie im Lawrence Livermore National Laboratory in Kalifornien stehen, die ersten beiden Positionen. Beide beziehen ihre Rechenleistung von Power 9-CPUs und Nvidia V100-GPUs. Das Summit-System verbesserte sein HPL-Ergebnis von vor sechs Monaten leicht und lieferte einen Rekordwert von 148,6 Petaflops, während das Sierra-System Nummer zwei unverändert bei 94,6 Petaflops bleibt.
Das Sunway TaihuLight, ein vom chinesischen National Research Center of Parallel Computer Engineering & Technology (NRCPC) entwickeltes und am National Supercomputing Center in Wuxi installiertes System, belegt mit 93,0 Petaflops die Nummer drei. Es wird von mehr als zehn Millionen SW26010-Prozessorkernen angetrieben.
Auf Platz vier steht der Supercomputer Tianhe-2A („Milky Way-2A“), der von Chinas National University of Defense Technology (NUDT) entwickelt und im National Supercomputer Center in Guangzhou eingesetzt wird. Es verwendete eine Kombination aus Intel Xeon und Matrix-2000 Prozessoren, um ein HPL-Ergebnis von 61,4 Petaflops zu erzielen.
Der von Strohmaier bestaunte Frontera, der einzige neue Supercomputer in den Top 10, erreichte seine Nummer fünf mit 23,5 Petaflops auf HPL. Das Dell C6420-System mit Intel Xeon Platinum 8280 Prozessoren wird im Texas Advanced Computing Center der University of Texas betrieben.
Auf Platz sechs steht Piz Daint, ein Cray XC50-System, das im Swiss National Supercomputing Centre (CSCS) in Lugano installiert ist. Es ist mit Intel Xeon CPUs und Nvidia P100 GPUs ausgestattet. Piz Daint bleibt das mächtigste System in Europa.
Trinity, ein Cray XC40-System, das vom Los Alamos National Laboratory und den Sandia National Laboratories betrieben wird, verbessert seine Leistung auf 20,2 Petaflops, was ihm die Nummer sieben einbringt. Es wird von Intel Xeon und Xeon Phi Prozessoren angetrieben.
Die AI Bridging Cloud Infrastructure (ABCI) ist im Japan am National Institute of Advanced Industrial Science and Technology (AIST) installiert und steht mit 19,9 Petaflops auf Platz acht. Das von Fujitsu gebaute System ist mit Intel Xeon Gold Prozessoren und Nvidia Tesla V100 GPUs ausgestattet.
Der Münchner SuperMUC-NG liegt mit 19,5 Petaflops auf Platz neun. Es ist im Leibniz-Rechenzentrum in Garching installiert. Die von Lenovo gebaute Maschine läuft mit Intel Platinum Xeon Prozessoren sowie Intel Omni-Path.
Der aufgerüstete Lassen-Supercomputer erobert den Platz Nummer 10 mit einem Upgrade, das sein ursprüngliches HPL-Ergebnis von 15,4 Petaflops auf 18,2 Petaflops steigerte. Lassen wurde im Lawrence Livermore National Laboratory installiert und ist das nicht klassifizierte Gegenstück zum klassifizierten Sierra-System und verfügt über dieselbe IBM Power9/Nvidia V100 GPU-Architektur.
USA führen nur nach Leistung
China beansprucht mit 219 die meisten TOP500-Systeme, gefolgt von den Vereinigten Staaten mit 116. An dritter Stelle steht Japan mit 29 Systemen, gefolgt von Frankreich mit 19, dem UK mit 18 und Deutschland mit 14 Systemen.
Obwohl die USA, was die Gesamtzahl der Systeme betrifft, abgeschlagen sind, verfügen sie doch über eine große Anzahl von Systemen im vordersten Feld der Liste. Damit kann das Land seinen Vorsprung bei der HPL-Kapazität mit 38,4 Prozent der Gesamtleistung behaupten - Summit und Sierra allein stellen 15,6 Prozent der HPL-Flops auf der Liste. An zweiter Stelle liegt China mit seinen vergleichsweise kleinen Systemen mit 29,9 Prozent der Performance.
Chinesische Anbieter führend
Chinas Dominanz bei der Anzahl der Systeme spiegelt sich auch beim Absatz wider. Lenovo weist mit 173 die meisten Systeme auf der Liste auf, gefolgt von Inspur mit 71 und Sugon mit 63 Systemen. Alle drei verbesserten ihren Anteil gegenüber der Liste von vor sechs Monaten.
HPE mit 40 Systemen und Cray mit 39 Systemen belegen den vierten bzw. fünften Platz. Bull, als einziger europäischer Systemanbieter auf der Liste, beansprucht 21 Systeme, gefolgt von Fujitsu mit 13 und IBM mit 12. Da IBM jedoch der Anbieter von Summit, Sierra und einer Reihe anderer großer Systeme ist, beträgt die Gesamtleistung des Unternehmens 207 Petaflops, eine Zahl, die nur von Lenovo übertroffen wird, allerdings mit 14-mal so vielen Systemen.
Intel und Nvidia geben das Tempo vor
Mit Fokus auf Prozessoren dominiert Intel weiterhin die TOP500-Liste, wobei die Chips des Unternehmens in 95,6 Prozent aller Systeme erscheinen. IBM Power CPUs sind in sieben Systemen eingebaut, gefolgt von AMD-Prozessoren, die in drei Systemen zu finden sind. Ein einzelner Supercomputer auf der Liste, Astra, wird von ARM-Prozessoren angetrieben.
Insgesamt 133 Systeme auf der TOP500-Liste setzen Beschleuniger- oder Coprozessor-Technologie ein, etwas weniger als vor sechs Monaten, da waren es 138. Davon verwenden 125 Systeme Nvidia GPUs. Etwa die Hälfte davon (62) nutzt die neuesten Volta-Prozessoren, der Rest (60) basiert auf Pascal- und Kepler-Technologie.
Interconnects
Aus Perspektive der Interconnections dominiert Ethernet weiterhin die Liste und beansprucht 54,2 Prozent der TOP500-Systeme. InfiniBand ist mit 25 Prozent der Systeme die zweitbeliebteste Verbindung, gefolgt von benutzerdefinierten und proprietären Verbindungen mit 10,8 Prozent und Omni-Path mit 9,8 Prozent.
Betrachtet man jedoch alleine die 50 schnellsten Supercomputer auf der Liste, so ändern sich diese Zahlen dramatisch, wobei benutzerdefinierte Verbindungen in 40 Prozent der Top-Systeme verwendet werden, gefolgt von InfiniBand mit 38 Prozent, Omni-Path mit zehn Prozent und Ethernet mit zwei Prozent
Green500
Was die Green500-Liste betrifft, so hat sich die Energieeffizienz seit der Veröffentlichung der vorherigen Liste im November 2018 kaum bewegt. Das Shoubu-System B behauptet seine Nummer eins mit einem Wirkungsgrad von 17,6 Gigaflops/Watt. Das DGX SaturnV Volta-System von Nvidia liegt mit 15,1 Gigaflops/Watt auf dem zweiten Platz, gefolgt von Summit mit 14,7 Gigaflops/Watt und der AI Bridging Cloud Infrastructure (ABCI) mit 14,4 Gigaflops/Watt. Der MareNostrum P9 CTE Cluster verbesserte sein Ergebnis von vor sechs Monaten und eroberte mit 14,1 Gigaflops/Watt den fünften Platz. Insgesamt hat sich die durchschnittliche Energieeffizienz von Systemen auf der Green500-Liste von 3,0 Gigaflops/Watt vor sechs Monaten auf heute 3,2 Gigaflops verbessert.
HPCG-Ergebnisse
Die Benchmark-Ergebnisse für DenK-Benchmark (High-Performance Conjugate Gradient, HPCG) blieben gegenüber dem letzten November weitgehend unverändert. Summit und Sierra sind nach wie vor die einzigen beiden Systeme, die über einen Petaflop auf dem HPCG-Benchmark liefern und es auf 2,9 Petaflops bzw. 1,8 Petaflops bringen. Das durchschnittliche HPCG-Ergebnis liegt bei 213,3 Teraflops, ein marginaler Anstieg gegenüber den 211,2 Teraflops vor sechs Monaten.
(ID:45980909)