Die Nummer 1 auf der Green500-Liste Jülicher Superrechner ist extrem leistungsfähig und effizient

Quelle: Pressemitteilung Forschungszentrum Jülich 4 min Lesedauer

Anbieter zum Thema

In dieser Woche findet die Internationale Supercomputing-Konferenz (ISC) in Hamburg statt. Traditionell wird hier die jüngste Liste der leistungsfähigsten HPC-Rechner vorgestellt, die Top500 , und die der Energie-effizientesten, die Green500. Platz 1 im Green500-Ranking bekommt diees Mal der europäische Exascale-Supercomputer „Jupiter“, der als Exascale-Rechner geplant ist.

„Jupiter“-Entwicklungsssystem „Jedi“  (links, orange) in der Rechnerhalle des Jülich Supercomputing Centre. (Bild:)
„Jupiter“-Entwicklungsssystem „Jedi“ (links, orange) in der Rechnerhalle des Jülich Supercomputing Centre.
(Bild:)

Das erste Modul des europäischen Exascale-Supercomputers Jupiter mit der Bezeichnung „Jedi“ kommt auf den ersten Platz in der Green500-Liste der Energie-effizientesten Supercomputer, wie das Forschungszentrum Jülich und das EuroHPC Joint Undertaking (EuroHPC JU) zusammen mit dem Supercomputer-Konsortium Partec-Eviden heute auf der Internationalen Supercomputing-Konferenz ISC in Hamburg bekanntgegeben haben. Das Jupiter-Entwicklungssystem wurde im April vom deutsch-französischen Konsortium Partec-Eviden installiert und verfügt bereits über die gleiche Hardware wie der „Jupiter Booster“, der sich derzeit am Forschungszentrum Jülich im Aufbau befindet.

Die rasant fortschreitende Digitalisierung und der zunehmende Einsatz Künstlicher Intelligenz (KI)benötigen immer mehr Rechenleistung – und dadurch auch immer mehr Energie. In Deutschland haben Rechenzentren mittlerweile einen Anteil von knapp 4 Prozent am Stromverbrauch, Tendenz steigend. Effizientes Rechnen hat daher in den vergangenen Jahren zunehmend an Bedeutung gewonnen – wie auch die die Forschung und Maßnahmen zur Steigerung der Energie-Effizienz.

Der von EuroHPC JU beschaffte Supercomputer Jupiter präsentiert sich als echter Vorreiter auf diesem Gebiet. Der im April installierte erste Baustein, das „Jupiter Exascale Development Instrument“, kurz Jedi, schafft 72 Milliarden Rechenoperationen pro Sekunde pro Watt. Der vorherige Spitzenreiter kam im Vergleich dazu auf rund 65 Milliarden.

Entscheidend für die herausragende Effizienz von Jedi ist der Einsatz von Grafikprozessoren und die Tatsache, dass es gelungen ist, wissenschaftliche Anwendungen für die Berechnung auf Grafikprozessoren zu optimieren. Praktisch alle führenden Systeme der Green500 setzen heute massiv auf GPUs, die Berechnungen bauartbedingt wesentlich energiesparsamer ausführen können als herkömmliche Hauptprozessoren, CPUs.

Compute-Blade mit dem „Nvidia GH200 Grace Hopper Superchip“.  (Bild:  Forschungszentrum Jülich)
Compute-Blade mit dem „Nvidia GH200 Grace Hopper Superchip“.
(Bild: Forschungszentrum Jülich)

Das Entwicklungssystem Jedi gehört zu den ersten Systemen weltweit, die die neueste Beschleuniger-Generation von Nvidia einsetzen: den „GH200“, Grace Hopper Superchip, der einen Hopper-Grafikprozessor (GPU) und Grace-Hauptprozessor (CPU) des Herstellers auf einem Chip vereint. Die hocheffiziente Warmwasserkühlung von Eviden, die deutlich weniger Energie benötigt als eine klassische Luftkühlung, leistet ebenfalls einen Beitrag und erlaubt es darüber hinaus die entstehende Wärme im Nachgang weiter zu nutzen.

Warmwasserkühlung des „Jedi“-Systems von Eviden. (Bild:  Forschungszentrum Jülich / Sascha Kreklau)
Warmwasserkühlung des „Jedi“-Systems von Eviden.
(Bild: Forschungszentrum Jülich / Sascha Kreklau)

Der Jupiter-Vorbote Jedi verfügt bereits über die gleiche Ausstattung wie das spätere „Jupiter Booster“-Modul. Wissenschaftlerinnen und Wissenschaftler können so bereits in einer frühen Phase des Aufbaus im Rahmen des „Jupiter Research and Early Access Program" auf die Hardware zugreifen, um ihre Codes zu optimieren. Unterstützt werden sie dabei von Expertinnen und Experten des Jülich Supercomputing Centre.

Der Exascale-Supercomputer Jupiter

Jupiter soll als erster Supercomputer in Europa die Marke von einem ExaFlops durchbrechen, was einer Trillion – einer „1“ mit 18 Nullen – Rechenoperationen pro Sekunde entspricht. Das finale System wird im zweiten Halbjahr dieses Jahres schrittweise installiert und wissenschaftlichen Anwenderinnen und Anwendern zunächst im Rahmen des Early Access Program zugänglich gemacht, bevor es Anfang 2025 in den allgemeinen Nutzerbetrieb übergeht.

Die enorme Rechenleistung soll dazu beitragen, die Grenzen wissenschaftlicher Simulationen zu erweitern und große KI-Modelle zu trainieren. Das modular aufgebaute Exascale-System basiert auf der dynamischen modularen Systemarchitektur (dMSA), die Partec und das Jülich Supercomputing Centre gemeinsam entwickelt haben. Das derzeit installierte Booster-Modul von Jupiter wird aus 125 „Bull-Sequana XH300“- Racks und über rund rund 24.000 Nvidia GH200 Superchips verfügen, die über ein „Quantum-2 Infiniband“-Netzwerk miteinander verbunden sind.

Bei Berechnungen mit 8 bit, wie sie für das Training von KI-Modellen üblich sind, soll die Rechenleistung auf deutlich mehr als 70 Exaflops steigen. Stand heute wäre Jupiter damit der weltweit schnellste Rechner für KI.

Der geplante Energie-Bedarf

Der Energiebedarf von Jupiter wird nach Schätzungen im Mittel etwa 11 Megawatt betragen. Weitere Maßnahmen sollen dazu beitragen, die Energie noch nachhaltiger zu nutzen. So ist das modulare Rechenzentrum, in dem der Supercomputer untergebracht wird, darauf ausgelegt, die beim Kühlen anfallende Wärme auszukoppeln und zum Heizen der Gebäude auf dem Campus des Forschungszentrum Jülich zu nutzen.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Alle Hard- und Software-Komponenten von Jupiter werden durch den eigens entwickelten „Jupiter Management Stack“ installiert und gesteuert. Dabei handelt es sich um eine Kombination aus „Parastation Modulo“ von ParTec, „SMC xscale“ von Atos/Eviden) und Softwarekomponenten des JSC.

Das-Entwicklungssystem Jedi

Das Jupiter-Entwicklungssystem ist deutlich kleiner als der finale Exascalerechner. Es besteht aus einem einzelnen Rack der neuesten „Bull-Sequana XH3000“-Reihe, das aktuell 24 Einzelrechner, so genannte Rechenknoten, enthält. Diese sind über 4 Mellanox Quantum-2 Infiniand Switches miteinander verbunden und werden im Laufe des Mais durch 24 weitere Rechenknoten komplettiert.

Bei der Messung für die Green500-Liste der energie-effizientesten Supercomputer erzielte das Jedi-System eine Rechenleistung von 4,5 Billiarden Rechenoperationen pro Sekunde oder 4,5 PetaFlops bei einem Stromverbrauch von im Schnitt 66 Kilowatt. Bei einem optimierten Lauf hat sich die Leistungsaufnahme auf 52 Kilowatt reduzieren lassen.

Artikelfiles und Artikellinks

(ID:50031201)