Phase 2 beginnt Lenovo und Intel liefern die Hauptbestandteile der LRZ-Supercomputers-Ausbau

Redakteur: Ulrike Ostler

Lenovo und Intel gehen mit dem Leibniz-Rechenzentrum (LRZ) der Bayerischen Akademie der Wissenschaften in die zweite Ausbauphase seines Supercomputers „SuperMUC-NG“. In dieser sollen Methoden Künstlicher Intelligenz (KI) im Bereich des Compute integriert werden für mehr Simulationen, Modelle und Datenanalysen.

Firmen zum Thema

Die Heimat von SuperMUC-NG und bald auch von SuperMUC-NG Phase 2: Das Leibniz-Rechenzentrum in Garching bei München
Die Heimat von SuperMUC-NG und bald auch von SuperMUC-NG Phase 2: Das Leibniz-Rechenzentrum in Garching bei München
(Bild: LRZ)

Lenovo liefert eine Kombination aus einem warmwassergekühlten, zu 100 Prozent mit Beschleunigern ausgestatteten Rechnersystem, basierend auf dem Lenovo „Thinksystem SD650“, und der „Distributed Asynchronous Object Storage Architektur“ (Daos) von Intel, basierend auf dem Lenovo „Thinksystem SR630 V2“.

Gefördert wird der Ausbau von SuperMUC-NG Phase 2, der Teil des Gauss Centre for Supercomputing ist, durch den Freistaat Bayern und das Bundesministerium für Bildung und Forschung. Aktuell auf Platz 15 der Top 500 Supercomputer-Liste wird SuperMUC-NG auch nach der Erweiterung weiterhin zu den schnellsten und Energie-effizientesten Supercomputern der Welt gehören.

Seit Inbetriebnahme von SuperMUC-NG haben Experten den Supercomputer nicht nur für traditionelle Simulation und die Erstellung von Modellen eingesetzt, sondern auch für die Automatisierung von Bild- und Mustererkennung bei der Beobachtung von Planeten, Klimadaten von Satelliten, medizinischen Bild- und Gesundheitsdaten sowie demografischen Daten. Durch den erfolgreichen Einsatz von SuperMUC-NG in diesen Projekten ist die Nachfrage nach leistungsstarker Datenanalyse, maschinellem Lernen und schnellem Speicher weiter gestiegen.

Pat Gelsinger, CEO von Intel, mit Intels HPC-GPU „Ponte Vecchio“ in Händen
Pat Gelsinger, CEO von Intel, mit Intels HPC-GPU „Ponte Vecchio“ in Händen
(Bild: Lenovo)

Um diese Nachfrage zu erfüllen und um Forschenden weiterhin die Unterstützung bieten zu können, die sie benötigen, wird der Supercomputer nun mit „Intel Xeon Scalable“- Prozessoren, Codename „Sapphire Rapids“, und Intels kommenden HPC-GPUsauf Basis der „Xe“-Architektur, Codename „Ponte Vecchio“, erweitert.

Daos von Intel basiert auf Intel Xeon Scalable der dritten Generation, Codename „Ice Lake". Der Daos-Objektspeicher bietet 1 Petabyte an Datenspeicher und ermöglicht somit einen schnellen Durchsatz großer Datenmengen.

Ein nachhaltiger Ansatz

Die in Phase 2 vorgenommenen Erweiterungen sorgen dafür, dass SuperMUC-NG nun in der Lage ist, die unterschiedlichsten Aufgaben möglichst Energie-effizient auszuführen. Zum Beispiel werden die Rechenknoten von SuperMUC-NG Phase 2 insgesamt eine viermal höhere Leistung pro Watt (High Performance Linpack) liefern als die der Phase 1.

Die 240 Intel-Rechenknoten in den Lenovo-Server arbeiten mit der „Neptune“-Warmwasserkühlung des Herstellers und sind über ein Hochgeschwindigkeitsnetzwerk mit dem Daos-Speichersystem verbunden. Die Neptune-Warmwasserkühlung von Lenovo führt rund 90 Prozent der Wärme aus dem System ab, was den Energieverbrauch insgesamt senkt, die Gesamteffizienz erheblich steigert und es letztlich ermöglicht, dass die Prozessoren ihre volle Leistung entfalten können.

Die Lenovo-Komponenten für SuperMUC-NG Phase 2 werden in Europa gefertigt. und zwar in der neuen Produktionsstätte von Lenovo in Ungarn. Da weniger Kilometer zwischen Fertigung und Aufbau anfallen, senke das den ökologischen Fußabdruck der Lieferkette des Projekts zudem, so Lenovo.

Prof. Dr. Dieter Kranzlmüller, Leiter des Leibniz-Rechenzentrums: „Die Integration modernster KI-Technologie in unsere Supercomputer spielt [..] eine wichtige Rolle. Zusammen mit Lenovo und weiteren Partnern arbeiten wir daran, Forschenden genau dazu beiten, was sie für wissenschaftliche Spitzenleistung benötigen. Und nicht nur das: Mit der Warmwasserkühlungstehnologie von Lenovo können wir SuperMUC-NG Phase 2 so nachhaltig und Energie-effizient wie möglich umsetzen. “
Prof. Dr. Dieter Kranzlmüller, Leiter des Leibniz-Rechenzentrums: „Die Integration modernster KI-Technologie in unsere Supercomputer spielt [..] eine wichtige Rolle. Zusammen mit Lenovo und weiteren Partnern arbeiten wir daran, Forschenden genau dazu beiten, was sie für wissenschaftliche Spitzenleistung benötigen. Und nicht nur das: Mit der Warmwasserkühlungstehnologie von Lenovo können wir SuperMUC-NG Phase 2 so nachhaltig und Energie-effizient wie möglich umsetzen. “
(Bild: Lenovo)

Start von Phase 2

Im Winter dieses des Jahres 2021 wird das LRZ das Daos-Speichersystem erhalten, die Rechnerknoten werden im zweiten Quartal 2022 folgen. Das Team des LRZ bereitet seine Nutzergemeinschaft auf die Erweiterungen von Phase 2 vor, indem es Unterstützung und Beratung bei der Anpassung und Optimierung von Codes und KI-Algorithmen anbietet und Forschern Zugang zu GPU-Systemen gibt, die auf KI-Anwendungen spezialisiert sind. Das LRZ-Trainingsprogramm bietet außerdem eine Vielzahl von Kursen zum Thema Machine und Deep Learning an, in denen die Anwender lernen, wie sie bestehende Algorithmen anpassen oder eigene entwickeln und trainieren können.

Artikelfiles und Artikellinks

(ID:47469062)