Mit dem Fokus auf gigantische Datenmengen Der modulare Supercomputer Jureca ist neu und mit 23,5 PetaFlops bestückt

Redakteur: Ulrike Ostler

Der modularen Supercomputer „Jureca“ im Forschungszentrum Jülich leistet nun 23,5 Billiarden Rechenoperationen pro Sekunde, kurz: 23,5 PetaFlops. Erreicht wurde dies durch die Installation des Moduls „Jureca-dc“ – dc steht für data-centric –, das Atos geliefert hat und mit dem Betriebssystem von Partec arbeitet.

Firmen zum Thema

Das neue, 'datenzentrische' Cluster-Modul „Jrureca-dc“
Das neue, 'datenzentrische' Cluster-Modul „Jrureca-dc“
(Bild: Forschungszentrum Jülich / Ralf-Uwe Limbach)

Stand heute gehörte allein dieses neue Modul mit seinen 18,5 Petaflops zu den aktuell 30 schnellsten Supercomputern der Welt. Es wird wie der modulare Jülicher Superrechner „Juwels“, derzeit schnellster Rechner Europas, auf der aktualisierten „TOP500“-Liste der leistungsfähigsten Computer der Welt erscheinen, die am 28. Juni auf der „ISC21 Digital“ bekanntgegeben wird.

Zusätzlich wurde mit dem innovativen Flash-Speicher „Just-ime“ von Hewlett-Packard Enterprise (HPE) und DDN ein Speichersystem installiert, von dem mehrere Jülicher Superrechner profitieren. Damit gehen am JSC gleich zwei neue Systeme in Betrieb, die darauf zugeschnitten sind, die Verarbeitung von Daten zu beschleunigen und Wissen aus riesigen Datenbergen zu generieren.

Die Menge an Daten nimmt stetig exponentiell zu, sowohl in der Wissenschaft als auch in der Industrie. Gut beobachten lässt sich das in der Klimaforschung, etwa anhand neuer, datenintensiver Techniken der Datenassimilation, die genauere Vorhersagen zum Klimawandel ermöglichen. Bei der Methode geht es darum, Daten aus Computersimulationen mit realen Messdaten zu verknüpfen.

Die zwei wesentlichen Bestandteile

Ein weiteres Beispiel sind Wetterprognosen mittels Deep Learning. Diese nutzen Muster, die aus gigantischen Datensätzen extrahiert werden, um die Vorhersage von lokal auftretenden Gewittern und starken Regenfällen zu verbessern.

Die Erneuerung und Erweiterung der Rechnerinfrastruktur am Jülich Supercomputing Centre (JSC) trägt der Entwicklung zu datenintensiven Ansätzen Rechnung und ermöglicht es Forschenden nun, so große Datenmengen zu verarbeiten wie nie zuvor.

Jureca besteht aus zwei Modulen: einem Cluster-Modul, das universell einsetzbar ist, sowie einem Booster-Modul für spezielle Codes und rechenintensive Programmteile, die sich sehr effizient parallel auf einer Vielzahl von Rechenkernen berechnen lassen. Das Cluster-Modul wurde in den vergangenen Monaten durch das Jureca-dc-Modul ersetzt, während das Booster-Modul erst 2017 installiert wurde und weiter in Betrieb bleibt.

Das Modul Jureca-dc

Die Atos-Technik basiert auf der „Sequana-XH2000“-Reihe. Es besteht aus insgesamt 768 Rechenknoten, die mit zwei „AMD-Epyc-Rome“-CPUs mit 64 Kernen und 512 Gigabyte bis 1 Terabyte Hauptspeicher bestückt sind. Jeder einzelne Rechenknoten verfügt damit über einen Arbeitsspeicher, der von der Kapazität her der gesamten Festplatte in einem gewöhnlichen PC entspricht.

Ein neuartiges Flash-Speichersystem von Atos trägt zusätzlich dazu bei, datenintensive Anwendungen – ähnlich wie mit einer Solid-State-Disk in einem Notebook oder PC – zu beschleunigen. In einem gemeinsamen Projekt arbeiten das Forschungszentrum Jülich, Atos und Partec daran, das System in seiner frühen Produktionsphase schrittweise weiter zu optimieren.

Insgesamt 192 der 768 Knoten sind mit je vier „Tensor-Core“-Grafikprozessoren (GPUs) vom Typ „Nvidia A100“ ausgestattet. Die immense Rechenpower dieser Grafikprozessoren ist der wesentliche Grund, warum sich die Rechenleistung des neuen Moduls im Vergleich zum Vorgänger um beinahe eine Größenordnung erhöht hat. Von den GPU-beschleunigten Rechenknoten profitieren beispielsweise Anwendungen des maschinellen Lernens, wie sie bei der Analyse und Verarbeitung von hochaufgelösten Bilddaten in der Hirnforschung zum Einsatz kommen.

Selbstkonsistente Multiskalensimulationen von Turbulenzen und energetischen Teilchen in Tokamak-Plasmen, ein PPI4HPC-Projekt
Selbstkonsistente Multiskalensimulationen von Turbulenzen und energetischen Teilchen in Tokamak-Plasmen, ein PPI4HPC-Projekt
(Bild: Max Planck Institute for Plasma Physics, Garching)

Ein europäisches Anliegen

Das Jureca-dc-Modul wurde im Rahmen des „PPI4HPC“-Projekts beschafft, in dem sich Rechenzentren aus vier europäischen Ländern zusammengeschlossen haben, um – erstmals auf europäischer Ebene – in einem gemeinsamen Verfahren neue innovative Superrechner-Systeme zu erwerben. Die EU fördert den Prozess der so genannten Innovativen Öffentlichen Beschaffung (PPI), indem sie 35 Prozent der anfallenden Kosten übernimmt und dafür einen Teil der Rechenzeit für europäische Wissenschaftlerinnen und Wissenschaftler nutzbar machen kann. Neben dem JSC sind das BSC in Spanien, Genci/CEA in Frankreich und Cineca in Italien an PPI4HPC beteiligt.

(ID:47479699)