RWTH Aachen setzt auf Bull, Science + Computing sowie Intel Cluster Ready HPC-Ressourcen für über 1000 Wissenschaftler

Redakteur: Ulrike Ostler

Der neue Superrechner der RWTH Aachen gehört zu den 50 schnellsten weltweit. Dahinter steckt ein von Bull entwickeltes System mit 1.712 Knoten auf Basis der Intel Cluster Ready-Architektur. Implementiert wurde der Computer von der Bull-Tochter Science + Computing AG.

Anbieter zum Thema

Das Hauptgebäude der RWTH Aachen, eine der neun deutschen Excellenz-Univeritäten.
Das Hauptgebäude der RWTH Aachen, eine der neun deutschen Excellenz-Univeritäten.
(Bild: Wikipedia/Aleph)

Als eine der neun deutschen Exzellenz-Universitäten stellt die RWTH Aachen (RWTH = Rheinisch-Westfälische Technische Hochschule) IT-Ressourcen für mehr als 1.000 Wissenschaftler bereit, die in allen naturwissenschaftlichen Bereichen forschen. Alle Schlüsseldisziplinen der Universität nutzen HPC zur Erforschung des Universums, und die Leistungsfähigkeit und Flexibilität dieser Systeme können erheblichen Einfluss auf die entsprechenden Fortschritte haben.

Vor kurzem entschloss sich die Universität folglich zu einer grundlegenden Modernisierung ihrer HPC-Umgebung. Dieter an Mey, Leiter des HPC-Teams am Rechen- und Kommunikationszentrum der RWTH Aachen erläutert: „Wir haben uns für Bull entschieden, weil die gesamte Systemarchitektur auf die Anforderungen unserer Wissenschaftler und deren Forschungsbereiche zugeschnitten ist und weil wir hier unsere Anforderungen der kommenden Jahre an einen verlässlichen HPC-Partner in guten Händen wissen.“

Flexibilität „ab Werk“

Wegen des breiten Forschungsspektrums der RWTH Aachen musste der neue Cluster sowohl leistungsfähig als auch flexibel ausgelegt werden: Nicht alle HPC-Workloads sind gleich. Manche lassen sich in Teilaufgaben zerlegen, die gleichzeitig auf zahlreichen, relativ kleinen Serverknoten laufen können.

Andere Anwendungen laufen besser auf einem einzelnen Mehrprozessor-Server mit großem freigegebenem Arbeitsspeicher oder auf einem kleinen Cluster aus relativ großen Servern. Um diesen unterschiedlichen Anforderungen gerecht zu werden, wurde der Cluster für die RWTH Aachen mit zwei Hauptpartitionen konfiguriert.

Bildergalerie

Die MPI-Partition (MPI = Message Passing Interface, für eine skalierbare Performance der Software) verfügt über 1.350 „Bullx“ Server-Blades mit zwei Sockeln auf Basis der „Intel Xeon 5600“er-Prozessoren. Mit sechs Kernen pro Prozessor und der Intel Hyper-Threading-Technik kann diese Partition bis zu 32.400 parallele Tasks (Threads) verarbeiten.

Die SMP-Partition (SMP = Symmetric Multiprocessing) bietet größere Server-Knoten für Anwendungen, die auf einem Cluster aus kleineren Servern nicht optimal laufen. Sie verfügt über 342 „Bullx s6010“-Module mit vier Sockeln auf der Basis der „Xeon 7500“er-Prozessoren von Intel. Diese Prozessorfamilie bietet eine hohe Integration von Rechenressourcen (Kerne, Cache, Bandbreite), so dass jedes Modul erheblich größere Workloads bewältigen kann.

Infiniband zur Kommunikation und Petabyte zum Speichern

Alle Server im Cluster sind an ein Fat-Tree-Netzwerk mit QDR Infiniband angeschlossen, das hohe Bandbreite mit niedriger Latenz und sehr effizienter Node-to-Node-Kommunikation bietet. Das Massenspeichersystem unterstützt bis zu drei Petabyte.

Das neue System ist derzeit das weltweit größte Intel Cluster Ready zertifizierte HPC-System. Bei dieser Architektur lassen sich etwa ansonsten schwer zu erkennende Probleme wie falsche BIOS-Versionen oder eine langsame Netzwerkkarte schnell und kostengünstig ermitteln. Selbst beim Aufbau eines kleineren Clusters lässt sich so viel Aufwand sparen.

Zertifizierung durch Intel

Mit „Intel Cluster Checker“ kann die Konformität mit der Intel Cluster Ready Architektur zertifiziert werden. Das gelang mit dem Supercomputer der RWTH Aachen.

Die Zertifizierung garantiert die Einsetzbarkeit zahlreicher Standard-HPC-Anwendungen von führenden Softwareherstellern. Die standardisierte Architektur hilft auch bei der Vereinfachung der Entwicklung von Sonderanwendungen, da die Entwickler auf eine einheitliche Hardware- und Software-Plattform zählen können. Das spart Zeit und entlastet die Technik.

(ID:32616070)