Start im vierten Quartal Atos Sequana XH3000 kann für 20 MW ExaFlops, Hybrid Cloud sowie Quantensimulation

Von Ulrike Ostler

In der vergangenen Woche hat Atos mit „Bull Sequana XH3000“ in Paris einen Supercomputer vorgestellt, der eine Leistung von einem PetaFlops bis zu ExaFlops für herkömmliche digitale Simulationen mit doppelter Genauigkeit und bis zu 10 ExaFlops für KI-Leistungen mit gemischter Genauigkeit bieten soll. Die Verfügbarkeit ist für das vierte Quartal dieses Jahres geplant.

Anbieter zum Thema

Atos hat mit „Bull Sequana XH3000“ einen Supercomputer vorgestellt, der sowohl für herkömmliche digitale Simulationen als auch für Hybrid-Computing konzipiert ist.
Atos hat mit „Bull Sequana XH3000“ einen Supercomputer vorgestellt, der sowohl für herkömmliche digitale Simulationen als auch für Hybrid-Computing konzipiert ist.
(Bild: Atos)

Das 'X' in der Bezeichnung steht für Exascale und das 'H' für Hybrid. Und das Design des XH3000-Gehäuses ist unverkennbar von Atos; denn es enthält ein einzigartiges Turing-Muster, das die lebenden Elemente des Planeten symbolisiert. Damit sind die Kennzeichen des neuen Supercompuers auch schon genannt: Atos will Leistung, Hybrid Computing und Nachhaltigkeit vereinen.

So wirbt Atos mit einer Versechsfachung der Leistungsdichte, die laut Atos „die beste Rechenleistung pro Quadratmeter auf dem Markt“ darstelle. Das bedeutet eine Erhöhung des Strombedarfs. Atos schätzt, dass XH3000 bei voller Leistung pro Rack in etwa 140 Kilowatt benötigt, damit wären die 20 Megawatt recht schnell erreichtet. Einzelne Chips brauchen bis zu (oder sogar über) 1.000 Watt, im Vergleich zu rund 350 Watt für das „XH2000“-System, die aktuelle Generation.

Trotzdem sei das System doppelt so Energie-effizient ist wie die Vorgängergeneration „XH2000“. Denn das patentierte Kühlsystem biete in der vierten Generation über 50 Prozent mehr Kühlleistung als frühere Versionen, so Atos. Die direkte Flüssigkeitskühlung (DLC) von Atos arbeitet mit 40 Grad warmen Wasser. Zudem verweist das Unternehmen auf einen umweltfreundlichen Produktlebenszyklus, der von der „Rohstoffbeschaffung und Herstellung über die Prüfung und den Transport bis hin zur Entsorgung/Wiederverwertung“ reiche.

Flexibilität in der Prozessorwahl

Kunden haben die Wahl zwischen ARM- und x86-Computing-Architekturen und erhalten Versionen mit „Nvidia Grace“-, Intel- und AMD-Prozessoren. Die Architektur wird zudem den zukünftigen „Rhea“-Prozessor unterstützen, den Sipearl im Auftrag der European Processor Initiative entwickelt. Für beschleunigtes Rechnen unterstützt er Knoten mit vier „Tensor Core“-GPUs von Nvidia.

Der Superrechner verfügt über standardisierte Steckplätze für Compute- und/oder Switch-Blade-Module und unterstützt bis zu 38 Blades pro Rack. Die Connectivity beruht auf Nvidia-Infiniband-Optionen wie „Quantum-2 Infiniband“, „ConnectX-7“ und Ethernet-Adapter. Zu den Verbindungsoptionen gehört zudem die „BXI“-Technik von Atos,. Die Interconnect-Midplane der Bull Sequana-Generation XH2000 ist nicht in der Lage, NDR zu unterstützen.

Nach Herstellerangaben ist das Ergebnis eine flexible, hybride Rechenplattform, die in der Lage ist, die derzeit anspruchsvollsten HPC-Simulationen, KI-Aufgaben und neue Arbeitslasten im Quantencomputing auszuführen. Die Erwartungen sind hoch. So formuliert Rodolphe Belmer, CEO von Atos: „Bull Sequana XH3000 wird zweifellos über ein Tor zum Exascale-Computing und einige der wichtigsten wissenschaftlichen und industriellen Innovationsdurchbrüche der Zukunft ermöglichen.

Optimierungen für das Supercomputing-System XH3000 gehören zu den ersten Projekten von „Exail“, dem gemeinsamen Excellence AI Lab, das Atos und Nvidia im November vorgestellt haben. Generell aber erstreckt sich die Arbeit von Exail auf die Bereiche Klimaforschung, des Gesundheitswesens und der Genomik, des Quantencomputing, Edge AI und „Computer Vision“ sowie Cyber-Sicherheit. Die Forscher können auf Anwendungs-Frameworks wie „Nvidia Clara“ für das Gesundheitswesen und „Nvidia Morpheus“ für die Sicherheit sowie auf das „Cuquantum SDK“ von Nvidia für Quantencomputing und das HPC SDK von Nvidia zugreifen, auf dem Hunderte von wissenschaftlichen und technischen Anwendungen laufen.

Eine Quantenverarbeitungseinheit (QPU), auch als Quantenchip bezeichnet, ist ein physischer Chip, der eine Reihe miteinander verbundener Qubits enthält. Er ist die Grundkomponente eines Quantencomputers, der das Gehäuse für die QPU, die Steuerelektronik und viele andere Komponenten umfasst.
Eine Quantenverarbeitungseinheit (QPU), auch als Quantenchip bezeichnet, ist ein physischer Chip, der eine Reihe miteinander verbundener Qubits enthält. Er ist die Grundkomponente eines Quantencomputers, der das Gehäuse für die QPU, die Steuerelektronik und viele andere Komponenten umfasst.
(Bild: Atos)

Teil der Ankündigung vom vergangenen Mittwoch ist ein Ausblick auf eine künftige „QPU“-Komponente, die Quantenbeschleunigung bieten soll und eine Erweiterung der Atos-Technik „Quantum Learning Machine“ (Atos QLM) darstellt. Agnès Boudot, die Leiterin von HPC und Quantum bei Atos, erläutert: „Die QPU, die wir in unsere Maschine integrieren können, wäre wahrscheinlich eine der ersten auf der Welt, die das tut.“

Darüber hinaus, so Boudot, würden derzeit Anstrengungen unternommen, um traditionelle On-Prem-HPC mit Cloud-Umgebungen zu verbinden, indem die „Jarvice XE“-HPC-Cloud-Technologie genutzt werde, die mit dem Kauf von Nimbix erworben worden sei.

Das im Juli 2021 gekaufte Unternehmen Nimbix wurde 2010 gegründet und hat seinen Hauptsitz in der Nähe von Dallas, Texas. Es bietet HPC in der Cloud und vor Ort an und ermöglicht Ingenieuren und Wissenschaftlern den Zugang zu Infrastruktur und Software, die sie für die Erstellung, Berechnung, Analyse, Skalierung und Bereitstellung von Simulationen, künstlicher Intelligenz, maschinellem Lernen und Deep-Learning-Anwendungen benötigen. Nach eigenen Angaben hatte das Unternehmen schon vor dem Aufkauf Tausende von Cloud-HPC-Projekten in 68 Ländern begleitet.

Die kombinierten Möglichkeiten von Atos und Nimbix sollen ein umfassendes Angebot für die Workload-Orchestrierung sowohl On-Prem- als auch für (Milti-)Cloud-Kunden bieten – mit einem hohen Maß an Selbstbedienung und Automatisierung, insbesondere als Teil der „Onecloud“-Initiative von Atos.

Ergänzendes zum Thema
Eine produktive Beziehung

Die Zusammenarbeit von Atos und Nvidia ist keine neue Erfahrung. Atos hat einen der ersten Supercomputer in Europa gebaut, der die „Ampere Architektur“ des Komponentenherstellers verwendet, den „Juwels Booster“ im Jülich Supercomputing Center. Dieses Cluster nutzt 3.744 „A100 Tensor Core“-GPUs, um 2,5 ExaFlops an gemischter Präzisions-KI-Leistung zu liefern.

Um den Klimawandel besser zu verstehen, werden die Forscher von Atos und Nvidia KI-Modelle auf dem System ausführen, das derzeit auf Platz 8 der TOP500-Liste der schnellsten Supercomputer der Welt steht. Außerdem war das System bereits im Einsatz, um eine Quantenschaltungssimulation auszuführen.

Im Vergangenen Jahr leitete Atos den Einsatz von „Berzelius“, einem System, das auf dem „DGX Superpod“ von Nvidia basiert und Schwedens größter Supercomputer ist. Das ist nur ein Highlight unter den Supercomputing-Infrastrukturen in Europa, Indien und Südamerika auf der Grundlage von DGX-Systemen, an denen Atos beteiligt ist.

Als nächstes baut Atos „Leonardo“, einen Supercomputer für das italienische interuniversitäre Konsortium Cineca. Er wird mit 14.000 A100 Grafikprozessoren auf einem Quantum-Infiniband-Netzwerk ausgestattet sein und soll der schnellste KI-Supercomputer der Welt werden, der 10 ExaFlops an gemischter KI-Leistung erreichen soll.

(ID:48023208)