Einblick in den Betrieb eines Top-10-Supercomputers Nvidia zeigt ein paar Details des KI-Systems Eos

Quelle: Pressemitteilung 2 min Lesedauer

Anbieter zum Thema

„Eos“ lautet die Bezeichnung des Nvidia- Supercomputers im Rechenzentrumsmaßstab, der eine Blaupause für Unternehmen sein sein soll, die die nächste Stufe in Sachen KI-Innovation erklimmen wollen. Der Cluster basiert auf der Hardware und Software für die „DGX Superpods“ von Nvidia.

Der „Eos“-Cluster von Nvidia ist übrigens wasserkegühlt. (Bild:  Nvidia)
Der „Eos“-Cluster von Nvidia ist übrigens wasserkegühlt.
(Bild: Nvidia)

Eos ist ein extrem großer Nvidia DGX Superpod, auf dem die Entwickler des Konzerns ihre durchaus bahnbrechend zu nennenden KI-Ergebnisse mit Hilfe einer beschleunigten Computing-Infrastruktur und optimierter Software hervorbringen. Eos besteht aus 576 „DGX H100“Systemen, „Nvidia Quantum-2“-Infiniband-Netzwerken sowie Nvidia-Software und bietet insgesamt 18,4 ExaFlops FP8 KI-Leistung.

Vorgestellt hatte der Technik-Mogul Eos - benannt nach der griechischen Göttin, die jeden Tag die Tore der Morgendämmerung öffnet - bereits im November 2023 auf der Supercomputing-Messe. Am Donnerstag der vergangenen Woche hat Nvidia nun ein Video veröffentlicht, das einen Einblick in die Architektur gibt, die diese 'KI-Fabrik' antreibt.

Jedes DGX-H100-System ist mit acht H100-Tensor-Core-GPUs ausgestattet. Somit verfügt Eos über insgesamt 4.608 dieser Grafikprozessoren. Von Nvidia heißt es: „Dadurch kann Eos die größten KI-Workloads bewältigen, um große Sprachmodelle, Empfehlungssysteme, Quantensimulationen und mehr zu trainieren. Es ist ein Paradebeispiel dafür, was die Technologien von Nvidia leisten können, wenn sie in großem Maßstab eingesetzt werden.“

Zudem komme Eos zum „perfekten Zeitpunkt“. Die Menschen sind dabei, die Welt mit generativer KI zu verändern, von der Arzneimittelforschung über Chatbots bis hin zu autonomen Maschinen und darüber hinaus. Um diese Durchbrüche zu erzielen, brauchen sie mehr als KI-Expertise und Entwicklungsfähigkeiten. „Sie brauchen eine KI-Fabrik - eine zweckbestimmte KI-Maschine, die immer verfügbar ist und ihnen hilft, ihre Kapazität zur Erstellung von KI-Modellen in großem Maßstab zu erhöhen“, so der Hersteller.

Eos, liegt derzeit auf Platz 9 der aktuellen TOP500-Liste der schnellsten Supercomputer der Welt. Der Anspruch von Nvidia: neue Maßstäbe für KI-Technologie und -Infrastruktur. Der Cluster beinhaltet neben den Akzeleratoren auch hochentwickelte Software-Angebote, etwa „Base Command“ und „Nvidia AI Enterprise“.

Die Ausrichtung auf KI

Die Architektur von Eos ist für KI-Workloads ausgelegt, die sowohl niedrige Latenz als auch einen hohen Durchsatz über einen großen Cluster von beschleunigten Rechenknoten erfordern. Die auf Nvidia Quantum-2 Infiniband mit „In-Network“ Computing Technologie basierende Netzwerkarchitektur unterstützt Datenübertragungsgeschwindigkeiten von bis zu 400 Gigabit pro Sekunde (Gb/s). Damit lassen sich auch große Datensätze schnell übertragen, was für das Training komplexer KI-Modelle unerlässlich ist.

(ID:49917305)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung