Direct Cooling von CPUs und GPUs im Server Inspur setzt auf KI und Flüssigkeitskühlung

Von Klaus Länger Lesedauer: 3 min |

Anbieter zum Thema

Marktführer bei KI-Servern ist Inspur, so jedenfalls laut dem Europachef Jay Zhang. Dabei setzt der Hersteller nicht nur bei KI-Systemen auf Flüssigkeitskühlung, sondern im gesamten Produktportfolio.

Die KI-Server waren nur der Anfang bei der Flüssigkeitskühlung. Nun bringt Inspur die Cold-Plate-Technologie in das gesamte Server-Portfolio.
Die KI-Server waren nur der Anfang bei der Flüssigkeitskühlung. Nun bringt Inspur die Cold-Plate-Technologie in das gesamte Server-Portfolio.
(Bild: Inspur)

Inspur ist nach HPE und Dell der drittgrößte Server-Hersteller der Welt, wie im aktuellen „Server Tracker“ feststellt. Bei KI-Systemen belegte die Firma laut einer weiteren IDC-Studie mit einem Marktanteil von 20,2 Prozent im ersten Halbjahr 2020 sogar den ersten Platz. Neuere Zahlen zum Markt für KI-Systeme wurden seitdem nicht veröffentlicht.

„KI-Systeme sind das strategische Kerngeschäft von Inspur Information”, sagt dazu Jay Zhang, Vice President bei Inspur Global Business und gleichzeitig CEO von Inspur Europe. „Künstliche Intelligenz ist einer der am schnellsten wachsenden Technologiebereiche in der globalen IT-Branche”, ergänzt der Inspur-Europachef und ist davon überzeugt, dass der Markt für KI-Server auch weiterhin schnell wachsen wird.

Jay Zhang ist CEO von Inspur Europe und Vice President bei Inspur Global Business.
Jay Zhang ist CEO von Inspur Europe und Vice President bei Inspur Global Business.
(Bild: Inspur)

Eine hohe Rechenleistung ist dabei der Schlüssel für die effiziente Arbeit mit Daten und Algorithmen. Der Hersteller bietet hier mehrere Systeme für verschiedene Aufgaben an. Für umfangreiche Trainingsmodelle wie „GPT3“ sind laut Zhang Server mit mehreren GPUs nötig. Hier kamen bisher luftgekühlte NVLINK-Systeme wie „NF5488A5“ zum Einsatz.

Für kleine und mittelgroße Modellschulungs- oder Inferencing-Szenarien boten sich bisher PCIe-GPU-Modelle wie „NF5468A5“ an, so der Inspur-Manager. 32 Systeme vom Typ „NF5488A5“ und zusätzliche 38 „NF5488A5“-Server werden beispielsweise im neuen GPU-Cluster der Friedrich-Alexander-Universität Erlangen-Nürnberg eingesetzt, den Inspur gemeinsam mit dem Supercomputing-Spezialisten Megware als Partner aufgebaut hat.

Er belegt den Platz 184 in der aktuellen TOP500-Liste der schnellsten Supercomputer der Welt und ist laut Megware zudem das momentan Energie-effizienteste HPC System in Deutschland.

Mehr KI-Effizienz mit Flüssigkeitskühlung

Mit wassergekühlten GPU-Servern will Inspur nun den Stromverbrauch der Systeme reduzieren und gleichzeitig die Recheneffizienz verbessern. Denn die „steigende Nachfrage nach KI- und HPC-Cluster-Rechenleistung hat den Stromverbrauch und die Dichte von Rechenzentrumsgeräten vor größere Herausforderungen gestellt”, erläutert Zhang.

Anfang Juli hat das Unternehmen den flüssigkeitsgekühlten KI-Server „NF5488LA5“ mit acht „Nvidia-A100“-GPUs vorgestellt. Bei dem 4U-System werden nicht nur die acht Nvidia-A100-GPUs und sechs NVSwitches auf der „HGX-A100“-Platine durch Wasser gekühlt, sondern auch die beiden „AMD-Epyc“-Prozessoren aus der „7003“-Serie.

Bildergalerie

Der erste flüssigkeitsgekühlte KI-Server, der für Open Accelerated Computing entwickelt wurde, ist laut dem Hersteller das System „NF5498LA5“. Es unterstützt OAM-kompatible Beschleuniger mehrerer Hersteller. Die Peer-to-Peer-Bandbreite zwischen zwei OCP Accelerator Modules (OAMs) soll dabei bis zu 896 GB/s erreichen.

Für beide Systeme gibt Inspur einen sehr niedrigen PUE-Wert (Power Usage Effectiveness) von 1,1 an. Der flüssigkeitsgekühlte High-Density-Server „i24LM6“ unterstützt vier Dual-Socket-Knoten auf 2U-Bauhöhe und bietet damit eine Rechenleistung von 447,5 TFlop/s in einem einzigen Rack. Die Cold-Plate-Kühllösung deckt dabei nicht nur die CPUs ab, sondern auch die Spannungsregelung und die Speichermodule.

Flüssigkeitskühlung für alle Servertypen

In einem nächsten Schritt baut der Hersteller sein Portfolio an flüssigkeitsgekühlten Servern weiter aus und integriert die Cold-Plate-Flüssigkeitskühlung in alle Produkte. Beim 2U-Server „NF5280M6“ mit Intel-Xeon-Scalable-CPUs der dritten Generation soll die Flüssigkeitskühlung den Stromverbrauch für die Wärmeabfuhr um 80 Prozent reduzieren, was die Kosten senkt und gleichzeitig die Nachhaltigkeit steigert. Beim für große Rechenzentren bestimmten Rack-Server ORS3000S steigert die Cool-Plate-Flüssigkeitskühlung laut dem Hersteller die Kühleffizienz um 50 Prozent.

Artikelfiles und Artikellinks

(ID:49036118)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung