Modularisierte Alternative zum Server-Rack von Nvidia Gigabyte kündigt KI-Server mit acht „B200“-GPUs an

Quelle: Pressemitteilung Gigabyte 1 min Lesedauer

Anbieter zum Thema

Die luftgekühlten „G893“-Server bieten eine kompaktere und luftgekühlte Alternative zu den „Nividia NVL72“-Racks und erlauben die Wahl zwischen Intel- und AMD-CPUs.

Der von Gigabyte vorgestellte „G893-SD1-AAX5“-Server mit acht „Nvidia B-200“-GPUs.(Bild:  Gigabyte)
Der von Gigabyte vorgestellte „G893-SD1-AAX5“-Server mit acht „Nvidia B-200“-GPUs.
(Bild: Gigabyte)

Mit „G893“ hat Giga Computing, die Server-Tochter von Gigabyte, eine GPU-basierte Serverreihe für KI-Modelle und High-Performance-Computing auf Basis des „HGX B200“-Serverboards vorgestellt. Auch Gigabyte baut so auf dem Hype um die „B200“-GPUs von Nvidia auf. MLPerf-Benchmarks attestieren diesen bei der Ausführung von Large Language Models (konkret Llama 2 70B) eine um 3,7-mal höhere Leistung im Vergleich zu den breit eingesetzten „Nvidia H100“-Chips bei einer deutlich verbesserten Energieeffizienz.

Während Nvidia selbst mit dem „GB-200 NVL72“-System eine flüssigkeitsgekühlte Rack-Scale-Plattform mit 36 „Grace“ CPUs und 72 „B200“-GPUs anbietet, stellt Gigabyte eine luftgekühlte und modularisierte Alternative auf Server-Ebene vor. Acht der „B200“-Grafikeinheiten pro Server kommunizieren dabei über die „Nvidia NVLink“-Schnittstelle mit Übertragungsraten von bis zu 1800 GB/S.

Die Serverreihe ermöglicht ebenfalls die Wahl der eingesetzten CPU zwischen Intel- und AMD-Modellen. Der „SD1“-Server unterstützt „Intel Xeon“-CPUs der 4. und 5. Generation (Codenamen „Saphire Raids“ respektive „Emerald Rapids“). Der „ZD1“ nimmt „AMD EPYC“-Chips auf.

Jeder Server bietet PCIe-Konnektivität – Gigabyte hat hier insbesondere solche Lösungen im Blick wie den Netzwerkadapter „Nvidia ConnectX“ oder die Netzwerk-, Speicher- und Sicherheitsfunktionen übernehmenden „BlueField-3“-DPUs. Zugleich hat das Unternehmen mit „Gigapod“ auch eine eigene Rack-Scale-Lösung im Angebot.

Neben der Ausführung großer KI-Modelle hat Gigabyte bei den Zielgruppen auch das Gesundheitswesen und die Forschung, aber auch die Finanzbranche und Anbieter autonomer Systeme im Visier. Ein konkretes Einführungsdatum steht noch nicht fest. Auswirken könnten sich aber Verzögerungen bei der Produktionsausweitung der „GB200 NVL72“-Racks von Nvidia. Diese werden zwar bereits ausgeliefert, breite Verfügbarkeit wird aber erst zum Sommer 2025 erwartet.

Artikelfiles und Artikellinks

(ID:50279543)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung