Server-CPUs für agentische KI Die CPU-Racks kommen, erklärt AMD und will vorne dabei sein

Von Daniel Schrader 3 min Lesedauer

Anbieter zum Thema

AMD positioniert seine Epyc-Prozessoren als Marktführer für agentische KI-Workloads. Die Epyc-CPUs würden die Konkurrenz von Nvidia und Intel bei Durchsatz und im Direktvergleich mit Nvidia Vera auch bei der Kerndichte übertreffen. Hier liegt Intel vorne, AMD argumentiert aber mit dem Vorzug standardisierter x86-Architekturen.

72-Node-CPU-Racks sollen laut AMD zum Zuhause für KI-Agenten und ihre Ausführungsumgebungen werden. Intel stimmt zu. Der Marktkampf um KI-Prozessoren verschärft sich. (Bild:  KI-generiert)
72-Node-CPU-Racks sollen laut AMD zum Zuhause für KI-Agenten und ihre Ausführungsumgebungen werden. Intel stimmt zu. Der Marktkampf um KI-Prozessoren verschärft sich.
(Bild: KI-generiert)

KI-Agenten scheitern nicht an der GPU, sondern an der CPU, argumentiert Raghu Nambiar, Corporate Vize bei AMD und Verantwortlicher für Datacenter-Entwicklungen, in einem aktuellen Blogbeitrag. Zwar zeichnen sich KI-Workloads durch massive parallele Berechnungen aus, bei denen man nicht ohne GPUs oder andere spezielle Beschleuniger auskommt. Aber: Orchestrierung, Datenbankabfragen, Caching und Werkzeugaufrufe seien überwiegend Prozessor-gebunden. In dieser Lesart führen GPUs die Modelle aus, während die CPU die umgebende Logik, die Schlüssel-Wert-Speicher und die Ablaufsteuerung trägt.

Für das Argument nutzt AMD einen geschickt gewählten Vergleichsmaßstab: es geht nicht um die Leistung einzelner Sockel. Es geht auch nicht um CPUs in GPU-Servern. Zum Vergleichsmaßstab macht AMD stattdessen spezielle orchestrierende und koordinierende CPU-Racks im 100-Kilowatt-Maßstab, wie sie primär zur Steuerung von KI-Agenten und Einrichtung ihrer Ausführungsumgebungen (Sandbox) zum Einsatz kommen. Bei angenommenen zwei CPU-Sockeln pro Server wird die Effizienz der Kerne und ihre Anzahl pro CPU entscheidend.

Mit sechs Workload-Arten hat AMD einen Benchmark zusammengestellt. Die CPU-Performance bei Allzweck-Rechenleistung, serverseitigem Java, Web-Serving, Schlüssel-Wert-Speicher, In-Memory-Caching und relationalen Datenbanken werden zu einem Mittelwert zusammengefügt und mit Konkurrenzprodukten verglichen.

Argument 1: mehr Durchsatz

Das Ergebnis: Im 100-Kilowatt-Modell beziffert AMD die Leistung der CPU Epyc 9965 „Turin“ mit 192 Kernen auf das 2,37-Fache des Durchsatzes der „Vera“-CPU von Nvidia verglichen und auf rund das 1,6-Fache von Intels Xeon 6980P „Granite Rapids-AP“ mit 128 Kernen. Die kommende Epyc-Generation „Venice“ mit 256 Kernen soll laut AMD-Projektion auf das 3,30-Fache von Vera kommen.

AMD normalisiert dazu alle Konfigurationen auf ein gemeinsames Rack-Leistungsbudget von 100 Kilowatt und vergleicht den Gesamtdurchsatz pro Rack. Damit soll eine Benachteiligung der pro Server-Node effizienteren Nvidia-CPU ausgeschlossen werden, diese schneide dennoch schlechter ab. Der Vergleich mit Nvidia-CPUs basiert dabei wohl auf Modellannahmen; Vera soll erst im Herbst 2026 verfügbar sein.

Argument 2: mehr Kerne pro Rack

Als zweites Argument führt AMD die Kerndichte je Rack an. In einem flüssigkeitsgekühlten Rack der Klasse „Dell Poweredge IR7000“ ermögliche Turin heute mehr als 27.000 CPU-Kerne, Venice sei für über 36.000 Kerne in derselben Rack-Klasse ausgelegt. Das Nvidia-Vera-Referenzdesign beziffert AMD auf etwa 22.500 Kerne. Die Zahl der Kerne sei gerade bei agentischen KI-Umgebungen entscheidender (im AMD-Argument: mehr Kerne = mehr Agenten-Sandboxes) als etwa beim KI-Training. Der Fokus auf CPU-lastige Workloads ist aber zugleich der Grund, wieso ein Vergleich mit der auf die enge Kopplung mit GPUs über Nvidia Nvlink ausgelegte Vera-CPU schwächelt.

In der Disziplin „Kerndichte“ führt AMD zudem keinen Vergleich mit Intel-CPUs an. Nambiars Zwischenüberschrift bietet eine Erklärung aus AMD-Perspektive „Dichte heute liefern statt proprietären Versprechen“. Damit spielt der AMD-Vize wohl einerseits auf die von Intel mit Foxconn entwickelten Rackscale Blueprints an. Im Rahmen des proprietären Architekturdesigns soll ein flüssigkeitsgekühltes Rack mit dem Xeon 6+ „Clearwater Forest“-Chips nach Intel-Angaben 36.864 Kerne fassen und so die von AMD für die Epyc-CPUs angepriesene Dichte übertreffen.

Aber auch jenseits von Architektur-Argumenten bleibt unklar, wieso AMD für die Durchsatz-Benchmarks den 128-Kerner 6980P vom Intel statt dem Xeon-6+-Flaggschiff mit 288 Kernen nutzt, welcher (bei geringerer Kerndichte pro Rack) auch eigenständig verfügbar ist. AMD veröffentlichte den Beitrag kurz nachdem Intel die Verfügbareit des Modells bekanntgab.

Der Seitenhieb gegen proprietäre Systeme ist andererseits auch ein Angriff auf Nvidia. Primäres Zuhause der Vera-CPU soll der vertikal integrierte „Vera Rubin“-Racks werden. AMD hingegen nutzt die etablierte x86-Architektur.

Steigende Nachfrage verschärft CPU-Marktkampf

Es ist dieser Vorteil bei Integration in etablierte Datacenter-Architekturen und x86-Softwarestacks, der die Vorteile der Epyc-CPUs für agentische Workloads treffender zu beschreiben scheint, als die angeführten AMD-Benchmarks. Zudem bestätigen aktuelle Marktanalysen, dass sich das Übergewicht von GPUs beim CPU-zu-GPU-Ratio wieder reduziert und die Nachfrage nach CPUs wieder steigt.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Auch hier allerdings hat AMD die Infrastruktur-Dienste für Agentische Workloads gemessen. Ein Benchmark der aktuellen CPU-Generationen mit konkreten agentischen Pipelines mitsamt Planung, GPU-Inferenz und knotenübergreifender Koordination wird deutlich aussagekräftiger für die Position der drei großen Kontrahenten im Kampf um KI-CPUs sein.

(ID:50885710)