Auf der Intel-Veranstaltung „Vision 2024“ dreht sich alles um das Thema KI: Der Chiphersteller stellt mit „Gaudi 3“ einen neuen KI-Beschleuniger vor, gibt einen Ausblick auf die „Xeon-6“-CPUs und einen Überblick über das gesamte KI-Portfolio für Client, Edge und Datacenter.
Der auf der Intel-Veranstaltung „Vision 2024“ vorgestellte KI-Beschleuniger „Gaudi 3“ soll bei Training und Inferencing schneller sein als „Nvidia H100“, dabei aber weniger kosten und Energie-effizienter arbeiten.
(Bild: Intel)
Die Vision-2024-Konferenz von Intel in Phoenix, Arizona steht unter dem Motto „Bringing AI Everywhere“. Damit ist auch der Rahmen für die Neuvorstellungen des Chipherstellers gesteckt: Intel-CEO Pat Gelsinger präsentiert dort offiziell den neuen KI-Beschleuniger Gaudi 3, der vor allem Nvidias Tensor-Core-GPUs „H100“ und „H200“ Konkurrenz machen soll. Zudem zeigt Intel die kommenden Xeon-6-CPUs für GenAI-Lösungen im eigenen Datacenter der Kunden sowie neue Prozessoren für Edge-Computing, die dort auch KI-Workloads übernehmen sollen.
Intel Gaudi 3
Vor fünf Jahren hat Intel den israelischen Chiphersteller Habana Labs übernommen. Bisher hat sich die Akquise gelohnt: Zwar reichen die nach dem katalanischen Architekten Gaudi benannten KI-Beschleuniger in der Leistung nicht an die Spitzenmodelle von Nvidia heran, sind aber deutlich günstiger und erfreuen sich daher reger Nachfrage. Mit Gaudi 3 kommt nun eine neue Generation des für KI-Training und Inferencing bestimmten Beschleunigers, die in der Leistung gegenüber dem Vorgänger deutlich zugelegt haben soll.
Der neue Chip besteht nun aus zwei Chiplets, die in einem 5-nm-Prozess hergestellt werden. Gaudi 2 ist noch ein 7-nm-Chip.
Die Zahl der Tensor-Cores ist bei Gaudi 3 von 24 auf 64 gewachsen. Zudem verfügt der KI-Prozessor über acht statt zwei Matrix Multiplication Engines sowie 96 statt 48 MB SRAM auf dem Die. Mit auf dem Prozessor sitzen nun acht HBMe2-Stacks mit zusammen 128 GB Speichergröße und 3,7 TB/s Bandbreite. Bei Gaudi 2 sind es noch sechs Stacks mit insgesamt 96 GB.
Das Plus an Hardware sorgt laut Intel für die doppelte Leistung bei FP8 und die vierfache Performance die BF16 gegenüber dem Vorgänger. Im Vergleich zu Nvidias H100 verspricht Intel eine um bis zu 1,7-fache Leistung beim Training großer Sprachmodelle und die 1,6-fache Leistung beim Inferencing. Dabei soll Gaudi 3 auch noch effizienter arbeiten und so mit weniger Strom auskommen.
Vom Training bis zum Inferencing
Ein weiterer Fortschritt bei Gaudi 3 ist die verbesserte Konnektivität durch die Verdoppelung der Bandbreite der 24 Ethernet-Ports auf dem Chip: Statt 100GbE- sind es nun 200GbE-Ports für eine bessere Skalierung im Cluster. Die Referenz-Architekturen von Intel reichen hin bis zu 1.024 Nodes mit 8.192 Gaudi-3-Beschleunigern und einem 800GbE-Netzwerk.
Die Nutzung von Ethernet für die Chip-zu-Chip-Verbindung soll ebenfalls die Kosten reduzieren und ein Vendor-Lock-in wie bei Nvidias NVLink und NVSwitch vermeiden. Intel beteiligt sich am Ultra Ethernet Consortium (UEC), das die Grundlagen für an KI und HPC angepasste Ethernet-Lösungen entwickelt.
Gaudi 3 kommt in verschiedenen Varianten auf den Markt: Als OAM-konforme Mezzzanine-Karte HL-325L, als Universal Baseboard HLB-325 mit acht Prozessormodulen sowie auch als Dual-Slot-PCI-Express-Karte mit 600 Watt TDP. Die OAM-Lösung und das Baseboard soll es zunächst mit Luft- und später auch mit Wasserkühlung geben.
Derzeit liefert Intel Samples an ausgewählte Partner und Kunden. Für das zweite Halbjahr verspricht der Hersteller eine breite Verfügbarkeit aus der Massenfertigung. Als OEM-Partner für den Launch treten Dell, HPE, Lenovo und Supermicro an.
Eine weitere Stärke der Gaudi-Beschleuniger ist laut Intel der umfangreiche Software-Stack, der das „Pytorch“-Framework integriert und den Zugang zu einer großen Zahl optimierter Modelle gewährt.
Nach Gaudi 3 steht mit Falcon Shores eine neue Beschleuniger-Generation auf der Roadmap, die auf der Vision kurz erwähnt wird. Sie soll die Gaudi-Technologie und die der „Xe“-GPUs integrieren und über eine Programmierschnittstelle auf Basis der OneAPI-Spezifikation zugänglich machen.
Xeon 6 mit E- und P-Cores
Die kommenden Xeon-6-Prozessoren spaltet Intel in zwei unterschiedliche Produktlinien auf: Prozessoren auf Basis von E-Cores, bekannt als „Sierra Forest“, mit sehr vielen aber dafür sparsamen Kernen und CPUs mit weniger aber dafür sehr schnellen P-Cores für rechenintensive Workloads wie KI. Diese Xeon-6-Modelle werden unter dem Codenamen „Granite Rapids“ entwickelt.
Beide laufen auf der selben Plattform und teilen sich den Software-Stack. Die Xeon-6-E-Prozessoren sollen schon bald auf den Markt kommen und sollen vor allem durch die Reduktion von Platzbedarf und Leistungsaufnahme im Datacenter überzeugen. Granite Rapids startet im zweiten Halbjahr und unterstützt dann das MXFP4-Datenformat, das die Ausführung von großen Sprachmodellen beschleunigen soll.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
KI für Edge Computing
Für den Embedded-Sektor bringt Intel den Mobile-Prozessor „Core Ultra“ alias „Meteor Lake“ in einer gesockelten PS-Version. Er soll gegenüber „Raptor Lake“ beim Inferencing, etwa der Klassifizierung von Bildern, die bis zu fünffache Leistung liefern. Eine höhere KI-Leistung bringt laut dem Hersteller ebenfalls die neue Atom-Generation der Serie „x7000C/x7000RE“. Zudem halten die „Arc“-GPUs Einzug in den Embedded-Sektor. Diese neuen Prozessoren zeigt Intel ebenfalls auf dem Event „Embedded World“ in Nürnberg.