Die HBM Adaptive Compute Acceleration Platform von Xilinx FPGAs mit hoher Bandbreite und Security für KI und Netzwerke

Autor Ulrike Ostler

Die Xilinx, Inc. hat mit „Versal HBM“ eine so genannte Adaptive Compute Acceleration Platform (ACAP) vorgestellt, die Konvergenz von schnellem Speicher, sicherer Konnektivität und anpassungsfähigem Compute in einer einzigen Plattform bieten soll. Die Serie mit integriertem High-Bandwidth-Memory zielt darauf ab, Big-Data-Compute-Herausforderungen in Netzwerk und Cloud meistern zu können.

Firmen zum Thema

Die „Versal HBM“ Adaptive Compute Acceleration Platform von Xilinx gleicht in Grundzügen der Serie Die „Versal Premium“, verfügt aber über ein zusätzliches HBM-Modul. Xilinx adressiert damit den Big-Data-Markt.
Die „Versal HBM“ Adaptive Compute Acceleration Platform von Xilinx gleicht in Grundzügen der Serie Die „Versal Premium“, verfügt aber über ein zusätzliches HBM-Modul. Xilinx adressiert damit den Big-Data-Markt.
(Bild: Xilinx)

Versal HBM ACAPs integrieren den HBM2e-DRAM. Die Speicherbandbreite mit 820 GB/s liegt im Vergleich zu vier DDR5-Komponenten mit 102GB/s um den Faktor 8 höher bei einer um 63 Prozent niedrigeren Leistungsaufnahme. Zudem sind die Transceiver auf den neuen Versal-HBM-Komponenten im Vergleich zu „Virtex Ultrascale+“-FPGAs mit 58G PAM4-Transceivern um den Faktor 2 schneller. Zudem warten die FPGas mit einer Logikdichte auf, die sich im Vergleich zu Virtex Ultrascale+ verdoppelt hat .

Insgesamt ist die Versal-HBM-Serie also so konzipiert, dass sie mit den höheren Speicheranforderungen von rechenintensiven, speichergebundenen Anwendungen für Rechenzentren, kabelgebundenen Netzwerken, Test- und Messsystemen sowie Luft-, Raumfahrt und Verteidigung Schritt halten kann. Die geringe Stromaufnahme ist dabei kein nettes Add-on.

Sumit Shah, Senior Director, Product Management and Marketing bei Xilinx, erläutert: „Viele Echtzeit-Hochleistungsanwendungen haben kritische Engpässe bei der Speicherbandbreite und arbeiten am Rande ihrer Leistungs- und thermischen Grenzen.“ Die Versal-HBM-Geräte verfügen über stromoptimierte Netzwerkkerne.

Aufbau

„Versal Prime“ wurde von Xilinx Ende 2018 vorgestellt und befindet sich in Produktion. Nach Angaben von Xilinx lasst sich die Erfahrung von dem Roll-out und einiges aus dem Design für die „Premium“-Variante nutzen. Versal HBM wiederum baut auf Versal Premium auf, plus einem HBM-Subsystem.

Die HBM-Serie bietet 5,6 Terabyte pro Sekunde (TB/s) serielle Bandbreite mit 112 Gigabit pro Sekunde PAM4-Transceivern, 2,4 TB/s skalierbare Ethernet-Bandbreite, 1,2 TB/s Line-Rate-Verschlüsselungsdurchsatz, 600 Gb/s Interlaken-Konnektivität und 1,5 TB/s PCIe Gen5-Bandbreite mit integriertem DMA (Direct Memory Access), das sowohl CCIX (Cache Coherent Interconnect) als auch CXL (Compute Express Link )unterstützt. Das Set bietet also standardmäßig vernetzte Multi-Terabit-Konnektivität für eine Vielzahl von Protokollen, Datenraten und optischen Standards.

Zugleich ist die Versal-HBM-Serie darauf ausgelegt, eine Vielzahl von Workloads mit großen Datensätzen zu beschleunigen. Sie integriert anpassungsfähige Engines für Hardware-Parallelität mit niedriger Latenz, DSP-Engines für KI-Inferenz und Signalverarbeitung sowie skalare Engines für Embedded Compute, Plattform-Management und sicheres Booten und Konfigurieren.

Anpassungsfähige Rechenleistung

Im Gegensatz zu Beschleunigern mit festen Funktionen können die Komponenten die Hardware innerhalb von Millisekunden dynamisch rekonfigurieren, um sie an sich entwickelnde Algorithmen und neue Protokolle anzupassen, wodurch die Notwendigkeit eines Hardware-Redesigns und einer Neuimplementierung entfällt. Sie sind sowohl für Hardware- als auch für Software-Entwickler zugänglich und bieten einen Design-Einstiegspunkt für jeden Entwickler, einschließlich der „Vivado“ Design Suite für Hardware-Entwickler, der „Vitis“ Unified-Software-Plattform für Software-Entwickler und „Vitis AI“ für Datenwissenschaftler mit domänenspezifischen Frameworks und Beschleunigungsbibliotheken.

Durch die Kombination von schnellem Speicher, Security und Adaptable Computing erreicht Xilinx beachtliche Leistungssteigerungen.
Durch die Kombination von schnellem Speicher, Security und Adaptable Computing erreicht Xilinx beachtliche Leistungssteigerungen.
(Bild: Xilinx)

Einsatzszenarien ergeben sich für Big-Data-Workloads wie Betrugserkennung, Recommendation Engines, Datenbankbeschleunigung, Datenanalyse, Finanzmodellierung und Deep-Learning-Inferenz für die Verarbeitung natürlicher Sprache (NLP). Durch die Verbesserung der Laufzeiten um Größenordnungen im Vergleich zu modernen Server-CPUs bei gleichzeitiger Unterstützung 4-fach größerer Datensätze können Anwender Anwendungen mit massiven, verknüpften Datensätzen mit weit weniger und kostengünstigeren Servern bereitstellen.

In ähnlicher Weise bieten Versal HBM ACAPs Netzwerkskalierbarkeit und Leistung für 800G-Router, Switches und Sicherheits-Appliances. Eine herkömmliche NPU-Implementierung (Network Processing Unit) einer 800G-Firewall der nächsten Generation würde mehrere NPU-Geräte und DDR-Module erfordern, wohingegen ein einziger Versal HBM ACAP externe Speicher eliminiert und Paketverarbeitung, Sicherheitsverarbeitung und anpassungsfähige KI-infundierte Anomalie-Erkennung bei drastisch geringerem Stromverbrauch und mit einem Bruchteil des Formfaktors durchführt.

Verfügbarkeit

Für die Fertigung der Versal-HBM-Serie wird die 7-Nanometer-Prozesstechnik von TSMC genutzt. Entwickler können mit dem Prototyping auf Bausteinen und Evaluation Boards der Versal Premium-Serie beginnen und nach Xinlix-Angaben problemlos auf die Versal-HBM-Serie migrieren. In der ersten Hälfte des Jahres 2022 soll mit der Bemusterung begonnen werden. Die Dokumentation aber steht sofort zur Verfügung und die Tools werden in der zweiten Hälfte 2021 über ein Early-Access-Programm erhältlich sein.

(ID:47514979)