Die Bedeutung von FPGAs für das High-Performance-Computing

Das Mango-Projekt Die Bedeutung von FPGAs für das High-Performance-Computing

23.01.2017 Philipp Ampletzer

Anbieter zum Thema

Rittal GmbH & Co. KG

Stäubli TEC-Systems GmbH Connectors

Vertiv GmbH

Im EU-Förderprojekt „Mango“ werden Multi-Kern-Architekturen für zukünftige High-Performance-Computing-Systeme erforscht. Im Projekt wird ein neuer Ansatz verfolgt, verschiedene Prozessor-Kerne wie High-End-CPUs, Grafikprozessoren und FPGAs zu kombinieren, um höchst anspruchsvolle Anforderungen verschiedenster Anwendungen zu erfüllen.

Das proFPGA quad Motherboard mit Virtex®-7 FPGA-Modulen: proFPGA System ist ein äußerst flexibles und skalierbares High-Performance-FPGA-System und eine der leistungsfähigsten Multi-FPGA-Plattformen auf dem Markt.(Bild: PRO DESIGN Electronic) — Das proFPGA quad Motherboard mit Virtex®-7 FPGA-Modulen: proFPGA System ist ein äußerst flexibles und skalierbares High-Performance-FPGA-System und eine der leistungsfähigsten Multi-FPGA-Plattformen auf dem Markt.
(Bild: PRO DESIGN Electronic)

Das Mango-Projekt wird von der EU im Rahmen des „H2020-FETHPC-2014“ Programms gefördert. Es verfolgt den Ansatz einen großen heterogenen High-Performance-Computing-Prototypen zu bauen, welcher auf modernen High-End-Prozessoren (CPUs), Graphikprozessoren (GPUs), low-power ARM-Prozessoren und FPGAs basiert. Der Prototyp hat eine gemeinsame Verbindungsarchitektur, um alle Komponenten effizient zu verbinden sowie ein innovatives Kühl- und Power-Monitoring-System.

Die Projektleitung hat die Universitat Politécnica de Valéncia (Spanien). Zum Mango-Konsortium gehören zudem Centro Regionale Information Communication Technology und Politecnico di Milano (beide Italien), University of Zagreb (Kroatien), Pro Design Electronic GmbH (Deutschland), Thales Communications & Security S.A.S. und Eaton (beide Frankreich), École Polytechnique Fédérale de Lausanne (Schweiz) sowie Philips Healthcare (Niederlande).

Bildergalerie

MANGO-Architektur: Die MANGO-Architektur besteht aus universalen Rechnerknoten (GNs) und äußerst heterogenen Beschleunigungsknoten (HNs). Diese Knoten sind durch ein optisches Netzwerk miteinander verbunden und von einem innovativen Kühl- und Power-Monitoring-System umgeben.(Bild: PRO DESIGN Electronic)

3P-Modell: Das 3P-Modell zeigt die Abwägungen, die für verschiedene HPC-Applikationen berücksichtigt werden müssen. So sind z.B. für High-Performance-Computing ohne Servicequalitäts-Ansprüche primär Leistungsfähigkeit und Stromverbrauch wichtig, während die Zuverlässigkeit sekundär ist.(Bild: PRO DESIGN Electronics)

Zuordnung von Anwendungen auf der MANGO-Plattform: Diese Abbildung zeigt wie mehrere Anwendungen mit der MANGO-Plattform abgebildet werden können. Jede Anwendung kann verschiedene Anforderungen haben und somit verschiedene Rechner-Einheiten erfordern. Der Ressourcen-Manager bestimmt, welche Rechner-Einheiten für welche Anwendungen am besten geeignet sind und ordnet die verfügbaren Ressourcen den jeweiligen Anwendungen zu.(Bild: PRO DESIGN Electronics)

Mango hat sich zum Ziel gesetzt Multi-Kern-Architekturen für künftige HPC-Systeme zu erforschen. Die Idee dabei ist ein wieder-konfigurierbares HPC-System zu schaffen, welches die Anforderungen verschiedenster Applikationen mit unterschiedlichen Anforderungen erfüllt. Die Herausforderung besteht darin, die jeweils beste Kombination aus verfügbaren Rechnereinheiten (CPUs, GPUs und FPGAs) zu finden.

Stromverbrauch, Leistungsfähigkeit und Zuverlässigkeit

Dabei ist muss insbesondere auf Stromverbrauch, Leistungsfähigkeit und Zuverlässigkeit geachtet werden wie das 3P-Modell (siehe: Bildergalerie) zeigt. Gleichzeitig soll die Benutzerfreundlichkeit durch das Verbessern von Programmierbarkeit, Integration und Servicequalität (QoS) optimiert werden.

Das Mango-System besteht aus drei Teilen – Hardware, Software und Applikationen. Die MANGO-Hardware beinhaltet universale Rechnerknoten (GNs), bestehend aus Blades mit CPUs und GPUs, sowie heterogene Beschleunigungsknoten (HNs) aus ARM-Prozessoren und FPGAs. Eine gemeinsame Verbindungsinfrastruktur ermöglicht es alle Komponenten effizient zu verbinden.

Zusätzlich gibt es ein Software-Paket basierend auf einem Linux-Betriebssystem. Dieses besteht aus Compilern und Programmiermodellen für die verschiedenen Rechnereinheiten sowie einem Ressourcen-Manager, der die zu verarbeitenden Daten analysiert und die beste Kombination der Rechnereinheiten auswählt und zuordnet. Der Ressourcen-Manager wird durch ein Programm kontrolliert, welches laufende Prozesse, Status, Betriebstemperatur und Stromverbrauch berücksichtigt.

Der dritte Teil des Mango-Systems sind Anwendungen und reale Fallstudien zur Verifikation neuer Architekturen. Dazu gehören Applikationen aus den Bereichen Transcodierung, Medizintechnik, Imaging, Sicherheit, Big Data und Kommunikation.

Die Hardware

Die universalen Rechnerknoten (GNs) des Mango-Systems bestehen aus einem skalierbaren Server aus Standard-Blades mit Intel-Prozessoren (CPUs) und Grafikprozessoren (GPUs).

Die heterogenen Beschleunigungsknoten (HNs) bestehen aus „Xilinx Zynq-7000“, „Xilinx Virtex-7“ und „UltraScale“- FPGA-Modulen aus der „proFPGA“-Produkt-Familie von Pro Design. Zynq-FPGAs haben einen eingebetteten ARM-Prozessor und einen FPGA-Teil während Virtex-Bausteine reine FPGAs mit größtmöglicher Logik-Kapazität sind.

Die oben genannten FPGA-Module können beliebig kombiniert und auf das „proFPGA quad“-Motherboard (später auf ein spezifisches Chassis), welches Steckplätze für 4 solcher Module hat, aufgesteckt werden. Mehrere solcher Motherboards können zu größeren Systemen miteinander verbunden werden. Das Baukastenprinzip ermöglicht das Upgrade beziehungsweise Downgrade des HN-Setups in Schritten von nur einem FPGA-Modul und erlaubt es HN-Cluster mit einer fast unbegrenzten Anzahl an FPGA-Modulen zu bilden.

Die Verbindungen zwischen den FPGA-Modulen werden mit Interconnect-Kabeln hergestellt, welche die regulären FPGA I/Os miteinander verbinden. Multi-Gigabit-Transceiver (MGT)-Verbindungen zwischen FPGAs werden über Extension-Boards mit optischen Schnittstellen, zum Beispiel Gigabit Ethernet oder QSFP+, realisiert. Ein PCIe- oder Ethernet-Link verbindet das proFPGA System mit dem Blade-Server und ermöglicht einen superschnellen Datenaustausch zwischen GNs und HNs.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Geschäftliche E-Mail

Bitte geben Sie eine gültige E-Mailadresse ein.

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Stand: 08.12.2025

Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.

Einwilligung in die Verwendung von Daten zu Werbezwecken

Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.

Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.

Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.

Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.

Recht auf Widerruf

Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.

Rechner-Einheiten

Im HPC-Bereich werden die meisten Rechenaufgaben von Hochleistungsprozessoren (CPUs), welche primär für die serielle Verarbeitung von aufeinander folgenden Daten ausgelegt sind, übernommen. GPUs hingegen haben eine immense Parallel-Architektur mit Tausenden von kleineren, effizienteren Rechnereinheiten, welche dazu entwickelt wurden, mehrere Aufgaben parallel durchzuführen.

GPU-beschleunigtes Co-Processing, bei dem rechenintensive Funktionen an Grafikprozessoren ausgelagert werden, währen der Rest des sequentiellen Codes von der CPU verarbeitet wird, bietet eine weit höhere Performance, was sich in einer deutlich kürzeren Verarbeitungszeit widerspiegelt. Allerdings kann diese Methodik nicht auf alle Algorithmen übertragen werden.

FPGAs bieten eine sehr hohe I/O-Bandbreite und ermöglichen eine programmierbare, fein unterteilbare, individuelle und flexible Parallelisierung. FPGAs haben aufgrund Ihrer Parallelverarbeitungsmöglichkeiten an Marktanteilen im HPC-Bereich gewonnen und werden aufgrund ihrer zunehmenden Reife und Fähigkeiten immer wichtiger. Zwar sind sie nach wie vor vergleichbar schwierig zu programmieren, allerdings nähern sie sich laut jüngsten Trends immer näher an Verfahrenssprachen und OpenCL an.

FPGAs im MANGO-Projekt

Der größte Vorteil von FPGAs ist ihre Vielseitigkeit. Im Mango-Projekt werden sie in zweierlei Hinsicht genutzt – einmal für Datenverarbeitungsaufgaben und zum anderen als Emulationsplattform.

Als Datenverarbeitungsplattform werden sie zur beschleunigten Verarbeitung von Massendaten genutzt. In diesem Fall ist das FPGA eine Rechner-Einheit aus dem Gesamtsystems. In Mango wird dieser Ansatz durch dedizierte Beschleunigungsdesigns validiert.

Im anderen Fall werden FPGAs als Emulationsplattform genutzt. Hier liegt der Fokus auf der Erforschung von neuen Architekturen – sowohl auf System-Ebene (NoC oder Multi-Core) wie auch auf Datenverarbeitungs-Ebene. Emulierte Systeme sind universelle von Software programmierbare Rechnereinheiten. In Mango zielt dieser Ansatz auf funktionale Aspekte ab und ermöglicht die Validierung des Software-Stacks. Die physikalische Leistung wird über Leistungsindikatoren ermittelt, Verbesserungen sind dabei relativ zu sehen.

Mein Fazit: Somit zeigt das EU-Projekt Mango die Bedeutung von FPGAs für heutige und künftige HPC-Systeme. FPGAs ermöglichen Entwicklern verschiedene Multi-Kern-Architekturen zu erforschen und sind gleichzeitig nicht wegzudenken als Hardware-Beschleuniger für die Verarbeitung von Massendaten. Durch die Unterstützung von vielversprechenden Projekten wie Mango rüttelt die EU an der Vorherrschaft der Amerikaner im HPC-Bereich. Auch wenn es für Europa noch ein weiter Weg ist, so sind wir doch dabei aufzuholen.

Anmerkung: Der Artikel erschien im Original bei der Schwesterpublikation „Elektronik Praxis“

* Philipp Ampletzer ist tätig als Director Sales & Business Development bei der Pro Design Electronic GmbH.

(ID:44468939)