Vier Mal höhere Deep-Learning-Rechenleistung Die Power9-CPU von IBM ist ein weiterer KI- Meilenstein

Autor Ulrike Ostler

IBM hat den neuen „IBM Power Systems Server“ mit seinem ebenfalls neu designten „Power9“-Prozessor speziell für rechenintensive KI-Workloads entwickelt. Mit ihm können die Trainingszeiten im Bereich Deep-Learning um das bis zu Vierfache beschleunigt werden.

Anbieter zum Thema

Die Grundlage für die neuen IBM-Rechner: Der IBM-Prozessor "Power9". Mit ihm sollen sich die Magie von Deep-Learning-Anwendungen entfalten. Das erste IBM-Rechner-Modell trägt die Bezeichnung "IBM Power System Accelerated Compute Server 922", kurz: AC922.
Die Grundlage für die neuen IBM-Rechner: Der IBM-Prozessor "Power9". Mit ihm sollen sich die Magie von Deep-Learning-Anwendungen entfalten. Das erste IBM-Rechner-Modell trägt die Bezeichnung "IBM Power System Accelerated Compute Server 922", kurz: AC922.
(Bild: IBM)

Der Power Systems Server mit der Power9-CPU soll erlauben, schnellere und präzisere KI-basierte Anwendungen zu bauen (KI = Künstliche Intelligenz). Einige zentrale Komponenten des neuen Prozessors wurden im deutschen IBM Forschungs- und Entwicklungszentrum in Böblingen bei Stuttgart entwickelt.

Dazu gehören beispielsweise eine PCI-Express 4.0-Schnittstelle, die bis zur doppelten Geschwindigkeit liefert wie ihre Vorgängerin, sowie neue Hardware-Funktionen für die Unterstützung von so genannten „High Precision Floating-Point Operationen" (128bit). Diese Präzision ist insbesondere für hoch-performantes wissenschaftliches Rechnen wichtig. Auch die Unterstützung von Blockchain-Anwendungen durch IBM Power-Systeme und eine verbesserte Rechenleistung pro Watt konnte IBM mit Hilfe deutscher Experten realisieren.

Die Anhänger

Bob Picciano, SVP von IBM Cognitive Systems, sagt: „Wir haben ein revolutionäres Kraftpaket für KI und kognitive Workloads entwickelt. Nicht nur zur Ausstattung der weltweit leistungsstärksten Supercomputer wurde IBM POWER9 Systems entwickelt, sondern vor allem um Unternehmen auf der ganzen Welt in die Lage zu versetzen, beispiellose Einblicke zu erhalten und wissenschaftliche Entdeckungen voranzutreiben, die in allen Industriezweigen zu transformierenden Geschäftsergebnissen führen.“

So ist Power9 das Herzstück der bald leistungsstärksten und datenintensivsten Supercomputer. Die Systeme „Summit“- sowie „Sierra“ des US-Energieministeriums, wird unter anderem von Google genutzt. „Google ist begeistert von IBMs Fortschritten bei der Power-Technologie“, sagt Bart Sano, VP von Google Platforms. „Der Power9 OpenCAPI Bus und die großen Speicherkapazitäten ermöglichen weitere Innovationschancen in Google Rechenzentren".

Das IBM-Modell AC922 bietet verschärfte Leistung für moderne High Performace Cluster, Analysen und Künstliche Intelligenz.
Das IBM-Modell AC922 bietet verschärfte Leistung für moderne High Performace Cluster, Analysen und Künstliche Intelligenz.
(Bild: IBM)

Der neue Server

Die Power9-basierten „AC922“-Power-Systeme sind die ersten, die PCI-Express 4.0, „Nvidia NVLink“ und OpenCAPI der jüngsten Generation einbetten. Zusammengenommen beschleunigt das die Datenübertragung, so dass diese bis zu 9,5x schneller ist als auf PCIe 3.0-basierten x86-Systemen.

Das Modell AC922 wurde entwickelt, um Leistungsverbesserungen in den gängigen KI-Frameworks wie „Chainer“, „Tensorflow“ und „Caffe“ zu erzielen und Datenbank-Anwendungen, etwa auf „Kinetica“ zu beschleunigen. Dadurch können Datenakrobaten schneller Anwendungen erstellen, die von tiefgehenden Erkenntnissen in der wissenschaftlichen Forschung über Echtzeitbetrugserkennung bis hin zur Kreditrisikoanalyse reichen.

Die Entwicklung bis hierhin

Deep Learning ist eine schnell wachsende maschinelle Lernmethode, die Informationen extrahiert, indem sie Millionen von Prozessen und Daten durchläuft, um die wichtigsten Aspekte der Daten zu erkennen und zu ordnen. Um diesen wachsenden Anforderungen der Industrie gerecht zu werden, hat IBM vor vier Jahren begonnen, den Power9-Chip auf einem leeren Blatt zu entwerfen, um eine neue Architektur für die Verwaltung von frei fließenden Daten, Streaming-Sensoren und Algorithmen für datenintensive KI und tiefgehende Lern-Workloads unter Linux zu entwickeln.

IBM kombiniert Hard- und Software mit Open-Source-Innovationen. Mehr als 300 Mitglieder zählt die Open Power Foundation. Zudem fördert Big Blue das OpenCAPI-Konsortium.

Mit „PowerAI“ hat IBM den Einsatz von Deep Learning Frameworks und Bibliotheken auf der Power-Architektur mit Beschleunigung optimiert und vereinfacht, so dass Datenwissenschaftler innerhalb von Minuten einsatzbereit sind. IBM-Forscher haben mit dem PowerAI Distributed Deep Learning Toolkit bereits tiefe Lernzeiten von Tagen auf Stunden verkürzt.

Hinweise zur den Messungen

  • Die Ergebnisse von 3.7X basieren aufIBM Internal Measurements, die 1000 Iterationen des vergrößerten GoogleNet-Modells (Mini-Batchgröße=5) auf dem vergrößerten Imagenet-Datensatz (2560x2560) ausführen. Hardware: Power AC922; 40 Kerne (2 x 20c Chips), Power9 mit NVLink 2.0; 2.25 GHz, 1024 GB Speicher, 4xTesla V100 GPU; Red Hat Enterprise Linux 7.4 für Power Little Endian (POWER9) mit CUDA 9.1/ CUDNN 7
    Der Wettbewerbs-Stack beruht auf: 2x Xeon E5-2640 v4; 20 Kerne (2 x 10c Chips) / 40 Threads; Intel Xeon E5-2640 v4; 2,4 GHz; 1024 GB Speicher, 4xTesla V100 GPU, Ubuntu 16.04. mit CUDA.9.0/ CUDNN 7
    Software: Chainverv3 /LMS/Out of Core mit Patches auf Github
  • Die Ergebnisse von 3.8X basieren aufIBM Internal Measurements, die 1.000 Iterationen des vergrößerten GoogleNet-Modells (Mini-Batchgröße=5) auf dem vergrößerten Imagenet-Datensatz (2240x2240) ausführen. Power AC922; 40 Kerne (2 x 20c Chips), POWER9 mit NVLink 2.0; 2.25 GHz, 1024 GB Speicher, 4xTesla V100 GPU, Red Hat Enterprise Linux 7.4 für Power Little Endian (Power9) mit CUDA 9.1/ CUDNN 7;.
    Der Konkurrenz-Stackbesteht aus: 2x Xeon E5-2640 v4; 20 Kerne (2 x 10c Chips) / 40 Threads; Intel Xeon E5-2640 v4; 2,4 GHz; 1024 GB Speicher, 4xTesla V100 GPU, Ubuntu 16.04. mit CUDA .9.0/ CUDNN 7.
    Software:
    IBM Caffe mit LMS Quellcode

Artikelfiles und Artikellinks

(ID:45050503)