Datenzentrischer Ansatz mit Big-Data-Hochleistungsrechner

IBM verzehnfacht die Computerleistung beim US-Energieministerium

| Redakteur: Ulrike Ostler

IBM und andere Mitglieder des Ooen-Power-Konsortiums bauen eine Archtektur für das Datensammeln und die -Analyse.
IBM und andere Mitglieder des Ooen-Power-Konsortiums bauen eine Archtektur für das Datensammeln und die -Analyse. (Bild: IBM)

IBM schließt Verträge mit dem US-Energieministerium in Höhe von 325 Millionen Dollar. Kernstück des Vertrages ist der Aufbau von zwei „datenzentrischen“ Supercomputern mit Open-Power-Technik von IBM, Mellanox und Nvidia an den Forschungsstandorten Lawrence Livermore und Oak Ridge.

Ziel der Installation sind Forschungsaktivitäten in Wissenschaft, Technik sowie der nationalen Sicherheit. Das IBM System nutzt eine neuartige Architektur, bei der die Systemtechnik quasi um die Daten herum gebaut werden. Die Folge: Daten müssen seltener zwischen Speicher und hin und zurück transportiert werden, wodurch der Energieverbrauch des Gesamtsystems drastisch sinkt.

Die rasant wachsende Datenmenge von täglich 2,5 Milliarden (was ungefähr der Fläche von 250 Millionen Fußballfeldern bedeckt mit Büchern entspricht), macht Big-Data-Techniken zu wichtigen Werkzeugen für neue Entdeckungen. Gleichzeitig werden damit aber auch neuartige Computersysteme für die Verarbeitung dieser Datenflut immer wichtiger.

Heute werden in Computern die Daten ständig zwischen Speicher und Prozessor hin und her geschickt, um sie zu bearbeiten oder zu analysieren. Im Umfeld von Big Data trägt dieser Ansatz nicht mehr, weil zu viel Zeit und Energie dafür aufgewendet werden muss.

Was ist ein "datenzentrischer" Ansatz?

Um dem zu begegnen, wurden bisher immer schnellere Prozessoren eingesetzt. Diese konnten allerdings aufgrund der Datenmengen relativ gesehen immer weniger Kapazitäten zur Bearbeitung und Analyse zur Verfügung stellen konnten, da sie vielmehr mit dem Management und dem Transport der Daten zwischen den einzelnen Systemkomponenten beschäftigt waren.

IBM Forscher haben deshalb in den letzten fünf Jahren eine datenzentrische Systemarchitektur entwickelt, in der die notwendigen Komponenten eines Computersystems und damit Rechenleistung dort „angesiedelt“ sind, wo die Daten sitzen. Damit können jetzt Datenanalyse, Modellierung, Visualisierung und Simulation mit bisher unerreichter Geschwindigkeit durchgeführt werden.

Leistungsumfang und Einsatzgebiete

Die beiden Forschungszentren des Energieministeriums erwarten, dass die beiden IBM zu den Energie-effizientesten Computersystemen weltweit gehören werden. Im Vergleich zu den bestehenden Systemen der Labore soll ihre Performance bis zu zehn Mal und ihre Energie-Effizienz mehr als fünf Mal besser sein.

Die beiden auf Open Power basierenden Installationen mit dem Namen „Sierra“ am Lawrence Livermore Institute und „Summit“ in Oak Ridge werden eine Leistung von jeweils mehr als 100 erreichen und dabei fünf an dynamischen und nutzen. Der Datendurchsatz wird sich auf mehr als 17 Petabyte pro Sekunde summieren – dies entspricht etwa der Datenmenge von 100 Milliarden Bildern auf Facebook pro Sekunde.

Die Forschungsinstitute bieten Wissenschaftlern aus verschiedenen Fachgebieten sowie Behörden und Unternehmen die Möglichkeit, die Systeme zur Beantwortung unterschiedlichster wissenschaftlicher und technischer Fragestellungen zu nutzen. Durch den neuen Ansatz können die Installationen nicht mehr nur klassisch wissenschaftliche Daten modellieren und simulieren, sondern ihre Rechenleistung auch für hochkomplexe Datensätze beispielsweise aus dem Gesundheitswesen oder der Betriebs- und Finanzwirtschaft zur Verfügung stellen.

Offene Architekur mit Open Power

Die wachsenden Notwendigkeiten, große Datenmengen und verschiedenartige Daten zu erfassen, zu managen und zu analysieren, macht es zunehmend erforderlich, die traditionelle Computerarchitektur durch offene Plattformen zu ergänzen oder zu ersetzen. Organisationen müssen die Herausforderungen, die diese Datenflut an sie stellen, ganzheitlich betrachten: angefangen vom Design eines Computersystems bis hin dazu, wie Daten genutzt werden sollen. Dies bedeutet, dass alle Schritte des Analyseprozesses von der Datengenerierung, über die Aufbereitung bis hin zur Auswertung betrachtet werden.

Durch den Einsatz der Open Power-Technik (siehe: Link) in einem modular integrierten System werden beide Forschungszentren in der Lage sein, die Supercomputer entsprechend den spezifischen zukünftigen Anforderungen anzupassen. Nvidia, Gründungsmitglied der Open-Power-Initiative, hat in Zusammenarbeit mit IBM die so genannte „NV-Link“-Technik entwickelt, die es und ermöglicht, die Daten fünf- bis zwölfmal schneller zwischen den entsprechenden Prozessoren zu bewegen.

Nvidia NV-Link im Bund mit IBM-Power-CPUs

Nvidia NV-Link werden in IBM-Power-CPUs integriert werden und die nächste Generation der Nvidia-GPUs wird auf der „Volta“-Architektur basieren – und so Sierra und Summit eine bisher unerreichte Leistungskapazität ermöglichen. Gemeinsam mit Mellanox wird IBM außerdem einen so genannten intelligenten Interconnect implementieren, um die Datenverarbeitung innerhalb der Systeme weiter zu optimieren.

Tom Rosamilia, Senior Vice President, IBM Systems and Technology Group, bewertet die Bekanntgaben des Auftragseingangs wie folgt: „Die heutige Ankündigung markiert eine Abkehr vom traditionellen Supercomputing, das mit der wachsenden Datenflut nur noch unzureichend Schritt halten kann. Der datenzentrische Ansatz von IBM ist aus unserer Sicht das neue Paradigma in diesem Bereich: Offene Computerplattformen, die in der Lage sind, mit den wachsenden Datenmengen umzugehen.“

Die datenzentrische Technik für jedermann

Er setzt für das Otto-Normal-Enterprise hinzu: „Was die beiden Systeme zudem besonders macht: Die Kerntechnologien sind bereits heute für Unternehmen und Organisationen unterschiedlichster Größen und aus unterschiedlichsten Industriezweigen verfügbar.“ IBM biete heute schon datenzentrische Technologien für seine Kunden an: „IBM Power 8“, „IBM Elastic Storage Server“, „IBM Elastic Storage Software“ basierend auf der „General Parallel “-Technologie sowie „IBM Platform Computing Software“.

Teile des Systems für das Energieministerium der USA gibt es bereits.
Teile des Systems für das Energieministerium der USA gibt es bereits. (Bild: IBM)

IBM Research wird zukünftig mit Lawrence Livermore und Oak Ridge zusammenarbeiten, um die bestmöglichen Tools und Technologien für die beiden Computersysteme zu entwickeln, um so die Leistung der Systeme zu optimieren. An der Entwicklung von Applikationen für datenzentrische Systeme werden auch Wissenschaftler des deutschen IBM Forschungs- und Entwicklungszentrum in Böblingen sowie von IBM Research Zürich in Rüschlikon beteiligt sein.

Die Inbetriebnahme beider Rechner ist für 2017 beziehungsweise 2018 geplant.

Was meinen Sie zu diesem Thema?

Schreiben Sie uns hier Ihre Meinung ...
(nicht registrierter User)

Kommentar abschicken

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 43073046 / Server)