Dual-GPU-Beschleuniger für Datenanalysen und wissenschaftliches Computing

Nvidia Tesla K80 liefert doppelte Leistung und Speicherbandbreite

| Redakteur: Ulrike Ostler

Die Front des Nvidia Tesla K80 Dual-GPU-Beschleunigers
Die Front des Nvidia Tesla K80 Dual-GPU-Beschleunigers (Bild: Nvidia)

Kürzlicht führte Nvidia die Dual-GPU (GPU = Graphical Processor Unit) „Tesla K80“ ein, nach Angaben des Herstellers nun „der weltweit leistungsfähigste Beschleuniger“. Die Systemkomponente soll sich insbesondere für maschinelles Lernen, Datenanalysen sowie Wissenschafts- und High-Performance-Computing-(HPC) eignen.

Die Tesla-K80-Dual-GPU ist „das neue Flaggschiff der Tesla Accelerated Computing Platform“, so Nvidia. Die Plattform vereint GPU-Beschleuniger, die parallele Computing-Plattform „CUDA“ und ein umfangreiches Ökosystem von Software-Entwicklern und –Anbietern sowie -Lieferanten für Rechenzentrumssysteme.

Tesla K80 bietet nahezu die zweifache Leistung des Vorgängermodells „Tesla K40“ und verdoppelt die Speicherbandbreite. Mit einer zehnmal höheren Leistungsfähigkeit als die aktuell schnellste lässt K80 konkurrierende Beschleuniger und CPUs in Hunderten unterschiedlichen komplexen Analysen und großen, rechenintensiven Wissenschaftsapplikationen weit hinter sich.

Anwender können die ungenutzte Leistung vieler Applikationen mit der erweiterten Version der „Nvidia-GPU-Boost“-Technologie des Beschleunigers freischalten. Diese wandelt dynamisch Energiereserven in einen optimalen Leistungs-Boost um – und das bei jeder einzelnen Anwendung.

Leistung für Wissenschaft, Datenanalysen und maschinelles Lernen

Der GPU-Beschleuniger wurde vor dem Hintergrund komplizierter Berechnungsaufgaben entworfen. Diese erstrecken sich von Astrophysik über Genomforschung und Quantenchemie bis hin zu Datenanalysen. K80 ist außerdem für fortgeschrittene Deep-Learnig-Aufgaben optimiert, einem schnell wachsendem Segment im Bereich des maschinellen Lernens.

Dazu Yann LeCun, Director of AI Research bei Facebook und Silver Professor of Computer Science & Neural Science an der New York University: „Nvidia GPUs haben sich de facto zu der Computing-Plattform der Deep-Learning-Community entwickelt. Da sich die Genauigkeit von Deep-Learning-Systemen mit größer werdenden Datensätzen verbessert, suchen wir stets nach der schnellsten Hardware, die wir finden können.“

Tesla K80 bietet nahezu die zweifache Leistung des Vorgängermodells „Tesla K40“ und verdoppelt die Speicherbandbreite.
Tesla K80 bietet nahezu die zweifache Leistung des Vorgängermodells „Tesla K40“ und verdoppelt die Speicherbandbreite. (Bild: Nvidia)

Der Tesla-K80-Beschleuniger mit seiner Dual-GPU-Architektur und großem Speicher liefere mehr Teraflops und mehr als bisher ein ganzer, einzelner Server. „Dadurch machen wir beim Deep Learning einen großen Schritt nach vorn“, schließt LeCun.

Fließkomma-Rechenleistung von bis zu 8,74 Teraflops Single-Precision

Tesla K80 liefert eine Fließkomma-Rechenleistung (Peak) von bis zu 8,74 Teraflops Single-Precision und bis zu 2,91 Teraflpos Double-Precision. Damit ist die Leistung bei führenden Wissenschafts- und Engineering-Anwendungen wie AMBER, GROMACS, Quantum Espress und LSMS zehnmal höher als mit den aktuell schnellsten CPUs (s.u.).

So hat die Nvidai-technik auch in deutschen Forschungsbereichen Anhänger. Wolfgang Nagel, Director of the Center for Information Services and HPC an der Technischen Universität Dresden, führt aus: „Die Tesla-K80-Dual-GPU-Beschleuniger sind bis zu zehnmal schneller als CPUs in einigen unserer Haupt-Applikationen, was letztlich zu Durchbrüchen in der Wissenschaft führen kann.“ Er setzt hinzu: „ Darüber hinaus haben sie eine niedrige Energiebilanz. Unsere Forscher nutzen die verfügbaren GPU-Ressourcen auf dem Taurus- ausgiebig, um eine immer präzisere Krebstherapie zu ermöglichen, indem sie die Zellen durch Live-Beobachtungen besser verstehen. Darüber hinaus untersuchen sie Asteroiden im Zuge der ESA-Rosetta-Mission.“

Hauptmerkmale des Tesla- K80-Dual-GPU-Beschleunigers:

  • Zwei GPUs pro Board – Verdoppelt den Durchsatz von Applikationen, die für mehrere GPUs ausgelegt sind
  • 24 GB ultraschneller GDDR5-Speicher – 12 GB Speicher pro GPU, zweimal mehr Speicher als die Tesla K40-GPU. Erlaubt Anwendern zweimal größere Datensätze zu verarbeiten.
  • 480 GB/s Speicherbandbreite – Höherer Datendurchsatz erlaubt Datenwissenschaftlern, Petabytes an Informationen in der Hälfte der Zeit zu bearbeiten im Vergleich zu einem Tesla-K10-Beschleuniger.
  • 4.992 CUDA-Parallel-Prozessoren – Beschleunigt Applikationen bis zum Faktor 10x im Vergleich zu einer alleinigen CPU.
  • Dynamische Nvidia-GPU-Boost-Technologie – Skaliert dynamisch GPU-Taktraten anhand der Charakteristiken jeder einzelnen Anwendung für maximale Leistung
  • Dynamic Parallelism – GPU Threads können dynamisch neue Threads erzeugen. Dies ermöglicht es Anwendern, sich schnell und einfach durch adaptive und dynamische Datenstrukturen zu arbeiten.

Verfügbarkeit

Tesla K80 beschleunigt eine große Anzahl an Applikationen aus den Bereichen Wissenschaft, Engineering, Werbung und Enterprise HPC sowie Anwendungen für Rechenzentren – alles in Allem mehr als 280. Eine Übersicht aller GPU-beschleunigten Applikationen (PDF) ist als Download verfügbar.

Beispiel-Benchmarks für den 80er Tesla und den GPU-Beschleunigern
Beispiel-Benchmarks für den 80er Tesla und den GPU-Beschleunigern (Bild: Nvidia)

Der Tesla-K80-Dual-GPU-Beschleuniger ist von verschiedenen Server-Herstellern erhältlich, darunter ASUS, Bull, Cirrascale, Cray, Dell, Gigabyte, HP, Inspur, Penguin, Quanta, Sugon, Supermicro und Tyan sowie von Nvidia-Fachhandelspartnern. Anwender können die Tesla K80 auch kostenlos auf per Remote zur Verfügung gestellten testen. Weitere Informationen dazu gibt es auf der GPU-Test-Drive-Webseite.

Was meinen Sie zu diesem Thema?

Schreiben Sie uns hier Ihre Meinung ...
(nicht registrierter User)

Kommentar abschicken

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 43103317 / Komponenten)