Performance-Messungen

Was sind Floating Point Operations Per Seconds (FLOPS)?

| Autor / Redakteur: Otto Geißler / Ulrike Ostler

PLOPS sind eine Methode zur Codierung reeller Zahlen im Rahmen der auf Computern verfügbaren endlichen Genauigkeit.
PLOPS sind eine Methode zur Codierung reeller Zahlen im Rahmen der auf Computern verfügbaren endlichen Genauigkeit. (Bild: © djama - stock.adob.com)

Die Floating Point Operations Per Second (Gleitkommaoperationen pro Sekunde) entsprechen einer Maßeinheit für die Leistungsfähigkeit von Computern. Sie bezeichnen die Anzahl der Gleitkommazahl-Operationen (Additionen oder Multiplikationen), die pro Sekunde möglich sind.

Beim Vergleich von zwei Rechnersystemen hinsichtlich ihrer Leistungsfähigkeit ist dies mit FLOPS jedoch nur möglich, wenn beide Systeme die gleiche Architektur aufweisen. Liegen unterschiedliche Architekturen vor, so hat der Vergleich keine Aussagekraft. Operationen im Sinne von Floating Point Operations Per Second (FLOPS) sind mathematische Operationen wie zum Beispiel das Addieren oder Multiplizieren von Zahlen.

Bestimmung von FLOPS

Das Gleitkomma (Floating Point) lässt sich als eine bei Rechnern gängige Art der Zahlendarstellung verstehen, die für die Berechnung sehr großer oder sehr kleiner reeller Zahlen erforderlich sind. FLOPS geben also an, wie viele dieser Berechnungen ein Rechner pro Sekunde abarbeiten kann. Je mehr FLOPS ein Computer schafft, desto schneller und performanter ist er. Zur Bestimmung der FLOPS-Leistung eines Computers kommen spezialisierte Software-Tools zum Einsatz.

Bei der Bestimmung von FLOPS wird die gesamte Rechner-Architektur - bestehend aus Hauptspeicher, Bus, Compiler... gemessen - und nicht die reine Geschwindigkeit des Prozessors. Meist wird eine Best-Case-Abschätzung oder ein rein theoretischer und damit möglicher Wert angegeben. Es gibt Einteilungen in KiloFLOPS (kFLOPS), MegaFLOPS (MFLOPS), GigaFLOPS (GFLOPS), TeraFLOPS (TFLOPS), PetaFLOPS (PFLOPS), ExaFLOPS (EFLOPS), ZettaFLOPS (ZFLOPS) und YottaFLOPS (YFLOPS).

Zum Vergleich: Der elektromechanische Zuse Z3 aus dem Jahre 1941 war der erste in der Praxis einsetzbare frei programmierbare Computer. Dieser Rechner konnte knapp zwei Additionen pro Sekunde und damit 2 FLOPS realisieren. Andere Operationen dauerten zum Teil deutlich länger.

Heute erzielt der Supercomputer „Summit“ aus dem Oak Ridge National Laboratory (ORNL) mit einer theoretischen Rechenleistung (Peak-Wert) 200 PFlops und 3,3 ExaFLOPS bei KI-Workloads. Damit ist er aktuell (Sommer 2019) der schnellste Supercomputer der Welt und auch achtmal so schnell wie sein ORNL-Vorgänger „Titan“ (damit Platz 5).

Kritik an Linpack-basiertem Ranking der Top500

Vergleichbarkeit in Gefahr oder unsinnige Rangliste?

Kritik an Linpack-basiertem Ranking der Top500

22.07.19 - Beim jüngsten „Top500“-Ranking der Supercomputer ist die Messlatte ein nach Ansicht von Experten völlig überholter Benchmark-Test namens Linpack beziehungsweise HPLinpack. Er wird nur noch aus historischen Gründen beibehalten, hat sich aber zuletzt weiterentwickelt. Eine moderne Alternative ist der HPCG-Benchmark-Test. lesen

Die neue Hitliste der Supercomputer ist ein Meilenstein

Kommentare von Listenautor Erich Strohmaier

Die neue Hitliste der Supercomputer ist ein Meilenstein

18.06.19 - Die 53. Ausgabe des TOP500 der amtierenden Supercomputer wurde gestern veröffentlicht. Auf der ISC High Performance Conference in Frankfurt kommentierte sie einer der Autoren der Liste, Erich Strohmaier vom NERSC/Lawrence Berkeley National Laboratory.. lesen

Abgrenzung zu anderen Einflussgrößen

Die FLOPS sind nicht direkt proportional zu der Taktgeschwindigkeit eines Prozessors, da Gleitkomma-Operationen je nach Implementierung unterschiedlich viele Taktzyklen in Anspruch nehmen können.

Neben den FLOPS als Einheit zur Messung der Performanz von Rechnern und Prozessoren kann auch die Maßeinheit MIPS herangezogen werden. Die Maßeinheit MIPS (Million Instructions per Second) ermittelt, wie viele Millionen Maschinenbefehle pro Sekunde ein Rechner ausführen kann. Wogegen FLOPS die Anzahl der Gleitkommazahl-Operationen pro Sekunde ausdrücken, bestimmen MIPS nur die ganzzahlige Leistung eines Computers.

Dazu gehören Ganzzahl-Operationen wie zum Beispiel Datenverschiebungen (A nach B) oder Wertetests (Wenn A = B, dann C). Die Leistungsbenchmark MIPS eignet sich für Anwendungen wie zum Beispiel Datenbankabfragen, Textverarbeitung, Tabellenkalkulationen oder zum Ausführen mehrerer virtueller Betriebssysteme.

Berechnung

Die theoretische Spitzenleistung (Theoretical Peak Performance) eines CPU-basierten Hochleistungsrechners lässt sich wie folgt berechnen: GFLOPS = (CPU-Takt in GHz) × (Anzahl der CPU-Kerne) × (CPU-Instruktionen pro Takt) × (Anzahl der CPU im Rechenknoten).

Je nach vorliegender Prozessor-Architektur können die ausgeführten Instruktionen pro Sekunde variieren. Das heißt, die Intel X5600 Series CPU und AMD 6100/6200 Series CPU weisen vier Instruktionen per Zyklus und die Intel E5-2600 Series CPU acht Instruktionen per Zyklus auf.

Kritik

Die Maßeinheit FLOPS ist für den Vergleich zweier Prozessor-Architekturen ungeeignet. Denn ein RISC-Prozessor kann meist viel mehr Operationen pro Sekunde durchführen, als ein vergleichbarer CISC-Prozessor. Dies rührt daher, dass die Instruktions-Ausführungszeit für RISC-Operationen meist unter denen von CISC-Operationen liegt. Andererseits benötigen RISC-Prozessoren für die gleiche Aufgabe mehr Operationen als CISC-Prozessoren.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de/ (ID: 46096688 / Definitionen)