Performance-Messungen Was sind Floating Point Operations Per Seconds (FLOPS)?
Die Floating Point Operations Per Second (Gleitkommaoperationen pro Sekunde) entsprechen einer Maßeinheit für die Leistungsfähigkeit von Computern. Sie bezeichnen die Anzahl der Gleitkommazahl-Operationen (Additionen oder Multiplikationen), die pro Sekunde möglich sind.
Anbieter zum Thema

Beim Vergleich von zwei Rechnersystemen hinsichtlich ihrer Leistungsfähigkeit ist dies mit FLOPS jedoch nur möglich, wenn beide Systeme die gleiche Architektur aufweisen. Liegen unterschiedliche Architekturen vor, so hat der Vergleich keine Aussagekraft. Operationen im Sinne von Floating Point Operations Per Second (FLOPS) sind mathematische Operationen wie zum Beispiel das Addieren oder Multiplizieren von Zahlen.
Bestimmung von FLOPS
Das Gleitkomma (Floating Point) lässt sich als eine bei Rechnern gängige Art der Zahlendarstellung verstehen, die für die Berechnung sehr großer oder sehr kleiner reeller Zahlen erforderlich sind. FLOPS geben also an, wie viele dieser Berechnungen ein Rechner pro Sekunde abarbeiten kann. Je mehr FLOPS ein Computer schafft, desto schneller und performanter ist er. Zur Bestimmung der FLOPS-Leistung eines Computers kommen spezialisierte Software-Tools zum Einsatz.
Bei der Bestimmung von FLOPS wird die gesamte Rechner-Architektur - bestehend aus Hauptspeicher, Bus, Compiler... gemessen - und nicht die reine Geschwindigkeit des Prozessors. Meist wird eine Best-Case-Abschätzung oder ein rein theoretischer und damit möglicher Wert angegeben. Es gibt Einteilungen in KiloFLOPS (kFLOPS), MegaFLOPS (MFLOPS), GigaFLOPS (GFLOPS), TeraFLOPS (TFLOPS), PetaFLOPS (PFLOPS), ExaFLOPS (EFLOPS), ZettaFLOPS (ZFLOPS) und YottaFLOPS (YFLOPS).
Zum Vergleich: Der elektromechanische Zuse Z3 aus dem Jahre 1941 war der erste in der Praxis einsetzbare frei programmierbare Computer. Dieser Rechner konnte knapp zwei Additionen pro Sekunde und damit 2 FLOPS realisieren. Andere Operationen dauerten zum Teil deutlich länger.
Heute erzielt der Supercomputer „Summit“ aus dem Oak Ridge National Laboratory (ORNL) mit einer theoretischen Rechenleistung (Peak-Wert) 200 PFlops und 3,3 ExaFLOPS bei KI-Workloads. Damit ist er aktuell (Sommer 2019) der schnellste Supercomputer der Welt und auch achtmal so schnell wie sein ORNL-Vorgänger „Titan“ (damit Platz 5).
:quality(80)/images.vogel.de/vogelonline/bdb/1591700/1591753/original.jpg)
Vergleichbarkeit in Gefahr oder unsinnige Rangliste?
Kritik an Linpack-basiertem Ranking der Top500
:quality(80)/images.vogel.de/vogelonline/bdb/1577800/1577815/original.jpg)
Kommentare von Listenautor Erich Strohmaier
Die neue Hitliste der Supercomputer ist ein Meilenstein
Abgrenzung zu anderen Einflussgrößen
Die FLOPS sind nicht direkt proportional zu der Taktgeschwindigkeit eines Prozessors, da Gleitkomma-Operationen je nach Implementierung unterschiedlich viele Taktzyklen in Anspruch nehmen können.
Neben den FLOPS als Einheit zur Messung der Performanz von Rechnern und Prozessoren kann auch die Maßeinheit MIPS herangezogen werden. Die Maßeinheit MIPS (Million Instructions per Second) ermittelt, wie viele Millionen Maschinenbefehle pro Sekunde ein Rechner ausführen kann. Wogegen FLOPS die Anzahl der Gleitkommazahl-Operationen pro Sekunde ausdrücken, bestimmen MIPS nur die ganzzahlige Leistung eines Computers.
Dazu gehören Ganzzahl-Operationen wie zum Beispiel Datenverschiebungen (A nach B) oder Wertetests (Wenn A = B, dann C). Die Leistungsbenchmark MIPS eignet sich für Anwendungen wie zum Beispiel Datenbankabfragen, Textverarbeitung, Tabellenkalkulationen oder zum Ausführen mehrerer virtueller Betriebssysteme.
Berechnung
Die theoretische Spitzenleistung (Theoretical Peak Performance) eines CPU-basierten Hochleistungsrechners lässt sich wie folgt berechnen: GFLOPS = (CPU-Takt in GHz) × (Anzahl der CPU-Kerne) × (CPU-Instruktionen pro Takt) × (Anzahl der CPU im Rechenknoten).
Je nach vorliegender Prozessor-Architektur können die ausgeführten Instruktionen pro Sekunde variieren. Das heißt, die Intel X5600 Series CPU und AMD 6100/6200 Series CPU weisen vier Instruktionen per Zyklus und die Intel E5-2600 Series CPU acht Instruktionen per Zyklus auf.
Kritik
Die Maßeinheit FLOPS ist für den Vergleich zweier Prozessor-Architekturen ungeeignet. Denn ein RISC-Prozessor kann meist viel mehr Operationen pro Sekunde durchführen, als ein vergleichbarer CISC-Prozessor. Dies rührt daher, dass die Instruktions-Ausführungszeit für RISC-Operationen meist unter denen von CISC-Operationen liegt. Andererseits benötigen RISC-Prozessoren für die gleiche Aufgabe mehr Operationen als CISC-Prozessoren.
(ID:46096688)