Die Energie-Effizienz von 166 Sprachmodellen in der Bewertung Die neue E-Klasse: AI Energy Score identifiziert das Energie-effizienteste KI-Modell

Ein Gastbeitrag von Steffen Müller* 5 min Lesedauer

Anbieter zum Thema

OpenAI-CEO Sam Altman x-te jüngst: „Es macht super viel Spaß zu sehen, wie die Leute die Bilder in 'ChatGPT' lieben, aber unsere GPUs schmelzen.“ Will heißen: Die Bilderzeugung ließe in Sekunden hyperrealistischer KI-Bilder en masse entstehen, wird aber gedrosselt, weil die GPUs der Hitze nicht standhalten. Die Beschleuniger brauchen zu viel Strom, werden somit zu heiß.

So sieht eine KI das Schmelzen von GPUs. Die Technik, die 600 Kilowatt und mehr pro Rack bewältigen kann - und die Stromrechnung - kommt erst noch. Salesforce und andere setzen zunächst auf weniger energiehungrige KI-Modelle. (Bild:  Dall-E / KI-generiert)
So sieht eine KI das Schmelzen von GPUs. Die Technik, die 600 Kilowatt und mehr pro Rack bewältigen kann - und die Stromrechnung - kommt erst noch. Salesforce und andere setzen zunächst auf weniger energiehungrige KI-Modelle.
(Bild: Dall-E / KI-generiert)

Also: Neben den technischen, rechtlichen und gesellschaftlichen Herausforderungen beim Einsatz von KI stellt der hohe Energieverbrauch, etwa durch Kühlung, eine noch ungelöste Aufgabe dar. Heute nutzen Rechenzentren rund 1,5 Prozent des global erzeugten Stroms; ein durch KI verursachter Anstieg auf 4,5 Prozent wird bis 2030 erwartet. Die wirtschaftlichen und ökologischen Auswirkungen dieser Zunahme gehören dringend adressiert.

Neulich auf „X“ .....(Bild:  x)
Neulich auf „X“ .....
(Bild: x)

Der wachsende Energiebedarf ist sowohl auf den steigenden Einsatz Energie-intensiver KI-Modelle, insbesondere großer Sprachmodelle (LLMs), als auch auf die breitflächige Integration dieser KI-Modelle in Anwendungen verschiedenster Art zurückzuführen. Es gibt jedoch keinen klaren Konsens darüber, was „KI“ im eigentlichen Sinne umfasst und wie ihre direkten und indirekten Umweltauswirkungen umfassend erhoben und bilanziert werden können. Woran es bisher mangelt, sind standardisierte Methoden, um den Energieverbrauch einzelner KI-Modelle zu bewerten und zu vergleichen.

Unternehmen und Endanwender haben zwar keinen direkten Einfluss auf den Energieverbrauch von KI-Modellen. Sie können jedoch bei der Auswahl der Technologiepartner und Sprachmodelle die Energie-Effizienz zu einem wesentlichen Entscheidungskriterium machen und damit auch KI-Modellentwickler ermutigen, diesem Aspekt höhere Priorität einzuräumen.

Ein standardisierter Bewertungsrahmen für mehr Transparenz

Orientierung bei der Auswahl des für spezifische Anwendungsfälle am besten geeigneten und kostenbewusstesten LLMs gibt seit Juli 2024 bereits der 'LLM Benchmark für CRM' von Salesforce. Kürzlich haben wir außerdem gemeinsam mit der Hochschule Carnegie Mellon University sowie den Partnern Hugging Face und Cohere den „AI Energy Score“ ins Leben gerufen, der die Energie-Effizienz von derzeit 166 Sprachmodellen bewertet und vergleichbar macht. Dabei werden sowohl Open-Source- als auch proprietäre Modelle einbezogen.

Der AI Energy Score misst die Energie-Effizienz von KI-Modellen während der Inferenz, also der Phase, in der ein trainiertes Modell zur Verarbeitung neuer Daten eingesetzt wird. Er bewertet den Energieverbrauch anhand von standardisierten Benchmarks für gängige KI-Aufgaben wie Text- und Bildgenerierung und berücksichtigt dabei Faktoren wie Hardware-Effizienz, Modellarchitektur und Ressourcennutzung.

Einheitliche Datensätze für jede Aufgabe stellen sicher, dass eine vergleichbare, reale Leistung überprüft wird. Die Ergebnisse werden in einer öffentlichen Bestenliste veröffentlicht und mit einem 1- bis 5-Sterne-Label versehen.

Der AI Energy Score auf einen Blick

Über das 5-Sterne-Bewertungssystem wird der Vergleich zwischen verschiedenen Technologien einfacher und die Entscheidungsfindung für nachhaltigere KI-Modelle erleichtert. Dabei hilft der AI Energy Score Unternehmen und Entwicklern, die Energie-Effizienz verschiedener Modelle auf einen Blick zu verstehen. Dieser standardisierte Ansatz schafft Transparenz und fördert Energie-effiziente Entwicklungspraktiken für die gesamte Technologiebranche.

Die Entwicklung des AI Energy Score erfolgte in Zusammenarbeit zwischen Salesforce, Hugging Face, Cohere und der Carnegie Mellon University. Ziel war es, ein robustes Bewertungssystem zu schaffen, das zehn verschiedene KI-Aufgaben abdeckt, darunter Textgenerierung, Bildklassifizierung und Objekterkennung.

Für ein konsistentes Benchmarking werden standardisierte Hardware-Komponenten, insbesondere „Nvidia H100“ GPUs, eingesetzt. Das Bewertungssystem wird halbjährlich aktualisiert, um technologische Fortschritte zu berücksichtigen. Die Methodik sieht vor, dass die energieeffizientesten 20 Prozent der Modelle mit fünf Sternen ausgezeichnet werden, während die am wenigsten effizienten 20 Prozent lediglich einen Stern erhalten.

Entwicklung des AI Energy Score

Die Grundlage für den neuen AI Energy Score bilden der „MLPerf“ Inference Benchmark, der neben der Performance verschiedenster Hardware, Software und Anwendungen auch den Energieverbrauch erhebt, sowie die Open-Source-Library „Zeus“, die Schnittstellen zur Messung des Energieverbrauchs von Deep-Learning-Workloads bietet, allerdings nur für Open-Source-Modelle. Für proprietäre Modelle bietet Ecologits Schätzwerte auf Basis von Ableitungen aus Open-Source-Daten.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Da die Datenlage im Hinblick auf die proprietären Modelle jedoch unzureichend ist, sind Belastbarkeit und Vergleichbarkeit begrenzt. Der AI Energy Score baut auf diesen Arbeiten auf und etabliert einen standardisierten, unabhängigen Energieeffizienz-Benchmark für KI-Modelle.

Das vereinheitlichte Rahmenwerk bietet eine konsistente, transparente und skalierbare Bewertung von Open-Source- und proprietären Modellen. Dafür überführt es die komplexen Energiemessungen in eine einzige, leicht verständliche relative Metrik. Die Daten sind in einem öffentlich zugänglichen Leaderboard kostenlos einsehbar.

Mehrwerte für Unternehmen

Anhand des AI Energy Scores können Unternehmen datenbasiert über den Einsatz Energie-effizienter KI-Modelle entscheiden und dabei Leistungsmerkmale wie Genauigkeit, Latenz und Durchsatz mit Nachhaltigkeitszielen in Einklang bringen. Dadurch erleichtern sie sich die Auswahl der für ihre Ziele am besten geeigneten Technologie.

Gleichzeitig senkt der Einsatz Energie-effizienter Modelle die Energiekosten. Zudem werden Unternehmen ihrer Nachhaltigkeitsverantwortung gerecht, indem sie dem Aspekt des bewussten Ressourcenumgangs bei ihren Innovationsaktivitäten Priorität einräumen. Im Zuge der gesetzlichen Vorgaben hinsichtlich der Berichterstattung können sie die konkreten Metriken direkt integrieren, ohne die Werte separat aufwändig erheben zu müssen.

Der AI Energy Score ist ein zentraler Bestandteil der Salesforce-Strategie für verantwortungsvolle KI-Entwicklung. Als eines der ersten Unternehmen in der Branche haben wir die Energie-Effizienzdaten unserer eigenen Modelle offengelegt. „Agentforce“, eine Plattform für autonome KI-Agenten, ist selbst auf den möglichst ressourcenschonenden Einsatz der Technologie ausgelegt.

Salesforce engagiert sich

Das gelingt unter anderem durch den Fokus auf Small Language Models (SLMs). Diese kleineren Modelle verbrauchen im Vergleich zu großen Sprachmodellen erheblich weniger Energie und verursachen somit geringere CO₂-Ausstöße. Diese auf definierte Anwendungen und Einsatzbereiche zugeschnittenen Modelle optimieren Kosten, reduzieren die Komplexität, sind oft schneller und dennoch „sauberer“ als LLMs.

*Der Autor
Steffen Müller ist Direktor für Nachhaltigkeit und Transformation bei Salesforce. Er fasst zusammen:
Energie-Effizienzbewertungen liefern wertvolle Erkenntnisse, die bei der Entwicklung und dem Einsatz von KI als Entscheidungshilfe dienen können. Durch die Kombination dieser Werte mit Leistungsmetriken, etwa Durchsatz, Genauigkeit und Latenz, können Benutzer fundierte Entscheidungen bei der Modellauswahl treffen, um die Energie-Effizienz mit ihren individuellen Anforderungen in Einklang zu bringen.
Sind KI-gestützte Produkte mit ihrem Energie-Score gekennzeichnet, können sich Unternehmen bewusst für ein nachhaltiges Modell entscheiden und nicht nur die Umweltauswirkungen, sondern auch ihre Kosten senken.
Politischen Entscheidungsträgern können diese Bewertungen bei der Ausarbeitung neuer Gesetze und Vorgaben helfen, die Anreize für den nachhaltigen Einsatz von KI bieten, zum Beispiel, indem sie vorschreiben, dass Modelle, die besonders breit genutzt werden oder rund um die Uhr im Einsatz sind, einen möglichst guten Energy Score aufweisen müssen.

Bildquelle: Salesforce

(ID:50373064)