Prior 1-Auswertung der häufigsten Praxisfehler und wie man sie vermeidet Bei der Stromversorgung sparen viele Datacenter an der falschen Stelle

Quelle: Pressemitteilung Prior 1 4 min Lesedauer

Anbieter zum Thema

Nicht nur KI-Workloads testen Belastungsgrenzen von Rechenzentren, sondern auch Planungs- und Betriebsfehler bei der Stromversorgung. Eine Prior 1-Analyse benennt oft nur scheinbare Redundanz, ungenügende Dimensionierung, unsaubere Leitungstrennung und mangelnde Tests als wichtige Ausfallrisiken, zeigt aber auch Lösungsansätze auf.

Prior1-Analyse: viele Rechenzentren eher auf dem Papier redundant versorgt, während faktisch ungenügende Dimensionierung, unsaubere Infrastrukturentrennung und mangelnde Tests Ausfallrisiken erhöhen.(Bild:  Midjourney / KI-generiert)
Prior1-Analyse: viele Rechenzentren eher auf dem Papier redundant versorgt, während faktisch ungenügende Dimensionierung, unsaubere Infrastrukturentrennung und mangelnde Tests Ausfallrisiken erhöhen.
(Bild: Midjourney / KI-generiert)

Der anhaltende KI-Boom (KI = Künstliche Intelligenz) bedeutet weiter steigende Belastungen für Rechenzentren. Schon heute entfällt ein Drittel des weltweiten Energieverbrauchs in Rechenzentren auf stromhungrige KI- und HPC-Workloads, erläutert Achim Dewald, Projektleiter beim Datacenter-Betreiber Prior 1.

Projektion des globalen Energieverbrauchs von Rechenzentren in Terawattstunden nach Workload-Arten bis 2034.(Bild:  Internationale Energieagentur, Technology Collaboration Programme, „Total Energy Model 4.0 - Data Centres, May 2025“, S. 27.)
Projektion des globalen Energieverbrauchs von Rechenzentren in Terawattstunden nach Workload-Arten bis 2034.
(Bild: Internationale Energieagentur, Technology Collaboration Programme, „Total Energy Model 4.0 - Data Centres, May 2025“, S. 27.)

Getrieben durch KI-Anwendungen wird sich der Stromverbrauch von Rechenzentren weiter rasant erhöhen. Die Internationale Energie-Agentur hält laut ihrer jüngsten Projektion eine Erhöhung des Stromverbrauchs auf knapp das Achtfache bis 2030 für möglich, mit einer auch perspektivisch steiler werdenden Wachstumskurve.

Dieser Stromhunger geht mit einer dramatisch steigenden Leistungsdichte einher, die Bestandsrechenzentren an ihre Grenzen bringen kann, aber auch ein Puzzle bei Neuplanungen darstellt. Prior 1 hat nun erste Ergebnisse einer systematischen Untersuchung von in der Praxis am häufigsten gesichteten Mängeln bei Stromversorgung, Elektroinstallationen und Erdung vorgestellt. Selbst vermeintlich kleine Mängel können sich dabei schnell „im Störfall zu großen Effekten addieren“, warnt Dewald.

Fehlerquelle: die dimensionieren von Strom- und Notstromversorgung

Ein großer Teil der beobachteten Fehler geht auf mangelnde Dimensionierung und nur scheinbar gewährleistete Redundanz zurück. Datacenter-Entwickler und -Betreiber sparen damit oftmals an falscher Stelle, mit hohen Folgerisiken.

Oft existieren Redundanzen laut Prior 1-Analysen lediglich auf dem Papier, etwa wenn eigentlich redundante USV-Anlagen vom gleichen Batterieblock gespeist werden. In anderen Fällen würden redundant vorhandene Strom- und Datenleitungen nicht baulich getrennt, was genaso Resilienz untergrabe.

Insgesamt sei die Ersatzstromversorgung oft genügend groß dimensioniert, habe eine zu geringe Leistungsgüte oder werde nicht ausreichend durch Lasttests überprüft. In der Praxis regulär anzutreffen seien insbesondere zu kleine Generatoren, die Laststöße beim Stromausfall nicht auffangen können.

Ähnliche Fehler habe Prior 1 auch bei der Hauptstromversorgung beobachtet. Auch hier führe eine falsche Auslegung von Leitungen, Sammelschienen oder Schutzeinrichtungen zu erhöhten Ausfallrisiken, umso mehr bei anspruchsvollen KI-Workloads. Besonders häufig anzutreffen seien zu klein gewählte Kabelquerschnitte und Sammelschienen. Neben möglicher Überlastung könne dadurch oft auch keine selektive Koordination gewährleistet werden, also sichergestellt werden, dass im Fall eines Stromfehlers nur die nächstgelegene Schutzeinrichtung anspringt, während das übrige Datacenter im Regelbetrieb funktionieren kann.

Fehlerquelle: Erdung und Leitungstrennung

Ein entscheidender Risikofaktor sei zudem das Erdungssystem. Oft fehle eine systematische und einheitliche Vermaschung der metallischen Komponenten im Rechenzentrum, die eine gleichmäßige Erdung und eine gleiche relative Spannung der Komponenten (elektrische Potentiale) sicherstellt. Zudem werde in vielen Fällen das Prinzip möglichst kurzer Leitungswege missachtet, das für möglichst geringe Widerstandsunterschiede sorgt. Auch der Stromkreis werde oft nicht ausreichend auf unzulässige Ströme und Abweichungen überwacht.

Schließlich liegt eine weitere entscheidende Fehlerquelle laut Prior 1-Auswertungen nicht in den Installations- und Betriebspraktiken. Oft würden Stark-, Schwachstrom- und IT-Leitungen vermengt statt getrennt verlegt, was nicht nur zu Instabilitäten führen könne, sondern den Wartungsaufwand verstärke und die Visualisierung der Lastflüsse behindere. All dies werde ebenfalls durch oft fehlende Abstände zwischen Anlagen und unzureichende Kennzeichnungen erschwert.

Auch hier würden mangelnde Prozeduren für die Absicherung eines planmäßigen Betriebs für den Notfall und bei Beanspruchung der Redundanz-Kapazitäten tägliche Risiken erhöhen. Dies sei etwa der Fall, wenn die Lastübernahme bei der Notstromversorgung oder die geplante Umschaltung zwischen Versorgungssystemen nicht umfassend geprüft und dokumentiert werden.

Mangelnde Redundanz, fehlerhafte Schaltungen und Batterieprobleme betreffen Rechenzentren bis zu den Hyperscalern

Achim Dewald ist Projektleiter beim Datacenter-Betreiber Prior 1. Sein Plädoyer: „Mit KI steigt die kritische Abhängigkeit von verlässlicher Energie. Wer heute baut oder ertüchtigt, sollte die Energieversorgung als Produktmerkmal denken: zertifizierbar, testbar, rückgewinnungsfähig, und im Zweifel netzunabhängiger als gestern“.(Bild:  Prior 1)
Achim Dewald ist Projektleiter beim Datacenter-Betreiber Prior 1. Sein Plädoyer: „Mit KI steigt die kritische Abhängigkeit von verlässlicher Energie. Wer heute baut oder ertüchtigt, sollte die Energieversorgung als Produktmerkmal denken: zertifizierbar, testbar, rückgewinnungsfähig, und im Zweifel netzunabhängiger als gestern“.
(Bild: Prior 1)

Dewald plädiert dafür, diese Risikofaktoren ernst zu nehmen: „In Bamberg brannte 2025 ein Umspannwerk. Die angeschlossenen Rechenzentren verfügten zwar über Notstrom, doch teils fehlte die saubere Redundanz, so dass einzelne Services über Stunden offline waren.

Und auch Hyperscaler sind nicht immun: Immer wieder kommt es zu Beeinträchtigungen durch fehlerhafte USV-Schaltungen oder Batterieprobleme“. Dewald schlussfolgert: „Technische Redundanz allein genügt nicht. Getestete Redundanz, selektive Schutzkonzepte und saubere Erdung sind die eigentlichen Game-Changer.“

Damit Betreiber diesen Risiken effektiv begegnen können, sollten sie laut Dewald ihr Augenmerk auf mehrere konkrete Stellschrauben richten. Bei der allgemeinen Architektur böten die Norm EN 50600 und die Tier-Klassen des Uptime Institute eine klare Grundlage für konsequente Redundanz und somit Resilienz. Betreiber seien gut beraten, die zwei höchsten Verfügbarkeitsklassen respektive Tiers anzustreben, um etwa eine echte unterbrechungsfreie Wartung oder eine vollständige Trennung von Strompfaden zu ermöglichen.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Messungen und Dokumentation entscheidend für Resilienz, aber auch für Berichtspflichten

Gerade die physische Trennung der Energie- und Datenwege sei entscheidend. „Ordnung in der Infrastruktur ist ein Verfügbarkeitsfaktor“, so Dewald. Damit einher gingen auch eine ausreichende Dimensionierung der Versorgung und die Abstimmung mit der Schutztechnik. Für elektromagnetische Stabilität könne zudem ein engmaschiges und sauber dokumentiertes Erdungssystem mit durchgängiger Kabelabschirmung sorgen.

Schließlich seien reguläre Messungen und vorausschauende Analysen der Notstromversorgung gefordert. Etwa müsse Redundanz durch „vierteljährliche Last- und Black-Start-Szenarien, dokumentierte Runbooks und vollständige Rückschaltproben“ regelmäßig auf die Probe gestellt werden.

Messung und Dokumentation seien zudem nicht nur für Sicherstellung von Redundanz, sondern auch für die zunehmenden Berichtspflichten fundamental. Sie seien die Grundlage dafür, dass Rechenzentren die Einhaltung von PUE-Schwellen (Power Usage Effectiveness) und, ab Juli 2026, ihre Abwärme-Abgabe gemäß den Anforderungen Energie-Effizienzgesetz sauber belegen können.

Artikelfiles und Artikellinks

(ID:50592750)