Hardware-Konsolidierung schafft Kapazität für KI-Workloads Die KI-Revolution braucht Bestands­rechen­zentren

Ein Gastbeitrag von Manik Kapoor* 4 min Lesedauer

Anbieter zum Thema

Die stetig steigende Masse an KI-Workloads lässt den Hunger nach Rechenleistung explodieren. Doch Neubauprojekte bei Rechenzentren stoßen oftmals an harte physikalische und oft auch regulatorische Grenzen. Dabei besteht der Ausweg aus dem Kapazitäts-Dilemma nicht in „mehr Hardware, Leistung, Strom“, sondern in der Optimierung bestehender Infrastrukturen.

Herausforderungen beim Bau neuer Rechenzentrumsflächen machen Bestands-Datacenter zu Protagonisten der KI-Revolution. Die Optimierung bestehender Infrastrukturen ermöglicht genug Kapazität und Effizienz auch für anspruchsvolle KI-Workloads.(Bild:  GPT-Images 2 / KI-generiert)
Herausforderungen beim Bau neuer Rechenzentrumsflächen machen Bestands-Datacenter zu Protagonisten der KI-Revolution. Die Optimierung bestehender Infrastrukturen ermöglicht genug Kapazität und Effizienz auch für anspruchsvolle KI-Workloads.
(Bild: GPT-Images 2 / KI-generiert)

In der Ära von Cloud-Computing und allgegenwärtiger Künstlicher Intelligenz (KI) steigt die Nachfrage nach Bandbreite und Rechenleistung jeden Tag. Weltweit expandieren die Rechenzentren, um dieser Nachfrage Herr zu werden.

Aber gleichzeitig stoßen Neubauprojekte zunehmend an Barrieren. So sind die Stromnetze fast überall bereits am Limit, es gibt zu wenig geeignete Flächen für Neubauten und sowohl die Nachhaltigkeitsziele der Unternehmen als auch die Erfüllung gesetzlicher Vorgaben wie des Energieeffizienzgesetzes (EnEfG) rücken in weite Ferne.

Das führt dazu, dass die gesamte Branche an einem Scheideweg steht, mit wirtschaftlich notwendigem Wachstum auf der einen und ökologischer Verantwortung auf der anderen Seite. Dabei verläuft der richtige Weg oftmals weder rechts noch links, sondern in der Mitte: über die Modernisierung und Optimierung der vorhandenen Infrastruktur.

Das Netzanschluss-Dilemma: Wenn der Strom zum Nadelöhr wird

Denn die Herausforderungen beim Bau neuer Rechenzentren sind deutlich spürbar. Schätzungen zufolge kann weltweit etwa die Hälfte aller geplanten Projekte nicht wie vorgesehen umgesetzt werden, weil die Netzanschlusskapazität begrenzt ist. Auch in Deutschland sind vergleichbare Schwierigkeiten zu beobachten.

So führen in deutschen Datacenter-Hotspots wie Frankfurt am Main Netzengpässe bereits heute zu massiven Verzögerungen entsprechender Baumaßnahmen. Und Genehmigungsverfahren sowie die Bereitstellung der notwendigen Leistungen durch die Energieversorger dauern oftmals drei bis fünf Jahre.

Die German Datacenter Association (GDA) warnt angesichts jahrelanger Genehmigungsschleifen vor einer drohenden Investitionsbremse. Das bedeutet für CIOs und andere Entscheider, dass sie im KI-Wettlauf wertvolle Zeit verlieren, wenn sie auf den Ausbau neuer Rechenzentrumsflächen warten.

Das Effizienz-Paradoxon von KI

Dabei unterstreichen die harten Zahlen den Handlungsdruck. So wird die globale IT-Rechenzentrumskapazität Prognosen zufolge bis zum Jahr 2028 auf 296 Gigawatt anwachsen, von gerade einmal 180 Gigawatt im Jahr 2024. Im selben Zeitraum soll der Stromverbrauch von 397 Terawattstunden (TWh) auf ganze 915 TWh steigen.

Aufgrund des massiven Energiebedarfs von KI-Anwendungen sind neue Design-Ansätze zwingend notwendig. Energie-Effizienz bleibt zentral, wie beispielsweise der europäische Supercomputer LUMI (Large Unified Modern Infrastructure) in Finnland mit 100 Prozent Strom aus Wasserkraft und Abwärmenutzung zeigt.

Effizienz reicht aber alleine nicht aus. Ein ausgewogenes Zusammenspiel von CPUs, GPUs sowie Networking und offener Software ist vielmehr entscheidend.

Modernisierung statt Expansion

Ein großes Problem vieler Bestandsrechenzentren ist die Überalterung der eingesetzten Hardware. Denn viele Datacenter-Verantwortliche betreiben Hardware, die teilweise bis zu zehn Jahre alt oder noch älter ist, einzig um die entsprechenden Investitionen maximal abschreiben zu können. Dabei nehmen diese Systeme nicht nur wertvollen Platz ein, sie verbrauchen außerdem im Verhältnis zur geleisteten Rechenkapazität unverhältnismäßig viel Strom.

Doch das liefert den perfekten Hebelpunkt, um wirklich etwas zu bewegen. Eine Möglichkeit, wie dies bewerkstelligt werden kann, ist der gezielte Austausch veralteter Server. Diese werden dann durch moderne, hocheffiziente Plattformen ersetzt, etwa „AMD Helios“ - Ende 2026 auf dem Markt erwartet - sowie CPUs, GPUs und „Pensando“-Netzwerktechnik sowie „ROCm“-Software, welche in einem offenen OCP-Open-Rack-Wide-Format (Open Compute Project) kombiniert werden. So lässt sich der Datacenter-Footprint massiv reduzieren und die Leistung innerhalb des bestehenden Stromkontingents massiv steigern.

Ein aktuelles Pionierprojekt der Deutschen Telekom in Zusammenarbeit mit AMD verdeutlicht diesen Ansatz. So konnte der Telekommunikationsriese im Rahmen seines „Full Stack Energy Efficiency“-Ansatzes Energieeinsparungen von bis zu 65 Prozent in seinem 5G-Kernnetz erzielen. Dies war nur durch den Einsatz hocheffizienter AMD „Epyc-Prozessoren“ in Kombination mit einer intelligenten, dynamischen Steuerung der Ressourcen möglich.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Der Full-Stack-Ansatz als Leitfaden für CIOs

Bei der Erneuerung der Infrastruktur in einem Rechenzentrum geht es um weit mehr als nur den Austausch von Mikrochips. Stattdessen sind für IT-Entscheider heute drei Faktoren wettbewerbsentscheidend:

  • 1. Ganzheitliches Energie-Management: Wie das Beispiel der Telekom zeigt, müssen für eine maximale Effizienz alle Ebenen optimal zusammenspielen. Komponenten dürfen nicht isoliert betrachtet werden. Vielmehr sorgt ein echter Full-Stack-Ansatz dafür, dass alle möglichen Faktoren in einem Rechenzentrum gemeinsam ausgewertet werden, vom Prozessorverbrauch über den Server und die Cloud-Plattform bis hin zum eigentlichen Service. Das Ziel dahinter ist also, dass nur dann Energie verbraucht wird, wenn die Hardware auch wirklich im Einsatz ist.
  • 2. Offene Software und Cloud-Native-Strukturen: Werden standardisierte Plattformen genutzt, können Funktionen unabhängig voneinander skalieren. Offene Software-Standards stellen dabei sicher, dass verschiedene Teile des Stacks herstellerübergreifend zusammenarbeiten und KI-basierte Algorithmen die Netzsteuerung vorausschauend optimieren können.
  • 3. Interoperabilität und x86-Kontinuität: Je komplexer das Marktumfeld ist, für das ein Rechenzentrum konzipiert wurde, desto wichtiger ist es, eine x86-basierte Infrastruktur zu priorisieren. Nur so kann eine Kompatibilität mit bestehenden Software-Stacks sichergestellt werden. Gleichzeitig reduziert dies Integrationsprobleme und verbessert die Agilität der Entwickler, da diese sich nun darauf konzentrieren können, bewährte Ökosysteme zu modernisieren, ganz ohne teure Code-Anpassungen.

Das Rechenzentrum der Zukunft wird im Bestand gebaut

Der KI-Boom stellt die gesamte IT-Branche vor gewaltige Herausforderungen. Doch diese sind nicht unlösbar. Wachstum darf nicht mehr nur mit Neubau gleichgesetzt werden.

Wir leben mittlerweile in einer Welt, in der Strom selbst in hochindustrialisierten Ländern kein unbegrenzt vorhandenes Gut mehr ist. Die echte Revolution bei Rechenzentren findet daher bei der Optimierung statt.

Verantwortliche müssen das Beste aus vorhandenen Flächen und bereits genehmigten Stromkontingenten herausholen. Dann lässt sich der scheinbare Konflikt zwischen Skalierung und Nachhaltigkeit in einen strategischen Vorteil umwandeln.

*Der Autor
Manik Kapoor ist AI and Datacentre Lead bei AMD und Spezialist für die Skalierung von KI-Lösungen und den Aufbau strategischer Partnerschaften.
Sein Fazit: „Die Rechenarchitektur von heute entscheidet darüber, ob ein Unternehmen morgen den Raum und die Kapazitäten für die Innovationen hat, die unsere Wirtschaft und Gesellschaft verändern können“.

Bildquelle: AMD

(ID:50844679)