Ein Orakel für Ampere: GPU-freie Inferenz Oracle plant die Übernahme von Ampere Computing

Von Anna Kobyinska und Filipe Martins* 6 min Lesedauer

Anbieter zum Thema

Oracle hat sich mit CPUs von Ampere Computing eingedeckt und die (Hinter)türe für eine Übernahme des ARM-Designers geöffnet. Bekannt für die hohe Energie-Effizienz seiner Chips und konstante Performance unter Volllast will Ampere das Rechenzentrum noch weiter verdichten.

Der Hoffnungsträger von Oracle für GPU-freie Inferenz: Der Prozessor „Ampere One“ von Ampere Computing (nicht zu verwechseln mit Ampere-GPUs von Nvidia!)(Bild:  Ampere Computing)
Der Hoffnungsträger von Oracle für GPU-freie Inferenz: Der Prozessor „Ampere One“ von Ampere Computing (nicht zu verwechseln mit Ampere-GPUs von Nvidia!)
(Bild: Ampere Computing)

Allen Anzeichen nach will Oracle für die eigenen Rechenzentren selbst Chips entwickeln und fertigen lassen, ohne auf AMD oder Nvidia angewiesen zu sein. Knapp ein Drittel (29 Prozent) der Ampere-Aktien sind bereits im Besitz von Oracle. Laut einer Ende September eingereichten Vollmachterklärung hat Oracle die Option, in rund zwei Jahren die Mehrheitskontrolle an sich zu reißen;die Verschuldung vom Ampere macht es möglich.

Weg vom Parkett

„Der Gesamtbuchwert unserer Investitionen in Ampere betrug nach Berücksichtigung der Verluste gemäß der Equity-Methode 1,5 Milliarden Dollar zum 31. Mai 2024,“ ließ Oracle in der Einreichung verlauten. Zusätzlich zu den 400 Millionen Dollar Schulden aus dem vorangegangenen Geschäftsjahr hat Oracle dem Chip-Startup Ampere aus dem kalifornischen Santa Clara (nur wenige Minuten Autofahrt von Nvidia, Intel und AMD entfernt) im Geschäftsjahr 2024 noch weitere zusätzliche Darlehen in Höhe von 600 Millionen Dollar in Form von wandelbaren Schulden gewährt.

Die Schulden von Ampere werden ab Juni 2026 fällig, zu welchem Zeitpunkt Oracle die Möglichkeit hat, diese Investitionen gegen Eigenkapital des Chip-Startups auszutauschen und die Kontrolle über Ampere zu übernehmen, hieß es weiter in der Einreichung.

Laut dem Dokument hat Oracle im Geschäftsjahr 2023 etwa 48 Millionen Dollar für Ampere-Prozessoren ausgegeben – teils direkt bei Ampere, teils über Dritte. Im Vergleich dazu gab Oracle im Geschäftsjahr 2024 nur 3 Millionen Dollar für Ampere-Chips aus und hatte Produkte im Wert von 101,1 Millionen Dollar auf Basis eines Vorauszahlungsauftrags zur Verfügung. Ampere hat im Gegenzug die eigenen IPO-Pläne aufgegeben.

Ampere befindet sich derzeit in einer wichtigen Wachstumsphase, sowohl in Bezug auf Umsatz als auch auf den Kapitalfluss. Das Unternehmen plant, bis 2025 einen positiven Cashflow zu erzielen. Amperes Prozessoren sind besonders im Bereich der Cloud- und Edge-Computing-Lösungen gefragt, da sie im Vergleich zu x86-basierten Chips eine bessere Energieeffizienz und konstante Leistung bieten.

@BILD:((Ampere-Roadmap-2024-Q2.png))

Infomania(k)!

Als einer der Pioniere der Arm-Architektur im RZ-Markt kann Ampere auf Kunden wie Microsoft, Google oder Oracle verweisen. Oracle Cloud Infrastructure nutzt ARM-Chips von Ampere als Ersatz für x86, um seinen KI-Arbeitslasten zu kosteneffizienter Skalierbarkeit zu verhelfen.

Kostenkalkulation: Ein 1 Megawatt Rechenzentrum mit einem PUE von 1,5 bei 15 Kilowatt pro Rack erneuert 20 Racks mit sechs Jahre alten Servern wahlweise mit CPUs von AMD oder Ampere Computing.(Bild:  Ampere Computing)
Kostenkalkulation: Ein 1 Megawatt Rechenzentrum mit einem PUE von 1,5 bei 15 Kilowatt pro Rack erneuert 20 Racks mit sechs Jahre alten Servern wahlweise mit CPUs von AMD oder Ampere Computing.
(Bild: Ampere Computing)

Infomaniak, das größte Webhosting-Unternehmen der Schweiz, stand kürzlich vor der Herausforderung, die Energie-Effizienz zu verbessern und die Leistung des Cloud-Speichers seiner luftgekühlten Rechenzentren zu optimieren (siehe: Abbildung) .

Die Leistungswerte der bestehenden x86-Server hatten besorgniserregende und unvorhersehbare Leistungsschwankungen. Infomaniak entschied sich, die x86er Server auszusortieren und durch „HPE Proliant RL300 Gen 11“ Server zu ersetzen. Diese Server nutzen „Ampere Altra“- und „Ampere Altra Max“-Prozessoren mit bis zu 128 Kernen pro Sockel und sind optimiert für skalierbare Rechenzentrumsanwendungen.

Die Integration dieser Server hat die Leistungswerte tatsächlich stabilisiert und die Energie-Effizienz verbessert. Besonders im Bereich des Cloud-Speichers berichtet Infomaniak von signifikanten Fortschritten. „Die Ampere-basierten HPE Proliant RL300 Server bieten eine konstante Leistung und hohe Energie-Effizienz, wodurch wir den Stromverbrauch reduzieren und gleichzeitig die Zuverlässigkeit unserer Cloud-Speicherlösungen verbessern konnten“, urteilt Thomas Goirand, Systemadministrator bei Infomaniak.

Die offizielle Roadmap von Ampere Computing sieht plausibel aus; ob sich das erhoffte Wachstum einstellt, hängt nicht zuletzt von der Finanzierung ab.(Bild:  Ampere Computing)
Die offizielle Roadmap von Ampere Computing sieht plausibel aus; ob sich das erhoffte Wachstum einstellt, hängt nicht zuletzt von der Finanzierung ab.
(Bild: Ampere Computing)

Die schnelle Implementierung der neuen Plattform war ein weiterer Pluspunkt. Dank der guten Kompatibilität von „Debian“ mit ARM64-Architektur der Ampere-Prozessoren musste Infomaniak nur minimale Anpassungen vornehmen. „Die nahtlose Integration und schnelle Bereitstellung (...) haben uns sofortige Ergebnisse beschert, mit besserem Durchsatz und geringerem Energieverbrauch“, bestätigt Goirand: „Der Wechsel zu Ampere war ein entscheidender Schritt für unsere nachhaltigen Cloud-Angebote.“

Die eigene Website von Ampere Computins läuft auf Ampere Altra (nicht zu verwechseln mit Ampere-GPUs von… Nvidia!).

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Ampere One

Ampere hat kürzlich eine Version seiner „Ampere One“-Prozessorfamilie mit bis zu 256 Kernen angekündigt, die nächstes Jahr auf den Markt kommen soll. Eine „monströse“ Variante mit 512 Kernen ist auch bereits in Arbeit.

Der bis zu 192 Kerne starke Ampere-One-Chip „Siryn“ vom Mai 2023 basiert auf dem ersten Ampere-eigenen Kern „A1“ und wird im verbesserten 5-Nanometer-Prozess von TSMC gefertigt. Die Leistungsaufnahme bewegt sich je nach Konfiguration zwischen 210 und 350 Watt.

Ähnlich wie bei „Graviton3“ von AWS sind bei diesem Chip alle Rechenkerne auf einem monolithischen Die untergebracht, während die Speicher- und I/O-Controller als Chiplets außen angeordnet sind.

Der Ampere One der ersten Generation arbeitet mit einer Taktfrequenz von bis zu 3,7 Gigahertz (GHz) und kann mit acht 4,8 GHz starken DDR5-Speicherkanälen auftrumpfen; eine Variante mit zwölf Speicherkanälen (hier genannt 'Kern A2') soll noch in diesem Jahr auf den Markt kommen.

Die 512-Kern-„Ampere One Aurora“ mit dem Kern, [den die Autoren „A2“ nennen - der Hersteller macht darauf aufmerksam, dass es keine 'offizielle Bezeichnung' dafür gibt] (derzeit noch in der Entwicklung) ist noch weitgehend geheimnisumwittert. Durchgesickert sind aber bereits einige Details über die aufgebohrten Ampere-One-Kerne, das skalierbare Ampere-One-Mesh und eine Die-to-Die-Interconnect-Technologie für die Kommunikation zwischen Chiplets. Diese Lösung basiert auf einer speziell entwickelten SERDES-Schaltung (Serializer/Deserializer) und nutzt ein angepasstes Protokoll.

Von Prozessoren über Ampere-optimierte KI-Frameworks zu den Anwendungsfällen bei Kunden.(Bild:  Ampere Computing)
Von Prozessoren über Ampere-optimierte KI-Frameworks zu den Anwendungsfällen bei Kunden.
(Bild: Ampere Computing)

Die SERDES-Schaltung hat die Aufgabe, serielle Datenströme in parallele umzuwandeln und umgekehrt. Das angepasste Protokoll bezieht sich auf ein maßgeschneidertes Kommunikationsschema, das speziell auf die Anforderungen des Chiplet-Designs und die interne Kommunikation abgestimmt ist.

Ampere One mit dem A2-Kern dürfte eine um rund 33 Prozent höhere Anzahl an Speichercontrollern und möglicherweise 40 bis 50 Prozent mehr Speicherbandbreite aufweisen. Bei zwölf Speichercontrollern mit einer Taktfrequenz der DIMMs von 7,8 GHz könnte die Speicherbandbreite Analysten zufolge um den Faktor 2,25 ansteigen. Sollte Ampere Computing DDR5-Speicher mit 6,4 GHz einsetzen, würde sich die Bandbreite pro Sockel verdoppeln.

Der nachfolgende dritte Generation von AmpereOne soll im 3N-Prozess von TSMC gefertigt werden. Dieser zukünftige Cloud-optimierte Chip dürfte über 256 Kerne verfügen. Ampere Computing beabsichtigt, für zukünftige Designs das Chiplet-Interconnect UCIe (Universal Chiplet Interconnect Express), eine in-Socket-Variante von PCI-Express, zu nutzen.

Schluss mit lustig: Benchmarks der ersten Generation von „Ampere One“ im Vergleich zu „AMD Epyc Genoa“.(Bild:  Ampere Computing)
Schluss mit lustig: Benchmarks der ersten Generation von „Ampere One“ im Vergleich zu „AMD Epyc Genoa“.
(Bild: Ampere Computing)

AWS scheint im „Graviton4“ ein Zwei-Chiplet-Design zu verwenden, welches die „Demeter“-V2-Kerne von ARM zu je 48 Stück pro Chiplet beinhaltet und mit zwölf DDR5-Speichercontrollern auftrumpfen kann. Wenn AWS sein monolithisches Compute-Die aufbrechen kann, dürfte auch Ampere Computing soweit sein.

Ampere Computing rüstet seine CPUs auf Biegen und Brechen für extreme KI-Inferenz aus. Der AmpereOne der ersten Generation (Kern A1) hat zwei 128-Bit-Vektoren, ähnlich wie ein Neoverse-N1- und N2-Kern. Ampere dürfte dies auf vier 128-Bit-Vektoren erweitern oder eine Tensor-Core-Matrix-Mathe-Einheit hinzufügen.

Mit dem Aufkommen der großen Sprachmodelle begannen CPU-Hersteller wie Intel oder IBM, Matrix-Mathe-Einheiten in ihre Designs zu integrieren, Intel in „Xeon Scalable“ (ehemals „Xeon SP“) und IBM in „Power10“-Prozessoren. Damit kann die Inferenz trotz steigender Anzahl von Parametern größtenteils auf CPUs bleiben, wo auch die zugehörigen Anwendungen laufen, zum Beispiel jene von Oracle.

Oracle erweitert aggressiv sein Rechenzentrumsgeschäft, um die steigenden Nachfrage nach KI-Arbeitslasten mit angemessenen Infrastrukturen gerecht zu werden. Diese Expansionsbemühungen umfassen den Einsatz umfangreicher GPU-Cluster von Nvidia und AMD, wobei die größten Campus-Entwicklungen fast ein Gigawatt an Kapazität erreicht haben sollen. Ampere passt in diese Pläne wie angegossen.

„Wenn wir oder unsere Co-Investoren eine dieser Optionen [zum Umtausch der Schulden gegen zusätzliches Eigenkapital] ausüben, würden wir die Kontrolle über Ampere erlangen und dessen Ergebnisse mit unseren Geschäftsergebnissen konsolidieren“, erklärte Oracle in dem Proxy-Bericht.

Im Jahr 2023 lag der Umsatz von Ampere bei rund 2,8 Milliarden Euro und soll sich bis 2031 knapp verzehnfachen. Dies entspricht einem jährlichen Wachstum von mehr als 30 Prozent im Laufe der kommenden paar Jahre.

*Das Autorenduo

Das Autorenduo besteht aus Anna Kobylinska und Filipe Pereia Martins. Die beiden arbeiten für McKinley Denali, Inc., USA.

Ihr Fazit lautet: Da GPUs ihren Käufern aufgrund hoher Preise und anhaltender Lieferverzögerungen des Öfteren sauer aufstoßen, bleiben „aufgebohrte“ CPUs eine verlockende Alternative.

(ID:50193936)