Die Nvidia-GPU-Konkurrenz Positron AI baut Beschleuniger-Chips mit enormen Arbeitsspeichern

Quelle: Pressemitteilung 2 min Lesedauer

Anbieter zum Thema

Nvidia führt den Markt für Grafikprozessoren an, die für KI-Rechnereien hergonommen werden. Diese GPUs sind teuer und nicht immer in gewünschtem Umfang zu bekommen. Das befeuert eine Start-up-Scene. Darunter das KI-Inferenz-Startup Positron AI, das nun 230 Millionen Dollar für die Entwicklung von Chips einsammeln konnte, die „mit Nvidia konkurrieren sollen“.

Der Chip „Asimov“, der 2027 auf dem Markt kommen soll, zeichne sich laut Hersteller insbesondere durch folgende Parameter aus: bis zu 2,3 TB Speicher pro Chip, 5-mal mehr Tokens pro Dollar und 5-mal mehr Tokens pro Watt  im Vergleich zu „Nvidia Rubin“ sowie 400 Watt TDP mit Unterstützung für Luftkühlung. (Bild:  Positron AI)
Der Chip „Asimov“, der 2027 auf dem Markt kommen soll, zeichne sich laut Hersteller insbesondere durch folgende Parameter aus: bis zu 2,3 TB Speicher pro Chip, 5-mal mehr Tokens pro Dollar und 5-mal mehr Tokens pro Watt im Vergleich zu „Nvidia Rubin“ sowie 400 Watt TDP mit Unterstützung für Luftkühlung.
(Bild: Positron AI)

Das 2023 gegründete Start-up Positron AI mit Sitz in Reno, Nevada, will Energie-effiziente Hardware entwickeln, die sich inbesondere für Inferenz-Workloads eignen. Nun hat das Unternehmen in einer überzeichneten Serie-B-Finanzierungsrunde 230 Millionen Dollar für die Entwicklung dieser Chips einsammeln können. Der wert des Unternehmens ist damit auf 1 Milliarde Dollar geklettert. Die Finazierungsrunde ist gemeinsam von Arena Private Wealth, Jump Trading und Unless geleitet worden, unter Beteiligung neuer und bestehender Investoren, etwa Qatar Investment Authority, ARM, Valor Equity Partners, Atreides Management und Flume Ventures.

Nach Angaben des Unternehmen können seine „Atlas“-Chips der ersten Generation die dreifache Rechenleistung pro Watt der „H100“-GPUs von Nvidia erreichen. Sie wurden Intel in den USA hergestellt und gehen derzeit an Kunden.

Die zweite Generation „Asimov“ unterstützt 2 Terabyte (TB) Speicher pro Beschleuniger und 8 TB Speicher pro Titan-System und unterstützt somit speicherintensive KI-Workloads. Nach Unternehmensaussagen erreicht der Chip damit eine Bandbreite, die mit der von „Nvidia-Rubin“-GPU vergleichbar ist. Auf Rack-Ebene entsprechen diese Zahlen, so Pisitron AI einer Speicherkapazität von insgesamt mehr als 100 TB.

Die künftige Chip-Generation

Die Chip-Generation soll im kommenden Oktober, 16 Monate nach Beginn des Designprozesses für den Chip, fertiggestellt sein; die Produktion ist für Anfang 2027 geplant

Mitesh Agrawal, CEO von Positron AI, sagt, die Begeisterung der Investoren sei ein Spiegelbild der Marktnachfrage: „Die Energieverfügbarkeit hat sich als ein wesentlicher Engpass für den Einsatz von KI herausgestellt. Und unser Chip der nächsten Generation wird in unseren Kern-Workloads fünfmal mehr Tokens pro Watt liefern als die kommende Rubin-GPU von Nvidia.“

Und auch das werden Anwender gerne hören, die insbosondere von galoppierenden Speicherpreisen geplagt sind: „Der Speicher ist der andere große Engpass bei der Inferenz“, setzt Agrawal an. „Unsere Asimov-Chips werden im kommenden Jahr mit über 2.304 Gigabyte (GB) RAM pro Gerät ausgeliefert.“ Bei Nvidia Rubin seien es „nur“ 384 GB.

Kennzahlen für den geplanten Silizium-Chip „Asimov“. (Bild:  Positron AI)
Kennzahlen für den geplanten Silizium-Chip „Asimov“.
(Bild: Positron AI)

Der Chip ist nicht zwangsläufig als Universal-Lösung für jeden Workload gedacht. Aber bei Workloads wie Video, Handel, Modellen mit mehreren Billionen Parametern und allem, was ein enormes Kontextfenster erfordert, mache das Positron-Design einen „entscheidenden Unterschied“. Agrawal: „Wir gehen auch davon aus, dass wir Rubin bei der Leistung pro Dollar für spezielle speicherintensive Workloads übertreffen werden.“

Artikelfiles und Artikellinks

(ID:50705753)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung