„Rack-less“ nachhaltig Hala Point, die neuromorphe „Super-Kiste“ von Intel

Von Anna Kobylinska und Filipe Martins* 8 min Lesedauer

Anbieter zum Thema

Das erste neuromorphe System im großen Maßstab ist aus den Startlöchern: Das Super-System von Intel „Hala Point“. Mit dem Forschungscomputer will der Chip-Riese die drohende KI-Energiekrise abwenden. Rechenleistung, Neuroplastizität und Energie-Effizienz gehen offenbar Hand in Hand.

Würde in einem Backofen Platz haben: „Intel Hala Point“ mit 1.152 neuromorphen Prozessoren „Loihi 2“ und 2.300 eingebetteten x86er bei einer maximalen Leistungsaufnahme von 2.600 Watt. (Bild:  Intel Corporation)
Würde in einem Backofen Platz haben: „Intel Hala Point“ mit 1.152 neuromorphen Prozessoren „Loihi 2“ und 2.300 eingebetteten x86er bei einer maximalen Leistungsaufnahme von 2.600 Watt.
(Bild: Intel Corporation)

Konventionelle Chip-Architekturen leiden alle unter demselben Problem: Sie können nicht 'mal eben spontan auf neue Anforderungen reagieren. Sie überkompensieren ihre nicht-existente Anpassungsfähigkeit, indem sie kontinuierlich übers Ziel hinausschießen (in übertragenem Sisse). Darum verschwenden sie Energie. Das Gehirn macht es anders.

Das Gehirn lässt nämlich nur jene Neuronen feuern, für die es auch etwas zu tun gibt. Das reduziert den Energiebedarf und fördert die Neuroplastizität hin zu noch mehr Effizienz. Zudem entwickelt sich natürliche Intelligenz weiter während der produktiven Nutzung. Der durchschnittliche Energieverbrauch: so um die 20 Watt.

Im Gegensatz dazu wirft die IT-Industrie mit Energie nur so um sich. Bisher ging es ja nicht anders. Am Anbruch der KI-Ära spitzen sich die Herausforderungen noch zu.

Das Autoren-Duo

Das Autorenduo besteht aus Anna Kobylinska und Filipe Pereia Martins. Die beiden arbeiten für McKinley Denali, Inc., USA.

Ihr Fazit lautet: Das einzigartige Leistungsprofil neuromorpher Systeme verspricht transformative Auswirkungen in einer Vielzahl von anspruchsvollen Anwendungsfällen (siehe dazu: das eBook „Future IT“ von Data Center Insider). Mit seinem Forschungscomputer „Hala Point“ hat Intel einen bedeutenden Meilenstein erreicht: Erstmals lassen sich gängige KI/ML-Modelle „neuromorphisch“ umsetzen.

Jetzt liegt der Ball in der Nutzergemeinde.

Problem erkannt

Tiefe Neuronale Netze (Deep Neural Networks, DNNs) zeigen eine nahezu unbegrenzte Skalierbarkeit, aber brauchen enorme Rechenleistung und setzen große Mengen an vorab vorhandenen Datenbeständen voraus. Viele aufkommende KI-Anwendungsfälle – insbesondere jene in unberechenbaren realen Umgebungen mit Leistungs-, Latenz- und Datenbeschränkungen – vertragen sich nicht mit diesen Grundvoraussetzungen. Es sind grundlegend neue Ansätze vonnöten.

Bei Intel sah man schon vor vielen Jahren das Menetekel an der Wand. Die Forschung an neuromorphen Chips läuft seit 2011 auf Hochtouren. Mike Davies, Leiter des Labors für Neuromorphes Computing bei Intel Labs, argumentiert: „Die Kosten für das Berechnen von KI-Modellen steigen in einem nicht haltbaren Tempo an. Die Branche braucht frische neue Ansätze, welche [das benötigte Maß an] Skalierbarkeit unterstützen.“

Mit Hala Point will die Halbleiterschmiede eine Brücke zu mehr KI-Nachhaltigkeit schlagen.

Hala Point ist das erste neuromorphe System der Welt, auf dem sich gängige KI-Modelle ausführen lassen – und das mit einem Bruchteil des Energiebedarfs konventioneller Architekturen.

Hirnsache

Neuromorphes Computing wagt eine grundlegende Neugestaltung der Computerarchitektur auf Transistorebene, inspiriert von der Form und Funktion der biologischen neuronalen Netzwerke im Gehirn. denn trotz jahrzehntelanger Fortschritte in der Computertechnologie bleiben biologische neuronale Schaltkreise unübertroffen in ihrer Fähigkeit, intelligent auf reale Daten zu reagieren, diese zu verarbeiten und daraus zu lernen – und das bei Mikrowatt-Leistungsniveaus und Millisekunden-Reaktionszeiten.

„Intel Hala Point“, das weltweit größte und bisher fortschrittlichste neuromorphe System, rechnet mit bis zu 1,15 Milliarden künstlichen Neuronen.(Bild:  Intel Cprporatiion)
„Intel Hala Point“, das weltweit größte und bisher fortschrittlichste neuromorphe System, rechnet mit bis zu 1,15 Milliarden künstlichen Neuronen.
(Bild: Intel Cprporatiion)

Neuromorphes Computing zielt somit nicht auf die Erschaffung bewusstseinsfähiger KI-Systeme ab, sondern vielmehr darauf, Systeme zu entwickeln, die kognitive Aufgaben ähnlich wie das menschliche Gehirn bewältigen. Neuromorphes Computing orientiert sich an den Prinzipien der biologischen neuronalen Verarbeitung.

Es bricht mit den vertrauten Algorithmen und Programmierabstraktionen der konventionellen Computertechnologie. Das Ziel besteht darin, eine Computerarchitektur zu entwickeln, die von Natur aus die gesamte Bandbreite der intelligenten Informationsverarbeitung abdecken kann, die ein lebendes neuronales Netz (zum Beispiel das menschliche Gehirn) mühelos bewältigt: Rechnen und gleichzeitig Daten speichern, in Echtzeit lernen und gleichzeitig Vorhersagen treffen.

Die Erwartungen sind hoch

Neuromorphes Computing verspricht enorme Effizienz- und Leistungsgewinne im Vergleich zu herkömmlichen Architekturen, die jeweils nur eine Aufgabe auf einmal bewältigen können: entweder nur Rechnen oder nur Daten speichern, entweder nur lernen oder nur inferieren. Der ganze Aufwand mit dem Transport von Daten zwischen separaten Systemkomponenten entfällt im neuromorphen Computing.

Ein einzelner „Loihi 2“-Prozessor von Intel kommt bei den meisten Arbeitslasten mit je einem Watt Energie aus.(Bild:  Intel Corporation)
Ein einzelner „Loihi 2“-Prozessor von Intel kommt bei den meisten Arbeitslasten mit je einem Watt Energie aus.
(Bild: Intel Corporation)

Mit ihrer Fähigkeit, zu lernen und sich anzupassen, ohne auf umfangreiche externe Infrastrukturen und massive Datenbestände angewiesen zu sein, bieten sich neuromorphe Chips für den Einsatz an der Edge geradezu an.

„Rack-less“, dafür nachhaltig

Intels neuester Geistesblitz, Hala Point, ist das weltweit größte und fortschrittlichste neuromorphe System. Intel spendierte der Kiste 1,15 Milliarden künstliche Neuronen und 128 Milliarden Synapsen, verteilt über 140.544 neuromorphe Rechenkerne.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Im Inneren von Hala Point werkeln 1.152 neuromorphe Prozessoren „Loihi 2“ und 2.300 eingebettete x86er. Das Ganze passt in ein 6U-großes „Datencenter-freundliches“ Gehäuse, das etwa so viel Platz belegt wie ein Backofen.

Mit seinen 15 TOPS/W (Engl. Trillion Operations Per Second per Watt) schlägt das System Rekorde der Leistungsfähigkeit und Energie-Effizienz. Die maximale Leistungsaufnahme des ganzen Systems beträgt gerade einmal 2.600 Watt. - Ein einzelner Loihi 2-Prozessor kommt übrigens bei den meisten Anwendungen mit je einem Watt Energie aus.

Den Nerv muss man haben

Um die Funktionsweise von Neuronen nachzubilden, hat sich Intel auf die eigenen Stärken besonnen. Loihi 2 ist der erste Prozessor, den Intel auf dem 4-Prozessknoten (in 7nm) fertigen konnte.

Jeder Loihi 2-Chip verfügt über sechs eingebettete Mikroprozessorkerne vom Typ „Lakemont x86“ (Loihi hatte nur drei), bis zu 128 asynchrone Neuronenkerne (NCs) und ein asynchrones Network-on-Chip (NoC) mit Multi-Chip-Skalierbarkeit. Ein einzelner Loihi-Chip kann bis zu 1 Million Neuronen und 120 Millionen Synapsen bereitstellen.

Die Neuronenkerne sind für neuromorphische Arbeitslasten optimiert. Jeder der Neuronenkerne implementiert eine Gruppe von künstlichen Spike-Neuronen samt den erforderlichen Synapsen.

Die Kommunikation zwischen den Neuronenkernen erfolgt in Form von Spike-Nachrichten.

Die Mikroprozessorkerne in einem Loihi 2 sind auf Spike-basierte Kommunikation hin optimiert und können C-Code ausführen, zum Beispiel, um das Netzwerk zu konfigurieren, Datenflüsse über E/A-Operationen zu steuern und ihre „Arbeitslasten“ zu überwachen. Direkt benachbarte Chips sind mit Pin-zu-Pin-Verbindungen aneinander „verdrahtet“. Parallele E/A-Schnittstellen erweitern das On-Chip-Mesh auf bis zu 16.384 Chips.

„Kapoho Point“, das ultrakompakte Board von Intel mit acht „Loihi 2“ Chips (vier oben, vier unten), ist stapelbar und hat eine Ethernet-Schnittstelle. (Bild:  Intel Labs)
„Kapoho Point“, das ultrakompakte Board von Intel mit acht „Loihi 2“ Chips (vier oben, vier unten), ist stapelbar und hat eine Ethernet-Schnittstelle.
(Bild: Intel Labs)

Loihi 2 unterstützt vollständig programmierbare Neuronenmodelle mit abgestuften Spikes. Jedes Neuronenmodell ist im Grunde genommen ein Stück Software, bestehend aus einer kurzen Folge von Microcode-Anweisungen, die das Verhalten des Neurons beschreiben. Der Microcode-Befehlssatz unterstützt Bit- und grundlegende mathematische Operationen zusätzlich zu bedingter Verzweigung, Speicherzugriffen und speziellen Anweisungen für die Spike-Erzeugung und -Prüfung.

Um Ergebnisse zu kommunizieren, geben Loihi-2-Neuronen abgestufte Spitzen aus, die ganzzahlige Datennutzlasten kodieren. Optimierte Konnektivitätsschemata nutzen Sparsity und erlauben Faltung, prozedurale Generierung und faktorisierte Gewichtsverteilung, um die Effizienz des Synapsenspeichers radikal zu verbessern. Der On-Chip-Synapse-Status unterstützt auch programmierbare, auf Spike-Timing basierende Plastizitätsregeln.

Asynchrone digitale Schaltkreise erlauben eine bis zu 10-mal schnellere Verarbeitung der Spikes im Vergleich zu Loihi. Zusammen mit einer dichteren Prozesstechnologie erweitert dies die Algorithmen und Anwendungs-Workloads, die ein oder mehrere Loihi-2-Chips in Echtzeit adressieren können.

N(i)x da

Eine der größten Herausforderungen, die die Kommerzialisierung der neuromorphen Technologie behindern, stellt die hohe Fragmentierung des aufkeimenden Software-Ökosystems dar. Neuromorphes Computing ist grundlegend inkompatibel mit herkömmlichen Programmiermodellen, einschließlich der heute weit verbreiteten Machine-Learning- und KI-Frameworks. Neuromorphe Architekturen sind inkompatibel miteinander. Es fehlen Standards und ausgereifte Werkzeuge.

Neuromorphe Software für verschiedene Plattformen hat also gar keinen gemeinsamen Nenner. Die Entwicklung folgt keinem roten Faden. Ein einheitliches Konzept fehlt.

Vor diesem Hintergrund zeigt sich Intel bemüht, eine Gemeinde um ein offenes Ökosystem neuromorphischer Innovationen aufzubauen. Für die Programmierung von Loihi, der ersten Generation des neuromorphen Prozessors, hatte Intel mit dem „Nx SDK“ ein Softwarepaket mit Low-Level-Abstraktionen entwickelt. Loihi 2 wird mit „Lava“ ausgeliefert, dem quelloffenem Software-Framework von Intel für die Entwicklung neuroinspirierter Anwendungen und Modellierung auf neuromorphen Plattformen. Im Gegensatz zum Nx SDK ist das Lava Framework Hardware-agnostisch, also in keiner Weise an die neuromorphen Chips von Intel gebunden, und erweiterbar.

Lava, Magma & Co.

Lava hat eine modulare und zusammensetzbare Architektur. Das übergeordnete Ziel bestand darin, die Konvergenz neuromorpher Plattformen auf einer gemeinsamen, offenen Softwarebasis zu ermöglichen, um die neuromorphe Programmierung einer breiteren Entwicklergemeinschaft zugänglich zu machen.

Lava enthält „Magma“, eine Low-Level-Schnittstelle für die Abbildung und Ausführung neuronaler Netzwerkmodelle und sequenzieller Prozesse auf neuromorpher Hardware. Diese Schicht umfasst nun plattformübergreifende Ausführungsunterstützung für die Vorab-Simulation von neuromorphen Anwendungen auf konventionellen CPUs/GPUs. (Siehe hierzu auch den Beitrag: „Goldrausch um KI-Chips; GPU-Wahnsinn… und (A)KI-Tollheiten“). Diese Schicht umfasst auch einen Profiler, der die Leistung und den Energieverbrauch auf den anvisierten Back-End-Plattformen messen oder vorhersagen kann.

Lava unterstützt kanalbasierte asynchrone Nachrichtenübermittlung, die sowohl konventionelle als auch neuromorphe Komponenten unterstützt. Die Kommunikation zwischen allen Prozessen erfolgt über ein ereignisbasiertes 'Message-Passing-Backbone' und eine für alle Prozesse verfügbare API.

Das neuromorphische Forschungsteam hinter „Hala Point“ bei Intel (von links nach rechts): Patricio Martinez, Platform Hardware Design Engineer, Eduardo Quijano Centeno, Leitender Platform Hardware Design Engineer, Gerardo Peralta Francisco, Platform Hardware Designer, Leobardo Campos Macias, AI Applied Research Scientist. (Bild:  Intel Corporation)
Das neuromorphische Forschungsteam hinter „Hala Point“ bei Intel (von links nach rechts): Patricio Martinez, Platform Hardware Design Engineer, Eduardo Quijano Centeno, Leitender Platform Hardware Design Engineer, Gerardo Peralta Francisco, Platform Hardware Designer, Leobardo Campos Macias, AI Applied Research Scientist.
(Bild: Intel Corporation)

Nachrichten in Lava variieren in ihrer Granularität von Einzelbit-Spikes (Loihi) bis zu gepufferten Paketen mit beliebigen Nutzdaten. Damit steht den Entwicklern ein übergreifendes Programmierparadigma wahlweise für sequenzielle Prozesse oder für extreme Parallelität zur Verfügung.

Ereignisgetriebene Schnittstellen zu Frameworks wie dem „Robotic Operating System“ (ROS), „YARP“, „Tensorflow“, „Pytorch“, „Nengo“ und anderen erlauben die Erstellung von Anwendungen, die mit cyber-physischen Systemen der realen Welt interagieren. Alle Bibliotheken und Funktionen in Lava sind über Python verfügbar; einige liegen leistungsoptimiert als C/C++/CUDA/OpenCL-Code vor.

Die Software steht unter BSD-3- und LGPL-2.1-Lizenzen zur freien Verfügung. Die Komponenten der untersten Ebene, die für die Bereitstellung von Anwendungen auf Loihi 2-Hardware-Systemen erforderlich sind, liefert Intel leihweise und kostenfrei an engagierte Mitglieder der Intel NRC-Gemeinde (Intel Neuromorphic Research Community). Die Mitgliedschaft ist kostenfrei und steht weltweit „allen qualifizierten Teilnehmern“ (aus akademischen, staatlichen und industriellen Organisationen) offen.

Die Namensgebung

In Intels neuromorpher Nomenklatur stechen geologische, geographische und sogar botanische Referenzen zu Hawaii hervor. In Anspielung an die Fähigkeit dieser malerischen Vulkaninseln, ihre Topologie zu verändern und doch in Sachen Resilienz zu punkten, bekommen die aspirierenden Anwenderorganisationen die eine oder andere Lektion über neuromorphes Computing „zwischen den Zeilen“ serviert.

  • Lōʻihi ist ein aktiver Unterwasservulkan, südlich von der Südostküste der Insel Hawaii gelegen. Kapoho Point, Intels ultrakompaktes Board mit acht Loihi 2 Chips (vier oben, vier unten), ersetzt seinen Vorgänger, Kapoho Bay. (Die geografische Referenz: Kapoho Bay in Hawaii war ein begehrtes Urlaubsziel, bis die Bucht samt benachbarten Häusern, innerhalb von nur wenigen Stunden, mit heißer Lava überschwemmt und bis zur Unkenntlichkeit verunstaltet wurde. Das neue geologische Merkmal der Küste ist als Kapoho Point bekannt. „Point“ statt „Bay“ weil es jetzt über Wasser statt unter Wasser liegt.
  • Hala ist ein Strauch (Lateinisch: Pandanus tectorius), der an der Hawaiianischen Küste wächst. Die Fähigkeit der Pflanze, sich mit stabilen Stützwurzeln in anspruchsvollen Böden zu verankern, reflektiert die Widerstandsfähigkeit der Natur – nicht zuletzt vor dem Hintergrund umwälzender geologischer Katastrophen. Der Hala-Baum verkörpert Resilienz und unterstreicht die tiefe spirituelle Verbindung zwischen dem Hawaiischen Volk und seinem Land.

Intel hofft offenbar, durch die aktive Förderung der NRC-Gemeinde tiefe Wurzeln zu schlagen. Die kommerzielle Verfügbarkeit neuromorpher Systeme dürfte nicht lange auf sich warten lassen.

(ID:50067543)