Auf Basis der Nvidia AI Data Platform Cloudian stellt S3‑kompatible KI‑Infrastruktur vor

Von Michael Matzer 3 min Lesedauer

Anbieter zum Thema

Eine KI‑fähige Lösung für den hausinternen Einsatz (On-Prem) vereinfacht die Bereitstellung integrierter Plattformen für beschleunigte Rechen- und Speichernetzwerke in „S3“‑kompatiblen Enterprise‑Umgebungen – besonders wichtig für MSPs. Nutzbar sind ausschließlich firmeninterne Daten, und zum Einsatz kommt ein durch Air-Gap abgesichertes Sprachmodell (LLM).

Eine Top-Level-Ansicht auf die „Cloudian AIDP“: Auf der Basis der DAIP kann KI Unternehmensdaten in KI-Erkenntnisse umwandeln.(Bild:  Cloudian)
Eine Top-Level-Ansicht auf die „Cloudian AIDP“: Auf der Basis der DAIP kann KI Unternehmensdaten in KI-Erkenntnisse umwandeln.
(Bild: Cloudian)

Cloudian, ein Anbieter softwaredefinierter Objektspeicherlösungen, hat seine „Hyperscale AI Data Platform“ vorgestellt. Diese KI‑fähige Lösung basiert auf S3‑API‑Speicher, sei kompatibel mit bestehenden Datensätzen und Anwendungen und lasse sich nahtlos bis in den Exabyte‑Bereich skalieren.

Die Plattform unterstützt das S3‑Speicherprotokoll über Remote Direct Memory Access (RDMA), das die CPU und den TCP/IP-Stack umgeht, und soll dadurch höhere Leistung und Effizienz für KI‑Workloads bieten. Die Plattform basiert nach Angaben des Herstellers auf der „Nvidia-RTX-PRO-6000-Blackwell“-Server-Edition-GPU und folgt dem Referenzdesign der „Nvidia AI Data Platform“.

Bildergalerie

Die Cloudian Hyperscale AI Data Platform soll eine der zentralen Herausforderungen bei der Einführung von Agentic AI und GenAI lösen: Ihre umfangreichen Bestände an unstrukturierten Daten lassen sich sofort für KI‑Anwendungen erschließen und nutzbar machen. Damit könnten Organisationen auf die 90 Prozent ihrer Daten zuzugreifen, die unstrukturiert vorliegen, beispielsweise Berichte, Handbücher, Präsentationen und Multimedia-Inhalte, die das interne Wissen ausmachen.

Komplexe Infrastrukturanforderungen eliminieren

Traditionelle KI‑Implementierungen erfordern in der Regel komplexe, dedizierte Dateisysteme und separate Vektordatenbanken, um die nötige Performance zu erreichen, ein kostenintensiver und zeitaufwändiger Prozess, der spezielles Know-how verlangt, das vielen IT-Teams fehlt. Sie müssten entweder in neue Talente investieren oder sich mit einer schlechteren KI-Leistung zufriedengeben.

Cloudian will diese Hürden beseitigen, indem Unternehmen KI‑Applikationen direkt auf den nativen S3‑kompatiblen Datenquellen betreiben können, also ohne zusätzliche Dateisystemebenen oder eine separate Vektordatenbank‑Infrastruktur. Dieser Ansatz reduziere die Komplexität drastisch, beschleunige Implementierungen und erlaube es, bestehendes IT‑Know‑how und vorhandene Infrastrukturinvestitionen optimal zu nutzen.

Unternehmensdaten in KI‑fähige Informationen verwandeln

Die Technik bringe KI‑Rechenleistung direkt an die Datenspeicher und mache diese automatisch zur KI‑fähigen Infrastruktur. Dank einer in die Speicherebene integrierten Vektordatenbank würden multimodale, unstrukturierte Inhalte automatisch aufgenommen, eingebettet und indiziert. So ließen sich Daten sofort über Vektorsuchschnittstellen finden und für RAG-Workflows (Retrieval‑Augmented‑Generation) bereitstellen.

Dieser Ansatz soll sicherstellen, dass KI‑Agenten im gesamten Unternehmen Informationen nahezu in Echtzeit auffinden, durchsuchen und analysieren können. Datensilos würden aufgelöst, und Unternehmen könnten in der Agentic-AI-Ära, in der KI‑Systeme unmittelbaren Zugriff auf das gesamte interne Wissen benötigen, ihre Wettbewerbsfähigkeit sichern. Die oben erwähnte S3‑over‑RDMA‑Fähigkeit steigere die Leistung zusätzlich, indem sie höhere Lese‑ und Schreibdurchsätze liefere und den Zugriff auf KI‑Speicherressourcen optimiere.

Infrastruktur für KI‑Agenten

Durch die Kombination aus beschleunigtem Computing und integrierten Vektordatenbank‑Funktionen direkt auf der Speicherebene mache die Hyperscale AI Data Platform den Aufbau und Betrieb komplexer, separater KI‑Infrastrukturen überflüssig. Dieser Ansatz beseitige technische Barrieren, die die KI‑Einführung bislang erschwert hätten, und ermögliche eine schnelle Bereitstellung auf Basis vorhandener IT‑Fähigkeiten und bestehender Infrastruktur.

Wesentliche Komponenten der Lösung sind Nvidia-RTX-PRO-6000-Blackwell-GPUs, /„Nvidia-Bluefield-DPUs“ und „Nvidia-AI-Enterprise“-Software, darunter „Nvidia NIM“ Microservices und Nvidia NeMo Retriever Microservices. „Nvidia-Spectrum‑X“-Ethernet‑Networking liefere mit RDMA und direkten Datenpfaden zwischen Storage, Systemspeicher und GPU‑Speicher eine hohe Performance von bis zu 35 GB/s pro Knoten (Lesegeschwindigkeit). Dies soll bis auf Terabytes pro Sekunde skalierbar sein.

Das System ermöglicht es Unternehmen, KI‑Agenten bereitzustellen, die das gesamte Unternehmenswissen sofort verstehen, abfragen und auswerten können und schafft damit die Basis, um KI‑Agenten zentral in Geschäftsprozesse zu integrieren. „Die Hyperscale AI Data Platform markiert einen grundlegenden Wandel in der Art und Weise, wie Unternehmen ihre KI‑Readiness angehen“, sagt Neil Stobart, CTO bei Cloudian.

Bildergalerie

Cloudian-Objektspeicher wird in der „Hyperstore“-Produktfamilie angeboten. Hierauf lässt sich mit S3 zugreifen, aber auch mit SMB und NFS. Die Hyperstore-Nodes können sowohl Festplatten als auch TLC-NVMe-SSDs enthalten.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Als Sprachmodell verwendet die Hyperscale AI Data Platform das „Llama-3.2-3B-Instruct“-LLM von Meta. Die vier Nvidia-GPUs pro Knoten erledigen jeweils eine Aufgabe, nämlich LLM-Inferenz, Arbeiten der Vektordatenbank, Re-Ranking und Relevanz sowie eine gemeinsame Aufgabe für Vektor-Einbettungen und andere Aufgaben.

Der Nutzer bedient eine einfache grafische Benutzeroberfläche, in der er im Prompt Fragen stellen und sie dann verfeinern kann, ähnlich wie in „ChatGPT“ oder einem anderen Chatbot. Die naheliegenden Use-Cases sind die Abfrage von Unternehmenswissen, die Abfrage geschützter Dokumente, die Auswertung von Video-Inhalten sowie der Aufbau von Datenableitungen und Audit-Trails im Hinblick auf Compliance und Governance.

(ID:50645475)