Hewlett Packard Enterprise bringt mit „HPE Swarm Learning“ eine Software für das dezentrale KI-Training auf den Markt. Damit können verschiedene Standorte und Organisationen KI-Trainingsergebnisse teilen, ohne Rohdaten auszutauschen. Um das Training von KI-Modellen zu beschleunigen oder erst einmal zu ermöglichen, bietet HPE ein Komplettsystem an: eine Softwareplattform für Maschinelles Lernen, HPC-Systeme, Beschleuniger, Netzwerke und System-Management.
Hewlett-Packard Enterprise bringt mit „HPE Swarm Learning“ eine Software für das dezentrale KI-Training auf den Markt und stellt mit „HPE Machine Learning Development System“ ein Komplettsystem für KI und ML vor.
Das „HPE Machine Learning Development System“ ist eine integrierte und vorkonfigurierte KI-Infrastruktur, die sofort einsetzbar ist. Als Teil des Angebots bietet „Pointnext Services“ eine Vor-Ort-Installation und ein Software-Setup. Das System ist sofort als Basismodul mit Erweiterungsoptionen verfügbar. Die kleine Konfiguration enthält:
Das „HPE Machine Learning Development Environment“, womit Unternehmen Modelle schnell entwickeln, iterieren und skalieren können – von der Testphase bis zur Produktionsreife. Die ML-Software stammt aus der Übernahme von Determined AI und wurde inzwischen umbenannt.
Das „HPE Apollo 6500 Gen10 Plus“- System, das Rechenkapazität zum Trainieren und Optimieren von KI-Modellen bietet und mit 8 „Tensor-Core“-GPUS von Nvidia mit 80 Gigabyte (GB) Arbeitsspeicher bestückt ist
System-Management mit der Software „HPE Performance Cluster Management“, dem Server „Proliant DL325“ und 1Gb-Ethernet-Switches des Typs „Aruba CX 6300“.
Hochgeschwindigkeitsübertragung mit „Nvidia Quantum Infiniband“
Das HPE-System trägt unter anderem dazu bei, die Genauigkeit der Modelle durch verteiltes Training, automatische Hyperparameter-Optimierung und Neural Architecture Search zu verbessern. Zu den Pilotanwendern des HPE Machine Learning Development System gehört das deutsche Startup Aleph Alpha.
Das „HPE Machine Learning Development System“ soll die Komplexität von KI-Projekten reduzieren und die Zeit bis zum Produktiveinsatz merklich verkürzen.
(Bild: HPE)
Das Unternehmen trainiert mit dem HPE-System sein multimodales KI-Modell, das Natural Language Processing (NLP) und Computervision verbindet. Das Modell kombiniert damit Bild- und Texterkennung für fünf Sprachen mit einem menschenähnlichen Kontextverständnis. Nach der Bereitstellung des HPE Machine Learning Development System konnte Aleph Alpha in Rekordzeit mit dem Training beginnen. Zum Einsatz kommen dabei Hunderte von GPUs.
Jonas Andrulis, Gründer und CEO von Aleph Alpha, erläutert: „Das HPE Machine Learning Development System gibt uns eine erstaunliche Effizienz und eine Leistung von mehr als 150 TeraFlops. Das System wurde schnell aufgesetzt, und wir konnten mit dem Modell-Training innerhalb von Stunden anstatt erst nach Wochen beginnen.“ Er setzt hinzu: „Angesichts unserer gewaltigen Workloads und unserer laufenden Forschungstätigkeit ist es ein großer Vorteil, sich auf eine integrierte Lösung für Deployment und Monitoring verlassen zu können.“
Notwendig: Nutzerfreundlichkeit erhöhen und Komplexität senken
Laut IDC haben Unternehmen in Bezug auf KI-Infrastruktur im Schnitt einen niedrigen Reifegrad. Das sei oft der Grund für das Scheitern von KI-Projekten (siehe: Kasten). In der Regel erfordere die Einführung einer KI-Infrastruktur einen komplexen, mehrstufigen Prozess, der den Kauf, die Einrichtung und Verwaltung eines hochgradig parallelen Software-Ökosystems und einer maßgeschneiderten Infrastruktur umfasst.
Künstliche Intelligenzen lernen voneinander
Zunächst setzt Justin Hotard, Executive Vice President und General Manager, HPC & AI, HPE, für alle Unbedarften auseinander, was Swarm Learning überhaupt sein soll: „Schwarmlernen ist ein neuer, leistungsstarker KI-Ansatz, mit dem bereits Fortschritte bei der Bewältigung globaler Herausforderungen erzielt wurden – etwa bei der Verbesserung der Gesundheitsversorgung und beim Erkennen von Anomalien in der Betrugsaufdeckung und bei der vorausschauenden Wartung.“
Der Clou dabei: Die Daten, die von KI-Systemen interpretiert werden, können aus verschiedenen Quellen kommen und müssen trotzdem nicht verschoben, dupliziert oder ausgetauscht werden (siehe Video: „What is Swarm Learning?“). „HPE trägt auf bedeutende Weise zur Verbreitung des Schwarmlernens bei, indem es eine für größere Organisationen geeignete Lösung bereitstellt, mit der diese zusammenarbeiten, Innovationen voranbringen und die Leistung ihrer KI-Modelle steigern können – während sie zugleich ihre ethischen, datenschutzrechtlichen und regulatorischen Standards einhalten“, so Hotard.
HPE Swarm Learning löst Probleme des zentralisierten KI-Trainings
Das Problem bisher: KI-Modell-Training findet üblicherweise an einem zentralen Standort mit zentralisierten Datensätzen statt. Dieser Ansatz kann jedoch ineffizient und kostspielig sein, wenn große Datenmengen an einen Ort geschickt werden müssen. Oft verhindern zudem Datenschutz oder Bedenken hinsichtlich der Datensouveränität eine Zentralisierung der Daten. Die Folge kann sein, dass zu wenige Daten für das KI-Training zur Verfügung stehen.
Aufklappen für Details zu Ihrer Einwilligung
Stand vom 30.10.2020
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von redaktionellen Newslettern nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://support.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung, Abschnitt Redaktionelle Newsletter.
HPE Swarm Learning versetzt Organisationen in die Lage, verteilte Datenquellen für das KI-Training zu nutzen, ohne dass die Quelldaten transferiert werden. Stattdessen teilen sie KI-Trainingsergebnisse in Form von Modellparametern.
Mit der HPE-Software „Swarm Learning“ können Standorte oder Organisationen KI-Lernergebnisse austauschen, ohne den Datenschutz zu verletzen.
(Bild: HPE)
Dieses Verfahren wird über eine Blockchain organisiert. Sie steuert beispielsweise die Aufnahme von Schwarm-Mitgliedern und die wiederkehrende Wahl eines Mitglieds, das im jeweiligen Trainingszyklus die Modellparameter zusammenführt. Das gibt dem Schwarmnetzwerk Stabilität und Sicherheit. Zudem können große Datenmengen für das KI-Training erschlossen werden, ohne den Datenschutz oder die Datensouveränität zu beeinträchtigen.
Zu den möglichen Einsatzgebieten von HPE Swarm Learning gehören beispielsweise die folgenden:
Krankenhäuser können KI-Trainingsergebnisse etwa aus CT- und MRT-Scans oder aus Genexpressionsdaten mit anderen Krankenhäusern teilen, um die Diagnose von Krankheiten zu verbessern und gleichzeitig die Patientendaten zu schützen.
Banken und Finanzdienstleister können Kreditkartenbetrug bekämpfen, indem sie betrugsrelevante Modellparameter mit mit anderen Finanzinstituten austauschen.
Fertigungsstandorte können mit Schwarmlernen ihre vorausschauende Wartung verbessern, indem sie Trainingsergebnisse aus Sensordaten aus mehreren Produktionsstandorten sammeln.
Erfolge in der Krebsforschung und in der Betrugserkennung
Zu den ersten Anwendern von HPE Swarm Learning gehört ein Team von Krebsforschern am Universitätsklinikum der RWTH Aachen. Dieses hat eine Studie durchgeführt, um die Diagnose von Darmkrebs zu verbessern, indem es KI auf die Bildverarbeitung anwendet. Damit will man genetische Veränderungen vorhersagen, die dazu führen können, dass Zellen krebsartig werden.
Die Forscher haben KI-Modelle mithilfe von HPE Swarm Learning mit Patientendaten aus Irland, Deutschland und den USA trainiert und die Vorhersageleistung mit zwei unabhängigen Datensätzen aus Großbritannien verglichen. Die Ergebnisse haben gezeigt, dass Schwarmlernen die KI-Modelle übertroffen hat, die nur auf lokalen Daten trainiert wurden.
Tigergraph, ein auf Betrugserkennung spezialisierter Anbieter von Graph-Analyse-Lösungen, kombiniert HPE Swarm Learning mit seinen eigenen Analysewerkzeugen, um ungewöhnliche Vorgänge bei Kreditkartentransaktionen möglichst schnell zu erkennen. Die Kombination erhöht die Genauigkeit beim Trainieren von ML-Modellen aus riesigen Mengen von Finanzdaten, die von mehreren Banken und Filialen an verschiedenen Standorten stammen.