Predictive Analytics im Datacenter-Storage

Mit HPE Infosight auf dem Weg zum autonomen Rechenzentrum

| Autor / Redakteur: Till Stimberg* / Ulrike Ostler

Je besser die Vorhersagen, desto sinnvoller die Maßnahmen, die ergriffen werden müssen. Im Rechenzentrum kann das automatisiert erfolgen.
Je besser die Vorhersagen, desto sinnvoller die Maßnahmen, die ergriffen werden müssen. Im Rechenzentrum kann das automatisiert erfolgen. (Bild: gemeinfrei - OpenClipart-Vectors/Pixabay / CC0)

Die Digitalisierung erhöht die Komplexität der IT-Infrastrukturen erheblich. Dem ist mit den bisherigen prozessorientierten Management-Methoden à la ITIL alleine nicht mehr beizukommen. Erforderlich ist vielmehr ein sich autonom verwaltendes und reparierendes Rechenzentrum.

Am 3. April 2018 meldeten viele Online-Medien eine folgenschwere Computerpanne bei der europäischen Flugsicherung Eurocontrol: Verloren gingen an diesem Tag alle Flugpläne, die vor 12.26 Uhr in das ETMFS (Enhanced Tactical Flow Management System) eingegeben wurden. Dieses System kontrolliert Flüge und Kapazitäten.

Die Folge: Schätzungsweise die Hälfte von 29.500 in Europa geplanten Flügen waren beeinträchtigt, statt der üblichen wurden Notfallverfahren verwendet. Erst um etwa 20 Uhr war das System wieder verfügbar.

Das Beispiel zeigt: Der Ausfall wichtiger IT-Einrichtungen hat unter Umständen gravierende Folgen. Umso wichtiger ist es, Ausfälle, Datenverluste oder auch nur Leistungseinbußen weitgehend zu verhindern und, falls sie doch einmal auftreten, so schnell wie möglich zu beheben.

Was bisher geschah

Bisher versuchte man, Zuverlässigkeit, Leistung und Verfügbarkeit durch strikte Steuerung und Kontrolle der IT-Prozesse sowie durch Überkapazitäten und Hardware-Redundanz zu erzielen. Im Zeitalter der sehr leistungsfähigen Multicore-Prozessoren, Flash-Speichermedien und der Virtualisierung tritt an die Stelle von Überkapazitäten und Redundanzen eine stärkere Verzahnung der Komponenten im Rechenzentrum.

Mehrere Applikationen laufen parallel auf einem System, und die Zahl der Applikationen steigt – jede mit eigenen Anforderungen. Das Marktforschungsunternehmen Enterprise Storage Group (ESG) stellte jüngst in ihrem Bericht: „IT Spending Intentions Survey 2017” fest, dass in 45 Prozent der Unternehmen mit mehr als 1.000 Mitarbeitern mehr als 500 Geschäftsanwendungen laufen. Weniger als 100 sind es nur bei 12 Prozent der befragten Unternehmen.

Ergänzendes zum Thema
 
HPE Infosight im Support

Gleichzeitig steigert die Digitalisierung die Geschwindigkeit von Marktveränderungen, Unternehmen müssen sich daran durch neue Applikationen und Services anpassen, um im Wettbewerb vorn zu bleiben, und die IT ist dabei zum wichtigsten Werkzeug geworden. Prozesssteuerungsverfahren wie ITIL (IT Infrastructure Library) sind dafür schlicht zu langsam.

Neue Anforderungen verlangen Tempo

Eine weitere, im Auftrag von HPE durchgeführte Untersuchung von ESG zeigte, dass Unternehmen heute hochkomplexe Infrastrukturen nutzen, deren Betriebskosten durch Fehlerbehebungsmaßnahmen und Produktivitätsausfälle signifikant nach oben schnellen können (siehe: „Die finanziellen Auswirkungen von HPE Infosight auf Predictive Analytics“, September 2017. An der Studie nahmen 489 Unternehmen aller Größenklassen und aus vielfältigen Branchen teil, darunter Fertigungsindustrie, Finanzwesen, Bildung, Verwaltung, Gesundheitswesen und Einzelhandel.) Die Fehlerursachen sind laut Aussage der Befragten mit konventionellen Methoden oft schwer zu finden, der Weg führt durch mehrere zeitraubende Eskalationsstufen, und oft schiebt einer der betroffenen Hersteller die Verantwortung auf den anderen. Lösungen dauern deshalb viel zu lang.

Einige Zahlen aus der ESG-Studie zeigen, was dies für die Verwaltung von Speicherinfrastruktur bedeutet. So besitzen 65 Prozent der Nutzer konventionell gemanagter Speicherlösungen designiertes Personal, das sich nur mit dieser Aufgabe befasst. Die durchschnittliche Zahl der Vollzeit-Äquivalente für die Speicherverwaltung beträgt bei ihnen 2,83.

Knapp die Hälfte der Storage-Administratoren mit konventionellem Management sieht sich mit 11 bis 15 Trouble Tickets pro Monat konfrontiert, die zu lösen bei 61 Prozent der Befragten einen Zeitaufwand von mindestens einer Stunde oder mehr bedeutet. Kein Wunder: Ist doch die Problemlösung oft verbunden mit dem mühseligen Nachvollzug der Störung, der Generierung von Protokolldateien und in komplexeren Fällen der Auseinandersetzung mit den Service Level 1 und 2, deren Wissen in der Regel für solche Probleme nicht ausreicht.

Bis ein Level-3-Mitarbeiter zu sprechen ist, dauert es bei 32 Prozent der Nutzer konventioneller Storage-Managementlösungen im Durchschnitt 84 Minuten. Alles in allem also viel unproduktive Zeitverschwendung.

Auch HPE 3Par wird heute mit HPE InfoSsght ausgeliefert.
Auch HPE 3Par wird heute mit HPE InfoSsght ausgeliefert. (Bild: HPE)

Eine neue Generation von IT-Management-Systemen

Nötig ist deshalb eine neue Generation von Management-Anwendungen, die durch Intelligenz und Automatisierung Administratoren von Alltagsarbeit entlasten und ihre Kapazitäten für wertsteigernde Tätigkeiten freisetzen. Am besten wäre es, wenn intelligente Algorithmen, gespeist durch Sensordaten der zu steuernden Systeme, Störungen oder Engpässe, Fehlkonfigurationen oder Optimierungsmöglichkeiten voll automatisch erkennen und vielleicht sogar selbsttätig beheben könnten.

Dafür steht „HPE Infosight“. Das Cloud-basierte Management- und Support-Tool war zunächst nur für „HPE Nimble Storage“ verfügbar, jetzt gibt es die Lösung auch für „HPE 3PAR“, die Primär-Storage-Plattform von HPE. Derzeit bietet das Produkt einen durch künstliche Intelligenz (KI) gesteuerten Empfehlungsmechanismus, eine Stack-übergreifende Analyse der IT-Infrastruktur und globale Reichweite. Was bedeutet das im Einzelnen?

  • Globale Reichweite: Die in der Cloud arbeitenden KI-Algorithmen werten die Daten der Hard- und Softwaresensoren in weltweit allen installierten HPE-Nimble-Storage- und in Zukunft auch der HPE-3PAR-Systeme in Echtzeit aus. Ein neues Cloud-Portal, das HPE Infosight und die Speicheranalyse-Plattform „HPE Storefront Remote“ kombiniert, ermöglicht den Kunden, detaillierte Leistungstrends, Kapazitätsvorhersagen, Statuschecks und Best-Practice-Informationen einzusehen.
  • Stack-übergreifende Analyse: Die analytischen Fähigkeiten von HPE Infosight überschreiten schon heute die Grenzen der Storage-Systeme. Die Lösung sammelt auch Informationen darüber, ob andere Systeme in der IT-Infrastruktur ordnungsgemäß arbeiten. Viele Informationen bekommt HPE InfoSight beispielsweise von den APIs der in zahlreichen IT-Umgebungen installierten VMware-Lösungen.
    Auch die an den Eingängen der Speichersysteme eintreffenden Datenströme werden überwacht, woraus Infosight dann Rückschlüsse auf Probleme im gesamtem Applikations- und Netzwerkstack ziehen kann. Dabei hilft die große globale Datenbasis, welche es den Produktalgorithmen erlaubt, Muster zwischen verschiedenen Installationen zu vergleichen.

Probleme außerhalb der Speicher

Laut ESG-Studie nutzen 71 Prozent der HPE-Nimble-Anwender HPE Infosight auch, um Probleme außerhalb der Storage-Infrastruktur zu finden und zu analysieren. Dabei zeigte sich, dass rund 54 Prozent der ursprünglich dem Speicherumfeld zugewiesenen Probleme ihre Ursache außerhalb der Storage-Lösungen hatte.

Bei einem Schweizer Unternehmen waren es nach eigenen Angaben sogar zwei Drittel der vermeintlichen Speicherprobleme, die eine andere Ursache hatten. Damit können die Speicheradministratoren von viel Arbeit befreit werden, die letztlich nur dem Nachweis dient, dass der eigene Bereich das Problem nicht verursacht hat.

Mit HPE Infosight sinkt bei HPE-Nimble-Nutzern der Zeitbedarf für die Fehlerbeseitigung um Dimensionen (Bild: ESG/HPE) ((Studie S. 9)) (JPG-Datei: Zeit_Arbeitsaufwand)
Mit HPE Infosight sinkt bei HPE-Nimble-Nutzern der Zeitbedarf für die Fehlerbeseitigung um Dimensionen (Bild: ESG/HPE) ((Studie S. 9)) (JPG-Datei: Zeit_Arbeitsaufwand) (Bild: ESG/HPE: (Studie S. 9))

KI-gesteuerter Empfehlungsmechanismus: Die in der HPE-Infosight-Cloud arbeitenden Algorithmen erkennen sich anbahnende Leistungs- oder Kapazitätsengpässe proaktiv und unterbreiten den Storage-Administratoren beim Kunden oder dessen Servicepartner Optimierungsvorschläge. Derzeit führt das HPE-Tool Konfigurationsänderungen an den verwalteten Systemen noch nicht selbsttätig durch, sondern weist die jeweils Verantwortlichen darauf hin, was getan werden müsste, um potentielle Probleme zu beheben. Technisch wäre eine Automatisierung partiell allerdings bereits möglich.

Bessere Algorithmen

Ein Team von Datenanalysten bei HPE beschäftigt sich ausschließlich mit der Entwicklung neuer und der Verbesserung bereits bestehender analytischer Algorithmen für HPE Infosight. Genutzt werden Softwaretechnologien wie maschinelles Lernen, Mustererkennung sowie Monte-Carlo- und multivariante Regressions- und Korrelationsanalysen.

Der Support hat sich durch den Empfehlungsmechanismus des Werkzeugs bereits erheblich vereinfacht: Die Service Level 1 und 2 entfallen für HPE-Nimble- und nun auch für HPE-3PAR-Kunden, wenn HPE Infosight im Einsatz ist – es gibt nur noch einen Level-3-Support. Denn 86 Prozent aller auftretenden Probleme können die Administratoren durch die proaktiven Empfehlungen lösen, bevor sie sich negativ bemerkbar machen.

So ist es gar nicht nötig, den Support zu involvieren. Für die restlichen 14 Prozent der Probleme, für die es keinen automatisiert bereitgestellten Lösungsvorschlag gibt, erhält der Anwender oder externe Support-Spezialist sofort Zugriff auf technisch kompetentes Fachpersonal, das mit ihm gemeinsam möglichst schnell eine Lösung findet. Dabei müssen keine Daten oder Protokolle mehr generiert werden, all das ist bereits in HPE Infosight vorhanden.

HPE-Nimble-Anwender müssen sich dank der proaktiven Analysen von HPE Infosight mit erheblich weniger Trouble Tickets herumschlagen als die Nutzer anderer Speicherprodukte.
HPE-Nimble-Anwender müssen sich dank der proaktiven Analysen von HPE Infosight mit erheblich weniger Trouble Tickets herumschlagen als die Nutzer anderer Speicherprodukte. (Bild: ESG/HPE (Studie S. 8))

So wirken sich sie Algorithmen praktisch aus

Die positiven Effekte reichen dabei, wie schon angedeutet, über die Storage-Systeme hinaus. Gelegentlich etwa legen Bios-Updates des Speichers Schwächen anderer genutzter Technologien, beispielsweise des Hypervisors, offen. Sobald diese erkannt sind, kann HPE an deren Behebung gemeinsam mit dem Anbieter arbeiten.

Anwender dagegen bleiben weitgehend von den betreffenden Problemen verschont. Denn stellt sich zum Beispiel heraus, dass ein Update unerwartet bei einigen Systemen zu Problemen führt, ermöglicht die immanente Intelligenz, schnell ähnlich konfigurierte Systeme zu erkennen und sie nicht mit dem betreffenden Update zu versorgen, ehe die Probleme vollständig neutralisiert sind.

All das führt bei HPE-Nimble-Kunden zu einem gegenüber konventionellen Speicherlösungen um Dimensionen verbessertes Nutzungs- und Support-Erlebnis. Auch hierfür liefert die ESG-Studie Belege: Nur 25 Prozent der Anwender von HPE Nimble Storage haben überhaupt dediziertes Personal für die Speicherverwaltung, und wenn, dann beträgt die durchschnittliche Zahl der Vollzeit-Äquivalente 1,21, also weniger als halb so viel als bei Nutzern anderer Lösungen.

Bei HPE-Nimble-Kunden entstanden daher übers Jahr 79 Prozent geringere Personalkosten für die Speicherverwaltung. 88 Prozent der HPE-Nimble-Kunden müssen im Jahr maximal fünf Trouble Tickets verarbeiten

Till Stimberg: „Ein Team von Datenanalysten bei HPE beschäftigt sich ausschließlich mit der Entwicklung neuer und der Verbesserung bereits bestehender analytischer Algorithmen für HPE Infosight.“
Till Stimberg: „Ein Team von Datenanalysten bei HPE beschäftigt sich ausschließlich mit der Entwicklung neuer und der Verbesserung bereits bestehender analytischer Algorithmen für HPE Infosight.“ (Bild: HPE)

Weiterentwicklung von HPE Infosight

Dabei wird die Leistungsfähigkeit von der HPE-Software stetig verbessert. Irgendwann sollen die intelligenten Algorithmen die gesamte IT-Infrastruktur überwachen und automatisiert steuern. Zu diesem Zweck wird HPE die Infosight-Technik auf weitere Infrastruktur-Plattformen erweitern – als Nächstes sollen HPEs Server in die Analyse-Umgebung einbezogen werden. Die erweiterte Datenbasis eröffnet dann ganz neue, noch weiterreichende Analyse- und Steuerungsmöglichkeiten.

Auch im Bereich Netzwerke arbeitet HPE am Ausbau seiner Fähigkeiten: Jüngst hat das Unternehmen Cape Networks erworben. Das Startup wird Arubas intelligentes Netz-Management durch eine KI-basierte Lösung erweitern, die proaktiv die Verfügbarkeit von Services und Applikationen testet. Falls erforderlich, unterrichtet die Software die Verantwortlichen über etwaige Engpässe oder Probleme, noch bevor sie die Leistung der Infrastruktur und das Geschäft beeinträchtigen. Die Lösung soll voll in die Aruba-Software integriert werden.

* Till Stimberg ist Director Hybrid IT Solutions Business Unit DACH und Russia bei HPE.

Was meinen Sie zu diesem Thema?

Schreiben Sie uns hier Ihre Meinung ...
(nicht registrierter User)

Kommentar abschicken
copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 45315893 / Software)