Neue Schlauberger für das Rechenzentrum AIOps automatisiert den IT-Betrieb

Autor / Redakteur: Sascha Petry* / Ulrike Ostler

IT-Administratoren, -Admistiratorinnen bekommen eine neue Hilfskraft: Mit AIOps hält eine zentrale Intelligenz Einzug in Unternehmen, die dem Menschen zur Seite steht und dabei hilft, eine ständig komplexer werdende IT-Landschaft zu steuern und zu überwachen. Unternehmen können so die Verfügbarkeit von Geschäftsanwendungen sichern, da heute jeder IT-Ausfall sofort zu Umsatzverlusten führen würde.

Firmen zum Thema

Service für IT-Admins: AIOps hilft, komplexe Abläufe im IT-Betrieb zu steuern.
Service für IT-Admins: AIOps hilft, komplexe Abläufe im IT-Betrieb zu steuern.
(Bild: Peter Pieras auf Pixabay)

Das Herzstück von AIOps (Artificial Intelligence for IT Operations) ist die Fähigkeit, die von Monitoring-Werkzeugen und weiteren Quellen gelieferten Statusdaten über die gesamte IT-Infrastruktur zusammenzuführen und auszuwerten. Basierend darauf sowie einer kontinuierlichen Analyse kann die AIOps-Lösung automatisiert den IT-Betrieb steuern und die IT-Leistung sichern.

Eine der Herausforderungen ist die Aufbereitung der unterschiedlichen Formate aus Logfiles, Metriken, Alarmierungen oder Ticket-Systemen. Darüber hinaus erhalten IT-Experten von dieser Anwendung wertvolle Hinweise zu Unregelmäßigkeiten im IT-Betrieb.

AIOps hat sich in kurzer Zeit zu einem Wachstumsmarkt entwickelt und zählt zu den am schnellsten wachsenden Sektoren im Bereich des IT-Managements. Laut den internationalen Analysten von Omdia wurde im Jahr 2020 weltweit ein Umsatz von umgerechnet 787 Millionen Euro erzielt. Bis zum Jahr 2024 erwarten Experten ein Plus von etwa 25 Prozent jährlich.

In der Praxis

Ein einfaches Beispiel zeigt, wie AIOps im Storage-Management unterstützen kann. Stellt die KI-Lösung auf Basis aktueller Monitoring-Daten fest, dass die Kapazität eines Storage-Arrays eine kritische Grenze erreicht, kann die Lösung eingehende Daten frühzeitig auf ein anderes Array umleiten. Dies erfolgt automatisiert, ohne dass Administratoren eine Änderung manuell vornehmen müssen.

AIOps nutzt dafür Analysen wie maschinelles Lernen (ML) sowie KI-Algorithmen, um den IT-Betrieb zu überwachen. Weiterhin unterstützt AIOps das Application Performance Monitoring, da die Lösung Schwankungen in der Leistung von Software-Systemen frühzeitig erkennt und mögliche Quellen der Störung aufzeigen kann. So können Unternehmen auf einen möglichen Ausfall von Geschäftsprozessen zeitnah reagieren – im Idealfall noch bevor es zu einem Stillstand kommt.

AIOps spielt seine Stärken insbesondere in großen verteilten IT-Landschaften aus, in denen Tausende von Servern und Benutzern sowie eine Vielzahl von Diensten und Anwendungen laufen, da eine solche Plattform beispielsweise in der Lage ist, auch sehr heterogene Log-Daten zusammenzuführen. Damit wird AIOps auch für Unternehmen wichtig, die ihre IT-Landschaft über Edge-Computing erweitern, also an immer mehr Standorten neue Mini-Rechenzentren aufbauen. Die Menge an Statusdaten, die in so einer Umgebung entsteht, kann von einem Menschen nicht mehr manuell ausgewertet werden.

KI fängt auf Netzwerkebene an

Wichtig ist, dass die Lösung mit korrekten und aktuellen Daten arbeitet. Denn nur wenn die KI-Algorithmen mit den richtigen Daten gespeist werden, kann die Lösung sinnvolle Entscheidungen treffen. Daher ist es auch so wichtig, die Daten bereits auf Netzwerkebene sorgfältig auszuwählen und diese zu verdichten. Laut dem Storage-Anbieter Netapp haben fast 25 Prozent der großen Unternehmen acht oder mehr Monitoring-Tools installiert, um einen ganzheitlichen Überblick über ihre IT-Landschaft zu bekommen.

ML kann hier helfen, auftretende Netzwerkfehler durch die kontinuierliche Analyse der Logs sowie durch einen Abgleich mit historischen Daten in Echtzeit präzise zu identifizieren. In Kombination mit einer intelligenten Ereignisunterdrückung, die eine Überlastung durch falsche Alarme verhindert, erfolgt schon auf dieser Ebene eine Verdichtung der Daten, so dass aussagekräftige Fehlermeldungen an die AIOps-Plattform weitergereicht werden.

Im Idealfall lässt sich damit schon frühzeitig eine Fehlerbehebung einleiten. Daher sind intelligente und selbstlernende Algorithmen auch so wichtig, um den Menschen effizient bei dem Management der IT-Landschaft zu unterstützen.

Auf der Suche nach der Intelligenz

Wo aber steckt eigentlich genau die Intelligenz bei AIOps? Eine KI-Komponente entsteht zum Beispiel durch die operative Nutzung der Plattform und die damit gewonnenen Informationen; denn: Die Datenbasis wird mit der Zeit immer wertvoller, je mehr Datensätze vorhanden sind. Dafür ist es notwendig, möglichst viele Log- und Statusdaten aus der gesamten IT-Landschaft zu integrieren.

Dann kann die Lösung über ML und Datenanalysen Zusammenhänge in Echtzeit oder durch nachgelagerte Auswertungen erkennen, Vorhersagen unterstützen sowie Unregelmäßigkeit im laufenden Betrieb entdecken, die auf eine Störung oder einen Cyber-Angriff hinweisen können. Ist die Lösung in der Lage, eigenständig Muster zu identifizieren, kann das System den Menschen über mögliche Probleme und Gefahren warnen. Dies alles erfolgt komplett automatisiert, oder eben: intelligent.

Viele IT-Manager sind von AIOps überzeugt

Eine im August 2021 veröffentlichte Studie von ABB zur Automatisierung des IT-Betriebs gibt Einblicke in die Arbeit der IT-Verantwortlichen. So erfragt sie beispielsweise, was die IT-Verantwortlichen daran hindert, die Automatisierung im Rechenzentrum weiter voranzutreiben. Die Antwort ist denkbar einfach: Es sind die beiden klassischen Faktoren Zeit und Geld. Erst an dritter Stelle wird fehlendes technologisches Fachwissen genannt.

Ist dann erfolgreich eine Initiative zur Automatisierung gestartet, geht es den Unternehmen vor allem darum, die operativen Kosten rund um den IT-Betrieb zu senken. Gleichzeitig sollen Fehler vermieden und damit die Ausfallzeiten verringert werden.

Etwa 45 Prozent der Befragten sind der Meinung, dass KI und ML ihre Feuerprobe im Rechenzentrum bereits bestanden haben, da entsprechende Lösungen ihren Wert für den IT-Betrieb unter Beweis stellen konnten. Für knapp 50 Prozent ist es für eine solche Bewertung noch zu früh.

Die wichtigsten Vorteile

An erster Stelle steht also die erhöhte Sichtbarkeit über die gesamte IT-Infrastruktur hinweg. Ein KI-basiertes Management hilft dabei, Daten aus verschiedenen Monitoring-Plattformen an zentraler Stelle zusammenzuführen, so dass Administratoren schneller die richtigen Entscheidungen treffen können.

Weiterhin hilft AIOps den IT-Experten dabei, auftretende Probleme zu priorisieren: Tritt zum Beispiel in einem wenig genutzten Datenarchiv ein kritischer Fehler auf, während eine Business-Anwendung leichte Performance-Schwankungen hat, könnte ein menschlicher Administrator aufgrund der Schwere das Vorfalls eher dazu neigen, sich um das Datenarchiv zu kümmern. Dabei könnte ein Ausfall der Geschäftsanwendung kurz bevorstehen.

Ein weiterer Vorteil ist eine beschleunigte Root-Cause-Analyse: Die KI-Anwendung kann automatisiert Logs auswerten und verdichten, so dass der Administrator, die Administratorin klare Hinweise auf die mögliche Fehlerquellen erhält, ohne dass eine manuelle Suche in den Logs notwendig wird.

Ebenfalls wichtig ist eine verbesserte Vorhersagbarkeit: Rechenzentren sind längst von einer rein reaktiven Wartung zu einer planmäßigen Wartung übergegangen. Jeder IT-Verantwortliche träumt jedoch davon, auftretende Probleme sicher vorhersagen zu können, um so Ausfälle verhindern zu können, bevor sie auftreten. Mit AIOps sowie ML-Analysen, die bereits kleinste Abweichungen vom Normalbetrieb erkennen, ist die IT-Welt diesem Gedanken etwas nähergekommen.

Ausblick

In Zukunft erwartet uns ein noch stärker automatisierter Rechenzentrumsbetrieb. Neue AIOps-Werkzeuge könnten beispielsweise auf ein Cloud-Ökosystem an Tools und Services zurückgreifen, das als Plattform für eine weitergehende Automatisierung des IT-Betriebs dient und ergänzende Services bereitstellt.

Sascha Petry ist im Business Development von Park Place Technologies beschäftigt.
Sascha Petry ist im Business Development von Park Place Technologies beschäftigt.
(Bild: Reflect Yourself / People Photography, Inhaber Martina Schwarzer)

Davon werden auch Unternehmen profitieren, die ihre Datacenter-Hardware länger als drei bis fünf Jahre nutzen möchten. Hierbei unterstützen zum Beispiel Anbieter wie Park Place Technologies, die Support-Leistungen und Ersatzteilversorgung nach Ablauf der Herstellergarantie anbieten – Stichwort Third-Party Maintenance. Statusdaten dieser Systeme lassen sich ebenfalls in eine zentrale AIOps-Lösung einspeisen und über Analysen auswerten oder mit ML-Algorithmen in Echtzeit auswerten.

Der Ausblick ist verlockend. Mit AIOps könnte ein neuer digitaler KI-Kollege in die IT-Abteilung einziehen, der den IT-Administrator dabei unterstützt, die tägliche Verfügbarkeit der Anwendungen und Systeme zu sichern.

* Sascha Petry ist im Business Development von Park Place Technologies tätig.

Artikelfiles und Artikellinks

(ID:47767316)