Hase und Igel Park-Place-Manager Sascha Petry über Drittwartung und AIOps
Anbieter zum Thema
Die IT-Innovationsspirale dreht sich trotz Pandemie immer schneller. Mit Technologien wie AIOps und einem zentralen Monitoring für Cloud und Edge gelingt es, das Wettrennen mit Innovationsdruck und Ausfallsicherheit zu gewinnen. Im Interview mit DataCenter-Insider erläutert Sascha Petry, Park Place Technologies, wie sich im Zuge der Pandemie der Markt für die Wartung von IT-Landschaften verändert hat und warum KI-Systeme im Datacenter-Betrieb so wichtig sind.

Park Place Technologies ist ein Drittanbieter für IT-Wartung (TPM: Third Party Maintenance). Mit diesen Leistungen können Datacenter-Betreiber die Wartungskosten für Hardware-Systeme deutlich senken und gleichzeitig die Gesamtbetriebskosten eines Rechenzentrums reduzieren.
Weiterhin helfen TPM-Anbieter dabei, die Reaktionszeiten bei IT-Ausfällen zu verkürzen, da sie Support für viele Herstellersysteme bieten. Die geografische Abdeckung und der Zugang zu Ersatzteilen sind weitere Pluspunkte für TPM. Schließlich gelingt es mit TPM den Lebenszyklus der Hardware über das Ende des Hersteller-Supports hinaus zu verlängern.
:quality(80)/images.vogel.de/vogelonline/bdb/1560600/1560684/original.jpg)
Ein unabhängiger, 360-Grad-Blick auf die Rechenzentrums-IT
Third Party Maintenance von Datacenter-IT
Hat sich während der Pandemie das eigene Rechenzentrum vom Business-Treiber zu einem Risiko entwickelt, weil Fachkräfte drohten auszufallen?
Sascha Petry: Ganz so schlimm war es dann doch nicht. Allerdings war es für manche Unternehmen in der Tat eine Herausforderung, in kurzer Zeit das IT-Management komplett remote zu organisieren und gleichzeitig den Vor-Ort-Betrieb zu sichern.
Zwei Aspekte waren besonders heikel. Bei Notfällen musste für externe Servicepartner weiterhin ein schneller Zugang unter Beachtung der notwendigen Hygienemaßnahmen gewährleistet sein. Der andere Aspekt war der Umzug der Mitarbeiter ins Homeoffice.
In einigen Fällen hatte das Workplace-Management plötzlich nicht mehr die volle Kontrolle über die Endgeräte. Hier wird es also wichtig, zum Beispiel die Fähigkeiten für das Remote-Management weiter auszubauen.
Das Remote-Management der gesamten IT-Infrastruktur hat durch die Pandemie an Bedeutung gewonnen. Wer aber soll das erweiterte Monitoring überwachen, da IT-Administratoren schon vor der Pandemie häufig stark ausgelastet waren.
Sascha Petry: Die Pandemie führte zu dezentralen Belegschaften sowie zu einem massiven Anstieg von BYOD-Geräten. Sicherheits- und softwaredefinierte Lösungen wurden verstärkt eingesetzt, und die Nachfrage nach einem erweiterten Netzwerkzugang stieg sprunghaft an. Da Unternehmen das Netzwerk zunehmend auf eine Art und Weise nutzen, für die es nicht geplant war, wurden neue Lösungen für die Netzwerküberwachung dringend benötigt.
Um das erweiterte Monitoring mit den bestehenden Workforce-Kapazitäten umzusetzen, sollten Unternehmen bei der IT-Automatisierung auf KI-gestützte Analysesysteme setzen. So ist es notwendig, dass die Flut an Events im Fehlerfall von der Monitoring-Software eigenständig analysiert und vorverdichtet wird.
Diese Analysefunktionen gibt es natürlich bereits, aber mit einer KI-basierten Lösung werden Abweichungen vom Normalbetrieb schneller und vor allem für den Menschen nachvollziehbarer sichtbar. Administratoren gelingt es somit deutlich schneller die betroffenen Komponenten zu identifizieren. Sie können zudem die möglichen Auswirkungen auf den operativen Betrieb präziser abschätzen.
Die Cloud-Nutzung hat in vielen IT-Organisationen zu einem hybriden IT-Betriebsmodell geführt und die Komplexität im Rechenzentrum gesteigert. Wie bekommen CIOs diesen Mix an eigenen und externen IT-Services in den Griff?
Sascha Petry: Auch hier hat sich gezeigt, dass ein zentrales und intelligentes Monitoring der Schlüssel für einen ausfallsicheren Betrieb ist. Da immer mehr zentrale Geschäftsprozesse an der IT hängen, führt ein IT-Stillstand häufig zu direkten Umsatzausfällen. Unternehmen sollten daher auf ein IT-Monitoring setzen, das eine zentrale Sicht auf Cloud-Ressourcen und den On-Premises-Betrieb gleichermaßen ermöglicht, um schnell Fehlerquellen identifizieren zu können. Ein weiter Trumpf ist der Einsatz von KI zur Überwachung und Automatisierung des laufenden IT-Betriebs, bekannt unter dem Kürzel AIOps, also Artificial Intelligence for IT Operations.
Gehört AIOps heute in jedes Rechenzentrum mit hybrider IT-Infrastruktur?
Sascha Petry: Je komplexer der IT-Betrieb, desto wichtiger wird es, das Monitoring zu automatisieren und eine eigenständige Erkennung und Reaktion auf Fehler über KI-basierte Algorithmen zu implementieren, wie es das Konzept von AIOps vorsieht. KI und Machine Learning (ML) helfen dabei, die immer weiteren steigenden Mengen an heterogenen Monitoring-Events zu verarbeiten. Vor allem die Vorhersage möglicher Ausfälle hilft dem CIO dabei, die Ausfallzeiten zu minimieren.
Darüber hinaus könnte laut den Analysten von IDC bis 2023 ein Cloud-Ökosystem entstehen, mit dem IT-Organisationen ihre Ressourcen steuern und in Echtzeit analysieren, um damit gezielt Initiativen für die IT-Automatisierung voranzutreiben (siehe: IDC und IT-Automatisierung). Um das Ziel einer selbststeuernden Infrastruktur zu erreichen, sollten CIOs jedoch verstärkt auf die erwähnten KI-gestützten Analysen setzen sowie eine richtliniengesteuerte Automatisierung realisieren. Somit lassen sich auch zentrale Kennzahlen und SLAs effizienter erreichen und schrittweise verbessern.
Bei welchen SLAs kann AIOps denn konkret helfen, diese zu verbessern?
Sascha Petry: Die KI-Modelle helfen zum Beispiel dabei, wichtige Kennzahlen im Service-Management zu optimieren. Dazu zählen die mittlere Dauer bis zur Entdeckung eines Vorfalls (MTTD: Mean Time to Detect), die Identifizierung und Isolierung (MTTI: Using Mean Time to Identify) bis zur Problemlösung (MTTR: Mean Time to Resolve). Für eine IT-Organisation sind dies wichtige Parameter, die es einzuhalten gilt.
So lassen sich Strafgebühren bei SLAs vermeiden oder neue Geschäftsabschlüsse realisieren, wenn diese Werte besser ausfallen als bei dem Wettbewerb. Schließlich gibt es noch indirekte Kosten durch unzufriedene oder verlorene Kunden, wenn diese Kennzahlen nicht eingehalten werden können.
Das Einhalten dieser SLAs kann umso komplexer werden, desto verteilter und heterogener die IT-Landschaft wird. Cloud und vor allem Edge-Computing verlangen daher eine zentrale Überwachung über geeignete Monitoring-Systeme.
Trends wie das Edge-Computing führen zu mehr verteilten IT-Installationen innerhalb eines Unternehmens und steigern die Komplexität im Infrastrukturmanagement weiter. Wie kann die IT-Organisation das Wachstum durch Edge-Systeme beherrschen?
Sascha Petry: Aus der Perspektive des Monitoring sind Edge-Systeme weitere Hardware-Devices, die in das globale Monitoring zu integrieren sind. Die Herausforderung liegt nun darin, die relevanten Parameter für die Überwachung zu identifizieren, Schwellenwerte aufzusetzen und das Alarming effizient umzusetzen.
Tritt bei einem Edge-Server ein Fehler auf, kommt es für den Support darauf an, schnell und präzise den Standort der betreffenden Maschine zu identifizieren und die Ursache zu bestimmen. Bei einem klassischen Hardware-Defekt wird im Idealfall automatisch der Techniker benachrichtigt. Bei unseren Kunden funktioniert dies für den IT-Betrieb auf globaler Ebene sehr gut und häufig erfährt der Kunde von einem Problem erst in dem Moment, in dem unser Techniker vor Ort mit dem Ersatzteil vorfährt.
Die Digitalisierung führt dazu, dass immer mehr IT-Systeme implementiert werden. Gleichzeitig rückt für viele Unternehmen der Klimaschutz weiter in den Vordergrund. Wie kann die IT-Infrastruktur umweltschonender und CO2-neutraler arbeiten?
Sascha Petry: In unseren Breitengraden fällt es schwer, ein Rechenzentrum komplett auf Basis regenerativer Energien zu betreiben. In skandinavischen Ländern funktioniert das schon eher, hier lassen sich Wind- und Wasserkraft mit Konzepten für die Freikühlung kombinieren.
CIOs sollten daher bei der Energieversorgung starten und den Anteil an grünem Strom weiter ausbauen. Die Energieoptimierung verlangt jedoch individuelle Betriebskonzepte, abhängig von der Art des Datacenter und den Workloads.
Eine andere Möglichkeit ist es, über Third-Party-Management-Services beziehungsweise Drittwartung den IT-Betrieb nachhaltiger aufzustellen, indem die Nutzungsdauer bestehender Hardware im Rechenzentrum verlängert wird. Zwar gibt es Ökostrom, jedoch keine wirklich nachhaltig produzierten Hardware-Systeme.
Anstatt also nach drei, vier oder fünf Jahren den klassischen Refresh für Storage- oder Serversysteme durchzuführen, können CIOs die Wartung an externe Serviceprovider übergeben und bestehende Systeme länger nutzen. Damit werden potenziell weniger gefährliche Stoffe aus alter Hardware in den Kreislauf zurückgeführt.
Werfen wir noch einen Blick auf die Drittwartung und wie sich die Anforderungen des Marktes an das Service-Management verändert haben.
Sascha Petry: Viele unserer Kunden haben die Zeit des Lockdown während der Pandemie genutzt, um ihre IT-Organisation zu analysieren und die externen Servicepartner sowie das Vertrags-Management zu überprüfen. Wer zum Beispiel mit über 50 externen Partnern weltweit aktive Serviceverträge unterhält, wird erhebliche Ressourcen benötigen, um diese Vereinbarungen zu prüfen und aktuell zu halten.
Das ist ein Punkt, an dem wir starke Nachfrage in den vergangenen Monaten gespürt haben. Mit unseren Leistungen helfen wir, indem wir als zentraler Ansprechpartner das gesamte globale Vertragsmanagement übernehmen.
Weiterhin hat uns sehr geholfen, dass wir im Jahr 2019 mit der britischen Entuity einen führenden Anbieter von Software für das Netzwerk- und System-Management übernommen haben. Somit haben wir unsere Fähigkeiten für das Remote-Management kompletter IT-Umgebungen vor der Pandemie bereits ausgebaut.
Dann haben wir in 2020 Curvature übernommen, einen der großen US-amerikanischen TPM-Anbieter mit weltweiten Standorten. So hat dadurch beispielsweise unser globaler Ersatzteillagerbestand auf mehr als 1,15 Millionen Teile erhöht, die an über 2.400 Lagerstandorten verfügbar sind. Will sagen: Wir haben uns in den vergangenen Jahren kontinuierlich weiterentwickelt und sehen uns heute als einen Partner für global aufgestellte Unternehmen, der komplexen Technologieumgebungen weltweit betreut und dabei hilft, die Ausfallzeiten der IT zu verringern.
Artikelfiles und Artikellinks
(ID:47550790)