Multicloud und Multi-Infrastrukturen im Blick Mehr Transparenz für eigene und externe Systeme!

Ein Gastbeitrag von Marcus Gerstmann* 3 min Lesedauer

Anbieter zum Thema

In der IT lassen sich Ausfälle nicht vollständig vermeiden. Wer externe Infrastrukturen oder Cloud-Services nutzt, kann aber oft nur schwer herausfinden, bei welchem System der Fehler liegt. Daher benötigen Unternehmen umfassendes Monitoring, das unabhängig von der Infrastruktur eine einheitliche Sicht auf die Konnektivität bieten.

Um ein Monitoring über Unternehmens- und Cloud-Grenzen hinweg zu gewährleisten, müssten Admins ihre Augen und Ohnen überall haben, nicht nur an einer Stelle - oder ein Tools, das diese Überwachungsblicke erlaubt. (Bild:  Song_about_summer - stock.adobe.com)
Um ein Monitoring über Unternehmens- und Cloud-Grenzen hinweg zu gewährleisten, müssten Admins ihre Augen und Ohnen überall haben, nicht nur an einer Stelle - oder ein Tools, das diese Überwachungsblicke erlaubt.
(Bild: Song_about_summer - stock.adobe.com)

Oh,oh! Vor kurzem wurden bei „Slack“ Bilder verschwommen oder ausgegraut angezeigt, so dass viele Nutzer keine Dateien hochladen oder Screenshots teilen wollten. Ursache waren zwei interne Prozesse, die zufällig zur gleichen Zeit liefen und die Datenbank-Cluster im Rechenzentrum überlasteten.

Die Suchfunktion von „Spotify“ lieferte wenig später keine Ergebnisse. Dabei funktionierte die Anwendung selbst, so dass nur die Backend-Such-API oder die API, welche die Suche initiierte, ausgefallen war.

Ein Stromausfall in einer Availability Zone von „Microsoft Azure“ führte dazu, dass einige Kunden nicht mehr auf „Azure SQL Database“ zugreifen konnten. Das „Playstation Network“ war für Nutzer nicht verfügbar, wahrscheinlich aufgrund eines Konnektivitätsproblems im „PSN“-Backend.

Zudem traten bei einigen Nutzern des Google Kalenders im Web und auf mobilen Geräten Probleme auf. Die Ursache war ein Software-Update, das unbeabsichtigt einen Fehler ausgelöst hat.

Ausfälle passieren – überall

Diese Beispiele vom 'Cisco Thousandeyes Internet Intelligence Team' zeigen, dass Server- und Netzwerk-bezogene Ausfälle aus verschiedenen Gründen und überall geschehen können – im eigenen Rechenzentrum oder dem Datacenter eines Cloud-Provider. Da Unternehmen heute zunehmend verschiedene Infrastrukturen und Cloud-Dienste nutzen, wird es immer schwieriger, die Problemursache schnell zu lokalisieren. Häufig schieben sich Cloud-Anbieter, Dienstleister und Kunde gegenseitig die Verantwortung zu – ebenso wie innerhalb des Unternehmens Anwendungs-, Server- und Netzwerk-Teams.

Gerade wenn die Ursache an Konnektivitätsproblemen zwischen den Infrastrukturen liegt, kann es lange bis zur Identifizierung dauern. Denn die internen Teams nutzen häufig unterschiedliche Monitoring-Tools, die jeweils nur den für sie interessanten Ausschnitt des Gesamtsystems zeigen. So kommt es häufig vor, dass für jedes Team alles in Ordnung erscheint, aber trotzdem die Nutzer nicht auf Dienste zugreifen können.

Noch schwieriger wird die Problemidentifizierung bei Cloud-Diensten. Hier wissen IT-Teams häufig nicht, ob und wann das Problem bei einem Anbieter auftritt – und bei welchem Provider. So ist unklar, mit welchem Team sie zusammenarbeiten müssen, um das Problem zu lösen. Zudem sitzen die IT-Teams von Kunde und Anbieter oft in unterschiedlichen Städten oder sogar Zeitzonen. Statt an einem Tisch das Problem zu diskutieren, werden häufig Mails oder Messages hin- und hergeschickt.

Tatsächlich ist die Angst vor solchen Situationen ein häufiger Grund, warum IT-Verantwortliche von Unternehmen kritische Anwendungen und Dienste lieber im eigenen Rechenzentrum belassen, selbst wenn Betriebs- und Wartungsaufwand dann deutlich höher sind. Denn mit den Prozessen lagern sie auch die Transparenz über die Abläufe aus.

Sie profitieren zwar von höherer Effizienz und schnellerer Skalierung, geben aber dafür die Kontrolle für einen reibungslosen Ablauf an den Dienstleister ab. Trotzdem bleibt die Verantwortung dafür gegenüber der Geschäftsführung und den Mitarbeitenden beim CIO.

Übergreifendes Monitoring-Tool

Je mehr verschiedene Clouds und eigene Infrastrukturen ein Unternehmen nutzt, desto wichtiger wird ein umfassendes Monitoring-Tool, das systemübergreifend und -unabhängig die genaue Problemursache lokalisieren kann. Damit hört das Fingerpointing auf. Und umso schneller können die verantwortlichen Teams an die Problemlösung gehen.

Dies gilt sowohl im eigenen Haus als auch in der Zusammenarbeit mit dem Cloud-Provider. Im Idealfall können dann sich abzeichnende Probleme schon gelöst werden, bevor sie die Nutzer überhaupt bemerken.

Aber auch wenn es nicht so schnell geht, bietet ein solches Monitoring-Tool den Vorteil, dass IT-Verantwortliche sofort die Geschäftsführung und Mitarbeitenden darüber informieren können, wo das Problem liegt, wer davon betroffen ist und eventuell wie lange es voraussichtlich andauert. Dann können die Betroffenen fundiert wählen, ob sie besser abwarten oder eine Alternative nutzen.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Dies gilt auch für die IT-Verantwortlichen selbst. Fällt eine eigene Infrastruktur oder ein Cloud-Dienst aus, müssen sie entscheiden, ob sie die betroffenen Dienste und Anwendungen auf ein anderes System umschalten oder auf das Ende des Ausfalls warten. Hier spielen Überlegungen wie Kundenservice, Kosten, mögliche Sicherheitsrisiken und Datenverlust eine wichtige Rolle.

*Der Autor
Marcus Gerstman ist Leader DACH und Zentraleuropa bei Cisco Thousandeyes. Sein Fazit lautet: Moderne Monitoring-Produkte geben so tiefe Einblicke in die Konnektivität von Multi-Infrastrukturen und Multiclouds als wären diese im eigenen Rechenzentrum. So lassen sich selbst kritische Anwendungen und Dienste an Provider auslagern, da IT-Verantwortliche weiterhin die reibungslose Bereitstellung kontrollieren und im Fehlerfall schnell reagieren können.

Bildquelle: Cisco Thousandeyes

(ID:49988912)