Grundlagen des System-Managements, Teil 1 System-Management: Lästige, aber notwendige Pflicht

Ein Gastbeitrag von Peter Dümig*

„Never touch a running system”, hieß es früher oft, doch die alte IT-Weisheit hat ausgedient. IT-Systeme brauchen Pflege und Wartung, um Hardware-Ausfälle und Cyber-Attacken zu vermeiden, auch wenn das Zeit kostet und mit gelegentlichen Downtimes verbunden ist. Dieser Artikel ist der Auftakt zu einer Serie über die Grundlagen des System-Managements.

Anbieter zum Thema

Server und andere IT-Systeme brauchen regelmäßige Pflege, damit sie zuverlässig funktionieren.
Server und andere IT-Systeme brauchen regelmäßige Pflege, damit sie zuverlässig funktionieren.
(Bild: Dell Technologies)

Die kontinuierliche Pflege und Wartung von IT-Systemen empfinden viele Admins als lästige Pflicht. Gerade in kleinen und mittelständischen Unternehmen, in denen sich wenige Personen um sehr viele IT-Aufgaben kümmern müssen und die Budgets knapp bemessen sind, ist die Verlockung groß, problemlos laufende Systeme nicht weiter anzufassen. Für eine vorausschauende Systempflege fehlt den Verantwortlichen schlicht die Zeit. Zudem wollen sie wartungsbedingte Downtimes unbedingt vermeiden.

Dieses Vorgehen ist jedoch riskant, denn Systemausfälle infolge von Cyber-Angriffen, Hardware-Defekten, Software-Bugs und Fehlkonfigurationen verursachen meist deutlich längere Ausfallzeiten, großen Schaden und größere Arbeitsaufwände als ein proaktives System-Management. Dass Admins dennoch darauf verzichten, hat häufig damit zu tun, dass sie noch im „Turnschuh-Modus“ unterwegs sind und die notwendigen Tätigkeiten manuell direkt am Server oder Storage-Array erledigen.

Dabei gibt es inzwischen eine Vielzahl von Lösungen, um insbesondere Server nicht nur aus der Ferne, sondern auch weitgehend automatisiert zu verwalten. Dazu zählen spezielle Management-Karten beziehungsweise Management-Chips auf dem Mainboard, die einen zuverlässigen Remote-Zugriff sicherstellen, sowie Monitoring- und Management-Tools von den Herstellern der Server, kommerziellen Anbietern und aus der Open-Source-Community. Auch Betriebssysteme und Virtualisierungsplattformen bringen umfangreiche Werkzeuge für die Systemverwaltung mit.

Was gehört zum System-Management?

In den kommenden Teilen dieser Artikelserie werden die verschiedenen Möglichkeiten näher vorgestellt. Nicht alle Lösungen eignen sich für jeden Einsatzbereich und decken alle Anwendungsfälle ab – schließlich ist System-Management ein sehr weites Feld und umfasst die unterschiedlichsten Aufgaben.

Zu den wichtigsten zählen das Installieren und Konfigurieren der Server, deren permanentes Monitoring und die Aktualisierung von Firmware, Betriebssystemen und Anwendungen. Darüber hinaus kann das System-Management beispielsweise auch dabei helfen, die Server-Ressourcen optimal zu nutzen.

Insbesondere das Monitoring der Server hilft dabei, potenzielle Probleme frühzeitig zu erkennen und zu beheben, bevor sie zu Systemausfällen führen oder umfangreiche Schäden verursachen. Eine steigende Fehlerrate bei Arbeitsspeicher und Massenspeichern, plötzliche Last-Peaks, hohe Temperaturen, langsam drehende Lüfter oder Spannungsschwankungen – all das deutet auf Probleme hin und lässt sich remote leicht und automatisiert überwachen.

Peter Dümig, Senior Product Manager Server bei Dell Technologies Deutschland, hat für Datacenter-Insider eine komplette Artikelserie zum System-Management erarbeitet, obwohl auch er weiß: Für viele ist diese Disziplin nur eine lästige Pflicht. Er weiß aber auch: Das muss nicht so bleiben.
Peter Dümig, Senior Product Manager Server bei Dell Technologies Deutschland, hat für Datacenter-Insider eine komplette Artikelserie zum System-Management erarbeitet, obwohl auch er weiß: Für viele ist diese Disziplin nur eine lästige Pflicht. Er weiß aber auch: Das muss nicht so bleiben.
(Bild: Dell GmbH)

Auch Bugfixes und Sicherheits-Updates können bequem aus der Ferne installiert werden. Sie verhindern unter anderem den Ausfall von Systemkomponenten durch Firmware-Fehler, Programmabstürze durch Software-Bugs und Angriffe auf bekannte Schwachstellen. Wie wichtig regelmäßiges Patching und das schnelle Anpassen von Konfigurationen nach dem Bekanntwerden von Sicherheitslücken sind, haben in der Vergangenheit etwa „Spectre“ und „Meltdown“, „WannaCry“ und „NotPetya“ sowie vor kurzem erst „Log4J“ gezeigt.

Letztlich schützt das System-Management die Infrastruktur und hält sie betriebsbereit – und das, ohne den Admin zu überlasten.

Hinweis: Der zweite Teil der Artikelserie „Direktzugriff auf entfernte Server“ erscheint voraussichtlich am 8. Februar 2022.

* Peter Dümig ist Senior Product Manager Server bei Dell Technologies Deutschland.

(ID:47957147)