Anbieter zum Thema
Überwachung des gesamten Netzwerks
Die GWDG betreut das Übertragungsnetz „Gönet“, das die Göttinger Institute mit dem nationalen Wissenschaftsnetz „X-Win“ und dem Internet verbindet. Eine weitere Grundanforderung war daher die Überwachung des gesamten Netzwerks.

Schwierig daran war, dass ein geeigneter Weg gefunden werden musste, um alle Performance-Daten, zum Beispiel Antwortzeiten, Paketverlust, Traffic sowie Errors& Discards, für die rund 75.000 Netzwerk-Interfaces der Router und Switches des Gönet aufzuzeichnen und darzustellen. Das bedeutet, dass alle fünf Minuten 280.000 Performance-Daten gesammelt und verarbeitet werden müssen. Gleichzeitig sollte sich aber die eingesetzte Hardware auf ein Minimum beschränken. Die Idealvorstellung sah den Einsatz eines Mastersystems ohne Satellitensysteme zur Lastverteilung vor.
Der Einsatz von Datensammlern
Um dieses Problem zu lösen, integrierte IT-Novum einen Datensammler, der sich ausschließlich um die Verarbeitung der Daten für das Gönet kümmert, und „mod_gearman“ zur Durchführung der Host- und Servicechecks. Durch die Erweiterung des Frontend von Open IT Cockpit integriert sich der Datensammler vollständig in das Monitoring-Framework.
Das Monitoring-System überwacht dadurch rund 2.000 Hosts sowie 3.000 Services und verarbeitet 280.000 Performance-Daten mit nur einer physikalischen Hardware. Durch die Einbindung des Datensammlers und mod_gearman ist das System außerdem so ausgelegt, dass es auch noch im weiteren Projektverlauf skalieren kann.
Hier zeigt sich das Leistungspotenzial von open IT Cockpit im Vergleich zu einem reinen Nagios-System: Nagios wäre angesichts der Menge an Checks in Kombination mit einer möglichst schlanken Hardware schnell an seine Grenzen gestoßen.
Geplant: Umfassendes Service-Monitoring
„Inzwischen sind alle zentralen Systeme bei uns mit Open IT Cockpit überwacht, auch wenn der Umfang der Überwachung im Detail noch ausbaufähig ist“, sagt Heuer. Die Forschungseinrichtung will daher den nächsten Schritt wagen. Geplant ist, das System immer weiter in Richtung eines umfassenden Service-Monitoring auszubauen.
Dazu gehören für die GWDG neben einem umfassenden Monitoring auch die Themen Event-Korrelation und SLA-Reporting, eine Anforderung. Das System verfügt über die entsprechenden funktionalen Erweiterungen. Heuer bemerkt dazu: „Es zeigt sich, dass das Reporting über Ausfallzeiten immer wichtiger wird. Wir planen daher, die Qualitäts-Management-Erweiterung zum SLA-Nachweis gemeinsam mit IT-Novum noch in diesem Jahr in Betrieb zu nehmen.“
Die Visualisierung
Um spezielle Ansichten für einzelne Anwender und Teilbereiche aufbauen zu können, denkt die GWDG langfristig auch über Visualisierungsmöglichkeiten durch „Nagvis“ und die bereits in der Community-Version verfügbaren Mandantenfähigkeit nach. Indem die Statusinformationen einzelner Checks und von korrelierten Zuständen genutzt werden, lassen sich in Open IT Cockpit vollständige Dashboards erstellen, auch speziell für einzelne Abteilungen.
Durch die Bereitstellung diverser Services ist auch ein End-2-End-Monitoring angedacht. Auch ohne das Umsetzen dieser Funktionen verfügt die GWDG über ein organisationsweites Überwachungssystem für ihre Infrastruktur, das durch die offene Architektur zukunftssicher ist, weil es sich einfach und flexibel an sich verändernde Anforderungen anpassen lässt.
Der Autor:
Jens Michelsons arbeitet bei der IT-Novum GmbH.
(ID:42699227)