Suchen

Wie aus Maschinendaten Unternehmens-Werte werden Splunk fischt Juwelen aus dem Big Datennebel

| Redakteur: Ulrike Ostler

Kennen Sie „Splunk“? Nein, es handelt sich nicht um das neu erfundene Wort von Pipi Langstrumpf. Es handelt sich um einen Firmennamen, der ein wenig an „Spelunke“ erinnert und im umgangsprachlichen Amerikanisch etwa „Im Trüben fischen“, „im Nebel stochern“ meint. Splunk fischt nach wertvollen Informationen in maschinengenerierten Daten.

Im April dieses Jahres ging Splunk an die Börse; das Bild ist eine Collage, die die Mitarbeiter an diesem Tag zeigt.
Im April dieses Jahres ging Splunk an die Börse; das Bild ist eine Collage, die die Mitarbeiter an diesem Tag zeigt.
(Bild: Ostler)

Bisher wissen hauptsächlich Datacenter-Administratoren das Unternehmen, das im April dieses Jahres an der Nasdaq notiert ist; der Aktienkurs lag am Freitagmorgen bei 22,15 Euro. Denn Splunk liest in einem patentierten Verfahren Daten aus Quellen wie Dateien und Ports auf einem Host, klassifiziert die Quelle als Quelltypen wie „syslog, „access_combined“,“Apache_error“, extrahiert den Zeitstempel , teilt die Daten in individuelle Ereignisse – einzeilig oder mehrzeilig – und schreibt jedes einzelne Ereignis in einem Index auf der Festplatte.

In diesem Index lässt sich suchen. Dabei werden diese Ereignisse zurückgegeben und Felder wie „status=404“, „user=David“ extrahiert, mit den Quelltypen abgeglichen und klassifiziert, zum Beispiel „error“ und „login:“). Unter „error“ beispielsweise lassen sich alle Fehler-Einträge finden.

Der Aufbau der Splunk-Software
Der Aufbau der Splunk-Software
(Bild: Splunk)
Splunk hat eine eigene Suchsprache entwickelt, mit der sich die Ereignisse individuell durchstöbern lassen. Die „Search Processing Language“ (SPL) umfasst derzeit 70 Kommandos und Funktionen.

Kontrolle über Anwendungen

Außerdem lassen sich die Ergebnisse in Reports und Dashbords verwenden. Sie erlauben ein Monitoring in Echtzeit und ein Drill-down, um zum Beispiel Problemen auf den Grund zu gehen.

Damit ist klar, warum Splunk seine ersten Erfolge im Rechenzentrum feiern konnte. Typische Anwendungsgebiete sind das Applikations-Management, Security und Compliance, Infrastruktur und IT Management sowie Web-Analysen.

Bildergalerie
Bildergalerie mit 5 Bildern

So kann die Splunk-Software für operative Transparenz über den gesamten Applikations-Stack sorgen und helfen, die Ausfallzeiten zu reduzieren. Die Software unterstützt zudem Dev-Ops-Collaboration durch einen sicheren Zugriff auf benötigte Daten, ohne dass dazu ein Eingriff in die Live-Systeme notwendig wäre.

Splunk erkennt auch unbekannte Bedrohungen

Der Einsatz von Splunk ist nicht auf Maschinen beschränkt, die im Rechenzentrum stehen.
Der Einsatz von Splunk ist nicht auf Maschinen beschränkt, die im Rechenzentrum stehen.
(Bild: Splunk)
Für Security-Anwendungen empfiehlt sich Splunk, weil mit Hilfe der Software historische Analysen ermöglicht werden, aber auch die Visualisierung von massiven Datensätzen in Echtzeit. So lassen sich sowohl Bedrohungen von außen als auch beispielsweise Dataleakage bekämpfen. Ad-hoc-Berichte lassen sich in Minuten erstellen und Schutzmaßnahmen auch vorausschauend implementieren.

Die Algorithmen erlauben aber auch das Aufspüren und Untersuchen von Netzwerk, Server- und Speicherproblemen sowohl in physischen als auch virtuellen oder Cloud-Infrastrukturen.

Dass sich Splunk-Software darüber hinaus für die Überwachung und Optimierung Web-Anwendungen eignet, leuchtet nun fast schon von selbst ein: Die Software erlaubt Einblicke in die Ansicht und Nutzung digitaler bestände, Webseiten-Performance-Monitoring, die Analyse von Sessions und abgebrochener Kaufvorgänge beispielsweise. Ongame, ein Anbieter von B2B-Poker, der zu Spitzenzeiten rund 45.000 Besucher zählt, die gleichzeitig spielen, konnte durch den Einsatz der Splunk-Software seine Ausfallzeiten um 30 Prozent reduzieren. Das spart dem Unternehmen jährlich rund 1,9 Millionen Dollar.

Artikelfiles und Artikellinks

(ID:36948980)