Auf der Spur von Messdaten und Social Input

IBM und VMware kaufen Big-Data-Companies

| Redakteur: Ulrike Ostler

Big Data setzt aich aus maschinell und in social Medai erzeugten Daten zusammen, die zumeist schon lange da sind, häufig gesammelt aber nicht ausgewertet werden. Insofern spricht IBM von einer "natürlichen Ressource".
Big Data setzt aich aus maschinell und in social Medai erzeugten Daten zusammen, die zumeist schon lange da sind, häufig gesammelt aber nicht ausgewertet werden. Insofern spricht IBM von einer "natürlichen Ressource". (Bild: IBM)

Sowohl IBM als auch VMware kaufen je ein Big-Data-Unternehmen. IBM übernimmt Vivisimo und VMware Cetas Software. Denn Big Data schafft einen riesigen Markt.

Kürzlich sagte Andreas Reichel, Vorstand Technik von Dataport, einem 1.670 Mitarbeiter-IT-Dienstleister für die öffentliche Verwaltung im Norden Deutschlands, in einem Vortrag über die Trends, die die IT und die Gesellschaft verändern: Big Data werde einen größeren Einfluss auf die IT und insbesondere Rechenzentren nehmen, als sich die meisten jetzt vorstellen könnten, so Reichel.

In diese Kerbe schlägt auch Günter Stürner, Vice President Sales Consulting bei Oracle. Allerdings fügt er hinzu, in Deutschland poppe das Thema erst jetzt auf: „Wir sind rund zwölf Monate hinter der Entwicklung hinterher“, sagt er.

Bei Big Data gehe es zum einen um eine Verbindung von strukturierten Daten und unstrukturierten, wie solchen aus sozialen Netzen, von Sensoren und Maschinen, aber vor allem um die Auswertung dieses bisher weitgehend missachteten Stroms an solcherlei binären, nicht codierten Daten. Die Vorreiter hierzulande seien in der Automobil- und der Retail-Branche zu finden sowie in der Marktforschung.

Der Markt für Big Data-Technik und -Services ist riesig

IBM rechnet aus, dass derzeit jeden Tag rund 2,5 Trillionen (1 Trillion = 1 und 18 Nullen) Bytes durch soziale Medien, Messtechnik und mobile Geräte produziert werden. IDC geht davon aus, dass der Markt für Big-Data-Technik und -Services um rund 40 Prozent wächst und 2012 einen Wert von 16,9 Milliarden Dollar erreicht.

Nun akquiriert IBM Vivisimo, ein privat geführtes Unternehmen mit Sitz in Pittsburgh, Pennsylvania, das Software für den Informationszugriff und Discovery anbietet. Diese ermöglicht es Organisationen, unternehmensweit über mehrere Systeme hinweg auf große Datenmengen zuzugreifen und sie zu analysieren. Dabei spielt es keine Rolle, in welchem Format die Daten vorliegen oder wo sie zu finden sind.

IBM beabsichtigt, die Software mit der hauseigenen Technik zu verknüpfen, um den Datenfluss im Unternehmen stärker zu automatisieren zu können für eine schnellere, einfachere und sicherere Auswertung im Sinne von Business Intelligence. Das Kundenverhalten soll für die Unternehmen leichter zu verstehen sein, sie sollen Wechselwilligkeit leichter erkennen können aber auch Dinge wie das Netzwerkverhalten und Betrügereien.

IBM verbaut Vivisimo ins eigene Analyse-Portfolio

Das Navigieren durch Big Data, um darin Informationen zu finden und zu enthüllen, ist eine Herausforderung für alle Industriezweige”, sagt Arvind Krishna, General Manager Information Management bei der IBM Software Group. Die Gewinner würden diejenigen sein, die es schafften, Big-Data aufzuschlüsseln, um die darin enthaltenen Informationswerte für Innovationen, zeitnahe Entscheidungen und allgemein als Wettbewerbsvorteil zu nutzen.

Die Big-Data-Plattform von IBM im Schaubild
Die Big-Data-Plattform von IBM im Schaubild (Bild: IBM)

Vivisimo zählt rund 140 Kunden, darunter Airbus, US AirForce, Procter & Gamble und AlexisNexis. Nun wird das Unternehmen Bestndteil der IBM-Software Group.

Di Big-Data-Plattform von IBM basiert auf dem Open-Source-Projekt „Apache Hadoop“. Die Software erlaubt datenintensiven Anwendungen Petabyte-große Datenbestände zu verwalten und auszuwerten. Auf Hadoop basieren Anwendungen beispielsweise für das Data-Warehousing, für Business Intelligence, die Datenintegration, -bereinigung und -visualisierung.

VMware kauft sich eine Eintrittskarte

IBM will über die Akquisition von Vivisimo die eigenen Analyse-Tools für strukturierte Daten verstärkt mit solchen kombinieren, die bereits für Big Data verfügbar sind, etwa Cloudera, ebenfalls eine Hadoop-Distribution. Umgekehrt können Cloudera-Anwender die Big-Data-Plattform von IBM nutzen.

Auf der Cetas-Website: Freude über den Aufkauf durch VMware
Auf der Cetas-Website: Freude über den Aufkauf durch VMware (Bild. Cetas)

Während IBM bereits über 100 Partnerschaften im Big-Data-Segment geschlossen hat, kauft sich VMware mit dem Startup Cetas Software einen Zugang zu Big-Data-Welt (siehe: Link auf Blog von EMC-Mann Chuck Hollis). vSpere-Kunden sollen eine Möglichkeit bekommen, innerhalb ihrer virtuellen beziehungsweise Cloud Umgebung große Mengen an Daten auszuwerten.

Die Produkte von Cetas Software laufen auf vSphere von VMware und auf Amazon EC2. Sie lassen sich für online-Anwendungen nutzen, für Auswertungen in der IT und von Betriebsdaten sowie Hadoop-Analysen.

Die Cloud als Runtime-Umgebung

Anwender Matthew Cunningham, CIO bei CareCore National, bewertet den Firmenkauf: “Unternehmen wie VMware beginnen nun zu verstehen, dass ein Angebot an Grundlagentechnik allein nicht ausreicht. Sie müssen sich jetzt auf Werkzeuge und Techniken einlassen, die Entscheidungsträgern bei der Analyse helfen und das zum Kerngeschäft ausbauen.“

Allerdings ist Big Data nicht mit einem einzigen Tool zu knacken. Vielmehr braucht es ein ganzes Set an Prozessen und Techniken, die helfen, die Daten so zu verwerten, dass sich damit ein Nutzen erzielen lässt, im besten Fall in Echzeit.

Die Idee hinter Cetas ist es, über verschiedenen Repositories einen Zugang zu Big Data zu bauen, so dass die Daten leichter verdaulich werden, etwa leichter zu durchforsten und zu analysieren (siehe: Video).

Cetas baut Brücken

Die „Instant Intelligence” Software von Cetas kann verschiedene Datentypen aus verschiedenen Quellen quasi ansaugen und das auch noch auf verschiedene Weise: per Dateifreigabe im Netzwerk, im Stream oder per Daten-Repository auf Amazon S3. Benutzer können Dateien per Drag & drop in einen Ordner ziehen oder die Software extrahiert und verarbeitet die Daten unter Verwendung von Hadoop. Von dort aus erledigt die Cetas-Software das Parsen und legt automatisch Filter an.

Daten aus einer .csv.Datei, die beispielsweise ein Set an Spieldaten enthält, lässt sich herauslösen und nach diversen Dimensionen filtern: Spieler, IP-Adressen, erreichte Level, Log-in und Logout-Zeiten beispielsweise. Die Ergebnisse lassen sich wiederum grafisch aufbereiten und miteinander abgleichen sowie tiefer analysieren.

Kommentar zu diesem Artikel abgeben

Schreiben Sie uns hier Ihre Meinung ...
(nicht registrierter User)

Kommentar abschicken

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 33454960 / Strategien)