Die Enterprise-tauglichen Ausprägungen von Hadoop

Barc veröffentlicht Vergleich von Hadoop-Distributionen

| Redakteur: Ulrike Ostler

Barc bietet unter anderem eine Übersicht und Einordnung der Hadoop-Partnerschaften.
Barc bietet unter anderem eine Übersicht und Einordnung der Hadoop-Partnerschaften. (Bild: Barc)

Forrester hat schon eine, jetzt auch das deutsche Forschungs- und Beratungsinstitut für Unternehmenssoftware Barc: eine vergleichende Studie der „Hadoop“-Distributionen ”. Damit sollen Unternehmen einen Überblick über die diversen auf Apache Hadoop basierenden, aber funktional oft unterschiedlichen Angebote für die Verwaltung von Big-Data-Daten erhalten.

Der Wunsch nach einer geschäftlichen Nutzung von Big Data hat in den vergangenen Monaten auch die Nachfrage nach Techniken verstärkt, mit denen sich solche großen, polystrukturierten Datenbestände verwalten sowie schnell und fortschrittlich auswerten lassen. Einer der größten Hoffnungsträger ist hierbei „Hadoop“, eine Sammlung von Komponenten für unterschiedliche Aufgabenstellungen für die Verwaltung und den Zugriff auf strukturierte und unstrukturierte Daten.

Hadoop ist ein seit 2008 bei der Apache Software Foundation angesiedeltes Top-Level-Projekt, das sich aufgrund des großen Interesses von Anwenderunternehmen rasant weiterentwickelt. Arbeitsschwerpunkte sind aktuell die Performance, die Stabilität, Sicherheitsmechanismen sowie die Analysefähigkeit, Nutzbarkeit, Wartbarkeit und die Administrierbarkeit des komplexen Frameworks.

Das Versprechen kommerzieller Software-Anbieter ist es somit, die Community-getriebene Open Source Apache Hadoop Distribution „unternehmensfähig“ auch für die Ansprüche von Großunternehmen nutzbar zu machen. Begleitend ist hierfür ein verlässlicher Support anzubieten und Fragen der Haftung zu klären.

Vielfalt der Hadoop-Distributionen

Aufbauend auf dem Apache-Projekt versuchen diverse Anbieter mit ihren eigenständigen Hadoop-Distributionen Schwächen zu beseitigen, Lücken zu füllen und durch einen „Added Value“ im Markt zu punkten. So konkurrieren aktuell reine Hadoop-Distributionen (Cloudera, Hortonworks, MapR), Software-Stack-Anbieter (IBM), Speicherlösungs-Anbieter mit Hadoop-Angebot (Netapp, Pivotal) und Cloud-Service-Anbieter (Amazon, Microsoft, Rackspace) um die Gunst der Kunden.

Entsprechend unübersichtlich ist mittlerweile das Hadoop-Angebot für Unternehmen geworden. Die Marktübersicht „Hadoop-Distributionen im Vergleich“ des Business Application Research Center (Barc) kostet 490 Euro und soll für Aufklärung sorgen. Nach einer kurzen Einführung zu Hadoop und seinen Komponenten stellt die Untersuchung die fünf eigenständigen kommerziellen Hadoop-Distributionen Cloudera, Hortonworks, IBM, MapR und Pivotal gegenüber und gibt dem Leser dabei Auswahlkriterien für deren Bewertung an die Hand.

Ergänzendes zum Thema
 
Über Barc

Gemeinsamkeiten und Unterschiede

Allen Distributionen gemein ist laut Studie, dass ihre Entwickler angesichts der hohen Anzahl von Komponenten und Werkzeuge, die in Hadoop-Umgebungen für die Integration, Speicherung, Zugriff, Analyse und das Reporting zum Einsatz kommen, das Daten-Management durch eine einheitliche Administrationskomponente vereinfachen wollen. Dabei zeigen sich in der Praxis vor allem in diesem Bereich Unterschiede zwischen den Angeboten, aber auch in den Feldern Security, Analytics und Benutzerfreundlichkeit.

Gute Karten sehen die Analysten offenbar für Hortonworks , Claudera und MapR. So kommentiert Timm Grosser, Co-Autor und Senior Analyst bei Barc, die weitere Marktentwicklung wie folgt: „In dem Maße, wie in den kommenden Monaten solche Daten-Management-Funktionen in Open-Source-Distributionen wie „Hortonworks“ verfügbar werden, wird sich der bislang noch teuer bezahlte „Added Value“ anderer Distributionen nicht mehr rechtfertigen lassen.“

Hadoop - das Big-Data-Betriebssystem

Hortonworks und das Release Data Platform 2.1

Hadoop - das Big-Data-Betriebssystem

25.04.14 - „Hadoop ist das Big-Data-Betriebssystem.“ Die Aussage vom Forrester-Analysten Mike Gaultieri macht das Open-Source-Framework für die Haltung und Verarbeitung multi-strukturierter Daten zu einem must-have – eine Steilvorlage für den Distributor Hortonworks, der gerade frisches Kapital bekam und seinen „Hadoop Summit“ hielt. lesen

Kommentar zu diesem Artikel abgeben

Schreiben Sie uns hier Ihre Meinung ...
(nicht registrierter User)

Kommentar abschicken

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 42635438 / Data)