Stinger.next beschleunigt Hadoop-SQL-Schnittstelle Hive auf Unternehmens-Niveau

Gebloggt: Hortonworks spricht über Pläne für Stinger.next

| Autor / Redakteur: Thomas Drilling / Thomas Drilling

Stinger.next
Stinger.next (http://hortonworks.com)

Hortonworks, das Unternehmen hinter dem Apache Hadoop Projekt hat in seinem Blog weitere Pläne zu Beschleunigung von Apache Hive, der SQL-Komponente für das Big-Data-Framework erläutert.

Das ist insofern bemerkenswert, da man erst im April dieses Jahres die 2013 gestartete Stinger-Alternative, welche Hive um einen Faktor bis zu 100 beschleunigt erfolgreich etablieren konnte. Jetzt soll das Projekt Stinger.next laut Hortonworks eine Echtzeitzugriff auf SQL-Daten ermöglichen und Hive mit Transaktionsfähigkeiten ausstatten.

Hive ist ein Open-Source-Projekt der Apache Software Foundation und erweitert das quelloffene Big-Data-Framework um Funktionen zur Datenanalyse durch Zurverfügungstellen einer SQL-ähnliche Abfragesprache.

Stinger.next

Bei Stinger.next setzen die Hortonworks-Entwickler wieder auf die Mitarbeit der Hive-Gemeinschaft, wobei wie schon bei Stinger ein Drei-Phasen-Modell die Realisierung der gesteckten Ziele vereinfachen soll und in Phase 3 auch SQL:2011-Analysen ins Spiel kommen sollen. Stinger.next soll die Reaktionszeit auf Anfragen in den Bereich unter 1 Sekunde drücken, womit Stinger.next die einzige Hadoop-SQL-Schnittstelle wäre, die sich auch für Anfragen im Tera- und Petabyte-Bereich eignet und in Hive Transaktionen ermöglicht. Transaktionen erlauben Hadoop-Anwendern das Einfügen, Ändern oder Löschen von Daten, während Hadoop an sich als prinzipiell batchorientiertes System für einmaliges Schreiben / mehrmaliges Lesen konzipiert ist. Mit den durch Stinger ermöglichten schnelleren Reaktionszeiten eignet sich Hive auch für explorative Analysen. Zudem planen die Hortonworks-Entwickler eine Integration in Apache Spark. Spark wiederum ist im Hadoop-Ökosystems ein Framework, das analytische Berechnungen auf Clustern ermöglicht.

Stinger.next macht Hive unternehmenstauglich

Stinger.next soll innerhalb der nächsten 18 Monate fertig sein und Hive insbesondere für den Unternehmenseinsatz fit machen. Konkurrierende Hadoop-Anbieter wie Cloudera stufen Hive dagegen als für den Unternehmenseinsatz ungeeignet, da zu langsam, ein und setzen auf eigene Lösungen wie zum Beispiel Cloudera Impala. Die geplante Fertigstellung von Stinger.next könnte dagegen die Karten neu mischen.

Potente Partner

Laut Hortonworks rechnet man dabei mit der Unterstützung potenter Partner, wie z.B. Microsoft. Microsofts Principal Software Development Engineer Eric Hanson schreibt zum Beispiel im Hortonworks-Partner-Blog, wie HDInsight-Kunden (die Microsoft-Azure-Version von Hortonworks Data Platform) von Stinger.next profitieren. Als Hive-Commiter, der jahrelang für Microsoft SQL Server gearbeitet hat ist Eric Hanson der Ansicht, Initiativen wie Stinger.next seinen unerlässlich, um Hive auf eine nächst höhere Stufe zu bringen, in der es mit Impala & Co konkurrieren kann.