Mit Exa-Solution zu prädiktiven Analysen in Echtzeit

Massiv paralleles Arbeiten mit der Programmiersprache „R“

| Redakteur: Ulrike Ostler

Exa-Solution ist das Datenbank-System von Exasol.
Exa-Solution ist das Datenbank-System von Exasol. (Bild: Exasol)

In-Memory-Spezialist Exasol AG wird mit „Exa-Solution“ die Programmiersprache „R“ für statistische Berechnungen unterstützen. Die Vorteile: Es entfallen teure Rechnerressourcen für Analysen, die Daten von einem ins andere System transferieren. Da das Produkt linear skalieren kann, laufen Analysen, auch auf sehr großen Datenmengen, in einem Bruchteil der bisher benötigten Zeit ab.

Exasol nutzt den Funktionsumfang und die Flexibilität der Open Source Programmiersprache R und kombiniert diese beiden Bereiche mit dem Datenbankturbo Exa-Solution. Das Ergebnis: leistungsstarke Datenanalysen auch bei schnell wachsenden Datenmengen.

Hersteller vergleichbarer Datenbanken sind oft gezwungen, sämtliche Daten erst in die „R“-Umgebung zu übertragen, was Zeit und nicht unerhebliche Kosten verursacht. Exa-Solution integriert R bereits auf jeden laufenden Cluster-Knoten, so dass ankommende Anfragen auf jeden Knoten verteilt werden. Anschließend können diese massiv parallel bearbeitet werden, da auf jedem einzelnen Knoten ein „eigenes“ R läuft.

Durch die Kombination aus R - der führenden Programmiersprache für Datenwissenschaftler und Geschäftsanalysen - und Exa-Solution ergeben sich für Data Scientists und anderen Analysespezialisten unter anderem aus den Branchen Handel, Produktion und Marktforschung erhebliche Nicht zuletzt ermöglicht die parallele Ausführung des R-Codes in Exa-Solution eine extrem hohe Performance von Abfragen.

R – die mächtigste Programmiersprache zur Datenanalyse

Steffen Weissbarth, CEO der Exasol, sagt: „Ob diverse Kundenklassifikationen, Warenkorb-, Churn-, oder Sentimentanalysen – überall wo es darum geht, Stimmungen von Kunden auszuwerten, kann unsere Lösung im Höchstmaß punkten.“ Als Beispiel nennt er einen Verlag, der wissen möchte, welches Buch seine Kunden am meisten kaufen werden. Dieser könne nun sämtliche Kundenrezessionen analysieren und so auf den vermeintlichen Bestseller des Jahres schließen.

R ist eine Software zur Datenanalyse und Visualisierung. 1993 an der Universität von Auckland in Neuseeland entwickelt, steht R für einen völlig neuartigen Ansatz, mit Daten aller Art umzugehen. R bietet eine Vielzahl von statistischen Methoden (lineare und nichtlineare Modellierung, klassische statistische Testverfahren, Zeitreihenanalyse, Clusteranalysen etc.) und Werkzeuge zur grafischen Visualisierung. Dabei ist R in höchstem Maße erweiterbar.

Ergänzendes zum Thema
 
In Memory - Exasol

Eine der Stärken von R ist die Flexibilität: R-Experten können mit dem gleichen Code, den gleichen Tools und dem gleichen Know-how sowohl Big Data als auch kleinere Studien analysieren, Text-Mining wie auch Regressionsanalysen durchführen. Standardeinstellungen liefern schon sehr gute Ergebnisse, sämtliche Algorithmen bleiben dem Benutzer jederzeit erhalten.

R wird weltweit von schätzungsweise 2 Millionen Nutzern in Unternehmen und Wissenschaft genutzt. Die Community hat mehr als 2.500 Pakete entwickelt, die Bausteine zur Erstellung analytischer Modelle darstellen.

Kommentar zu diesem Artikel abgeben

Schreiben Sie uns hier Ihre Meinung ...
(nicht registrierter User)

Kommentar abschicken

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 39179950 / Strategien)