Verteilte Daten, Datenbanken

Datos IO mit Daten-Management für Backup und Recovery bei Multi-Cloud-Datenbanken

| Autor / Redakteur: Kriemhilde Klippstätter* / Rainer Graefen

Modernes Daten-Management bedient eine neue IT-Landschaft.
Modernes Daten-Management bedient eine neue IT-Landschaft. (Bild: Datos)

Moderne Applikationen werden heute meist verteilt in verschiedenen Umgebungen gelagert. Doch wer kümmert sich um die Datensicherung, wenn Applikation und Datenbank auf unterschiedlichen Cluster-Knoten vorrätig sind? Das Startup Datos IO hat dafür mit „Recover X“ ein umfassendes Daten-Management auf den Markt gebracht.

Die Startup-Company aus San José im Silicon Valley wurde erst 2014 von Tarun Thakur und Prasentjit Sarkar gegründet, hat seither aber für Furore gesorgt. Während Thakur als CEO die Geschicke leitet, übernimmt Sarkar als CTO und Vordenker die technische Entwicklung. Er bezeichnet das Produkt Recover X als „Applikations-zentrierte Cloud-Management Software, die Backup und Recovery für moderne Anwendungen liefert“.

Heutige Applikationen sind praktisch „in der Cloud geboren“, das heißt: Sie sind für Cloud Computing entworfen worden. Sie nutzen nicht-relationale Datenbanken wie „MongoDB“, „Apache Cassandra“ oder andere. Der Vorteil nicht-relationaler Datenbanken besteht vor allem darin, dass sie hoch verfügbar sind; allerdings hapert es meist an der Datenkonsistenz.

Herkömmliche Anwendungen, die für das Rechenzentrum alter Prägung entworfen wurden und auf relationalen Datenbanken betrieben werden, wandern heute zunehmend ebenfalls in Cloud-Umgebungen. „Dafür reichen die klassischen Strategien für das Daten-Management aber nicht aus“, beschreibt Sarkar ein Problem, das Recover X lösen soll.

Datenbanken und Applikationen verändern sich und auch deren Speicherort.
Datenbanken und Applikationen verändern sich und auch deren Speicherort. (Bild: Datos)

Das Verbindende ist der Content

Zeitgemäßes Daten-Management muss also die neuen Herausforderungen, die durch Multi-Cloud-Umgebungen entstanden sind, für neue und alte Applikationen erfüllen. Datos IO hat dazu folgende Überlegungen für ein neues Daten-Management angestellt:

  • 1. Ein Bereitstellungsmodell, das nur auf Software basiert um mehr Flexibilität zu erhalten und dem Anwender die Wahl des gewünschten Speichers zu überlassen.
  • 2. Da jede Cloud eine unterschiedliche Infrastruktur nutzt, sind der einzige gemeinsame Nenner die Daten selbst. „SCSI LUNs oder ESX virtuelle Maschinen existieren in der Public Cloud nicht. Das einzig Gemeinsame, das alle Clouds verbindet, sind die Daten selbst“, stellt der CTO fest.
  • 3. Da Multi-Cloud-Datenbanken elastisch agieren, müssen die Datensicherheit und das Daten-Management hoch verfügbar, skalierbar und ausfallsicher sein.
  • 4. Zudem werden neue Point-in-Time-Techniken für die Einhaltung der Datenkonsistenz innerhalb eines Clusters benötigt.

Den Verantwortlichen bei Datos IO war klar, dass sie mit den herkömmlichen Architekturen des Daten-Managements die Herausforderungen heutiger und zukünftiger IT-Strukturen nicht bewältigen können. Deshalb entwickelten sie ein vollkommen neues Design, das sie „Consistent Orchestrated Distributed Recovery“ (CODR) nannten.

Die Erfolgsstory von Datos IO: Mitarbeiterzahl in einem Jahr verdoppelt, Kunden fast verdreifacht, gesicherte Kapazität vervierfacht.
Die Erfolgsstory von Datos IO: Mitarbeiterzahl in einem Jahr verdoppelt, Kunden fast verdreifacht, gesicherte Kapazität vervierfacht. (Bild: Datos)

RecoverX will auch zukünftige Scale-out-Datenbanken bändigen

„Der Vorteil unseres anwendungszentrierten Ansatzes ist eine feinkörnige und sehr platzsparende Lösung für Data Protection und Mobilität, die sich über Clouds auch jenseits von Netzverbindungen erstrecken kann“, beschreibt CTO Sarkar die Architektur. Ein zusätzlicher Vorteil der CODR-Engine bestehe darin, dass umfangreiche Daten-Management-Services wie Security, Data Governance und andere angeboten werden können. Damit unterscheide sich die Lösung von Datos IO fundamental von herkömmlichen Ansätzen, die auf virtuellen Maschinen oder LUN-basierenden beruhen und denen der Applikationsbezug fehle.

Eines der Elemente von CODR ist der Einsatz von Abstraktionen, die die Architektur von technischen Variationen der verschiedenen Datenquellen trennen. Als Beispiel nennt Datos IO die Verwendung des Open Database Connectivity (ODBC) API, um damit Datenbank-Management-Systeme (DBMS) zu erreichen. Eine Applikation, die ODBC verwendet, kann auf andere Plattformen – sowohl auf Client- als auch auf Server-Seite – portiert werden und benötigt dafür nur wenige Änderungen im Datenzugangscode.

Granulare semantische Deduplikation

Eine weitere Besonderheit sind die „Application Listeners“. Sie sind klein, stateless (speichern also keine Zustandsinformationen) und werden über ein Standard-API in die Datenbank integriert. Damit lassen sich Daten parallel auf einen zweiten Speicher streamen – ohne Unterbrechung (no choke point).

Dazu kreierten die CODR-Entwickler eine Scale-Out-Plattform, die die Datenbewegungen orchestriert, konsistente Backups veranlasst und Recovery-Operationen organisiert. Dieses Plattformprogramm liest die Daten, die die Applikation Listeners zum File oder Objekt im zweiten Speicher übertragen haben und bereitet sie für einen möglichen Recovery-Prozess auf.

Auch in puncto Deduplizierung haben sich die Entwickler etwas einfallen lassen: Statt blockbasierender wird jetzt die semantische Deduplizierung angewendet. Dabei werden nur die aktuellen Änderungen berücksichtigt, etwa ein einzelnes Element in einer einzigen Tafel. Daraus ergibt sich eine noch granularere Deduplikationsrate als bei herkömmlicher Vorgehensweise. Der Hersteller brüstet sich deshalb mit einer zehnmal so effizienten bidirektionalen Bewegungsrate im Vergleich zu anderen Methoden.

Das Ecosystem von Datos IO
Das Ecosystem von Datos IO (Bild: Datos)

Neues in Version 2.5 von RecoverX

Kurz vor Weihnachten veröffentlichte die Company das Release 2.5 von Recover X. Damit lassen sich jetzt Recovery-Prozesse von Select-Abfragen starten, die spezifische Spalten oder Zeilen eines Backups betreffen. Damit wird das Recovery genauer und reduziert Zeit und Kapazität.

Sensible Spalten lassen sich zudem vom Recovery-Prozess ausschalten. Der Recovery-Prozess wurde zudem mit dem „inkrementellen Recovery“ ergänzt.

Er erlaubt die Wiederherstellung von Daten zwischen zwei Zeitpunkten statt wie bisher nur ab einem. Damit müssen nicht nur weniger Daten wiederhergestellt werden, sondern man kann daraus auch ein Archiv erstellen: Wiederhergestellte Daten lassen sich an einen Archivspeicher senden an den später nur mehr die geänderten Daten geschickt werden.

Für mehr Mobilität der Daten sorgt die neue Version 2.5 ebenfalls, denn Backup und Wiederherstellung können von überall aus gestartet werden. Zudem hat Datos IO bei Recover X 2.5 auch noch die Verschlüsselung, Autorisierung und Authentifizierung verbessert.

* Kriemhilde Klippstätter ist freie Autorin und Systemischer Coach (SE) in München.

Was meinen Sie zu diesem Thema?

Schreiben Sie uns hier Ihre Meinung ...
(nicht registrierter User)

Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
Kommentar abschicken
copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 45115063 / Data Management - Fujitsu Content-Hub)