Daten- und Content-Management von IBM

IBM erweitert Db2

| Autor / Redakteur: Michael Matzer / Nico Litzel

So passt Apache Atlas in die Data-Governance-Ebene der IT-Architektur.
So passt Apache Atlas in die Data-Governance-Ebene der IT-Architektur. (Bild: Hortonworks)

IBM hat kürzlich einige Ergänzungen und Erweiterungen seiner Daten und Content-Management-Software „IBM Db2“ bekanntgegeben. Db2 erhält eine neue Cloud-Version sowie eine neue In-Memory-Version, während neue Werkzeuge für Data Governance und Machine Learning speziell europäischen Kunden zur Verfügung gestellt werden.

Die Version „Db2 on Cloud“ ist ein Managed Service, der aus der IBM Cloud zu beziehen ist. Wer Rechenleistung, RAM-Kapazität und Storage für sein Abo einstellen will, kann das nun mit einem Schieberegler tun. Das beseitigt den mühseligen Weg über die IT-Abteilung. Eine neue Web-gestützte Konsole soll Nutzern die Bedienung des Service erleichtern. Db2 on Cloud ergänzt den bestehenden „Db2 Hosted Service“.

Db2 unterstützt nun das Dateiformat JSON zur Übertragung von Datenobjekten und Dokumenten. Da sich JSON in der relationalen Datenbank DB2 speichern lässt, ist kein Umweg über „IBM Cloudant“ oder andere NoSQL-Datenbanken nötig. Zugriff und Abfrage erfolgen wie gewohnt mit SQL, die Indexierung innerhalb DB2.

Eine performante DB2-Erweiterung für In-Memory-Computing ist schon seit Jahren der „BLU“-Akzelerator. Dieser wurde nun so ausgebaut, dass er die hybride Verarbeitung von Transaktionen und Analysen (HTAP: hybrid Transactional and Analytical Processing) realisieren kann, ohne Daten zuvor replizieren zu müssen. Sekundäre Indizes sollen zudem die Abfrageperformance dieser OLTP-OLAP-Kombination steigern. Die technische Preview steht bereits Beta-Kunden zum Test zur Verfügung.

Developer Community Edition

Eine neue „Db2 Developer Community Edition“, die über den vollständigen Funktionsumfang verfügt, wendet sich an Entwickler. Diese können die Edition kostenfrei herunterladen. Mit ihr lassen sich Anwendungs-Prototypen entwickeln, die alle Funktionalitäten der Enterprise-Edition umfassen. Dabei können sie auch gleich den neuen IBM-Benchmark-Test ausprobieren, mit dem sich die Leistung von Db2 mit „AWS Aurora“, einem Service für eine relationale Datenbank, vergleichen lässt.

Data Governance

Eine ganz andere Baustelle sind die neuen Werkzeuge von Big Blue zur Einhaltung der verschärften Europäischen Datenschutzrichtlinien (GDPR beziehungsweise DSGVO), die ab dem 25. Mai 2018 gelten werden. Die Kunden sollen damit in der Lage sein, den regelkonformen Umgang mit sensiblen Daten zu realisieren.

Zu den neuen IBM-Werkzeugen gehört die „IBM Unified Governance Software Platform“, die den spezifischen Anforderungen der GDPR Rechnung trägt, so etwa im Hinblick auf die generelle Sammlung von Daten oder die Rückverfolgung von Personendaten. Dazu gehören aber auch Funktionen für Datenintegration, Reporting, Policy-Zuweisung und die kognitive „Ernte“ von Metadaten, welche im Rahmen von Governance eine Schlüsselrolle spielen.

Darüber hinaus stellt IBM mit dem „Information Governance Catalog Download & Go“ einen Software-Download bereit, mit dem es möglich sein soll, spezielle Governance-Tools direkt in die Systeme zu laden. So ein Catalog erweist sich als äußerst nützlich, um mithilfe seiner Metadaten auf einer benutzerfreundlichen Ebene nach bestimmten Kundendaten zu suchen. Die Software ergänzt die Cloud-basierte Version des Katalogs.

Eine weitere Neuerung ist „GDPR for StoredIQ”, wobei StoredIQ eine Software für Data Discovery darstellt, mit der sich unstrukturierte Daten unternehmensweit erforschen lassen. Big Blue hat seine Software durch Integration von analytischen Modulen so aufgerüstet, dass erstmals auch GDPR-spezifische sensible Personendaten für 15 EU-Länder und ihre elf Sprachen sofort erkannt werden. Dieses Tool verkürzt die Vorbereitungszeit für eine GDPR-Auditierung.

Support für Apache Atlas

So funktioniert Apache Atlas intern.
So funktioniert Apache Atlas intern. (Bild: Hortonworks)

All diese Werkzeuge kommen nicht von ungefähr, sondern mit Schützenhilfe. Diese holt sich IBM in einem Open Source Konsortium: Das „Open Data Governance Consortium for Apache Atlas“ beruht auf Atlas, das von der Apache Foundation für Hadoop entwickelte „Framework für Data Governance“. Ziel ist es nach Angaben des Herstellers, neue, offene, datenschutzkonforme Technologien bereitzustellen, die für die Entwickler frei zugänglich sind.

Atlas ist derzeit im Apache-Inkubator, soll von den Konsortiumsmitgliedern aber möglichst schnell zu einem Projekt auf höchster Ebene (TLP) entwickelt werden. Erst als TLP kann Atlas auch problemlos distribuiert werden. Zu den über ein Dutzend Mitgliedern des Konsortiums gehört neben IBM auch sein Allianzpartner Hortonworks, der wohl die reinste Distribution des Hadoop-Frameworks (HDP) vertreibt (siehe dazu auch die beiden Slideshows von Hortonworks und Synaltic auf Slideshare.

Machine Learning Hub in Deutschland eröffnet

Es hat ein paar Monate gedauert, aber nun hat IBM zwei neue Ressourcen für Data Science und Machine Learning auch in seinen Europa-Rechenzentren bereitgestellt, die ebenfalls im Hinblick auf GDPR bedeutsam sind. Die „collaborative“ Modellierumgebung IBM Data Science Experience (DSX) steht in einem Rechenzentrum in der Region London bereit. Die Kunden sollen damit regionale Anforderungen wie GDPR leichter in ihre entscheidungsunterstützenden Analyseanwendungen integrieren können. Die hier verarbeiteten Daten unterliegen – zumindest bis zum Brexit 2019 – dem Datenschutz der EU.

In seinem Forschungs- und Entwicklungslabor in Böblingen bei Stuttgart hat Big Blue das Machine Learning Hub eröffnet. Statt in abstrakten Schulungskursen sollen in den MLH-Workshops Kunden und Interessenten quasi hemdsärmelig nach Machine-Learning-basierten Lösungen für Data-Science-Probleme suchen können. Im Fokus stehen Einsatzbereiche, die von der Betrugserkennung im Finanzsektor bis zur Kundensegmentierung im Marketing reichen.

„Viele Unternehmen, die heute mit neuen, datenbasierten Geschäftsmodellen nachhaltige Veränderungen in ganzen Industriezweigen hervorrufen, nutzen Machine Learning. Um unseren Kunden einen direkten und einfachen Zugang zu Experten und Lösungen rund um das Thema zu geben, haben wir das Machine Learning Hub in unserem R&D-Zentrum gegründet“, sagt Udo Hertz, Director of Analytics Development, IBM. „Unser Ziel ist es, dass sie im Anschluss mit praktikablen und nachhaltigen Lösungen beginnen können, die Chancen von Machine Learning zu nutzen.“ Das Laborgelände, immerhin das größte Entwicklungslabor außerhalb der USA, könnte also schon bald zu einer Pilgerstätte für ML-Experten werden.

Was meinen Sie zu diesem Thema?

Schreiben Sie uns hier Ihre Meinung ...
(nicht registrierter User)

Kommentar abschicken
copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 44759265 / Data)