Wie Internet-Unternehmen mit den Daten ihrer Mitglieder umgehen So macht Apple aus Siri und iCloud Big Data

Autor / Redakteur: Bernhard Schoon / Ulrike Ostler

Das Geschäftsmodell der großen Internet-Unternehmen sieht den Umgang mit riesigen Datenbeständen vor. Wie das geht und was es bringt, lässt sich gut am Beispiel von Apple nachvollziehen.

Anbieter zum Thema

Mit den Kundendaten zu neuen Erkenntnissen.
Mit den Kundendaten zu neuen Erkenntnissen.
(Bild: Apple)

Wenn Apple einen Computer, ein Smartphone oder ein Tablet verkauft, heißt das niemals „Fire-and-Forget“. Im Gegenteil: Fast jedes Produkt von Apple meldet sich in den Rechenzentren des Unternehmens zurück, z.B. mit der Storage-Technologie „iCloud“. Oder zur Verarbeitung der gesprochenen Befehle für „Siri“. Oder zum Einkaufen.

Und gekauft wurde viel. In einer Pressemeldung gab Apple zu Beginn des Jahres bekannt, dass 2013 mehr als zehn Milliarden Dollar im eigenen App Store ausgegeben wurden, allein im Dezember wurden fast drei Milliarden Apps im App Store heruntergeladen.

Wo gespeichert wird, da wachsen die Rechenzentren in den Himmel

Für diese Transaktionen, Siri und die Speicherung mit iCloud muss Apple gigantische Datenmengen vorhalten, über deren Handling das Unternehmen selbst jedoch wenig verrät. Aber: Während sich neue Produkte erfolgreich geheim halten lassen, dringen die Pläne für Apples Rechenzentren zwangsläufig an die Öffentlichkeit: Grundstückskäufe oder Pachtverträge, Bauanträge und kommunale Beschlüsse machen die Baustellen des Apple-Konzerns recht transparent.

So wurde bekannt, dass Apple seit 2011 in den USA eine Reihe von Rechenzentren so groß wie mehrere Fußballplätze projektierte. Der Grund: Im Juni des Jahres hatte Apple seinen Backup-Dienst iCloud vorgestellt, der jedem Kunden zur Datensicherung fünf Gigabyte kostenlos zur Verfügung stellt.

Traditionelles Handwerk auf großer Stufenleiter

Mit welchen Anlagen und Betriebssystemen Apple diese Datenbestände verarbeitet, ist dem Unternehmen selbst nicht zu entlocken. Gewisse Hinweise lassen sich jedoch den Stellenanzeigen des Unternehmens entnehmen.

Das iOS 8 auf verschiedenen Displays.
Das iOS 8 auf verschiedenen Displays.
(Bild: Apple)

Im Dezember 2013 suchte Apple nach Informatikern mit Erfahrungen auf Big-Data-Plattformen wie „Hadoop“ zur Entwicklung komplexer und skalierbarer DW/BI-Lösungen. Vorausgesetzt wurden Kenntnisse in mehreren Programmiersprachen sowie Erfahrungen im Umgang mit Data Warehouses auf der Basis von Teradata, Oracle und Informatica.

Im Januar 2014 folgte eine Stellenanzeige für einen „Big Data Operations Engineer“ für das kalifornische Santa Clara. Zur Entwicklung standortbezogener, neuer iOS-Anwendungen sollten die Bewerber bereits Erfahrungen in der Hadoop-Cluster-Administration und Hadoop Mapreduce sowie mit CDH 4 oder Redhat Linux und Apache Webserver mitbringen, dazu Shellscripting und Programmierkenntnisse mit Java.

Anders als bei Google und Facebook: konventionelle Infrastruktur

Auch über die Hardware der Rechenzentren muss spekuliert werden. Allein für die USA betreibe Apple drei Server-Instanzen, so ein Beitrag in der Online-Community Reddit: Für die Westküste, die Ostküste und die übrigen US-Regionen, dazu eine unbekannte Anzahl weiterer Server-Instanzen für andere Länder und Regionen.

Die Server, so der Beitrag weiter, bestehen aus vier voll bestückten HP C7K Blade-Systemen mit jeweils acht Server-Blades zu jeweils 1 Terabyte RAM. Dies würde pro Instanz 32 Server-Blades mit 1.024 Kernen und 32 Terabyte Arbeitsspeicher ergeben, aktueller Marktwert gut 1 Million Dollar.

Die Daten befinden sich jedoch nicht lokal auf den Servern, sondern werden über ein SAN (Storage Area Network) abgerufen. Fällt ein Server aus, lässt er sich ohne Beeinträchtigung der Verfügbarkeit des Gesamtsystems austauschen. Zum Betriebssystem der Server wurden keine Angaben gewagt, statt dem OS X Server aus dem eigenen Haus hielt man eine andere Unix-Variante oder Linux für wahrscheinlicher.

Der praktische Nutzen von Big Data

Verständlich, dass die gesammelten Datenbestände auch bei Apple für nähere Einblicke und zukünftige Entwicklungen ausgewertet werden. Nicht nur, dass Apple über die persönlichen Daten von Millionen Anwendern verfügt, auch lassen sich Schlüsse ziehen, wie einzelne Apps tatsächlich eingesetzt werden. So ließe sich aus den Spielständen einer Game App folgern, wo besonders viele User scheitern, und der Spielverlauf an dieser Stelle nachbessern.

Die Datenhaltung mit iCloud, die Sprachverarbeitung für Siri und der App Store von Apple spülen ein riesiges Datenvolumen in die Rechenzentren des Unternehmens.
Die Datenhaltung mit iCloud, die Sprachverarbeitung für Siri und der App Store von Apple spülen ein riesiges Datenvolumen in die Rechenzentren des Unternehmens.
(Bild: Apple)

Auch die „iWatch“, sollte sie denn kommen, könnte zu einem Datenlieferant werden, der Apple über medizinische Messwerte des Anwenders, seinen Kalorienverbrauch oder Schlafenszeiten informiert. Sollte diese Uhr einmal in großen Stückzahlen getragen werden, läge bald ein Querschnitt über die Sport- und Essgewohnheiten oder gesundheitlichen Risiken der Bewohner ganzer Länder vor.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

Strategische Zukäufe

Was Apple mit seinen gesammelten Daten möglicherweise vorhat, lässt sich aus den Übernahmen des Konzerns folgern. Im Dezember 2013, also erst einen Monat nach der Übernahme von Primesense, einem Hersteller von 3D-Sensoren, kaufte Apple für 200 Millionen UDollar das Unternehmen Topsy, ein Spezialist für die Auswertung der Inhalte von Twitter.

Topsy berechnet zum Beispiel, wie beliebt und interessant ein bestimmtes Thema oder Ereignis bei Twitter war. Dieses Know-how in der Analyse großer Datenmengen könnte sowohl für neue Produkte von Apple als auch für die internen Big-Data-Analysen verwendet werden.

Im Juli 2013 kaufte Apple das kanadische Big-Data-Startup Locationary mit seiner Plattform Saturn zur Zusammenführung von Standortdaten. Also genau richtig nach dem Fehlschlag bei der Einführung des eigenen Kartendienstes „Apple Maps“.

Auch Fehlschläge gibt es

Nach der Trennung von Google Maps auf iOS 6 für das iPhone 5 lieferte der Dienst von Apple nach einer Einführung lächerliche und falsche Angaben. Mit der Technik von Locationary sollen nun geografische Punkte mit dynamischen Informationen wie Öffnungszeiten oder Fotos kombiniert dargestellt werden.

Ende vergangenen Jahres wurde ebenfalls ein Patent von Apple bekannt, das die Darstellung von Landkarten in mehreren Schichten ermöglicht. So werden zusätzliche Informationen auf eine Karte der geografischen Umgebung gelegt – entweder statische Informationen wie Sehenswürdigkeiten, Opernhäuser, Restaurants und Hotels oder dynamische Informationen über Wetter und Börse.

Aber Apple sammelt nicht nur Daten, sondern bringt sie auch zum Kunden. Bislang ließ das Unternehmen die erforderliche Internet-Infrastruktur von externen Dienstleistern betreiben, darunter vor allem Akamai als Anbieter eines CDN (Content Delivery Network) zur Übertragung von Apps, Multimedia und anderen Daten über Edge-Server in den wichtigen Regionen der Welt.

Nach einem Bericht des Wall Street Journals vom Februar dieses Jahres bereitet Apple jedoch eine eigene Infrastruktur vor. Ob damit auch ein größeres TV-Angebot gesendet werden soll, also das lang erwartete iTV, ist offen. Damit wäre dann auch Apple bei den „Big Big Data“ angekommen.

(ID:42845934)