Dateisysteme, Cloud und lokales Storage: Oracle/Sun QFS, Fujitsu Exabyte File System, Amazon EFS, Azure Data Lake, IBM Flashsystem, Cray Cluster Store

Speicher für riesige Datenmengen, Teil 4 Dateisysteme, Cloud und lokales Storage: Oracle/Sun QFS, Fujitsu Exabyte File System, Amazon EFS, Azure Data Lake, IBM Flashsystem, Cray Cluster Store

17.08.2020 Von Thomas Joos

Anbieter zum Thema

fsas-afc-horizontal-2-positive-rgb-nov24 (Fsas)

Fujitsu Technology Solutions GmbH

Kentix GmbH

STACKIT - Schwarz Digits Cloud GmbH & Co. KG

Im vierten Teil der Reihe zur Datenspeicherung von Daten im Petabyte-Bereich befasst sich Autor Thomas Joos erneut mit Dateisystemen, Cloud-Speichern in diesem Bereich und neuen Speichersystemen.

Dateisysteme für Big Data: hier Teil 4 unserer Übersicht.(Bild: gemeinfrei / Pixabay) — Dateisysteme für Big Data: hier Teil 4 unserer Übersicht.
(Bild: gemeinfrei / Pixabay)

In den ersten drei Teilen dieser Reihe sind Dateisysteme vorgestelle worden, die Daten im Petabyte-Bereich nicht nur theoretisch speichern können, sondern auch in der Lage sind, den benötigten Speicher den Anwendern und Workloads schnell und stabil zur Verfügung zu stellen. Den Abschluss machen weitere Dateisysteme sowie Cloud- und On-Premises-Speicher.

Dateisystem: Oracle/Sun Quick File System (QFS)

Bei „Quick File System (QFS)“ handelt es sich um ein Dateisystem von Sun Microsystems. Durch die Übernahme von Sun Microsystems durch Oracle wurde das Open-Source-Dateisystem in die Produktlinie von Oracle übernommen. Das Dateisystem ist Bestandteil von „SAM-QFS“ (Storage and Archive Manager). Hierbei handelt es sich um ein hierarchisches Speicher-Management-System.

Dateisystem: Fujitsu Exabyte File System

Beim „Fujitsu Exabyte File System (FEFS)“ handelt es sich um ein skalierbares, paralleles Dateisystem, das auf Lustre basiert. Das Dateisystem ist optimiert für Fujitsu-HPC-Cluster.

Unternehmen können ihre Speicherbereitstellungen horizontal skalieren. FEFS unterstützt Systeme mit bis zu 8 Exabyte (8.000 Petabyte) Kapazität und 1 Terabit pro Sekunde. Zusätzlich verfügt FEFS über Funktionen wie integrierte Hochverfügbarkeit aller Komponenten, Fair-Share-E/A-Verwaltung und Quoten auf Verzeichnisebene.

FEFS stellt Dateifreigaben zwischen einem HPC-Cluster-System mit „FEFS-Server“ und „FEFS-Client“ bereit. Der FEFS-Client arbeitet auf Rechenknoten und Anmeldeknoten, die mit hoher Geschwindigkeit verbunden sind. Das System nutzt Infiniband und bietet transparenten Dateizugriff auf FEFS-Server.

Der FEFS-Server umfasst Metadatenserver (MDS) und Objektspeicherserver (OSS) für Hochleistungsdaten. Mit redundanter Konfiguration von MDS und OSS bietet FEFS Hochverfügbarkeit und Failover-Funktionen. Die Systemkapazität und -leistung können dynamisch verändert werden.

Cloud-Speicher: Amazon Elastic File System (EFS)

Bei „Amazon Elastic File System (EFS)“ handelt es sich um ein skalierbares und verwaltetes NFS-Dateisystem in AWS. Administratoren können also selbst nicht in die Konfiguration von EFS zugreifen. Aktualisierung, Verwaltung und Patchen des Dateisystems werden von Amazon übernommen. Die Verwaltung läuft über Schnittstellen, mit denen Administratoren und Entwickler das System konfigurieren können.

Das System ist für die Verwendung von Cloud-Ressourcen in AWS optimiert. Die Skalierung erfolgt automatisch. Mit EFS lassen sich mehrere Tausend VMs in „EC2“ anbinden. Die VMs erhalten parallelen Zugriff und hohen Durchsatz. Das System ist aber nicht lokal auf eigenen Servern einsetzbar, sondern ausschließlich in der Amazon-Cloud.

Cloud-Speicher: Azure Data Lake

Bei „Azure Data Lake“ handelt es sich um einen Speicherbereich in „Microsoft Azure“, der nahezu beliebige Daten in unbegrenzter Menge speichern kann. Der Dienst kann auch gestreamte Datenmengen speichern und stellt seine Funktion für andere Dienste in Microsoft Azure zur Verfügung.

Azure Data Lake kann Daten im Petabyte-Bereich speichern. Zusätzlich zu „Hadoop“ unterstützt Azure Data Lake auch „Spark“, „Storm“, „Flume“, „Sqoop“, „Kafka“ und andere Software für Big Data, die mit Hadoop zusammenarbeiten.

Storage-Solution: IBM FlashSystem 7200, 9200 und 9200R

Es gibt viele Speichersysteme von großen Anbietern wie HPE, Dell oder IBM, mit denen sich Daten in großer Menge speichern lassen. Die neuen wie „Flashsystem“ 7200, 9200 und „9200R“ von IBM unterstützen bis zu 4 Petabyte.

Die Server basieren auf der Plattform „Spectrum Virtualize“. Die Storage-Systeme lassen sich in verschiedenen Bereitstellungsarten nutzen. Neben der Installation über Bare-Metal, kann die Umgebung auch virtualisiert und als Cloud-System gebucht werden. Auch Hybrid-Lösungen und Multicloud-Anbindung ist möglich.

Die Systeme bauen auf „Flashcore“-Modulen auf und stehen auch als Rack-Produkt zur Verfügung. Neben Flashcore werden in dem System auch Non-Volatile Memory Express (NVMe), Storage Class Memory (SCM), eine KI-basierte, vorausschauende Speicherverwaltung sowie die aktive Unterstützung durch Storage Insights bereitgestellt. Das Flashsystem wird assembliert geliefert, wobei Installation und Konfiguration von IBM durchgeführt werden.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Geschäftliche E-Mail

Bitte geben Sie eine gültige E-Mailadresse ein.

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Stand: 08.12.2025

Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.

Einwilligung in die Verwendung von Daten zu Werbezwecken

Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.

Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.

Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.

Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.

Recht auf Widerruf

Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.

Storage-Solution: Cray Cluster Store für ein Exabyte und mehr

Der Supercomputerhersteller Cray baut für das Department of Energy (DOE) und das Oak Ridge National Lab (ORNL) eine Exabyte-Speicherlösung. Das „Cray-Clusterstor“-Speicherdateisystem wird als Teil des Frontier-Exascale-Supercomputers von ORNL integriert, der auf der Shasta Architektur von Cray aufbaut. Das Frontier-System wird voraussichtlich 2021 fertiggestellt.

Der neue Speicher wird auf der nächsten Generation der Clusterstor-Speicherlinie von Cray basieren und aus mehr als einem Exabyte (EB) Hybrid-Flash und Speicher mit hoher Kapazität bestehen. Als Dateisystem wird „Lustre“ eingesetzt. Verglichen mit dem Speicher für den aktuellen Summit-Supercomputer des ORNL, ist diese Lösung mehr als viermal so leistungsfähig und mehr als viermal so durchsatzstark. Das System wird aus über 40 Speicherschränken bestehen und mehr als 1 Exabyte Gesamtkapazität über zwei Speicherebenen bieten.

* Thomas Joos ist freier Autor und schreibt auf DataCenter-Insider seinen eignen Blog mit Tipps und Tricks für Administratoren: Toms Admin Blog

(ID:46732445)