Bis zu 20 Gigabyte Daten pro Sekunde IBM baut Big-Data-System für Forscher
Die Forschungseinrichtung DESY und IBM haben eine Kooperation zur Entwicklung eines Big-Data-Systems geschlossen. Es wird auf IBM-Speichersystemen basieren und soll große Datenmengen schnell verarbeiten.
Anbieter zum Thema

Zum Einsatz kommen soll das System an der Forschungslichtquelle „Petra III“. Dabei handelt es sich um einen 2,3 Kilometer langen Ringbeschleuniger, der magnetisch geladene Teilchen zur Erzeugung starker Röntgenstrahlung nutzt und damit atomgenaue Einblicke in die Struktur von Materialien ermöglicht.
Dabei fallen enorme Datenmengen an: Jede einzelne von 14 Messstationen liefert einen Datenstrom von 14 Gigabit pro Sekunde, der zuverlässig gespeichert und verarbeitet werden muss.
Skalierbar und zukunftssicher
Das geplante Speichersystem wird Software-Defined-Storage auf Basis von IBMs „Elastic-Storage“-Projekt bieten, bis zu 20 Gigabyte an Daten pro Sekunde verarbeiten und Forschern schnellen Zugang zu Messdaten ermöglichen. Durch Skalierbarkeit soll das System zukunftssicher sein.
Die DESY-Forscher bauen derzeit mit dem Röntgenlaser „European XFEL“ eine weitere Forschungslichtquelle, die deutlich mehr Daten als Petra III produzieren wird. „Wir erwarten von European XFEL etwa 100 Petabyte pro Jahr“, erläutert Dr. Volker Gülzow, Leiter der DESY-IT. Das sei in etwa vergleichbar mit dem Datenvolumen des weltgrößten Teilchenbeschleunigers LHC („Large Hadron Collider“) am CERN in Genf.
„Die Software-Defined-Technologien von IBM können DESY mit der nötigen Skalierbarkeit, Geschwindigkeit und Agilität versorgen, damit das Forschungszentrum in Zukunft Analysen als Service in Echtzeit anbieten kann“, erklärt Jamie Thomas, General Manager Storage and Software Defined Systems bei IBM. „IBM kann von den Erfahrungen mit DESY profitieren und diese in andere datenintensive wissenschaftliche Bereiche wie etwa Astronomie, Klimaforschung und Geophysik einbringen. Dort können dann ebenfalls Speichersysteme errichtet werden für die Analyse von Daten, welche von verteilten Detektoren und Sensoren erzeugt worden sind.“
(ID:42908775)