HPC und KI im Einsatz für Bilderkennung und Simulation in der Systembiologie

Zusehen und verstehen, wie sich Leben entwickelt

| Autor / Redakteur: Michael Matzer / Ulrike Ostler

HPC-Simulation des Molekültransports in einer Zellorganelle, dem Endoplasmatischen Retikulum, dessen komplexe Geometrie die Transportprozesse bestimmt.
HPC-Simulation des Molekültransports in einer Zellorganelle, dem Endoplasmatischen Retikulum, dessen komplexe Geometrie die Transportprozesse bestimmt. (Bild: Ivo Sbalzarini[MOU4])

Künstliche Intelligenz und HPC helfen Systembiologen in Dresden bei der Forschung und Visualisierung. Ivo Sbalzarini und sein Team haben am Center for Systems Biology Dresden (CSBD) des Max-Planck-Instituts für Molekulare Zellbiologie und Genetik (MPI-CBG) und der Technischen Universität Dresden ein IT-Framework mit neuer Beschreibungssprache für Algorithmen entwickelt. Der Professor hat sein Projekt auf der ISC 2019 in Frankfurt/Main vorgestellt.

Computer-basierte Biologie erforscht biologische Zellsysteme mithilfe von Rechnern. Damit sie optimal auf biologische Phänomene abgestimmt werden können, ist die Entwicklung neuartiger numerischer und berechnender Methoden (Algorithmen) nötig.

Berechnende Biologie sieht sich zahlreichen Herausforderungen gegenüber, von komplexen geometrischen Formen bis zu ungleichmäßigen Prozessen. „Wir entwickeln und applizieren Methoden in einem zielgerichteten, Team-basierten Design-Ansatz mit dem Ziel, algorithmisch zu verstehen, wie Zellen Gewebe bilden“, schreibt Sbalzarini, Lehrstuhlinhaber für Wissenschaftliches Rechnen in der Systembiologie an der Fakultät Informatik der Technischen Universität Dresden (siehe:. „Scientific Computing for Image-based Systems Biology“).

HPC-Simulation des Molekültransports in einer Zellorganelle, dem Endoplasmatischen Retikulum, dessen komplexe Geometrie die Transportprozesse bestimmt.
HPC-Simulation des Molekültransports in einer Zellorganelle, dem Endoplasmatischen Retikulum, dessen komplexe Geometrie die Transportprozesse bestimmt. (Bild: Ivo Sbalzarini[MOU4])

Die Algorithmen, welche innerhalb lebender Zellen bei der Gewebebildung ablaufen, bestimmen, in welche Richtung eine Zelle in einem Organ sich entwickelt, teilt oder bewegt. Zellen „berechnen“ die Antwort anhand verschiedener Faktoren und Signale aus der Umgebung, aber mit welchen Mitteln und nach welchen Maßgaben, ist unbekannt. Geht diese Berechnung schief, so entsteht ein Zellhaufen oder ein bösartiger Tumor, also Krebs. Dieser und anderen wichtigen Fragen geht Sbalzarinis Institut nach.

Der Forschungsprozess stellt sich auf den Kopf

Zellen in einem Gewebe werden als „ausgefeiltes stochastisches, paralleles Rechengerät“ betrachtet. Während die Hardware-Komponenten (Moleküle) und der Quellcode (DNS, Genom) relativ gut bekannt sind, trifft dies auf die Algorithmen nicht zu.

Ergänzendes zum Thema
 
Kommentar von Ulrike Ostler

Professor Dr. Ivo Sbalzarini, Chair of Scientific Computing for Systems Biology, Center for Systems Biology Dresden and Senior Research Group Leader, Max Planck Institute of Molecular Cell Biology and Genetics.
Professor Dr. Ivo Sbalzarini, Chair of Scientific Computing for Systems Biology, Center for Systems Biology Dresden and Senior Research Group Leader, Max Planck Institute of Molecular Cell Biology and Genetics. (Bild: Center for Systems Biology Dresden (CSBD))

Ziel ist es, diese Algorithmen durch Reverse-Engineering der frühen Embryonalentwicklung von drei Arten (Fadenwurm, Fruchtfliege und Zebrafisch zu entdecken. Es geht also um nichts Geringeres, als die embryonale Gewebeformung virtuell im Rechner zu simulieren.

Dieses Vorhaben erforderte die inzwischen erfolgte Entwicklung eines Paradigmas für die mehrskalige Simulation biologischer Prozesse sowie von interaktiver Mikroskopie in Echtzeit. In technischer Hinsicht machte das Projekt Fortschritte in HPC sowie in den entsprechenden Programmiersprachen notwendig.

KI und natürlichsprachige Algorithmen

„Vor dem Hintergrund von Theorie, Algorithmen, Software und Anwendung konzentrieren wir uns in unserem Team auf bestimmte Methoden, die von bildgebender Systembiologie benötigt werden“, so Sbalzarini.

  • 1. Adaptive Simulationsmethoden mit unterschiedlicher Auflösung, die Partikel verwenden, um auf numerische Weise partielle Differentialgleichungen auf komplexen dreidimensionalen Geometrien und Oberflächen zu lösen;
  • 2. Bildverarbeitung und -analyse mithilfe von Partikelmethoden für die Segmentierung und Bewegungsverfolgung in Bildern aus Fluoreszenzmikroskopie;
  • 3. Paralleles HPC für Partikelmethoden und hybride Partikel-Gitter-Methoden, sowie deren Softwareprogrammierung;
  • 4. Biologisch inspirierte Algorithmen für Optimierung und datengetriebenes Lernen biologischer Modelle.

Bislang hat die Forschergruppe drei Simulationsmodule entwickelt. Um die Simulationen jeweils mit den Beobachtungen im Mikroskop vergleichen zu können, sind Korrelationen in Echtzeit nötig.

Die dreidimensionale AR- und VR-Visualisierung von Mikroskopiebildern und Simulationsdaten erlaubt auch Gestensteuerung.
Die dreidimensionale AR- und VR-Visualisierung von Mikroskopiebildern und Simulationsdaten erlaubt auch Gestensteuerung. (Bild: Ulrik Günther, CSBD[MOU6])

Entspricht die Vorhersage der Simulation dem beobachteten Ergebnis? Falls nicht, müssen die Parameter des Modells optimiert werden – natürlich in 3D und in Echtzeit. Mittelfristig soll eine gestengesteuerte VR-Visualisierung der 3D-Mikroskopie und der Simulationsergebnisse realisiert werden. Die entsprechende, neue Bildgebung ist sehr anspruchsvoll.

Für die Bildanalyse hat die Forschergruppe bereits die Software Mosaik-Suite Software veröffentlicht, die weltweit nach eigenen Angaben von 2017 ungefähr 3.000 Mal pro Monat heruntergeladen wird.

Paralleles HPC für Systembiologie

Für die Visualisierung werden GPUs verwendet, für Bildanalyse und Simulationen HPC-Cluster. In der Kombination ist eine HPC-Umgebung für Partikelmethoden entstanden.

In ihr wird seit 2005 die Softwarebibliothek Parallel Particle Mesh (PPM) ausgeführt. Diese PPM-Library hat nach Sbalzarinis Angaben einige der umfangreichsten und effizientesten Simulationen ermöglicht und die Dauer für die Code-Entwicklung von Jahren auf Wochen verkürzt. In 2019 wurde PPM durch einen modernen C++-Nachfolger, OpenFPM, ersetzt.

Seit 2019 verwendet das Forscherteam am CSBD die Bibliothek „OpenFPM“, die in C++ geschrieben ist. Sie wird auf einer sehr performanten HPC-Infrastruktur ausgeführt und erlaubt die transparente Implementierung skalierbaren Simulationscodes.
Seit 2019 verwendet das Forscherteam am CSBD die Bibliothek „OpenFPM“, die in C++ geschrieben ist. Sie wird auf einer sehr performanten HPC-Infrastruktur ausgeführt und erlaubt die transparente Implementierung skalierbaren Simulationscodes. (Bild: Pietro Incardona & Ivo Sbalzarini, CSBD)

Für ihre Simulationen hat das Team zudem mit „PPME“ eine anwendungsspezifische Programmiersprache entwickelt. Mithilfe von PPME kann das Team binnen weniger Stunden sowohl eine parallel ausgeführte, skalierbare Partikelmethode für eine Simulation als auch Bildverarbeitung auf die Beine stellen.

Auf der Suche nach Synergien

Zuvor kostete es Jahre, um solchen Code von Hand zu parallelisieren. Bei der Bildverarbeitung erlauben OpenFPM und PPME in Echtzeit die Bildsegmentierung noch während eine Aufnahme mit dem Mikroskop erfolgt (siehe: A Parallel Distributed-Memory Particle Method Enables Acquisition-Rate Segmentation of Large Fluorescence Microscopy Images).

Um von Synergien in der Entwicklung von Software zu profitieren, nimmt das Team am "Dresden Software Synergy Consortium" teil und trägt zu Opensource-Projekten wie „ImageJ2“ und „Fiji“ für die Bildverarbeitung sowie „ClearVolume “ für die Echtzeit-3D-Mikroskopie und „Scenery“ für die VR-Visualisierung großer Daten bei. Zudem stellt es seine Methoden als wiederverwendbare Workflows zur Verfügung. Sämtlicher Quellcode ist auf öffentlichen Git-Servern zu finden.

Was meinen Sie zu diesem Thema?

Schreiben Sie uns hier Ihre Meinung ...
(nicht registrierter User)

Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
Kommentar abschicken
copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de/ (ID: 46110071 / Anwendungen)