Mit Cloud Computing, Automatisierung und Blockchain zum besseren Daten-Management Gensequenzierung: Aus der Nische in den Alltag
Anbieter zum Thema
Ob in der Forschung, der klinischen Genetik, der Mikrobiologie oder Onkologie – mit Next Generation Sequencing (NGS) werden viele Hunderte Gene parallel sequenziert, um kleinste Veränderungen sichtbar zu machen. NGS hat die Kosten und den Zeitaufwand für Genuntersuchungen drastisch gesenkt. Die Analyse der anfallenden Datenmengen birgt allerdings Herausforderungen, für deren Bewältigung intelligente Computertechnologie unabdingbar ist.

Mit Next Generation Sequencing (NGS) werden – im Gegensatz zur klassischen „Gen-für-Gen“-Sequenzierung (Sanger-Sequenzierung) – mehrere hundert Millionen Fragmente in einer Probe simultan sequenziert. Diese Hochdurchsatz- oder Parallelsequenzierungstechnologien haben gänzlich neue Dimensionen in der Nukleinsäureanalytik eröffnet und unzählige Forschungsfelder im Bereich der Life Sciences revolutioniert.
Mit der Hochdurchsatz-Analyse von DNA werden zum Beispiel in der modernen genetischen Diagnostik häufig genetisch bedingte Erkrankungen abgeklärt. NGS erlaubt, viele Gene, die mit einem bestimmten Krankheitsbild zusammenhängen, in einem einzigen Sequenzierlauf zu lesen und zu analysieren. Die Ergebnisse können individuell bioinformatisch ausgewertet werden.
Die Anwendungsgebiete von NGS sind breit: Es wird für die Genomsequenzierung verwendet, bei der Untersuchung der Genomdiversität, in der Metagenomik, in der Epigenetik, bei der Erforschung nicht-kodierendender RNA und von Protein-DNA-Interaktion. Biotechnologische Innovationen lassen sich damit beschleunigen.
Die Vorteile und Herausforderungen
Die Vorteile der NGS liegen auf der Hand: Im Gegensatz zu bisherigen Verfahren reduzieren sich der Zeit- und der Laboraufwand, das Verfahren ist genauer und effizienter. Durch die Integration der NGS-Technologie, insbesondere in der Metagenomik, ist es möglich, Krankheitserreger leichter zu identifizieren und viel schneller geeignete Abhilfemaßnahmen zu finden.
Eine der größten Herausforderungen bei NGS ist das Daten-Management, also die Speicherung, Sicherheit und Analyse riesiger Datenmengen. Die Lösung für diese Herausforderungen umfasst Investitionen in die Infrastruktur: in Hardware, Ressourcen und Wartungsaktivitäten.
Anwendungen auf Grundlage von künstlicher Intelligenz (KI) und des maschinellen Lernens können helfen, die Datenanalyse zu verbessern. Auch der Datenschutz, zum Beispiel für klinische Genomdaten, darf nicht außer Acht gelassen werden.
Unternehmen sollten deshalb für die NGS-Analytik nichtöffentliche (geschützte) cloud-basierte Lösungen mit strenger und zuverlässiger Zugangskontrolle einrichten und cloud-basiertes Read-Mapping nutzen, das keine Übertragung der eigentlichen Lesesequenz in die öffentliche Cloud erfordert. Der Analyse-Workflow ist zu standardisieren. Außerdem sollte KI integriert werden, um die Datenmenge zu bewältigen.
Eine Plattform für die NGS-Datenanalyse
Als Anbieter für die digitale Transformation, IT, Netzwerke, Consulting & Engineering Services bietet Tech Mahindra eine solche cloud-basierte Genomik-Datenplattform, die die NGS-Datenanalyse rationalisiert und operationalisiert und damit die Zeit für lebensrettende Entdeckungen erheblich verkürzt. Die One-Stop-Lösung deckt Analysefunktionen für Genomik, Transkriptomik und Metagenomik ab, von der Datenbereinigung bis hin zu Annotationen.
Die Plattform bietet vorkonfigurierte Pipelines für die Untersuchung aller Arten von genetischen Varianten, beispielsweise Kopienzahlvariationen (Copy number variation, CNVs), Einzelnukleotid-Varianten (Single-nucleotide variants SNVs), Indels (Mutationen durch Insertion oder Deletion) und andere. Die Pipelines können so konfiguriert werden, dass sie Daten aus verschiedenen Experimenten analysieren und/oder das gesamte menschliche Antikörperrepertoire untersuchen, wie die umfassende Charakterisierung der B-Zell-Rezeptoren (BCR).
Sie unterstützt zudem verschiedene Anforderungen an die Datenanalyse (Isotyp-Analyse, Analyse der klonalen Abstammung, Phylogenetik) während der Phasen der Arzneimittel-Entwicklung: Generierung von Antikörper-Leitstrukturen, Optimierung, Funktionsanalyse und Sicherheitsstudien. Darüber hinaus ermöglicht die Plattform einen nahtlosen Datenaustausch, der die Zusammenarbeit zwischen verschiedenen Gruppen innerhalb der Organisationen fördert.
Automatisierung unterstützt Pionierarbeit
Beim Daten-Management-Service arbeiten wir mit Hyperscalern zusammen, deren IT-Ressourcen auf Basis des Cloud Computings sich in hohem Maß skalieren lassen. Mithilfe dieser leistungsfähigen Netzwerke bieten wir die besten Algorithmen und Speicherberechnungen für riesige Datenmengen.
In der Vergangenheit hat Tech Mahindra bereits die Pionierarbeit eines Unternehmens bei der Demokratisierung von NGS-Daten über mehrere Länder hinweg unterstützt. Das Unternehmen suchte nach einer integrierten Lösung für die Verwaltung von NGS-Daten und ihre Ergänzung aus zuverlässigen Quellen. Außerdem sollten manuelle Prozesse ersetzt und die Markteinführung beschleunigt werden.
Mit dem Kunden wurden folgende Lösungen erfolgreich umgesetzt: automatisierte Konvertierung von Datendateien (die von DNA-Lösungspipelines akzeptiert werden können), automatisierte Berichte zur Qualitätskontrolle, Hochgeschwindigkeitstransfer und -Sharing von Omics-Daten, Erstellen einer Arbeitsumgebung für Tertiäranalysen, Beratung für End-to-End-Workflows, Aufnahme strukturierter Daten in Hadoop (Open-Source-Framework) oder RDBMS (Relational Database -Management System).
Der Kunde profitierte vor allem von der Automatisierung – sowohl bei der Konvertierung der Dateien als auch bei der Datenübertragung. Da keine manuellen Eingriffe mehr nötig waren, war die Fehlerquote gering, wurden Metadaten konsistent generiert und hat sich die Datenverarbeitungszeit drastisch verkürzt.
Automatisierung und Sicherheit
Diese Anwendung hat einmal mehr gezeigt: In der Forschung und Entwicklung ist die Automatisierung von molekularbiologischen Arbeitsabläufen unbedingt notwendig. Durch die Automatisierung lassen sich die Arbeitsabläufe bei der Erstellung von DNA-Konstrukten rationalisieren, einschließlich der Erstellung von Anfragen, des Routings, des Designs, der Erstellung, Verfolgung und Archivierung von DNA-Konstrukten.
Eine weitere zukunftsweisende Technologie zur Sicherung und Verfolgung von Genomikdaten ist Blockchain. Insbesondere bei der Entwicklung von Diagnosen und Therapien für die personalisierte Medizin kann Blockchain Patienten, Anbietern und der Gesundheitsindustrie von Nutzen sein.
Blockchain macht Informationen sicher
Blockchain macht es möglich, dass Patienten ihre genetischen Informationen in einem sicheren, unveränderlichen Netzwerk mit Datenblöcken speichern, das jede Änderung dieser Daten verhindert. Außerdem wird ein dezentralisiertes Hauptbuch geschaffen, das es jedem, der über eine entsprechende Berechtigung verfügt, ermöglicht, anonym auf die Daten zuzugreifen, ohne die Privatsphäre der Patienten zu gefährden.
Tech Mahindra praktiziert Blockchain bereits für die Pharmaindustrie. Für einen Kunden kombinieren das Unternehmen NGS- und Blockchain-Angebote, um Genetikdaten zu sichern und nachzuverfolgen. Für Blockchain-Anwendungen bieten der Dienstleister eine modulare, plug-and-play-fähige Computer-Plattform in der Cloud (Platform as a Service, PaaS), die schnell zu aktivieren ist. Kunden können solche Blockchain-Plattformen und -Services in andere systemeigene Anwendungen wie Beschaffungs- und Loyalitäts-Management, Peer-to-Peer-Programme (P2P), Auftrags- und Zahlungs-Management (Order to Cash, O2C) integrieren.
* Fares Zaier ist Vice President & Country Head Germany & Austria bei Tech Mahindra.
(ID:48530750)