Pharma- und Gesundheitsforschung mit Cambridge-1 Leistungsfähigster Supercomputer in UK ist ein Nvidia-Cluster

Autor / Redakteur: Julia Mutzbauer / Ulrike Ostler

In der vergangenen Woche hat Nvidia „Cambridge-1“, den derzeit leistungsstärksten Supercomputer in Großbritannien, offiziell eingeweiht. Zu den ersten Projekten gehören welche mit Astra Zeneca, GSK, Guy's and St Thomas' NHS Foundation Trust, King's College London und Oxford Nanopore Technologies.

Firmen zum Thema

„Cambridge-1“ ist der erste Supercomputer von Nvidia, den das Unternehmen für Externe zugänglich macht, und zwar für branchenspezifischen Forschung in Großbritannien.
„Cambridge-1“ ist der erste Supercomputer von Nvidia, den das Unternehmen für Externe zugänglich macht, und zwar für branchenspezifischen Forschung in Großbritannien.
(© NVIDIA)

Cambridge-1 ist der erste Nvidia-Supercomputer, der für den externen Forschungszugang entwickelt und gebaut wurde, und der erste, der zur Förderung der branchenspezifischen Forschung in Großbritannien einsetzt wird. Nach eigenen Angaben hat Nvidia in die Entwicklung rund 100 Millionen Dollar investiert - in den Bereichen Accelerated Computing, Künstliche Intelligenz (KI) und Biowissenschaften. Spitzenwissenschaftler und Gesundheitsexperten sollen mit dem Rechen-Cluster die Revolution der digitalen Biologie beschleunigen und die Life-Science-Industrie des Landes stärken.

Das Unternehmen plant außerdem den Bau eines „AI Center for Excellence“ in Cambridge mit einem neuen ARM-basierten Supercomputer, der weitere Branchen im ganzen Land unterstützen soll.

Nach dem Ranking der Top500-Liste gehört das Cambridge-1, das auf der Nvidia-Supercomputertechnik „DGX SuperPOD“ gründet, zu den 50 schnellsten Computern der Welt und wird zu 100 Prozent mit erneuerbarer Energie betrieben.

Das Cluster ist mit 80 „DGX A100“-Systemen ausgestattet, die A100-GPUs, „Bluefield-2“ DPUs und „HDR Infiniband“-Netzwerke integrieren. Das System kommt auf mehr als 400 PetaFlops an KI-Leistung und 8 PetaFlops an Linpack-Leistung.Es befindet sich in einer Einrichtung, die vom Kao Data betrieben wird.

Laut einem Bericht der Wirtschaftsberatung „Frontier Economics“ hat Cambridge-1 das Potenzial, in den kommenden zehn Jahren einen geschätzten Wert von 600 Millionen Pfund (etwa 702,4 Millionen Euro) zu schaffen.

Der Anwender Astra Zeneca

Eines der Unternehmen, die von dem Superrechner profitieren könnte, ist der Pharmakonzern Astra Zeneca. Es geht um eine schnellere Entdeckung von Wirkstoffen und ein Transformator-basiertes generatives KI-Modell für chemische Strukturen.

„Transformer-basierte neuronale Netzarchitekturen, die erst in den letzten Jahren verfügbar geworden sind, ermöglichen es Forschern, riesige Datensätze mit selbstüberwachten Trainingsmethoden zu nutzen und die Notwendigkeit von manuell beschrifteten Beispielen während des Vortrainings zu vermeiden“, erläutern die Entwickler. Die die Notwendigkeit von manuell markierten Beispielen während des Pre-Trainings entfalle dadurch.

Als Modell wird „MegaMolBART“ verwendet. Es dient der Reaktionsvorhersage, der molekularen Optimierung und der „de novo“-Molekülgenerierung. Es basiert auf dem „MolBART“-Transformatormodell von AstraZeneca und wird auf der „Zinc“-Datenbank für chemische Verbindungen trainiert - unter Verwendung des „Megatron“-Framework von Nvidia, das ein massiv skaliertes Training auf einer Supercomputing-Infrastruktur ermöglicht. Dieses Modell wird für Forscher und Entwickler im „Nvidia NGC“- Software-Katalog als Open Source verfügbar sein.

Noch ein Astra-Teneca-Projekt

Geplant ist zudem ein separates Projekt auf Cambridge-1, das sich auf den Einsatz von KI in der digitalen Pathologie konzentriert. In der digitalen Pathologie wird viel Zeit und Geld darauf verwendet, ganze Objektträgerbilder von Gewebeproben zu annotieren, um die Suche nach neuen Erkenntnissen zu unterstützen. Durch den Einsatz von unüberwachten KI-Algorithmen, die auf Tausenden von Bildern trainiert wurden, ist es möglich, den Prozess der Annotation zu beschleunigen und gleichzeitig potenzielle Bildgebungsmerkmale zu finden, die bei der Arzneimittelentwicklung helfen

Lindsay Edwards, Vice President und Head of AI, Respiratory and Immunology, Biopharmaceuticals R&D bei Astra Zeneca, sagt: „Das Training von KI-Algorithmen auf ganzen Objektträger-Bildern ist eine Herausforderung, zum Teil aufgrund der Größe der Bilder. Die Zusammenarbeit mit Nvidia bei Cambridge-1 ermöglicht es, unsere aktuelle Arbeit zu skalieren und neue Methoden zu entwickeln, die den Einsatz von KI in der digitalen Pathologie voranbringen.“

Der Anwender Glaxo Smith Kline

Der Forschungs- und Entwicklungsansatz von GSK beinhaltet einen Fokus auf genetisch validierte Zielmoleküle, die eine doppelt so hohe Wahrscheinlichkeit haben, zu Medikamenten zu werden, und mittlerweile mehr als 70 Prozent der Forschungspipeline des Unternehmens ausmachen. Um das Potenzial dieser Erkenntnisse zu maximieren, hat GSK hochmoderne Kapazitäten an der Schnittstelle von Humangenetik, funktioneller Genomik sowie künstlicher Intelligenz und maschinellem Lernen aufgebaut.

Kim Branson, Senior Vice President und Global Head of AI-ML bei GSK, erläutert: „Fortschrittliche Technologien sind das Herzstück des F&E-Ansatzes von GSK und tragen dazu bei, das Potenzial großer, komplexer Daten durch prädiktive Modellierung auf einem neuen Niveau von Geschwindigkeit, Präzision und Skalierung zu erschließen.“

Die Zusammenarbeit mit Partnern, die in den Bereichen Genetik, Genomik und KI/ML führend sind, könne GSK letztlich dabei helfen, mehr über die menschliche Gesundheit vorherzusagen und bessere Medikamente zu entwickeln, die eine doppelt so hohe Wahrscheinlichkeit haben, in der Klinik erfolgreich zu sein und zu zugelassenen Therapien zu werden, die den Patienten zugute kommen.

King's College London sowie Guy's and St. Thomas' NHS Foundation Trust

Das King's College London und die Guy's and St.Thomas' NHS Foundation Trust nutzen Cambridge-1, um KI-Modellen beizubringen, synthetische Gehirnbilder zu generieren, indem sie aus Zehntausenden von MRT-Gehirn-Scans verschiedener Altersgruppen und Krankheiten lernen. Das ultimative Ziel ist es, dieses synthetische Datenmodell zu nutzen, um ein besseres Verständnis von Krankheiten wie Demenz, Schlaganfall, Hirntumor und Multiple Sklerose zu erlangen und eine frühere Diagnose und Behandlung zu ermöglichen.

Denn ein synthetische KI-Gehirnmodell kann eine unendliche Menge an nie gesehenen Hirnbildern mit ausgewählten Merkmalen wie Alte und Krankheit generieren. Das ermögliche, so hoffen die Forscher, ein besseres und nuancierteres Verständnis dafür ermöglichen, wie Krankheiten vor allem im Entwicklungsstadium aussehen, was möglicherweise eine frühere und genauere Diagnose ermöglicht.

Bildergalerie
Bildergalerie mit 5 Bildern

Für die Forschung greifen die Forscher auf Gesundheitsressourcen des Vereinigten Königreichs durch die enge Zusammenarbeit mit dem National Health Service und der UK Biobank zu, einer der reichhaltigsten biomedizinischen Datenbanken der Welt. Das King's College London beabsichtigt, dieses synthetische Datenmodell mit der größeren Forschungs- und Startup-Community zu teilen.

Professor Ian Abbs, Chief Executive Officer des Guy's and St Thomas' NHS Foundation Trust, erläutert: „Die Leistungsfähigkeit von Künstlicher Intelligenz im Gesundheitswesen wird dazu beitragen, die Diagnose für Patienten zu beschleunigen, Dienstleistungen wie Brustkrebs-Screening zu verbessern und die Art und Weise zu unterstützen, wie wir das Risiko einschätzen und Patienten je nach klinischem Bedarf priorisieren.“

Der Anwender Oxford Nanopore

Die Long-Read-Sequenzierungstechnologie von Oxford Nanopore Technologies wird in mehr als 100 Ländern eingesetzt, um genomische Erkenntnisse in einer Vielzahl von Forschungsbereichen zu gewinnen - von der menschlichen und pflanzlichen Gesundheit bis hin zur Umweltüberwachung und antimikrobiellen Resistenz. Der Anwender will die Nvidia-technik in einer Vielzahl von genomischen Sequenzierplattformen einsetzen, um KI-Tools zu entwickeln, die die Geschwindigkeit und Genauigkeit der genomischen Analyse verbessern.

Aufgaben soll sich im Zusammenhang mit der Verbesserung von Algorithmen in Stunden statt in Tagen erledigen. Die verbesserten Algorithmen können zudem eine höhere genomische Genauigkeit gewährleisten.

(ID:47505121)