Die Gen-Sequenzierung bei Urmenschen ist nun 39-mal effizienter KI-Technik von Inspur beschleunigt in China die Analyse antiker DNA

Autor / Redakteur: Liu Jun* / Ulrike Ostler

Wie schwierig ist die Untersuchung antiker DNA? Mithilfe von Inspur-FPGA-Technik, die beim erstem „Ancient DNA Laboratory“ im Einsatz sind, verkürzt sich jedenfalls die Analysezeit der Ganz-Genom-Proben von Urmenschen von zwei Wochen auf fast neun Stunden.

Firma zum Thema

Antike DNA zu entschlüsseln ist weitaus aufwändiger als den Gencode von heutigen Lebenwesen zu knacken. Lenovo liefert Rechner mit FPGAs als Bescheluniger, die den Analysezeitraum deutlich verkürzen können.
Antike DNA zu entschlüsseln ist weitaus aufwändiger als den Gencode von heutigen Lebenwesen zu knacken. Lenovo liefert Rechner mit FPGAs als Bescheluniger, die den Analysezeitraum deutlich verkürzen können.
(Bild: Inspur)

Die verschiedenen chinesischen Ethnien leben seit 5.000 Jahren auf der Erde. Um ihre Geschichte zurückzuverfolgen, haben Forscher aus Archäologie und Ethnologie verschiedene Methoden entwickelt, um die antiken Mythen zu entziffern, die den modernen Menschen hinterlassen wurden.

In den vergangenen Jahren hat eine neue Methode, die antike DNA-Forschung, eine neue Perspektive für die Erforschung der menschlichen Geschichte eröffnet. Damit lassen sich direkte und aussagekräftige Nachweise in der antiken DNA erbringen.

Antike DNA bezieht sich auf historische biologische Moleküle, die aus alten menschlichen und tierischen Überresten und paläontologischen Fossilien gewonnen werden. Der Vergleich von antiken DNA-Daten mit modernen Gendaten ermöglicht es Forschern, einen Stammbaum einer bestimmten biologischen Kategorie zu erstellen. Dieser erlaubt neue Erkenntnisse zur menschlichen Evolution und Migration, ethnischen Integration, frühen landwirtschaftlichen Entwicklung, Domestizierung von Tieren und Pflanzen und anderen wichtigen Themen im Zusammenhang mit der menschlichen Zivilisation.

Noch viel komplizierter ...

Die Erforschung antiker DNA erfordert die Extraktion, Amplifikation und Sequenzierung, was wesentlich komplexer ist als die Erforschung moderner DNA. Insbesondere die Extraktion antiker DNA (auch abgekürzt als aDNA zu finden) ist eine Herausforderung, da in der Natur kein geeignetes Konservierungsmilieu vorhanden ist; denn die DNA wird im Zellkern gespeichert. Beim Tod des Organismus, wenn die Zelle allmählich eine Autolyse durchläuft, wird die DNA schnell abgebaut.

Das Bild stammt von dem Labor für Alte DNA, das 2008 von der Graduiertenschule Menschliche Entwicklung in Landschaften und der Medizinischen Fakultät der Universität Kiel eingerichtet wurde. Die Arbeiten an antiker DNA (aDNA) werden derzeit am Institut für Rechtsmedizin (alle Prä-PCR-Schritte einschließlich der Abtrennung) und am Institut für Klinische Molekularbiologie (alle Post-Amplifikationsverfahren einschließlich Next Generation Sequencing (NGS) und Datenanalyse) durchgeführt.
Das Bild stammt von dem Labor für Alte DNA, das 2008 von der Graduiertenschule Menschliche Entwicklung in Landschaften und der Medizinischen Fakultät der Universität Kiel eingerichtet wurde. Die Arbeiten an antiker DNA (aDNA) werden derzeit am Institut für Rechtsmedizin (alle Prä-PCR-Schritte einschließlich der Abtrennung) und am Institut für Klinische Molekularbiologie (alle Post-Amplifikationsverfahren einschließlich Next Generation Sequencing (NGS) und Datenanalyse) durchgeführt.
(Bild: Universität Kiel)

Darüber hinaus ist die DNA bei hohen Temperaturen und Luftfeuchtigkeit anfällig für Hydrolyse und Zerfall. Selbst wenn die Zellen konserviert werden, könnten andere Mikroorganismen in die Zelle eindringen und Enzyme produzieren, die die DNA in der ursprünglichen Zelle zerstören könnten. Daher ist es schwierig, die DNA der toten Tiere und menschlichen Überreste intakt zu halten.

Aus diesem Grund sind antike DNA-Gen-Sequenzfragmente kürzer und die Sequenzierung aufwändiger als die von moderner DNA. Nicht nur die Menge der zu analysierenden und zu vergleichenden Daten ist größer, sondern auch die Linker-Sequenz an beiden Enden des DNA-Fragments muss vor der Sequenzierung entfernt werden. Außerdem sind Verfahren zur Datenreinigung und -verarbeitung erforderlich.

Wie löst das Ancient DNA Laboratory in China das Problem?

Im Jahr 1988 gründeten die Fakultät für Archäologie und die Fakultät für Life Science gemeinsam Chinas erstes „Ancient DNA Laboratory“ zur Erforschung antiker DNA. Seitdem haben das Forschungszentrum für Chinesische Grenzgebiet-Archäologie der Jilin Universität und das Antike-DNA-Labor an mehreren großen Forschungsprojekten zusammengearbeitet und verschiedene national und sogar weltweit führende Forschungsergebnisse erzielt.

Im Laufe des Studiums der antiken DNA wurden mehr als 10.000 Proben von antiken Menschen, Tieren und Pflanzen im Labor gelagert – die höchste Anzahl im Land. Das Ancient DNA Laboratory hat heute die Möglichkeit und Ressourcen, die Gen-Datenbank der antiken Chinesen aufzubauen, die in den Grenzgebieten (Frontiers) lebten.

Funde in Südchina, die geeignet sind, antike DNA zu entschlüsseln. Das Bild und die zugehörigen Erkenntnisse entstammen der Veröffnetlichung bei „Proceedings of the National Academy of Sciences“. So sammelten die Forscher Proben aus fünf Höhlen. Aus zwei Höhlen, der Yangjiapo-Höhle und der Fuyan-Höhle, extrahierten sie DNA aus menschlichen Überresten. Proben aus der Fuyan-Höhle waren zuvor indirekt auf ein Alter zwischen 80 000 und 120 000 Jahren datiert worden, und zwar auf der Grundlage von U-Th-Datierungen von Flussstein, Ablagerungen von Kalzit oder anderen Mineralien, die in Höhlen vorkommen. Dieser frühere Befund wurde aufgrund der Art der dort gefundenen Fossilien auch auf die Yangjiapo-Höhle extrapoliert. Die Forscher sequenzierten alte DNA-Proben von acht Zähnen aus der Yangjiapo-Höhle und zwei aus der Fuyan-Höhle. Bei der Analyse dieser und anderer moderner und alter menschlicher Proben sowie von Neandertaler- und Denisovan-Proben stellten die Forscher fest, dass das Höchstalter der Proben weniger als 15.600 Jahre beträgt und auf das Holozän und nicht früher datiert werden kann.
Funde in Südchina, die geeignet sind, antike DNA zu entschlüsseln. Das Bild und die zugehörigen Erkenntnisse entstammen der Veröffnetlichung bei „Proceedings of the National Academy of Sciences“. So sammelten die Forscher Proben aus fünf Höhlen. Aus zwei Höhlen, der Yangjiapo-Höhle und der Fuyan-Höhle, extrahierten sie DNA aus menschlichen Überresten. Proben aus der Fuyan-Höhle waren zuvor indirekt auf ein Alter zwischen 80 000 und 120 000 Jahren datiert worden, und zwar auf der Grundlage von U-Th-Datierungen von Flussstein, Ablagerungen von Kalzit oder anderen Mineralien, die in Höhlen vorkommen. Dieser frühere Befund wurde aufgrund der Art der dort gefundenen Fossilien auch auf die Yangjiapo-Höhle extrapoliert. Die Forscher sequenzierten alte DNA-Proben von acht Zähnen aus der Yangjiapo-Höhle und zwei aus der Fuyan-Höhle. Bei der Analyse dieser und anderer moderner und alter menschlicher Proben sowie von Neandertaler- und Denisovan-Proben stellten die Forscher fest, dass das Höchstalter der Proben weniger als 15.600 Jahre beträgt und auf das Holozän und nicht früher datiert werden kann.
(Bild: PNAS)

Allerdings bringt die steigende Zahl der Proben auch neue Herausforderungen mit sich. Die bisherige Computer-Infrastruktur ist nicht in der Lage, den Prozess der Gen-Sequenzierung von Daten in kurzer Zeit zu bewältigen.

Die Analyse von Ganz-Genom-Proben (WGS, Whole Genome Sequencing) und die Exom-Sequenzierung (WES, Whole Exome Sequencing) sind zwei unabdingbare Analyseverfahren der DNA-Forschung. Der mit der aktuellen CPU-basierten Rechenarchitektur entwickelte Best Practices Workflow des Genom-Analyse-Toolkits (GATK) benötigt jedoch Tage oder sogar Wochen, bis die Identifikation der einzelnen genomischen Varianten abgeschlossen ist.

Darüber hinaus führen die kürzeren Fragmente antiker DNA-Gene zu einem größeren Datenverarbeitungsbedarf und höheren Anforderungen an die Rechenleistung. Bei der Datenreinigung und Sequenzierung wird Anwendungssoftware benötigt, die sich von derjenigen unterscheidet, die bei der modernen DNA-Sequenzierung verwendet wird. Der schnelle Einsatz und die Entwicklung dieser Software ist ebenfalls eine große Herausforderung, was die Erforschung antiker DNA verlangsamt.

Rechner mit FPGAs als Beschleuniger

Professor Cai Dawei, stellvertretender Direktor des Forschungszentrums für chinesische Grenzarchäologie der Universität Jilin, erläutert das Problem: „Für die Verarbeitung antiker DNA-Sequenzierungsdaten haben wir Desktop-Workstations verwendet. In der Regel dauert es mindestens zwei Wochen, um die Analyse einer antiken menschlichen Genomprobe abzuschließen. Zudem besteht das Risiko, dass der Verarbeitungsprozess durch Ausfälle unterbrochen wird.“

Die Konsequenz: Es sei eine geradezu unmögliche Aufgabe, eine antike DNA-Genbank für Chinas Grenzgebiete mit dieser Effizienz aufzubauen. „Wir wollten dieses Problem so schnell wie möglich lösen“, sagt er.

Als Marktführer für KI-Computing in China schlug Inspur vor, eine Computing-Lösung mit FPGA-Beschleunigern zu entwickeln, um diese Herausforderung zu meistern. Die Lösungen mit FPGA-Beschleunigern sind programmierbar, ermöglichen paralleles Rechnen und zeichnen sich durch eine geringe Latenz aus.

KI-Tauglichkeit

Daher bieten sie eine leistungsstarke Beschleunigung für KI- und HPC-Szenarien wie Gensequenzierung, Spracherkennung, Videoverarbeitung und Risiko-Management. Nach ausführlichen Tests und umfassenden Untersuchungen entschied sich die School of Archaeology der Jilin University für die Zusammenarbeit mit Inspur und die Anwendung der FPGA-Technologie bei der Gensequenzierung von antiker DNA. Diese Zusammenarbeit markiert die erste Gensequenzierung mit FPGA-Beschleunigern auf dem Gebiet der Erforschung antiker DNA in China.

Das Inspur-Bauteil mit FPGA „F10A“
Das Inspur-Bauteil mit FPGA „F10A“
(Bild: Inspur)

Die neuen Systeme für die Gen-Sequenzierung nutzen den „F10A“ FPGA-Beschleuniger als Kern und integrieren die „GATK“ Gen-Verarbeitungssoftware von Falcon Computing. Als FPGA-Beschleuniger mit der höchsten Dichte und der extremsten Leistung, der OpenCL unterstützt, ist der Inspur F10A halb so hoch und halb so lang mit einer geringen Leistungsaufnahme von 35 Watt und eignet sich für verschiedene komplexe Computing-Umgebungen wie Rechenzentren, Edge und Desktops. Mit einer Leistung von 42 GigaFlops pro Watt kann der Inspur F10A eine professionelle Software-Algorithmen-Bibliothek laden.

Die integrierte GATK-Gen-Verarbeitungssoftware von Falcon Computing ist kompatibel mit Standard-Bioinformatik-Analyse-Tools, einschließlich aller Workflows der GATK Best Practices, wie „BWA“, „Picard“ und GATK. Die integrierte Software ist identisch mit der Originalsoftware mit dem gleichen Befehl. Benutzer können die Daten aufgrund der Zwischendaten, die mit den Originalproben konsistent sind, unkompliziert verwenden und anpassen.

Der Turbo für neue Forschungsfelder

Tests haben ergeben, dass mit der Inspur FPGA-Technik für beschleunigte Gen-Sequenzierung die Ganz-Genom-Analyse innerhalb von 9,64 Stunden und die Ganz-Exom-Analyse innerhalb von 48 Minuten abgeschlossen werden kann. Verglichen mit der CPU-basierten Lösung wird die Geschwindigkeit der Gendatenverarbeitung um das 39-fache erhöht.

Auf der Grundlage des neuen beschleunigten Computersystems für die Gen-Sequenzierung untersuchen die Forscher im Ancient DNA Laboratory der Jilin-Universität derzeit die menschlichen Knochen der Nomaden im nordchinesischen Grasland, wie der Xiongnu, Donghu, Xianbei, Wuhuan, Khitan und der Mongolei, sowie die ausgegrabenen Tiere und Pflanzen für die DNA-Extraktion und Forschung.

Darüber hinaus nutzen sie die damit gewonnenen Forschungsergebnisse für Erkenntnisse zu den biologischen Beziehungen zwischen den ethnischen Gruppen entlang der alten 'Seidenstraße' in Xinjiang, zum Migrations- und Verschmelzungsprozess zwischen den Völkern, zum wirtschaftlichen und kulturellen Leben, zur natürlichen Umgebung und die Beziehungen zwischen den Menschen. Die Forschung liefert kontinuierlich neues Material für die Erforschung der antiken Geschichte, Kultur und Ethnie und eröffnet neue Forschungsfelder.

Das erste Labor in China, das sich auf die Erforschung alter DNA spezialisiert hat, wurde 1998 in Zusammenarbeit mit der School of Life Sciences der Universität Jilin gegründet. Dem Labor stehen rund 400 Quadratmeter mit ultrasauberen Werkbänke, Kryomühlen, DNA-Gel-Imager, Gradienten-PCR-Maschinen, ABI 310 DNA-Sequenzierautomaten, UV-Spektralphotometer, Hochdruck-Flüssigkeitschromatographen sowie eine Vielzahl von Zentrifugen und anderer Geräte im Wert von 3,5 Millionen Yuan (rund 460 642 Euro) zur Verfügung.
Das erste Labor in China, das sich auf die Erforschung alter DNA spezialisiert hat, wurde 1998 in Zusammenarbeit mit der School of Life Sciences der Universität Jilin gegründet. Dem Labor stehen rund 400 Quadratmeter mit ultrasauberen Werkbänke, Kryomühlen, DNA-Gel-Imager, Gradienten-PCR-Maschinen, ABI 310 DNA-Sequenzierautomaten, UV-Spektralphotometer, Hochdruck-Flüssigkeitschromatographen sowie eine Vielzahl von Zentrifugen und anderer Geräte im Wert von 3,5 Millionen Yuan (rund 460 642 Euro) zur Verfügung.
(Bild: School of Archaeology, Jilin University © 2020)

Zum Beispiel arbeiten Professor Cai Dawei und sein Team an einem großen Projekt des National Social Science Fund „Study on Cultural Exchanges on the Silk Road from the Perspective of Ancient Animal DNA“. Mit antiker Tier-DNA als Forschungsgrundlage stellen sie den historischen Prozess des Ursprungs und der Ausbreitung antiker Tiergruppen entlang der Seidenstraße wieder her und zeigen die historischen Details des kulturellen Austauschs zwischen Osten und Westen auf der Seidenstraße auf.

* Liu Jun ist VP und General Manager, AI und HPC, bei Inspur Information.

Artikelfiles und Artikellinks

(ID:47571026)