Heutige Datenspeicher sind schnell in der Verarbeitung, haben aber auch eine schnelle Verfallszeit. Sie müssen deshalb relativ oft in aufwendiger Weise „umgebettet“ werden. DNA-Speicher haben da ganz andere Qualitäten. Derzeit sind sie allerdings erst Objekte der Forschung.
Speichert die Doppelhelix der Desoxyribonukleinsäure in ein paar Jahren die Daten in unseren Archiven?
(Bild: von Colin Behrens auf Pixabay)
Information ist wesensmäßig immateriell, deshalb können die zugrunde liegenden Daten in den unterschiedlichsten Stofflichkeiten materialisiert sein: auf Tontafeln, Papyri, Pergament oder Papier, durch Werkstoffe, bei denen magnetische, elektrische oder optische Eigenschaften geändert werden; oder auch in Form quantenphysikalischer Effekte oder durch DNA-Ketten.
Ein Beispiel für den letztgenannten Fall ist der DNA-Speicher, also die Nutzung von Desoxyribonukleinsäure (DNS oder englisch „DNA“), die in allen Lebewesen der Träger der Erbsubstanz ist, als künstlicher technischer Speicher.
Nullen und Einsen werden zu A, T, G, C
Bei einem solchen Projekt kann man erfreulicherweise - und das ist die positive Nachricht - auf Verfahren aus der Gentechnik aufsetzen. Auch dort geht es darum, technische Möglichkeiten zu schaffen, um vorliegende Gensequenzen von Lebewesen, speziell auch Menschen, zu entschlüsseln beziehungsweise (zum Beispiel zwecks Heilung von Krankheiten) zu ändern.
Sowohl bei der sogenannten Sequenzierung von Desoxyribonukleinsäure, sprich beim Auslesen der Informationen, als auch beim sogenannten Genom-Editieren, sprich dem zielgerichteten Verändern der DNA, hat die Gentechnik große Fortschritte gemacht, die auch für die Nutzung künstlich erzeugter DNA als technischer Speicher verwendet werden können.
Sehr vereinfacht ausgedrückt muss der binäre Code der Informatiker „nur noch“ (!) in eine geeignete Folge der organischen Basen Adenin, Thymin, Guanin und Cytosin umgesetzt werden.
Diese Bausteine des Lebens, in der Regel mit A, T, G und C abgekürzt, scheinen geradezu dazu gemacht zu sein, mit den Nullen und Einsen der herkömmlichen Informationsverarbeitung zu einer künstlichen biochemischen Speicherstruktur „algorithmisch verquickt“ zu werden. Und diese Verquickung ist auf den ersten Blick sehr einfach umzusetzen: die Ziffernfolge 00 wird zu A, die Folge 01 zu C, die Zifferfolge 10 zu G und die Folge 11 zu T.
Dabei treten zwar Fehler auf (das Problem kennt man aus dem Quantencomputing), die man indes mithilfe der im digitalen Bereich eingeführten Codierungs-Schemata ASCII oder UTF-8 erkennen und korrigieren kann.
Die Daten einer solchen Speicherstruktur können dann mit Standard-Gensequenziermaschinen dechiffriert und schließlich mit dem zur Chiffrierung genutzten Algorithmus wieder in die binären Ausgangsdaten zurückübersetzt werden.
Prozess-Schritte teilweise schwer automatisierbar
Leider ist diese kurze Prozess-Beschreibung allenfalls die halbe Wahrheit, weist sie doch erhebliche Lücken auf. Damit kommen wir zu den schlechten Nachrichten.
Zwischen den eben beschriebenen Stationen liegen nämlich sehr viele Prozess-Schritte im biochemischen Labor. In diesen Schritten müssen die Stränge je nach Speicherplan aus den Komponenten G, T, C und A vollautomatisch zusammengesetzt werden. Einschlägige Technologien sind zum Beispiel DNA-Print-Verfahren, mit denen Nukleotid für Nukleotid auf einem Array aufgebaut werden.
Die Prozess-Schritte sind im Vergleich zu konventionellen Speichermedien (derzeit?) sehr aufwendig und teuer, weil sie nur schwer zu automatisieren und in praktikabel nutzbare mobile Systeme einzubinden sind.
Auch gibt es biochemische Parameter, die die Speicherung negativ beeinflussen beziehungsweise gänzlich unbrauchbar machen können. So wird zum Beispiel die Stabilität von DNA stark vom GC-Gehalt beeinflusst, das heißt dem Anteil der Nukleotide Guanin und Cytosin. Cytosin und Guanin binden mit je drei Wasserstoffbrücken, Adenin und Thymin haben dagegen zwei Wasserstoffbrückenbindungen. Um die Stabilität des Gesamtgebildes zu erhalten, muss bei der Verwendung von DNA darauf geachtet werden, dass ein GC-Gehalt von 40 bis 60 Prozent eingehalten wird. Außerhalb dieses Bereiches wird die DNA instabil, was zu Degeneration und Informationsverlust bei der Lagerung, Synthese oder dem Auslesen führen kann.
Spezialfall In-vivo-Speicherung
Neben der eben genannten Problematik gibt es viele andere Fallstricke. So können zum Beispiel längere Wiederholungen desselben Nukleotids (sogenannte Homopolymere) nur schwer ausgelesen werden. Darüber hinaus lässt sich mit den heute verfügbaren Sequenzierungstechniken oft nicht die genaue Länge eines solchen Homopolymers bestimmen.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Eine delikate Sache stellen auch die jeweiligen kurzen DNA-Abschnitte dar ("Motive"). Nicht jedes Motiv ist für alle Lese- und Schreib-Operationen gleichermaßen geeignet. Und nicht zuletzt spielen der Typus und der Inhalt einer DNA-Sequenz eine entscheidende Rolle bei der In-Vivo-Speicherung, zum Beispiel in Bakterien. Hier müssen Sequenzen vermieden werden, die zum Ablesen der DNA führen können, aber auch zum Verlust der DNA bei der Zellteilung.
Nur zur Erklärung: In-vivo-Speicherung ist bei Überlegungen zur DNA-Speicherung nicht der Normalfall, aber eben doch möglich. Und sie ist interessant, weil man dadurch quasi gratis aufgrund der Zellteilung Kopien von Speicherinhalten erhält.
Wie macht man die DNA-Sequenz haltbar?
Das Besondere an einem DNA-Speicher ist zum einen das riesige Volumen: so ist es im Prinzip möglich, in einem Kubikmillimeter DNA eine Million Terabyte zu speichern. Damit übertrifft ein DNA-Speicher die besten konventionellen Speicher um mindestens den Faktor 106.
Der andere, noch weit interessantere Vorzug ist die große Beständigkeit, bei der ein DNA-Speicher heutige Computerspeicher um Längen übertrifft. Bei geeigneter Lagerung, die kühl und lichtgeschützt erfolgen muss, ist ein DNA-Speicher nahezu beliebig lange haltbar. Die erfolgreiche DNA-Bestimmung bei einem Neandertalerknochen ist dafür der handfeste Beweis.
Trotzdem: Es ist überhaupt nicht trivial, DNA-Sequenzen, in denen man einen Text, einen Film oder ein Musikstück gespeichert hat, haltbar zu machen und dann auch wieder erfolgreich zu „verflüssigen“, um den Inhalt auslesen zu können. Zu Demonstrationszwecken gelangen derartige Versuche zwar, waren aber mit hohem Aufwand verbunden.
Der schweizerische Chemieingenieur Robert Grass von der ETH Zürich hat zusammen mit seinem Kollegen Wendelin Stark ein Verfahren auf der Basis winziger Glaspartikel entwickelt. Mit einer Glaspartikel-Schicht können die einzelnen DNA-Moleküle geschützt und rund 1000 Jahre konserviert werden.
Um an die gespeicherten Daten zu kommen, benetzen die beiden Ingenieure die Glashülle mit Flusssäure, einer hochgiftigen Substanz. Die Flusssäure zersetzt die Hülle, beschädigt aber bei richtiger Konzentration und Anwendung die DNA nicht. Das Ganze ist nicht nur hochkomplex und hochgiftig, sondern - wie zu erwarten – auch sehr teuer. Neue Ideen sind also mehr als erwünscht.
Microsoft und die elf Nukleotide
Und als sei das alles nicht schon kompliziert genug, wartete kürzlich Microsoft zusammen mit einem Team der Universität von Illinois Urbana Champaign mit einer künstlichen Speicher-DNA auf, die nicht aus den biologisch vier organischen Basen besteht, sondern aus den vier natürlichen und sieben künstlichen Nukleotiden, also insgesamt elf. Damit kann man viel mehr Informationen kodieren, das ergibt schon eine einfache kombinatorische Überschlagsrechnung.
Leider können die derzeit existierenden DNA-Speicher-Systeme die sieben neuen Basen nicht erkennen. Deshalb musste das Team gleich noch eine neue Methode zum Auslesen von DNA-Sequenzen entwickeln.
Das Auslesen wird mit Hilfe eines speziellen Proteins ermöglicht, das alle Nukleotide erkennt, seien sie künstlich oder natürlich. Machine-Learning-Algorithmen entschlüsseln die darin gespeicherten Informationen. Man habe 77 verschiedene Kombinationen der elf Nukleotide ausprobiert und man habe jede von ihnen perfekt unterscheiden können, sagen die Forscher.
Anwendungsbereich Archivspeicher
Ist der DNA-Speicher das nächste (analoge) große Ding in der digitalen Welt? Noch vor dem Quantencomputing? Man weiß es nicht so genau.
Genauer kann man da schon das Anwendungsfeld erahnen, wenn denn ein DNA-Speicher technisch zuverlässig und industriell zu vernünftigen Kosten herstellbar auf den Markt kommt. Am sinnvollsten sind solche biochemischen Speichersysteme wohl für Archivspeichersysteme einsetzbar, die möglichst lange und ohne Umschichtung und Umcodierung lesbar sein sollen.