A, T, G, C statt 00, 01, 10, 11 Was ist ein DNA-Speicher?
Anbieter zum Thema
Heutige Datenspeicher sind schnell in der Verarbeitung, haben aber auch eine schnelle Verfallszeit. Sie müssen deshalb relativ oft in aufwendiger Weise „umgebettet“ werden. DNA-Speicher haben da ganz andere Qualitäten. Derzeit sind sie allerdings erst Objekte der Forschung.

Information ist wesensmäßig immateriell, deshalb können die zugrunde liegenden Daten in den unterschiedlichsten Stofflichkeiten materialisiert sein: auf Tontafeln, Papyri, Pergament oder Papier, durch Werkstoffe, bei denen magnetische, elektrische oder optische Eigenschaften geändert werden; oder auch in Form quantenphysikalischer Effekte oder durch DNA-Ketten.
Ein Beispiel für den letztgenannten Fall ist der DNA-Speicher, also die Nutzung von Desoxyribonukleinsäure (DNS oder englisch „DNA“), die in allen Lebewesen der Träger der Erbsubstanz ist, als künstlicher technischer Speicher.
Nullen und Einsen werden zu A, T, G, C
Bei einem solchen Projekt kann man erfreulicherweise - und das ist die positive Nachricht - auf Verfahren aus der Gentechnik aufsetzen. Auch dort geht es darum, technische Möglichkeiten zu schaffen, um vorliegende Gensequenzen von Lebewesen, speziell auch Menschen, zu entschlüsseln beziehungsweise (zum Beispiel zwecks Heilung von Krankheiten) zu ändern.
Sowohl bei der sogenannten Sequenzierung von Desoxyribonukleinsäure, sprich beim Auslesen der Informationen, als auch beim sogenannten Genom-Editieren, sprich dem zielgerichteten Verändern der DNA, hat die Gentechnik große Fortschritte gemacht, die auch für die Nutzung künstlich erzeugter DNA als technischer Speicher verwendet werden können.
Sehr vereinfacht ausgedrückt muss der binäre Code der Informatiker „nur noch“ (!) in eine geeignete Folge der organischen Basen Adenin, Thymin, Guanin und Cytosin umgesetzt werden.
Diese Bausteine des Lebens, in der Regel mit A, T, G und C abgekürzt, scheinen geradezu dazu gemacht zu sein, mit den Nullen und Einsen der herkömmlichen Informationsverarbeitung zu einer künstlichen biochemischen Speicherstruktur „algorithmisch verquickt“ zu werden. Und diese Verquickung ist auf den ersten Blick sehr einfach umzusetzen: die Ziffernfolge 00 wird zu A, die Folge 01 zu C, die Zifferfolge 10 zu G und die Folge 11 zu T.
Dabei treten zwar Fehler auf (das Problem kennt man aus dem Quantencomputing), die man indes mithilfe der im digitalen Bereich eingeführten Codierungs-Schemata ASCII oder UTF-8 erkennen und korrigieren kann.
Die Daten einer solchen Speicherstruktur können dann mit Standard-Gensequenziermaschinen dechiffriert und schließlich mit dem zur Chiffrierung genutzten Algorithmus wieder in die binären Ausgangsdaten zurückübersetzt werden.
Prozess-Schritte teilweise schwer automatisierbar
Leider ist diese kurze Prozess-Beschreibung allenfalls die halbe Wahrheit, weist sie doch erhebliche Lücken auf. Damit kommen wir zu den schlechten Nachrichten.
Zwischen den eben beschriebenen Stationen liegen nämlich sehr viele Prozess-Schritte im biochemischen Labor. In diesen Schritten müssen die Stränge je nach Speicherplan aus den Komponenten G, T, C und A vollautomatisch zusammengesetzt werden. Einschlägige Technologien sind zum Beispiel DNA-Print-Verfahren, mit denen Nukleotid für Nukleotid auf einem Array aufgebaut werden.
Die Prozess-Schritte sind im Vergleich zu konventionellen Speichermedien (derzeit?) sehr aufwendig und teuer, weil sie nur schwer zu automatisieren und in praktikabel nutzbare mobile Systeme einzubinden sind.
Auch gibt es biochemische Parameter, die die Speicherung negativ beeinflussen beziehungsweise gänzlich unbrauchbar machen können. So wird zum Beispiel die Stabilität von DNA stark vom GC-Gehalt beeinflusst, das heißt dem Anteil der Nukleotide Guanin und Cytosin. Cytosin und Guanin binden mit je drei Wasserstoffbrücken, Adenin und Thymin haben dagegen zwei Wasserstoffbrückenbindungen. Um die Stabilität des Gesamtgebildes zu erhalten, muss bei der Verwendung von DNA darauf geachtet werden, dass ein GC-Gehalt von 40 bis 60 Prozent eingehalten wird. Außerhalb dieses Bereiches wird die DNA instabil, was zu Degeneration und Informationsverlust bei der Lagerung, Synthese oder dem Auslesen führen kann.
Spezialfall In-vivo-Speicherung
Neben der eben genannten Problematik gibt es viele andere Fallstricke. So können zum Beispiel längere Wiederholungen desselben Nukleotids (sogenannte Homopolymere) nur schwer ausgelesen werden. Darüber hinaus lässt sich mit den heute verfügbaren Sequenzierungstechniken oft nicht die genaue Länge eines solchen Homopolymers bestimmen.
Eine delikate Sache stellen auch die jeweiligen kurzen DNA-Abschnitte dar ("Motive"). Nicht jedes Motiv ist für alle Lese- und Schreib-Operationen gleichermaßen geeignet. Und nicht zuletzt spielen der Typus und der Inhalt einer DNA-Sequenz eine entscheidende Rolle bei der In-Vivo-Speicherung, zum Beispiel in Bakterien. Hier müssen Sequenzen vermieden werden, die zum Ablesen der DNA führen können, aber auch zum Verlust der DNA bei der Zellteilung.
Nur zur Erklärung: In-vivo-Speicherung ist bei Überlegungen zur DNA-Speicherung nicht der Normalfall, aber eben doch möglich. Und sie ist interessant, weil man dadurch quasi gratis aufgrund der Zellteilung Kopien von Speicherinhalten erhält.
Wie macht man die DNA-Sequenz haltbar?
Das Besondere an einem DNA-Speicher ist zum einen das riesige Volumen: so ist es im Prinzip möglich, in einem Kubikmillimeter DNA eine Million Terabyte zu speichern. Damit übertrifft ein DNA-Speicher die besten konventionellen Speicher um mindestens den Faktor 106.
Der andere, noch weit interessantere Vorzug ist die große Beständigkeit, bei der ein DNA-Speicher heutige Computerspeicher um Längen übertrifft. Bei geeigneter Lagerung, die kühl und lichtgeschützt erfolgen muss, ist ein DNA-Speicher nahezu beliebig lange haltbar. Die erfolgreiche DNA-Bestimmung bei einem Neandertalerknochen ist dafür der handfeste Beweis.
Trotzdem: Es ist überhaupt nicht trivial, DNA-Sequenzen, in denen man einen Text, einen Film oder ein Musikstück gespeichert hat, haltbar zu machen und dann auch wieder erfolgreich zu „verflüssigen“, um den Inhalt auslesen zu können. Zu Demonstrationszwecken gelangen derartige Versuche zwar, waren aber mit hohem Aufwand verbunden.
Der schweizerische Chemieingenieur Robert Grass von der ETH Zürich hat zusammen mit seinem Kollegen Wendelin Stark ein Verfahren auf der Basis winziger Glaspartikel entwickelt. Mit einer Glaspartikel-Schicht können die einzelnen DNA-Moleküle geschützt und rund 1000 Jahre konserviert werden.
Um an die gespeicherten Daten zu kommen, benetzen die beiden Ingenieure die Glashülle mit Flusssäure, einer hochgiftigen Substanz. Die Flusssäure zersetzt die Hülle, beschädigt aber bei richtiger Konzentration und Anwendung die DNA nicht. Das Ganze ist nicht nur hochkomplex und hochgiftig, sondern - wie zu erwarten – auch sehr teuer. Neue Ideen sind also mehr als erwünscht.
Microsoft und die elf Nukleotide
Und als sei das alles nicht schon kompliziert genug, wartete kürzlich Microsoft zusammen mit einem Team der Universität von Illinois Urbana Champaign mit einer künstlichen Speicher-DNA auf, die nicht aus den biologisch vier organischen Basen besteht, sondern aus den vier natürlichen und sieben künstlichen Nukleotiden, also insgesamt elf. Damit kann man viel mehr Informationen kodieren, das ergibt schon eine einfache kombinatorische Überschlagsrechnung.
Leider können die derzeit existierenden DNA-Speicher-Systeme die sieben neuen Basen nicht erkennen. Deshalb musste das Team gleich noch eine neue Methode zum Auslesen von DNA-Sequenzen entwickeln.
Das Auslesen wird mit Hilfe eines speziellen Proteins ermöglicht, das alle Nukleotide erkennt, seien sie künstlich oder natürlich. Machine-Learning-Algorithmen entschlüsseln die darin gespeicherten Informationen. Man habe 77 verschiedene Kombinationen der elf Nukleotide ausprobiert und man habe jede von ihnen perfekt unterscheiden können, sagen die Forscher.
Anwendungsbereich Archivspeicher
Ist der DNA-Speicher das nächste (analoge) große Ding in der digitalen Welt? Noch vor dem Quantencomputing? Man weiß es nicht so genau.
Genauer kann man da schon das Anwendungsfeld erahnen, wenn denn ein DNA-Speicher technisch zuverlässig und industriell zu vernünftigen Kosten herstellbar auf den Markt kommt. Am sinnvollsten sind solche biochemischen Speichersysteme wohl für Archivspeichersysteme einsetzbar, die möglichst lange und ohne Umschichtung und Umcodierung lesbar sein sollen.
(ID:49705827)