Normalisierung ist ein Prozess, mit dem sich nicht optimierte Datenbankdesigns in eine bessere Form bringen lassen. Dies kann etwa durch Redundanzen oder durch Eingaben mit mehreren Werten der Fall sein, Normalisierung reduziert den Strukturmangel.
Das Normalisieren einer rationalen Datenbank bedeutet bis zu einem gewissem Grad mehr Übersichtlichkeit und Effizienz.
Datenbanken sollen Organisationen dabei helfen, die erhobenen Daten nicht einfach nur zu sammeln, sondern auch wirklich sinnvoll einsetzen zu können. Um dies zu gewährleisten, muss eine Datenbank aber auch adäquat strukturiert sein.
Den Prozess, in dem Redundanzen entfernt oder mehrwertige Eingaben gesplittet werden, nennt man Normalisierung. Ziel ist eine Strukturierung der Datenbank in eine optimierte Form, in der Daten in der korrekten Beziehung zueinander stehen und Suche und Sortierung wie gewünscht funktionieren.
Ausgangspunkt hierfür ist eine vorher definierte Normalform.
Von der Normalform zur Normalisierung
Jede Datenbank erhält per Definition eine Normalform, also einen Zielzustand. Dieser wird definiert und die Anforderungen hierfür richten sich ganz nach der gewünschten Nutzung der Datenbank.
Für Online-Shops etwa ist es relevanter zu wissen, welche Kundinnen und Kunden noch Artikel im Einkaufswagen haben, während es für den Newsletter eines Franchises wichtiger ist, die Postleitzahlen der Kund*innen zu kennen, um entsprechend sortieren zu können.
Allerdings gibt es nicht nur eine Normalform, sondern mehrere definierte Normalformen, so dass die Normalisierung die Datenbank von einer Normalform in die nächste überführt. Um dies zu verdeutlichen, ist ein Blick auf die Definitionen der unterschiedlichen Normalformen sinnvoll.
Nullte Normalform
Die Datenbank enthält alle Informationen, es liegt aber noch keine Normalisierung vor. Dieser Zustand kommt vor allem in Fällen vor, in denen die Anforderungsanalyse noch erstellt wird.
Die erste Normalform
Die Datenbank wird in atomare Tabellenspalten aufgeteilt. Atomar entspricht hierbei der Idee, dass sich die Information im Tabellenfeld nicht weiter aufteilen lässt, ohne ihren Sinn zu verlieren. Konkret bedeutet dies, dass etwa Postleitzahl und Ort getrennt werden, da es sich um separate Informationen handelt.
Die zweite Normalform
In der zweiten Normalform erfolgt eine Prüfung zur vollständigen Funktionalität bzw. funktionalen Abhängigkeit der Werte. Hierfür werden Relationstypen gebildet, die über funktionale Abhängigkeiten die Datenbank entschlacken. So erhalten etwa alle kundenbezogenen Datensätze eine individuelle Kundennummer, so dass Einkäufe nur noch in Relation zur Kundennummer gesetzt werden müssen. Es entsteht eine neue Tabelle, die mehr Übersichtlichkeit gewährleistet.
Dritte Normalform
Hier werden durch Normalisierung Redundanzen und Anomalien entfernt, das Streamlining schafft auch bessere Performancewerte, vor allem in großen Datenbanken. Notwendig ist als Vorstufe unbedingt die zweite Normalform, die dritte Normalform entfernt transitive Abhängigkeiten und lagert diese in neue Untertabellen aus. Der Wohnort ist beispielsweise transitiv abhängig von der eindeutigen Postleitzahl und lässt sich daher auslagern. Aufenthaltsland und Vorwahl stehen in einer ähnlichen transitiven Abhängigkeit zueinander.
Boyce Codd Normalform (BCNF)
In vielen Fällen ist die Normalisierung mit der dritten Nomalform abgeschlossen, weiterführende Datenbanknormalisierung würde eine Datenbank in die BCNF überführen. Die Boyce Codd Normalform ist lediglich erforderlich, wenn eine Datenbank mehrere Schlüsselkandidaten mit teilweiser Überlappung besitzt.
Liegt diese Bedingung nicht vor, so ist die dritte Normalform identisch mit der BCNF. Ein Beispiel hierfür wäre die Lagerführung, in der Bestellungen in der Datenbank den bestellten Artikel und den Lagerort führen. Eine Aufteilung der Daten in Untertabellen schafft einen neuen Primärschlüssel und kann so etwa Lagerprozesse optimieren.
Vierte Normalform
Wurde eine Datenbank so normalisiert, dass sie in BCNF vorliegt, kann eine Normalisierung in die vierte Normalform erfolgen. Hier werden mehrwertige Abhängigkeiten entfernt, da es sich hierbei um triviale Abhängigkeiten handelt. In der Praxis erfolgt diese weitere Normalisierung kaum.
Eine triviale Abhängigkeit liegt etwa dann vor, wenn unter einer Kundennummer alle vergangenen Bestellungen gespeichert werden, auch wenn diese an unterschiedliche Adressen verschickt wurden. Die mehrwertige Abhängigkeit ließe sich über zusätzliche Tabellen auflösen.
Fünfte Normalform
Wenn schon die vierte Normalform kaum praxisnah ist, welchen Mehrwert schafft dann eine Normalisierung in die fünfte Normalform? Ziel dieser Normalisierung ist die Auflösung aller Mehrwertigkeiten und eine und eine Auflösung in Abhängigkeiten, die sich nicht weiter trennen lassen. So können Bestellungen etwa nicht nur nach Kundennummer und Artikelnummer abgerufen werden, ein Online-Shop könnte eine neue Referenz über den Hersteller eines Produktes erstellen.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Auf diese Weise entsteht eine höhere Informationsdichte, um Rückschlüsse darauf ziehen zu können, ob der Kundenstamm Artikel bestimmter Hersteller, aus bestimmten Materialien oder mit bestimmten Lieferzeiten vorgezogen vorzieht. Die fünfte Normalform dient entsprechend der Analyse und Informationsgewinnung und kann als Zwischenschritt zur Optimierung der Marketing- und Geschäftsprozesse verstanden werden.
Normalisierung in der Praxis
Was theoretisch so klingen mag, als würde zusätzliche Normalisierung eine Datenbank stets auch in der Praxis optimieren, ist tatsächlich ein Trugschluss. Für die meisten Einsatzszenarien von Datenbanken ist eine Normalisierung in die dritte Normalform nicht nur vollkommen ausreichend, sondern sogar vorteilhaft.
Werden mehr Abhängigkeiten und Redundanzen gelöst, so benötigt die Datenbank mehr Primärschlüssel, die wiederum auf mehr Tabellen verweisen. In Praxis ist die Datenbank dann zwar in eine höhere Normalform normalisiert, allerdings hat sie dadurch entscheidend an Übersichtlichkeit eingebüßt.
Die dritte Normalform kann entsprechend als Optimierung zwischen den Bedürfnissen der User*innen einer Datenbank und der technischen Optimierung verstanden werden. Zusätzliche Optimierungen und Tabellen erhöhen zudem den Anspruch an Speicher und Rechenleistung. Und Prozesse wie Reporting müssen Normalisierungen oft aufheben, um Ergebnisse schneller und effizienter abrufen zu können.