Der Mensch als Vorbild

Was sind Neuronale Netze?

| Autor / Redakteur: Otto Geißler / Ulrike Ostler

Ein (Künstliches) Neuronales Netz ist ein Netzwerk aus vielen kleinen lernfähigen Einheiten (Neuronen), die hochgradig miteinander verknüpft sind.
Ein (Künstliches) Neuronales Netz ist ein Netzwerk aus vielen kleinen lernfähigen Einheiten (Neuronen), die hochgradig miteinander verknüpft sind. (Bild: © djama - stock.adob.com)

Unter (Künstlichen) Neuronalen Netzen, Artificial Neural Networks (ANN) oder Simulated Neural Networks (SNN), versteht man in der IT Computermodelle, die sich an den Organisationsprinzipien, der Informationsverarbeitung, der Speicherung der Informationen und den Lernprozessen des menschlichen Gehirns orientieren.

Nach „Eliza“, ein 1966 von Joseph Weizenbaum entwickeltes Programm, und dem nachfolgenden Boom um Künstliche Intelligenz, war es nach dem dem Ende de Hype für viele Jahre still um die Modelle der (Künstlichen) Neuronalen Netze (KNN). Einzelne Ansätze im Netzwerk-Management, in der Entscheidungsunterstützung und im IT-Service-Management gab es, genauso wie Algorithmen zur Optimierung, fanden aber weder in der IT-Branche noch in der Bevölkerung große Resonanz. Erst als sie in Smartphones die Sprachverarbeitung, in Bilderarchiven die Gesichtserkennung oder bei Brettspielen selbsttätig Spielzüge übernahmen, standen sie erneut im Rampenlicht der breiten Öffentlichkeit.

Das ging so weit, dass sich sogar der Weltchampion im asiatischen Strategiespiel „Go“ der Maschine geschlagen geben musste. Damit konnten (Künstliche) Neuronale Netze überzeugend beweisen, dass sie mittlerweile in der Lage sind, sehr vielfältige Aufgaben zu übernehmen und so die herkömmlichen, eher fehleranfälligen Algorithmen ersetzen können.

Das neue Paradigma

Was hat sich verändert? Einerseits sind Rechner heutzutage befähigt, vergleichsweise riesige Datenmengen (Big Data) zu verarbeiten. Andererseits fand mit den (Künstlichen) Neuronalen Netzen ein entscheidender Paradigmawechsel statt.

Wogegen früher Lösungsansätze möglichst exakt wiedergegeben werden sollten, kommen heute eher „unsaubere“ statistische Verfahren zum Einsatz. So bestand eine Gesichtserkennung aus Bildverarbeitungsfiltern, die charakteristische Merkmale wie zum Beispiel Augen, Nase oder Mund aus einem Bild extrahieren sollten.

Dieser Ansatz führte zu vielen Fehlern, da nicht jede Variation wie zum Beispiel ein Gesicht mit Brillen oder Hüten genau modelliert werden konnte. (Künstliche) Neuronale Netze hingegen nähern sich dieser Problemstellung völlig anders: Hier geht es nicht um die Identifizierung spezifischer Merkmale oder die Charakteristika eines Fachgebiets, sondern um die Aufarbeitung extrem vieler miteinander vernetzter mathematischer Funktionen. Denn (Künstliche) Neuronale Netze bestehen zwar aus recht simplen, dafür aber aus schier unermesslich vielen miteinander vernetzten mathematischen Funktionen.

Auf das Training kommt es an

Erst wenn sich das System in einer „Trainingssituation“ Tausende bis Millionen von Beispiele oder Muster (Big Data) angesehen hat, lernen die Netze mit der Zeit, was das Bezeichnende an einer Katze, einem Gartengerät oder Wochenendhaus ausmacht. Das heißt: Mit jedem neuen Muster während des Trainings bekommt das Netz quasi Feedback über die gegenwärtige Erkennungsleistung. Daraufhin passt es seine unzähligen Parameter immer wieder neu an.

Das geht so lange, bis sich aus den simplen Basisfunktionen genau die Verarbeitungsfilter formen, die für die Lösung relevant sind. Der Clou dabei: Die (Künstlichen) Neuronalen Netze lernen auf diese Weise ihre mathematischen Funktionen verschiedenster Komplexität und legen sich automatisch ihre Werkzeuge selbst zurecht. So kann man genauso gut (Künstliche) Neuronale Netze mit gesprochener Sprache trainieren lassen. Dabei lernen sie einzelne Laute unterscheiden und erkennen in Lautfolgen sinnvolle Wörter und Sätze.

Deus ex Machina …

Entsprechend wie Neuronale Netze in einem menschlichen Gehirn bestehen solche Netzwerke ebenfalls aus vielen Knotenpunkten, welche auch als Neuronen bezeichnet werden. Vereinfacht lässt sich die Struktur eines solchen Netzwerks folgendermaßen darstellen: eine Input-Layer (Schicht) auf der einen Seite, eine Aktivitäts-Layer in der Mitte (Hidden Layer) und eine Output-Layer auf der anderen Seite.

Die Input-Schicht (Input-Unit) hat die Aufgabe, Mess- oder Umweltdaten wie Gewicht, Körpertemperatur, Puls und Alter aufzunehmen. Und die Output-Schicht soll dann im Anschluss ein Ergebnis (Befund für Medizin) abbilden. Die Datenauswertung läuft über so genannte „Kanten“, mit denen die Neuronen in Verbindung stehen.

Da jeder Wert gewichtet wird, hat dies einen Einfluss auf die Intensität der Verbindung zwischen den Neuronen untereinander. Die wiederum während der Trainingsphase von der „Lernregel“ beziehungsweise dem Klassifikationsverfahren, zum Beispiel Delta-Regel und Backpropagation abhängt.

Deep Neural Networks

(Künstliche) Neuronale Netzwerke lassen sich mit dem Verfahren des Deep Learning (tiefgehendes Lernen) deutlich optimieren. Der entscheidende Unterschied liegt in der Komplexität der Aktivitäts-Layer in der Mitte (Hidden Layer). Deep Learning gilt nicht umsonst als der entscheidende Entwicklungstreiber im Bereich Künstlicher Intelligenz:

So können vor allem mit Deep Learning herausragende Ergebnisse erzielt werden, wenn in der Trainingsphase besonders große Datenmengen verarbeitet werden müssen. Gleichzeitig ist man mit Deep Learning nun in der Lage, besondere intellektuelle und mentale Prozesse darzustellen. Eine der bekanntesten Beispiele für die Gesichts- und Spracherkennung sind die Programme „Siri“ und „Cortana“. Weitere Anwendungsbeispiele sind die Google-Bildsuche sowie Chatbots.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 45126036 / Definitionen)