Artikel versenden

Neuronale Netze, Teil 1: Das Neuron – inspiriert durch die Biologie




 

// / /

Die Anfänge Neuronaler Netze gehen auf Forschungsarbeiten aus den 1940er Jahren zurück. Bereits am Anfang stand die Idee dahinter, Wissen aus der Gehirnforschung für die Computerwissenschaft nutzbar zu machen. Sehr früh wurden solche – aus heutiger Sicht einfachen – Netze zur Mustererkennung eingesetzt. Eine zweite zeitgleiche Entwicklung in der Computerwissenschaft, die Entwicklung von Programmiersprachen, sorgte durch ihren immensen Erfolg (bis hin zur heutigen Form der Digitalisierung) dafür, dass neuronale Netze zwar immer wieder für spezielle Probleme und Lösungen auftauchten, jedoch im Vergleich zur herkömmlichen Programmierung lange Zeit ein Schattendasein fristeten. Der Fortschritt wurde zunächst durch „klassische“ Softwareentwicklung erzielt.

Dies änderte sich erst in den letzten Jahren. Ausschlaggebend für den Wandel sind folgende Umstände:

  • Moderne Rechnerumgebungen und die Cloud liefern mittlerweile ausreichend Ressourcen an Rechenleistung und Datenspeicher, um die sehr hungrigen Algorithmen bedienen zu können.
  • Medienwirksame Lösungen wie der Sieg über den Schach-Weltmeister und den Go-Weltmeister durch Computer wurden erst durch tiefe neuronale Netze und Reinforcement Learning möglich.
  • Hinter den beeindruckenden und jetzt praktisch nutzbaren Lösungen des autonomen Fahrens stecken für Mustererkennung und Steuerung neuronale Netze.
  • Das Tooling für den Einsatz neuronaler Netze hat sich durch Cloudumgebungen und Bibliotheken immens professionalisiert und ist nutzbar geworden, gleichzeitig hat sich auch die Mathematik und Algorithmik durch Forschungen gerade in den letzten Jahren stark verbessert.
  • Forschungsarbeiten aus der Gehirnforschung zeigen, dass Gehirnstrukturen so flexibel sind (Plastizität), dass man z.B. mit dem auditiven Cortex (eigentlich für das Hören trainiert) visuelle Signale verarbeiten kann (Rewiring). Der auditive Cortex passt seine Struktur den veränderten Eingangssignalen an. Dies legt die Vermutung nahe, dass es genau einen optimalen Lernalgorithmus gibt: die Verknüpfung von Neuronen, die sich der jeweiligen Umgebung anpasst und durch diese Fähigkeit „alles“ lernen kann. Dies macht es noch attraktiver, Neuronale Netze als Universal-Lerner nachzuahmen.

Nüchtern betrachtet bildet sich der Begriff  „Neuronales Netz“ aus zwei Worten: Dem Neuron und dem Netz, also einer Verbindung der Neuronen in Form einer netzartigen Struktur von Verbindungen, die man sich unregelmäßiger Vorstellen muss als z.B. ein Fischernetz. Wissen scheint sich besonders gut in diesen vernetzten Strukturen verarbeiten und speichern zu lassen. Die modernen Neuronalen Netze bilden die Biologie des Gehirns nicht genau nach, so werden z.B. keine biochemischen Prozesse benötigt. Stattdessen bildet man das Modell funktional nach, durch Algorithmen und mathematische Modelle.

Die folgende Abbildung verdeutlicht den Zusammenhang zwischen dem biologischen und dem in Neuronalen Netzen verwendeten mathematischen Modell eines Neurons.

Die Parameter x1, x2, …xliegen an den Synapsenspalten, den Eingängen des Neurons j an. Wie stark die  Eingangsparameter innerhalb der Verarbeitung durch das Neuron wirken, wird durch die Gewichte w1j, w2j, …wnj festgelegt. Die Dendriten bilden die Verbindung und leiten zum Kern des Neurons, dem Soma, weiter. Im mathematischen Modell besteht die Verarbeitung im Soma aus zwei hintereinander geschalteten Schritten. Im ersten Schritt wird die Summe der gewichteten Eingangssignale gebildet, im zweiten Schritt wird durch die Funktion f entschieden, welches Signal am Ausgang (dem Axon) angelegt werden soll. Die Funktion f, auch „Activation Function“ genannt und mithilfe einer Sigmoid-Funktion implementiert, liefert den nichtlinearen Anteil der Bearbeitung durch den Zellkern. Mit Hilfe dieser Grundstruktur des Neurons sind Neuronale Netze in der Lage, hochkomplexe nichtlineare Zusammenhänge abzubilden.

Wie nun das Netz die beschriebenen Neuronen verbindet, beschreibe ich im zweiten Teil des Beitrags auf diesem Blog anhand eines Beispiels zur Gesichtserkennung.

Auch interessant:

Quelle Grafik: Setzwein IT-Management GmbH

Quelle Foto: @fiona-art – Pexels.com

| Keine Kommentare

 
Top | Impressum | Datenschutz