Nächste Seite: Grenzen der neuronalen Eimerkette
Aufwärts: Die Experimente
Vorherige Seite: Sequenzgenerierung
  Inhalt
Eine wichtige Aufgabe im Kontext nichtstationärer Umgebungen
ist es, zwischen verschiedenen Arten von Bewegung unterscheiden
zu lernen. Ein einfaches
Experiment mit zeitlich veränderlichen Wahrnehmungen
wurde durchgeführt. Eine eindimensionale `Retina', bestehend aus
5 normalen Eingabeknoten plus einem `wahren' Knoten, wurde
mit einer zwei Ausgabeknoten umfassenden WTA-Einheit `vorwärtsvernetzt'.
Die Ausgabeknoten waren ihrerseits untereinander vollständig bidirektional
vernetzt. Die Aufgabe bestand darin, zumindest während der
letzten drei Zeitschritte einer fünf Zeitschritte
dauernden Eingabesequenzpräsentation
den ersten Ausgabeknoten dann anzuschalten,
wenn ein `Illuminationspunkt' die Retina von `rechts' nach `links'
durchquerte, bzw.
den zweiten Ausgabeknoten anzuschalten,
wenn der Illuminationspunkt von `links' nach `rechts'
wanderte.
Während eines Trainingszyklus' wurde eine der zufällig gewählten
Eingabesequenzen dem Netzwerk zweimal hintereinander angeboten.
Gewichtssubstanz wurde analog zu den stationären
XOR-Experimenten vergeben (es handelte sich also um
eine Reinforcement-Lernaufgabe). In einem von 10 Testläufen schaffte
es das
System nicht, innerhalb von 3000 Präsentationen eine stabile
Lösung zu finden (das Kriterium für `stabil' entsprach dem
für stationäre Experimente). In den verbleibenden 9 Testläufen
waren durchschnittlich 223 Trainingszyklen pro Sequenz zur
Auffindung einer stabilen Lösung erforderlich.
Juergen Schmidhuber
2003-02-20
Related links in English: Recurrent neural networks - Subgoal learning - Reinforcement learning and POMDPs - Reinforcement learning economies - Selective attention
Deutsche Heimseite