next up previous contents
Nächste Seite: Grenzen der neuronalen Eimerkette Aufwärts: Die Experimente Vorherige Seite: Sequenzgenerierung   Inhalt

Sequenzerkennung

Eine wichtige Aufgabe im Kontext nichtstationärer Umgebungen ist es, zwischen verschiedenen Arten von Bewegung unterscheiden zu lernen. Ein einfaches Experiment mit zeitlich veränderlichen Wahrnehmungen wurde durchgeführt. Eine eindimensionale `Retina', bestehend aus 5 normalen Eingabeknoten plus einem `wahren' Knoten, wurde mit einer zwei Ausgabeknoten umfassenden WTA-Einheit `vorwärtsvernetzt'. Die Ausgabeknoten waren ihrerseits untereinander vollständig bidirektional vernetzt. Die Aufgabe bestand darin, zumindest während der letzten drei Zeitschritte einer fünf Zeitschritte dauernden Eingabesequenzpräsentation den ersten Ausgabeknoten dann anzuschalten, wenn ein `Illuminationspunkt' die Retina von `rechts' nach `links' durchquerte, bzw. den zweiten Ausgabeknoten anzuschalten, wenn der Illuminationspunkt von `links' nach `rechts' wanderte.

Während eines Trainingszyklus' wurde eine der zufällig gewählten Eingabesequenzen dem Netzwerk zweimal hintereinander angeboten. Gewichtssubstanz wurde analog zu den stationären XOR-Experimenten vergeben (es handelte sich also um eine Reinforcement-Lernaufgabe). In einem von 10 Testläufen schaffte es das System nicht, innerhalb von 3000 Präsentationen eine stabile Lösung zu finden (das Kriterium für `stabil' entsprach dem für stationäre Experimente). In den verbleibenden 9 Testläufen waren durchschnittlich 223 Trainingszyklen pro Sequenz zur Auffindung einer stabilen Lösung erforderlich.



Juergen Schmidhuber 2003-02-20


Related links in English: Recurrent neural networks - Subgoal learning - Reinforcement learning and POMDPs - Reinforcement learning economies - Selective attention
Deutsche Heimseite