next up previous contents
Nächste Seite: XOR-Varianten Aufwärts: Die neuronale Eimerkette Vorherige Seite: Mögliche Erweiterung für kontinuierliche   Inhalt

Die Experimente

Für alle im folgenden beschriebenen Experimente wurden dieselben Initialisierungsbedingungen und dieselben Lernraten verwendet. Zu Beginn einer Trainingsphase wurden alle modifizierbaren Gewichte mit zufällig aus dem Intervall $\left[ 0.999, 1.001 \right]$ gewählten Werten vorbesetzt. Sowohl $\eta$ als auch $\alpha$ waren stets gleich $0.005$. Es wurden keine systematischen Versuche unternommen, für ein gegebenes Problem durch geschickte Parameterwahl eine schnellere Konvergenz zu erreichen.

Für alle Experimente wurde die diskrete Version der neuronalen Eimerkette verwendet (siehe auch [50] und [53]). Die Rechengenauigkeit war durch $32$-Bit-Gleitkommaarithmetik gegeben.



Unterabschnitte

Juergen Schmidhuber 2003-02-20


Related links in English: Recurrent neural networks - Subgoal learning - Reinforcement learning and POMDPs - Reinforcement learning economies - Selective attention
Deutsche Heimseite