Nächste Seite: XOR-Varianten
Aufwärts: Die neuronale Eimerkette
Vorherige Seite: Mögliche Erweiterung für kontinuierliche
  Inhalt
Für alle im folgenden beschriebenen Experimente wurden dieselben
Initialisierungsbedingungen und dieselben Lernraten verwendet.
Zu Beginn einer Trainingsphase wurden alle modifizierbaren
Gewichte mit zufällig aus dem Intervall
gewählten Werten vorbesetzt. Sowohl
als auch
waren stets gleich
. Es wurden keine systematischen
Versuche unternommen,
für ein gegebenes Problem
durch geschickte Parameterwahl
eine schnellere Konvergenz
zu erreichen.
Für alle Experimente wurde die diskrete Version der
neuronalen Eimerkette verwendet
(siehe auch [50]
und [53]). Die Rechengenauigkeit
war durch
-Bit-Gleitkommaarithmetik gegeben.
Unterabschnitte
Juergen Schmidhuber
2003-02-20
Related links in English: Recurrent neural networks - Subgoal learning - Reinforcement learning and POMDPs - Reinforcement learning economies - Selective attention
Deutsche Heimseite