Nächste Seite: Kritik und Ausblick
Aufwärts: Abschließende Bemerkungen
Vorherige Seite: Abschließende Bemerkungen
  Inhalt
Zwischen der neuronalen Eimerkette und A3
bestehen zwar einige gravierende Unterschiede, aber
auch mancherlei Gemeinsamkeiten [61].
Beide erlauben (wenigstens im Prinzip) beliebige
Verzögerungen zwischen Aktionen und ihren späteren Konsequenzen.
Dennoch betrachten beide während der Lernphase zu einem gegebenen
Zeitpunkt
ausschließlich die engste zeitliche Umgebung
von
. Bei beiden Verfahren lassen sich gewisse dynamisch
veränderliche Größen
als Voraussagen zukünftigen zu erwartenden Reinforcements
interpretieren
(bei der Eimerkette entspricht das Reinforcement der
Gewichtssubstanz).
Juergen Schmidhuber
2003-02-20
Related links in English: Recurrent neural networks - Subgoal learning - Reinforcement learning and POMDPs - Reinforcement learning economies - Selective attention
Deutsche Heimseite