next up previous contents
Nächste Seite: Kritik und Ausblick Aufwärts: Abschließende Bemerkungen Vorherige Seite: Abschließende Bemerkungen   Inhalt

Konzeptuelle Gemeinsamkeiten mit der neuronalen Eimerbrigade

Zwischen der neuronalen Eimerkette und A3 bestehen zwar einige gravierende Unterschiede, aber auch mancherlei Gemeinsamkeiten [61]. Beide erlauben (wenigstens im Prinzip) beliebige Verzögerungen zwischen Aktionen und ihren späteren Konsequenzen. Dennoch betrachten beide während der Lernphase zu einem gegebenen Zeitpunkt $t$ ausschließlich die engste zeitliche Umgebung von $t$. Bei beiden Verfahren lassen sich gewisse dynamisch veränderliche Größen als Voraussagen zukünftigen zu erwartenden Reinforcements interpretieren (bei der Eimerkette entspricht das Reinforcement der Gewichtssubstanz).



Juergen Schmidhuber 2003-02-20


Related links in English: Recurrent neural networks - Subgoal learning - Reinforcement learning and POMDPs - Reinforcement learning economies - Selective attention
Deutsche Heimseite