Nächste Seite: Detaillierte Beschreibung von A3
Aufwärts: Mehrdimensionale adaptive Kritiker &
Vorherige Seite: Intuitive Erklärung des Grundprinzips
  Inhalt
Verwendet man z.B. einen linearen Kritiker, so bekommt man ein
Verfahren, das lokal in Zeit und Raum ist. Interessanterweise
stellt die Verwendung eines linearen Kritikers kein Hindernis für
die Lösung von Aufgaben des nicht linear separablen Typs dar,
wie man später sehen wird (siehe auch [51],
[26]).
Der resultierende Algorithmus A3 ist
viel einfacher als Andersons.
Unterabschnitte
Juergen Schmidhuber
2003-02-20
Related links in English: Recurrent neural networks - Subgoal learning - Reinforcement learning and POMDPs - Reinforcement learning economies - Selective attention
Deutsche Heimseite