next up previous contents
Nächste Seite: Multidimensionale adaptive Kritiker Aufwärts: Der lokale Algorithmus A3 Vorherige Seite: Ein Experiment mit `verzögertem   Inhalt

Kompliziertere statische Kritiker, kompliziertere R-Lernregeln

Statt des linearen Kritikers kann man ein BP-Netzwerk oder eine Boltzmann-Maschine verwenden. In der Regel zahlt man dabei mit dem `Grad' der Lokalität des Verfahrens. Statt der einfachen Hebb-ähnlichen Lernregel kann man raffiniertere statische R-Lernregeln verwenden [3]. Im nächsten Abschnitt überspringen wir allerdings diese Möglichkeiten und führen ein Schema für die Berechnung wesentlich informierterer Gewichtsänderungen ein, als mit einer statistischen Lernregel möglich wären.



Juergen Schmidhuber 2003-02-20


Related links in English: Recurrent neural networks - Subgoal learning - Reinforcement learning and POMDPs - Reinforcement learning economies - Selective attention
Deutsche Heimseite