Nächste Seite: Multidimensionale adaptive Kritiker
Aufwärts: Der lokale Algorithmus A3
Vorherige Seite: Ein Experiment mit `verzögertem
  Inhalt
Statt des linearen Kritikers kann man ein BP-Netzwerk oder eine
Boltzmann-Maschine verwenden. In der Regel
zahlt man dabei mit dem `Grad' der Lokalität des Verfahrens.
Statt der einfachen Hebb-ähnlichen Lernregel kann man
raffiniertere statische R-Lernregeln verwenden [3].
Im nächsten Abschnitt überspringen wir allerdings diese Möglichkeiten
und führen ein Schema für die Berechnung wesentlich informierterer
Gewichtsänderungen ein, als mit einer statistischen Lernregel
möglich wären.
Juergen Schmidhuber
2003-02-20
Related links in English: Recurrent neural networks - Subgoal learning - Reinforcement learning and POMDPs - Reinforcement learning economies - Selective attention
Deutsche Heimseite