Nächste Seite: Detaillierte Beschreibung von A3 Aufwärts: Mehrdimensionale adaptive Kritiker & Vorherige Seite: Intuitive Erklärung des Grundprinzips Inhalt

Der lokale Algorithmus A3

Verwendet man z.B. einen linearen Kritiker, so bekommt man ein Verfahren, das lokal in Zeit und Raum ist. Interessanterweise stellt die Verwendung eines linearen Kritikers kein Hindernis für die Lösung von Aufgaben des nicht linear separablen Typs dar, wie man später sehen wird (siehe auch [51], [26]). Der resultierende Algorithmus A3 ist viel einfacher als Andersons.

Unterabschnitte

Detaillierte Beschreibung von A3
Ein Experiment mit `verzögertem XOR'
Kompliziertere statische Kritiker, kompliziertere R-Lernregeln

Juergen Schmidhuber 2003-02-20

Related links in English: Recurrent neural networks - Subgoal learning - Reinforcement learning and POMDPs - Reinforcement learning economies - Selective attention
Deutsche Heimseite