Nächste Seite: Evolution eines Flip-Flops durch
Aufwärts: `Rekurrente' Umgebungsmodelle für R-Lernen
Vorherige Seite: Kommentare zum Algorithmus.
  Inhalt
Im Gegensatz zu allen anderen bisher implementierten modell-bildenden
R-Lernalgorithmen besitzt A2 ein
theoretisches Potential für das
Lernen in Nicht-Markov-Umgebungen. Läßt sich dieses Potential
in der Praxis verwirklichen, insbesondere wenn das mathematisch
exakte Verfahren zugunsten der on-line-Methode aufgeweicht wird?
Unterabschnitte
Juergen Schmidhuber
2003-02-20
Related links in English: Recurrent neural networks - Subgoal learning - Reinforcement learning and POMDPs - Reinforcement learning economies - Selective attention
Deutsche Heimseite