Nächste Seite: Evolution eines Flip-Flops durch Aufwärts: `Rekurrente' Umgebungsmodelle für R-Lernen Vorherige Seite: Kommentare zum Algorithmus. Inhalt

Experimente zum R-Lernen in Nicht-Markov-Umgebungen

Im Gegensatz zu allen anderen bisher implementierten modell-bildenden R-Lernalgorithmen besitzt A2 ein theoretisches Potential für das Lernen in Nicht-Markov-Umgebungen. Läßt sich dieses Potential in der Praxis verwirklichen, insbesondere wenn das mathematisch exakte Verfahren zugunsten der on-line-Methode aufgeweicht wird?

Unterabschnitte

Evolution eines Flip-Flops durch R-Lernen
Nicht-Markov-mäßiges Balancieren mit `perfektem Modell'
Vorschlag für ein Experiment zur Evolution von Sprache

Juergen Schmidhuber 2003-02-20

Related links in English: Recurrent neural networks - Subgoal learning - Reinforcement learning and POMDPs - Reinforcement learning economies - Selective attention
Deutsche Heimseite