Nächste Seite: EXPERIMENTE MIT NICHT ADAPTIVEM
Aufwärts: DISTANZIERTE PERFORMANZMASSE
Vorherige Seite: DIE ALGORITHMEN
  Inhalt
Im folgenden werden zwei Arten von Experimenten beschrieben.
Bei den Experimenten der ersten Art konzentrieren wir uns zunächst
ganz auf den Lernprozeß des Subzielgenerators:
Die
-Funktion und ihre partiellen Ableitungen werden auf
analytischem Wege berechnet (siehe auch [122]).
Bei den Experimenten der zweiten Art
wird der Evaluator
selbst durch ein in einer
separaten Lernphase trainiertes BP-Netzwerk implementiert
(siehe auch [101]
[22]).
Unterabschnitte
Juergen Schmidhuber
2003-02-20
Related links in English: Recurrent networks - Fast weights - Subgoal learning - Reinforcement learning and POMDPs - Unsupervised learning and ICA - Metalearning and learning to learn
Deutsche Heimseite