next up previous contents
Nächste Seite: EXPERIMENTE MIT NICHT ADAPTIVEM Aufwärts: DISTANZIERTE PERFORMANZMASSE Vorherige Seite: DIE ALGORITHMEN   Inhalt

EXPERIMENTE ZUR HINDERNISVERMEIDUNG

Im folgenden werden zwei Arten von Experimenten beschrieben. Bei den Experimenten der ersten Art konzentrieren wir uns zunächst ganz auf den Lernprozeß des Subzielgenerators: Die $eval$-Funktion und ihre partiellen Ableitungen werden auf analytischem Wege berechnet (siehe auch [122]). Bei den Experimenten der zweiten Art wird der Evaluator $E$ selbst durch ein in einer separaten Lernphase trainiertes BP-Netzwerk implementiert (siehe auch [101] [22]).



Unterabschnitte

Juergen Schmidhuber 2003-02-20


Related links in English: Recurrent networks - Fast weights - Subgoal learning - Reinforcement learning and POMDPs - Unsupervised learning and ICA - Metalearning and learning to learn
Deutsche Heimseite