Nächste Seite: Bezug zu TD-Methoden
Aufwärts: Vergleich mit anderen Ansätzen
Vorherige Seite: Bezug zu Hollands `bucket
  Inhalt
Es gibt eine Analogie zwischen der zielgerichteten
neuronalen Eimerkette
und dem statischen `Wettbewerbslernen' (competitive learning)
der unüberwachten Art. Statisches Wettbewerbslernen
[23]
[11]
[46] kann ebenfalls als eine lokale
Umverteilung von Gewichtssubstanz interpretiert werden.
Beim Wettbewerbslernen sind es jedoch schwache Beiträge
leistende eingehende Verbindungen eines `gewinnenden'
Knotens, die etwas von ihrem Gewicht an starke Beiträge
leistende
eingehende Verbindungen abtreten müssen.
Im Gegensatz dazu verursacht die neuronale Eimerkette
einen Gewichtssubstanztransport von den ausgehenden
Verbindungen zu den eingehenden.
Dies ist die Schlüsseleigenschaft des Algorithmus, die
den Erfolg vergangener Aktionen zum Erfolg zukünftiger
Aktionen in Beziehung setzt.
Juergen Schmidhuber
2003-02-20
Related links in English: Recurrent neural networks - Subgoal learning - Reinforcement learning and POMDPs - Reinforcement learning economies - Selective attention
Deutsche Heimseite