Nächste Seite: On-Line VERSUS Off-Line
Aufwärts: DYNAMISCHE VERBINDUNGEN
Vorherige Seite: PERFORMANZMASS
  Inhalt
Für alle Gewichte
(vom Knoten zum Knoten )
interessiert uns das Inkrement
|
(3.6) |
bezeichnet dabei eine konstante positive Lernrate.
Zu jedem Zeitschritt läßt sich der Faktor
durch konventionelles BP bestimmen (siehe Kapitel 1).
Wir schreiben für Knoten in :
Falls einen Ausgabeknoten bezeichnet, so ist
Steht hingegen für einen versteckten Knoten der -ten Lage
von , so gilt
Für erhalten wir nun mit der Kettenregel die Rekursion
Wir verwenden eine durch den RTRL-Algorithmus
(siehe Kapitel 2) inspirierte Methode:
Für jedes
und jedes
führen wir eine Variable
ein und initialisieren sie zu Beginn einer
Trainingssequenz mit 0.
läßt sich zu jedem Zeitschritt
aktualisieren:
|
(3.7) |
hängt davon ab, welche der beiden Architekturen wir
benutzen wollen.
Eine geeignete BP-Prozedur liefert uns jedenfalls
für jedes
den Wert
für alle
. Nach Aktualisierung der Variablen
wird (3.6)
mittels der Formel
bestimmbar.
(3.4) und (3.5) unterscheiden sich lediglich in der Art und Weise, in
der Fehlersignale für ' Ausgabeknoten berechnet werden:
Wird Architektur 1 verwendet, benützen wir konventionelles
BP zur Berechnung von
in (3.7). Dann
schreiben wir für Knoten in :
Bezeichnet einen Ausgabeknoten (mit ), so gilt
Stellt hingegen einen versteckten Knoten der -ten Lage von
dar, so ist
Bei Verwendung von Architektur 2 ist zu
berücksichtigen, daß
|
(3.8) |
Mit BP berechnet man am besten
für jeden
Ausgabeknoten und für alle . Die Resultate
lassen sich in
Variablen
unterbringen. Nun löst man Gleichung (3.7) in einem
zweiten Durchgang.
Bei beiden Architekturen beträgt
die Berechnungskomplexität pro Zeitschritt
.
Unterabschnitte
Nächste Seite: On-Line VERSUS Off-Line
Aufwärts: DYNAMISCHE VERBINDUNGEN
Vorherige Seite: PERFORMANZMASS
  Inhalt
Juergen Schmidhuber
2003-02-20
Related links in English: Recurrent networks - Fast weights - Subgoal learning - Reinforcement learning and POMDPs - Unsupervised learning and ICA - Metalearning and learning to learn
Deutsche Heimseite