Nächste Seite: On-Line VERSUS Off-Line
Aufwärts: DYNAMISCHE VERBINDUNGEN
Vorherige Seite: PERFORMANZMASS
  Inhalt
Für alle Gewichte
(vom Knoten
zum Knoten
)
interessiert uns das Inkrement
 |
(3.6) |
bezeichnet dabei eine konstante positive Lernrate.
Zu jedem Zeitschritt
läßt sich der Faktor
durch konventionelles BP bestimmen (siehe Kapitel 1).
Wir schreiben für Knoten
in
:
Falls
einen Ausgabeknoten bezeichnet, so ist
Steht
hingegen für einen versteckten Knoten der
-ten Lage
von
, so gilt
Für
erhalten wir nun mit der Kettenregel die Rekursion
Wir verwenden eine durch den RTRL-Algorithmus
(siehe Kapitel 2) inspirierte Methode:
Für jedes
und jedes
führen wir eine Variable
ein und initialisieren sie zu Beginn einer
Trainingssequenz mit 0.
läßt sich zu jedem Zeitschritt
aktualisieren:
 |
(3.7) |
hängt davon ab, welche der beiden Architekturen wir
benutzen wollen.
Eine geeignete BP-Prozedur liefert uns jedenfalls
für jedes
den Wert
für alle
. Nach Aktualisierung der
Variablen
wird (3.6)
mittels der Formel
bestimmbar.
(3.4) und (3.5) unterscheiden sich lediglich in der Art und Weise, in
der Fehlersignale für
' Ausgabeknoten berechnet werden:
Wird Architektur 1 verwendet, benützen wir konventionelles
BP zur Berechnung von
in (3.7). Dann
schreiben wir für Knoten
in
:
Bezeichnet
einen Ausgabeknoten (mit
), so gilt
Stellt
hingegen einen versteckten Knoten der
-ten Lage von
dar, so ist
Bei Verwendung von Architektur 2 ist zu
berücksichtigen, daß
 |
(3.8) |
Mit BP berechnet man am besten
für jeden
Ausgabeknoten
und für alle
. Die Resultate
lassen sich in
Variablen
unterbringen. Nun löst man Gleichung (3.7) in einem
zweiten Durchgang.
Bei beiden Architekturen beträgt
die Berechnungskomplexität pro Zeitschritt
.
Unterabschnitte
Nächste Seite: On-Line VERSUS Off-Line
Aufwärts: DYNAMISCHE VERBINDUNGEN
Vorherige Seite: PERFORMANZMASS
  Inhalt
Juergen Schmidhuber
2003-02-20
Related links in English: Recurrent networks - Fast weights - Subgoal learning - Reinforcement learning and POMDPs - Unsupervised learning and ICA - Metalearning and learning to learn
Deutsche Heimseite