Das Steuernetzwerk
sei (zur vereinfachten Darstellung des Prinzips) ein
konventionelles azyklisches BP-Netzwerk.
Alle Knoten in
seien durchnumeriert, die Aktivation
des
-ten Knotens in Antwort auf
den
-ten an der Eingabelage anliegenden Eingabevektor
sei mit
bezeichnet,
wobei
, falls
Eingabeknoten ist.
In der
-ten Lage von
(
)
berechnet sich
wie folgt:
![]() |
(4.1) |
Das Weltmodellnetzwerk sei ebenfalls als
azyklisches BP-Netzwerk implementiert.
's Eingabe ist die Konkatenation
der Vektoren
und
.
Für
's Trainingsphase wird i.a.
gelten,
für
's Trainingsphase hingegen stets
.
Die Aktivation
des
-ten Knotens von
in Antwort auf
wird mit
bezeichnet, wobei
gleich der
-ten Komponente von
ist, falls
Eingabeknoten ist.
In der
-ten Lage von
(
)
berechnet sich
analog zur Aktivationsausbreitung
in
wie folgt:
![]() |
(4.2) |
![]() |