Jede Fokustrajektorie schließt diskrete Zeitschritte 1 ...
ein.
Zum Zeitpunkt
der Trajektorie
heißt
's Eingabevektor
.
ergibt sich aus den sensorischen Eingaben des Fokus zur Zeit
.
's Ausgabevektor zur Zeit
heißt
.
wird als Steuersignal für den Fokus interpretiert und verursacht
eine Fokusbewegung und damit eine neue Eingabe
.
Die finale gewünschte Eingabe
der Trajektorie
ist ein extern vorgegebenes Aktivationsmuster und korrespondiert zu
dem in der visuellen Szene zu findenden Objekt. Für alle
ist
.
Zunächst nehmen wir an, daß
für alle Trajektorien
konstant ist (es soll also immer
dasselbe Detail der Szene gefunden werden).
's Aufgabe besteht darin, startend von beliebig vorgegebenen
Anfangspositionen Sequenzen von Fokusbewegungen zu produzieren, so daß
für alle Trajektorien
gilt:
.
Der finale Eingabefehler
der zum Zeitschritt
unterbrochenen Trajektorie
ist
Die ergeben sich also aus den Differenzen zwischen den
gewünschten und den tatsächlichen finalen Eingaben.
Das Modellnetzwerk sieht zu einem gegebenen Zeitpunkt
's Ein- und Ausgabe und wird
darauf trainiert,
's nächste Eingabe zu prophezeien.
Die folgende Diskussion bezieht sich auf den Fall, daß
und
parallel lernen. In einigen Experimenten werden
wir separate Trainingsphasen für
und
verwenden,
die Änderungen für diesen Fall sind aber trivial und
hauptsächlich notationeller Art.
's Eingabevektor zur Zeit
der Trajektorie
ist die Konkatenation von
und
.
's Ausgabevektor zur Zeit
der Trajektorie
ist
,
wobei
.
's Fehler zur Zeit
der Trajektorie
ist
's Ziel ist die Minimierung von
,
wozu BP verwendet wird:
Dem Systemidentifikationsansatz folgend nehmen wir nun an, daß
durch eine differenzierbare Funktion von
's
Gewichtsvektor
angenähert werden kann.
Um
Dabei ist das Inkrement von
und
's Lernrate.
Man beachte, daß die Differenz zwischen der
gewünschten finalen Eingabe und der tatsächlichen finalen
Eingabe zur Berechnung eines Gradienten für
unter
Zuhilfenahme von
herangezogen wird, nicht die Differenz
zwischen
der gewünschten finalen Eingabe und der von
vorhergesagten
finalen Eingabe (siehe auch Kapitel 6).
(In den unten beschriebenen Experimenten weichen wir
vom reinen Gradientenabstieg ab und ändern
's Gewichte
am Ende jeder Trajektorie.)