Der Anfangszustandsvektor der
Repräsentationsknoten sei für alle Sequenzen
der gleiche.
Der Eingabevektor zur Zeit
der Sequenz
sei
die Konkatenation
der Eingabe
und des vorangegangenen internen Zustands
.
Die Repräsentation des bis zum Zeitpunkt
beobachteten Sequenzpräfixes sei durch
selbst gegeben.
Wir minimieren und maximieren im wesentlichen dieselben
Zielfunktionen wie im stationären Fall.
Für den -ten Repräsentationsknoten,
dem nun rekurrente Verbindungen zu sich selbst
und zu den anderen Modulen entspringen (siehe Abbildung 6.4),
gibt es wieder einen adaptiven Prediktor
, der seinerseits nicht rekurrent zu sein braucht.
's Eingabe zur Zeit
ist
die Konkatenation
der Ausgaben
aller Repräsentationsknoten
.
's eindimensionale Ausgabe
wird gemäß der Zielfunktion
![]() |
Die einzige Möglichkeit, die ein Repräsentationsknoten wahrnehmen kann, um sich selbst vor auf den übrigen Repräsentationsknoten beruhenden Voraussagen zu schützen, besteht darin, mittels rekurrenter Verbindungen Eigenschaften der Eingabesequenzen zu speichern, die von den von den übrigen Knoten gespeicherten Aspekten statistisch unabhängig sind.
Um angemessene Gewichtsänderungen zu bestimmen, wird lediglich Information über den Zustand zum lezten Zeitschritt benötigt. Dies hat einen (im Gegensatz zu den ersten drei Methoden aus Kapitel 2) lokalen Algorithmus zur Folge. Trotzdem erlaubt das Verfahren theoretisch, eindeutige Repräsentationen beliebig langer Sequenzen und all ihrer Untersequenzen zu finden - wie sich durch Induktion über die Länge der längsten Eingabesequenz sehen läßt:
1. kann eindeutige Repräsentationen der
Anfänge aller Sequenzen lernen.
2. Angenommen, alle Sequenzen und Untersequenzen der
Länge sind bereits eindeutig in
repräsentiert.
Auch wenn zu jedem Zeitpunkt nur der letzte Zustand, nicht
aber frühere Zustände berücksichtigt werden, kann
eindeutige Repräsentationen aller
Sequenzen und Subsequenzen
der Länge
lernen.
Obige Gedankenführung vernachlässigt allerdings mögliche `cross-talk'-Effekte. Die Experimente des nächsten Abschnittes zeigen jedoch die Anwendbarkeit der Methode.