ARCHITEKTUR UND ZIELFUNKTIONEN

Nächste Seite: EXPERIMENT MIT DER RAAM-ARCHITEKTUR Aufwärts: KONTINUIERLICHE GESCHICHTSKOMPRESSION Vorherige Seite: AUCH RAAMS HABEN PROBLEME Inhalt

ARCHITEKTUR UND ZIELFUNKTIONEN

Zum Zeitpunkt der Sequenz ist $H^p(t) \circ X^p(t)$ die (weiter unten zu definierende) Eingabe eines Autoassoziators mit versteckten Knoten, Eingabeknoten, und Ausgabeknoten. 's interner Zustandsvektor (ablesbar von einem `Flaschenhals' versteckter Knoten) heißt . 's -dimensionaler Ausgabevektor wird mit bezeichnet. Zu jedem Zeitschritt versucht mittels BP, seine eigene Eingabe zu rekonstruieren. 's Zielfunktion ist dabei

$\begin{displaymath}E_A(t) = \frac{1}{2} (H^p(t) \circ X^p(t) - A^p(t))^T (H^p(t) \circ X^p(t) - A^p(t)). \end{displaymath}$

Der

-dimensionale Vektor

(aus gleich offensichtlich werdenden Gründen

's `reduzierter Zustand' genannt) nimmt für

einen `Defaultwert' an, z.B. den Nullvektor. Das gleiche gilt für den

-dimensionalen Vektor

Zum Zeitpunkt der Sequenz erhält ein azyklisches BP-Netz den Vektor $H^p(t) \circ x^p(t)$ als Eingabe. Um die Dinge nicht über Gebühr zu verkomplizieren, nehmen wir auf (theoretisch eigentlich notwendige) eindeutige Zeitrepräsentationen keine Rücksicht. 's -dimensionaler Ausgabevektor soll nach der Trainingsprozedur die Wahrscheinlichkeitsverteilung der möglichen approximieren. Daher wird so normalisiert, daß stets $\sum_i P^p_i(t) = 1$ gilt (siehe z.B. Abschnitt 5.3). Für sind und folgendermaßen definiert:

$\begin{displaymath} H^p_i(t) = (1-\tau^p(t)) H^p_i(t-1) + \tau^p(t) h^p_i(t-1) \end{displaymath}$

und

$\begin{displaymath} X^p_i(t) = (1-\tau^p(t)) X^p_i(t-1) + \tau^p(t) x^p_i(t), \end{displaymath}$

wobei $\tau^p(t)$ eine monoton wachsende Funktion von

ist, z.B. $\tau^p(t)= ~P^p_j(t-1)$ , wobei

so gewählt ist, daß

die von

vermutete Wahrscheinlichkeit von

ist. Betrachte hierzu Abbildung 7.3.

**Abbildung:** Kontinuierliche Geschichtskompression: Informationsfluß während zweier sukzessiver Zeitschritte. Siehe Text für Details.
$\begin{figure}\psfig{figure=fig7.4} \end{figure}$

Der Effekt dieses Vorgehens ist: Solange sich die nächste Eingabe aus der vorherigen Eingabe und dem vorherigen reduzierten Zustand als (nahezu) vorhersagbar erweist, bleibt die Eingabe des Autoassoziators im wesentlichen invariant. Nur die wirklich unerwarteten Ereignisse generieren neue Zielwerte für - damit wird dazu angehalten, ausschließlich informationstragende Ereignisse in seine internen Repräsentationen einzubinden. Es sollte erwähnt werden, daß obige Methode wiederum nur eine von mehreren Möglichkeiten darstellt, das grundlegende Prinzip zu implemetieren.

Nächste Seite: EXPERIMENT MIT DER RAAM-ARCHITEKTUR Aufwärts: KONTINUIERLICHE GESCHICHTSKOMPRESSION Vorherige Seite: AUCH RAAMS HABEN PROBLEME Inhalt

Juergen Schmidhuber 2003-02-20