next up previous contents
Nächste Seite: ZIELFUNKTIONSKOMBINATIONEN Aufwärts: PERFORMANZMASSE FÜR DIE DREI Vorherige Seite: EINE ZIELFUNKTION FÜR DAS   Inhalt

EINE ZIELFUNKTION FÜR DAS REVERSIBILITÄTSKRITERIUM

Um den in den Repräsentationsknoten dargestellten Code der Umgebungseingaben reversibel zu machen, läßt sich folgende altbekannte Methode verwenden: Für ein anliegendes Muster $x^p$ erhält ein Rekonstruktionsmodul (ein azyklisches BP-Netzwerk) die Konkatenation aller $y^p_i, i = 1, \ldots, n$ als Eingabe und wird daraufhin trainiert, seinen Ausgabevektor $z^p$ dem anliegenden Eingabevektor $x^p$ anzugleichen. Die zugrundeliegende Struktur ist die eines Autoassoziators (siehe Abbildung 6.2). Die zu minimierende Zielfunktion ist
\begin{displaymath}
I = \frac{1}{2} \sum_p (z^p - x^p)^T(z^p - x^p) .
\end{displaymath} (6.5)

Abbildung: Wie Abbildung 6.1, mit zusätzlichem Autoassoziator zur Erzielung reversibler Codes in den Repräsentationsknoten. Im Text wird gezeigt, daß der Autoassoziator nicht unbedingt nötig ist.
\begin{figure}\psfig{figure=fig6.2} \end{figure}



Juergen Schmidhuber 2003-02-20


Related links in English: Recurrent networks - Fast weights - Subgoal learning - Reinforcement learning and POMDPs - Unsupervised learning and ICA - Metalearning and learning to learn
Deutsche Heimseite