Das im vorliegenden Unterabschnitt betrachtete Eingabeensemble
besteht aus 4 verschiedenen Mustern:
,
,
, und
.
Die jeweiligen Wahrscheinlichkeiten ihres Auftretens sind
Code :
,
,
,
.
Code erfüllt das Unabhängigkeitskriterium, denn
die unbedingten Erwartungswerte jedes Repräsentationsknotens gleichen
den entsprechenden bedingten Erwartungswerten:
Ein nicht faktorieller (wohl aber reversibler und damit informationserhaltender) Code ist der folgende
Code :
,
,
,
.
Code erfüllt das Unabhängigkeitskriterium nicht, denn
nicht alle bedingten Erwartungswerte jedes Repräsentationsknotens
gleichen seinem unbedingten Erwartungswert:
Experiment 7:
`off-line',
,
,
verteilte Eingaberepräsentation mit
,
,
,
,
1 versteckter Knoten pro Prediktor,
2 allen Repräsentationsmodulen gemeinsame versteckte Knoten.
10 Testläufe mit 2000 Trainingsepochen für die
Repräsentationsmodule wurden durchgeführt.
Eine Epoche bestand dabei aus der Präsentation von 9 Mustern:
wurde einmal präsentiert,
wurde zweimal präsentiert,
wurde zweimal präsentiert,
wurde viermal präsentiert.
In 7 Fällen fand das System einen zu einem globalen Maximum
von
korrespondierenden faktoriellen Code.
Experiment 8 (Occams Rasiermesser):
Wie Experiment 7, jedoch mit .
In 9 von 10 Testläufen fand das System einen faktoriellen
Code (mit einem unbenutzten Repräsentationsknoten, der stets
denselben konstanten Wert lieferte).
Beim verbleibenden Testlauf erwies sich der resultierende
Code zumindest als informationserhaltend.
Experiment 9:
Wie Experiment 7, jedoch
lokale Eingaberepräsentation,
3 versteckte Knoten pro Prediktor,
4 allen Repräsentationsmodulen gemeinsame versteckte Knoten.
10 Testläufe mit 10000 Trainingsepochen für die
Repräsentationsmodule wurden durchgeführt.
In 5 Fällen fand das System einen zu einem globalen Maximum
von korrespondierenden faktoriellen Code.
In 2 weiteren Fällen erwies sich der Code als invertibel,
in den 3 verbleibenden Fällen nicht.
Wie schon des öfteren erwähnt, ist die wohl einfachste Strategie gegen lokale Maxima folgende: Wiederhole das Experiment unter verschiedenen Initialisierungsbedingungen, bis ein befriedigendes Ergebnis erreicht wird. Jedes neue Experiment entspricht einer neuen lokalen Suche im Suchraum.
Experiment 10 (Occams Rasiermesser):
Wie Experiment 9, aber mit .
In 2 aus 10 Testläufen fand das System einen faktoriellen
Code (mit einem unbenutzten Repräsentationsknoten, der stets
denselben konstanten Wert lieferte).
In den verbleibenden 8 Testläufen wurden stets invertible
Codes entdeckt. Dies reflektiert einen `trade-off'
zwischen Redundanz und Reversibilität: Überflüssige
Freiheitsgrade unter den Repräsentationsknoten
vermögen zwar einerseits
die Wahrscheinlichkeit der Auffindung
informationserhaltender Codes zu erhöhen, können aber andererseits
die Wahrscheinlichkeit der Entdeckung
eines faktoriellen Codes drücken.