Die folgenden Untersuchungen wurden von Martin Eldracher und Boris Baginski mit Hilfe von Bernhard Glavinas Robotersimulationsumgebung [30] durchgeführt (siehe auch [22]).
Abbildung 4.9 zeigt einen zweigelenkigen Manipulatorarm in einer Umgebung mit zwei seine Bewegungsfreiheit einschränkenden Wänden als Hindernissen.
Im Gegensatz zu den Experimenten aus dem vorangegangenem Abschnitt war selbst als vollständig vorwärts vernetztes BP-Netzwerk implementiert (Knoten einer bestimmten Lage entsprangen Verbindungen zu allen Knoten höherer Lagen). wurde mit BP daraufhin trainiert, vorherzusagen, ob ein zufällig gewählter Startpunkt im Winkelraum (siehe Abbildung 4.10) mit einem zufällig gewählten Zielpunkt durch eine kollisions- und krümmungsfreie Winkelraumtrajektorie verbunden werden kann.
's Trainingsphase lief wie folgt ab: Die 4-dimensionale Eingabe bestand stets aus einer Start/Zielkombination aus dem Bereich . Die erste Komponente des Eingabevektors beschrieb dabei den Anstellwinkel des `Oberarms' des Manipulators für die Startposition, die zweite Komponente beschrieb den Anstellwinkel des `Unterarms' (die beiden verbleibenden Komponenten standen in analoger Weise für die Zielposition). 's gewünschte Ausgabe war 1, falls sich durch Ausprobieren in der Robotersimulationsumgebung herausstellte, daß eine geradlinige Verbindung zwischen Start und Ziel im Winkelraum möglich war (Klasse 1), und 0 sonst (Klasse 2).
Für jede der beiden Klassen wurden 50000 Trainingsbeispiele verwendet. Tabelle 4.1 zeigt die Resultate für verschiedene Netzwerktopologien (angegeben ist die Zahl der Knoten in aufeinanderfolgenden Lagen) und `Epochenzahlen', wobei eine Epoche einem Durchlauf durch alle Trainingsbeispiele entspricht. Die angegebenen Prozentsätze beziehen sich auf die Zahl der korrekt klassifizierten Start/Zielkombinationen, wobei eine Evaluatorausgabe ( ) als korrekte Klassifikation von Klasse 1 (Klasse 2) akzeptiert wurde.
figure=el_mau.ps,angle=-90,width=1.48
|
figure=cspace2.eps,width=0.8
|
figure=2dscene.ps,angle=-90,width=1.2
|
Nach Beendigung der Trainingsphase des Evaluators wurde ein statischer, vollständig vorwärts vernetzter Subzielgenerator mit 4 Eingabeknoten und 2 Ausgabeknoten (zur Ausgabe eines Subziels im Winkelraum) gemäß Abbildung 4.3 mit zwei Evaluatorkopien zusammengeschaltet.
Einzelne Subziele für spezifische Probleme zu lernen, fiel nun ähnlich leicht wie bei den Experimenten aus dem vorangegangenen Abschnitt. Um jedoch dazu zu veranlassen, über einen weiten Bereich von Problemstellungen (Start/Zielkombinationen) auf Anhieb brauchbare Ergebnisse zu produzieren, mußte vergleichsweise langsam trainiert werden:
Tabelle 4.2 zeigt die mit verschiedene Netzwerktopologien und `Epochenzahlen' erhaltenen Resultate. Die angegebenen Prozentsätze beziehen sich auf die Zahl der als `gültig' bewerteten Subziele, wobei ein Subziel als `gültig' angesehen wurde, wenn die entsprechenden Ausgaben beider Evaluatorkopien 0.95 überstiegen. Ein sehr hoher Prozentsatz der `gültigen' Subziele erwies sich in der Simulationsumgebung tatsächlich als brauchbar, wie sich aus der Spalte mit der Überschrift `Güte der generierten Subziele' in Tabelle 4.2 ergibt. Die Mehrheit der ausgegbenen Subziele entsprach dabei einer angewinkelten Manipulatorposition, die auch nach menschlichem Ermessen sinnvoll ist (siehe Abbildungen 4.10 und 4.11 für Veranschaulichungen der Subzielhäufungen). Die Spalte mit dem Titel `Gesamtlösungssatz' in Tabelle 4.2 schließlich zeigt, daß der Subzielgenerator nach dem Training für über 90 Prozent der Testfälle auf Anhieb ein geeignetes Subziel ausgeben konnte (die verbleibenden Fälle erforderten zusätzliche Gradientenabstiegsiterationen).
Diese von Eldracher und Baginski durchgeführten Untersuchungen zeigen, daß die Trainingsvorarbeiten für das Subziele generierende System (insbesondere das Trainieren des Evaluators) aufwendig sein können. Nach der Lernphase kann jedoch in vielen Fällen schnell (auf Anhieb) geeignete Subziele produzieren. Die Beschreibungen weiterer Experimente mit adaptivem finden sich in [22] und [101].