next up previous contents
Nächste Seite: Keine Rückkopplung Aufwärts: Modellbildende Verfahren Vorherige Seite: Modellbildende Verfahren   Inhalt

Der Systemidentifikationsansatz

Der Systemidentifikationsansatz erfordert, ein sogenanntes Modellnetzwerk daraufhin zu trainieren, bestimmte Eigenschaften der externen Umwelt vollständig zu simulieren. Nach Abschluß der Trainingsphase des Modellnetzwerkes (oder auch schon vorher) identifiziert man das Modellnetzwerk mit der Umgebung und verwendet es, um Gradienteninformation für das eigentliche Hauptnetzwerk (im folgenden auch das Steuernetzwerk genannt) zu berechnen. Wie wir es schon aus früheren Abschnitten gewohnt sind, werden wir auch im folgenden wieder zwischen verschieden komplexen Unterfällen des Systemidentifikationsprinzips unterscheiden.



Unterabschnitte

Juergen Schmidhuber 2003-02-20


Related links in English: Recurrent neural networks - Subgoal learning - Reinforcement learning and POMDPs - Reinforcement learning economies - Selective attention
Deutsche Heimseite