Nächste Seite: Keine Rückkopplung
Aufwärts: Modellbildende Verfahren
Vorherige Seite: Modellbildende Verfahren
  Inhalt
Der Systemidentifikationsansatz erfordert, ein
sogenanntes Modellnetzwerk daraufhin zu trainieren, bestimmte
Eigenschaften der externen Umwelt vollständig zu simulieren.
Nach Abschluß der Trainingsphase des Modellnetzwerkes (oder auch
schon vorher)
identifiziert man das Modellnetzwerk mit der Umgebung und
verwendet es, um Gradienteninformation für das eigentliche Hauptnetzwerk
(im folgenden auch das Steuernetzwerk genannt) zu berechnen.
Wie wir es schon aus früheren Abschnitten gewohnt sind,
werden wir auch im folgenden wieder zwischen verschieden komplexen
Unterfällen des Systemidentifikationsprinzips unterscheiden.
Unterabschnitte
Juergen Schmidhuber
2003-02-20
Related links in English: Recurrent neural networks - Subgoal learning - Reinforcement learning and POMDPs - Reinforcement learning economies - Selective attention
Deutsche Heimseite