next up previous contents
Nächste Seite: Der Systemidentifikationsansatz Aufwärts: Grundlagen: R-Lernen und adaptive Vorherige Seite: Interne Rückkopplung   Inhalt

Modellbildende Verfahren

Die im letzten Abschnitt beschriebenen Verfahren verfolgen mehr oder weniger raffinierte Strategien, um Aktionen solange auszuprobieren, bis sich der Erfolg einstellt.

Wenn man in einer dynamischen Umgebung bestimmte Ziele erreichen will, so lohnt es sich oft, nicht nur Probierverfahren anzuwenden, sondern sich auch ein Modell der Umwelt oder bestimmter Aspekte der Umwelt zu konstruieren. Versteht man bis zu einem gewissen Grade, wie sich die Umwelt verhält, so kann man im allgemeinen auf einem viel direkteren Wege seine Ziele verfolgen als ohne ein derartiges Verständnis.

Es gibt einige erst vor kurzem in näheren Augenschein genommene Ansätze, adaptive `neuronale Umgebungsmodelle' für zielgerichtetes Lernen einzusetzen. Die beiden bedeutsamsten Ansätze sind die Systemidentifikationsansätze und die adaptiven Kritiker. Auf beide gehen wir im folgenden ein. Beide sind relevant für Kapitel 5 bzw. 6 dieser Arbeit.



Unterabschnitte

Juergen Schmidhuber 2003-02-20


Related links in English: Recurrent neural networks - Subgoal learning - Reinforcement learning and POMDPs - Reinforcement learning economies - Selective attention
Deutsche Heimseite