Nächste Seite: R-Lernen
Aufwärts: Zielgerichtetes Lernen
Vorherige Seite: Zielgerichtetes Lernen
  Inhalt
Ein Lernproblem ist ein überwachtes Lernproblem, wenn zu gewissen
Zeitpunkten einer Aktivationsausbreitungsphase eines Netzwerkes
von einem
externen Lehrer definierte gewünschte Ausgaben existieren,
und das Netzwerk niemals selbst Ausgabeaktivationen entdecken
muß. (Der Lehrer kann dabei unter Umständen durch die Umgebung selbst
oder aber sogar durch ein anderes Netzwerk gegeben sein.) Für
den überwachten Lerner stellt die externe Rückkopplung kein
kritisches Problem dar. Es gibt keine durch die externe
Rückkopplung verursachten unerwünschten Eingaben.
Beispielsweise kann man mit Hilfe eines überwachten Algorithmus
einem unseren Roboter steuernden Netzwerk beibringen, seinen Stab
zu balancieren. Voraussetzung ist allerdings, daß
ein gut informierter externer Lehrer angibt, welche
Kraft zu welchem Zeitpunkt
auf den Stab ausgeübt werden soll, um die Balance zu
halten. Die Aufgabe wird dadurch recht einfach und uninteressant, denn
irgend jemand muß ja vor dem Training schon wissen, wie
das Problem zu lösen ist!
Juergen Schmidhuber
2003-02-20
Related links in English: Recurrent neural networks - Subgoal learning - Reinforcement learning and POMDPs - Reinforcement learning economies - Selective attention
Deutsche Heimseite