Nächste Seite: Belohnung temporaler Invarianzen
Aufwärts: Zukünftige Untersuchungen
Vorherige Seite: Zukünftige Untersuchungen
  Inhalt
Befinden sich mehrere (gar ähnlich aussehende) Objekte oder
auch Objekte mit reicher interner Detailstruktur in der Szene,
so benötigt man entweder rekurrente Verbindungen (à la A2)
in
und
, oder aber irgendeinen anderen Mechanismus
für die Flucht aus lokalen Minima. Lokale Minima
ergeben sich zum Beispiel durch Teile der Pixelebene, die dem Zieldetail
ähneln, während die nähere Umgebung dies nicht tut.
In solchen Fällen wird die relevante externe Rückkopplung
im allgemeinen nicht-Markovsch.
Rudolf Huber hat für derartige Situationen
noch einige Experimente mit multiplen Objekten
und interagierenden rekurrenten Netzen durchgeführt [18].
Es stellte sich
heraus, daß interne Rückkopplung in
und
in gewissen Fällen
auch dann noch
zum Erfolg führen kann, wenn externe Rückkopplung alleine nicht mehr
ausreicht [18].
Einem sehr unterschiedlichen Ansatz werden allerdings
langfristig mehr Chancen eingeräumt, nämlich
dem adaptiven Generieren von
Subzielen. Das nächste Kapitel zeigt, wie
so etwas funktionieren kann.
Juergen Schmidhuber
2003-02-20
Related links in English: Recurrent neural networks - Subgoal learning - Reinforcement learning and POMDPs - Reinforcement learning economies - Selective attention
Deutsche Heimseite