Nächste Seite: Abschließende Bemerkungen
Aufwärts: Experimente zum R-Lernen in
Vorherige Seite: Nicht-Markov-mäßiges Balancieren mit `perfektem
  Inhalt
In naher Zukunft soll folgendes Experiment in Angriff genommen
werden: Zwei kommunizierende Agenten, beide ausgestattet mit
A2, sind nicht nur in der Lage, ihre physikalische Umwelt
zu manipulieren, sondern können auch `akustische' Ausgaben produzieren
und `akustische' Eingaben verarbeiten. Jeder Agent besitzt
ein adaptives Modell der `Bedeutung' der Ausgaben des anderen.
`Bedeutung' ist dabei nur implizit durch einen evaluativen
Kritiker gegeben, der die Effekte der Aktionen der beiden Agenten
beurteilt. Spezielle Aufgaben sollen den Agenten gestellt werden, und
zwar derart, daß eine Aufgabe nicht von einem einzelnen Agenten alleine
gelöst werden kann. Dadurch ergibt sich eine Notwendigkeit
für Kooperation: Die Agenten sollen gezwungen sein, zu lernen, in
sequentieller Manier zu kommunizieren.
Juergen Schmidhuber
2003-02-20
Related links in English: Recurrent neural networks - Subgoal learning - Reinforcement learning and POMDPs - Reinforcement learning economies - Selective attention
Deutsche Heimseite