Reinforcement Learning with RNNs

Forward model (Werbos, Jordan & Rumelhart, Nguyen & Widrow)

Train model, freeze it, use it to compute gradient for controller

Recurrent Controller & Model (Schmidhuber 1990)

Previous slide Next slide Back to first slide View graphic version

Back to J. Schmidhuber's Recurrent neural network page