next up previous contents
Nächste Seite: Statische Netzwerke Aufwärts: Grundlagen: Überwachtes Lernen Vorherige Seite: Grundlagen: Überwachtes Lernen   Inhalt

Überblick

Das zentrale Thema dieser Dissertation sind Lernalgorithmen für die allgemeine Situation, in der kein intelligenter Lehrer zur Verfügung steht. Wozu dann ein Kapitel zum überwachten Lernen?

Der Zweck dieses Kapitels ist ein zweifacher. Zum einen werden wir später sehen, daß man überwachte Techniken in sehr nützlicher Weise auch bei generellen Lernsituationen mit einbinden kann. Zwar kann man überwachte Netze per definitionem nicht direkt auf Probleme ansetzen, bei denen zwischen Ausgabeaktionen und erwünschten Zuständen eine Lücke (geschaffen durch unbekannte Eigenschaften einer externen Umgebung) klafft. Allerdings kann man überwachte Netze verwenden, um bestimmte Aspekte dieser Lücke zu modellieren. Dabei kann die Umgebung selbst eine lehrende Funktion übernehmen. Modelle von Umgebungseigenschaften können ihrerseits eine entscheidende Rolle als Hilfsmodule für ein allgemeineres System spielen, in das sie eingebettet sind. Drei der in dieser Arbeit vorgestellten Algorithmen sind in verschiedener Weise auf `selbstüberwachte' Hilfsmodule angewiesen. Man kann sie nicht verstehen, wenn man nicht vorher die Konzepte verstanden hat, die in diesem Kapitel vorgestellt werden.

Zum anderen soll aufgezeigt werden, welche Schwierigkeiten mit den existierenden überwachten Techniken verbunden sind. Im Rahmen der Vorstellung dieser Algorithmen wird insbesondere auf ihre relativen Stärken und Schwächen eingegangen. Schwerpunkt der Kritik ist die nicht vorhandene Lokalität in Zeit und Raum. Die Kritik liefert zusätzliche Motivation für weiterführende Kapitel.

Das Kapitel ist wie folgt gegliedert: In knapper Form wird zunächst auf die bekannten Algorithmen für azyklische Netze eingegangen. Dies dient im wesentlichen der Vorbereitung auf den zyklischen Fall. (Zusätzliche Motivation für die Beschreibung azyklischer Netze erwächst aus der Tatsache, daß in späteren Kapiteln auch statische Netzwerke sinnvoll als Module in größere dynamische Systeme eingebettet werden. Auch zeigt sich schon am azyklischen Fall ein für bisherige Verfahren typischer Nachteil, nämlich die nicht vorhandene Lokalität in Zeit und Raum.)

Im Anschluß werden Algorithmen für zyklische Netze beschrieben. Die Menge der zyklischen Netze zerfällt in zwei Untersorten: Equilibriumsnetze und andere. Erstere werden in ebenfalls knapper Form exemplarisch betrachtet, letztere machen den Hauptteil dieses Kapitels aus. Die allgemeinsten der Algorithmen für dynamische zyklische Netze sind (wenigstens prinzipiell) geeignet, beliebige Zeitverzögerungen zwischen beliebigen Ereignisfolgen und späteren Konsequenzen zu entdecken.

Schließlich wird im Rahmen des überwachten Lernens auf Methoden der zeitlichen Differenzen eingegangen. Die in dem entsprechenden Abschnitt beschriebenen Konzepte sind insofern allgemeiner Natur, als sie nicht an bestimmte Netztopologien gebunden sind. Sie sind ebenfalls relevant für spätere Kapitel zum Reinforcement-Lernen.


next up previous contents
Nächste Seite: Statische Netzwerke Aufwärts: Grundlagen: Überwachtes Lernen Vorherige Seite: Grundlagen: Überwachtes Lernen   Inhalt
Juergen Schmidhuber 2003-02-20


Related links in English: Recurrent neural networks - Subgoal learning - Reinforcement learning and POMDPs - Reinforcement learning economies - Selective attention
Deutsche Heimseite