next up previous contents
Nächste Seite: Lokalität in Zeit und Aufwärts: Aufgabenstellungen und Terminologie Vorherige Seite: R-Lernen   Inhalt

Unüberwachtes Lernen

Der Begriff `unüberwachte Lernalgorithmen' wird häufig nicht präzisiert. Normalerweise soll durch das Wort `unüberwacht' jedoch zum Ausdruck gebracht werden, daß es im Gegensatz zum zielgerichteten Lernen keine instruktive oder evaluative sich auf etwaige `Erfolge' oder `Mißerfolge' beziehende Rückmeldung für das lernende System gibt. Das Konzept des `(Miß-)Erfolgs' existiert gar nicht. Es gibt also auch keine offensichtliche Zielgerichtetheit. Unüberwachtes Lernen muß dennoch nicht gänzlich ziellos sein (was hätte es denn dann auch für einen Sinn?): Es kann zum Auffinden gewisser `Regelmäßigkeiten' in den Eingaben dienen. (Dies wiederum mag es einem R-Lernalgorithmus erleichtern, Ziele zu verfolgen.)

Der Begriff Regelmäßigkeit ist mit gewissen Schwierigkeiten belastet. Was ist eine Regelmäßigkeit? Bei näherer Betrachtung dieser Frage wird ein Problem offenbar, das mit den unterschiedlichen Auffassungen des Begriffs `Information' selbst zusammenhängt. Unterschiedliche Definitionen von Information (syntaktische Information oder Entropie, algorithmische Information, pragmatische Information) ziehen unterschiedliches Verständnis des Begriffes `Regelmäßigkeit' nach sich. Eine nähere Beleuchtung dieser Problematik würde allerdings den Rahmen dieser Arbeit sprengen.

Weiterhin ist festzustellen, daß zu vielen möglichen Gewichtsmodifikationsregeln eine (intuitiv häufig unsinnige) Zielfunktion gefunden werden kann, welche durch die jeweilige Regel minimiert wird. Dadurch werden diese Regeln im nachhinein zu `Lernregeln' (in Bezug auf die jeweilige Zielfunktion), und der Unterschied zwischen zielgerichtetem Lernen und unüberwachtem Lernen verschwimmt.

Spricht man im Rahmen von NN von Regelmäßigkeiten, so meint man meist Regelmäßigkeiten statistischer Natur, und faßt unter dem Begriff `unüberwachte Lernalgorithmen' die sogenannten `Clustering'-Algorithmen zusammen: `Ähnliche' Muster sollen zum Beispiel in `ähnliche' Kategorien klassifiziert werden, wobei das Maß für Ähnlichkeit meist recht einfach und nicht selbst adaptiv ist (z.B. euklidische Distanz o.ä.).

In den ersten 7 Kapiteln dieser Arbeit werden wir ohne unüberwacht lernende Komponenten auskommen, im wesentlichen deswegen, weil die von dieser Arbeit angesprochenen Probleme isoliert betrachtet werden sollen. Erst im Ausblick des letzten Kapitels werden Kombinationen aus zielgerichteten und unüberwachten dynamischen Lernsystemen vorgeschlagen werden.


next up previous contents
Nächste Seite: Lokalität in Zeit und Aufwärts: Aufgabenstellungen und Terminologie Vorherige Seite: R-Lernen   Inhalt
Juergen Schmidhuber 2003-02-20


Related links in English: Recurrent neural networks - Subgoal learning - Reinforcement learning and POMDPs - Reinforcement learning economies - Selective attention
Deutsche Heimseite