next up previous contents
Nächste Seite: Die Experimente Aufwärts: Der grundlegende Algorithmus Vorherige Seite: Gleichungen für diskrete Zeit   Inhalt

Mögliche Erweiterung für kontinuierliche Zeit

Ein letzter Rest globalen Charakters ist bei allen diskreten dynamischen Systemen noch durch die Notwendigkeit eines Taktgebers vorhanden. Das Eimerkettenprinzip ist potentiell jedoch auch für auf kontinuierlicher Zeit basierende Modelle neuronaler Informationsverarbeitung von Interesse. Um den asynchronen biologischen Vorbildern noch näher zu kommen, geben wir nun die Voraussetzung der vordefinierten WTA-Einheiten und des `sofortigen Aktivitätsschwunds' auf. Um das Konzept der `gewinnenden Knoten' zu retten, führen wir eine Nachbarschaftsordnung auf der Menge der Knoten sowie starre lokal inhibitorische Verbindungen zwischen benachbarten Knoten ein. Damit ist die Netztopologie durch eine (in ähnlicher Weise vielerorts im Gehirn vorgefundene) `On-center-off-surround'-Struktur eingeschränkt. Sowohl Kohonen als auch Grossberg verwenden (allerdings in ganz unterschiedlichem Kontext des unüberwachten Lernens) `On-center-off-surround'-Strukturen, um einen Wettbewerb zwischen Knoten zu implementieren [23] [11].

Wir nehmen an, daß sowohl die nun nicht mehr binären, sondern reellwertigen Ausgaben $x_{j} \in [0,1]$ des Knotens $j$ als auch die Eigenschaften der variablen exzitatorischen Verbindungen durch Differentialgleichungen bestimmt sind, welche aussagen, daß $x_j$ während der Zeit, die notwendig ist, um Aktivationsinformation von einem Knoten zu einem Nachfolger zu leiten, sich nicht signifikant ändert. Dann können wir eine Version für den Gewichtsänderungsalgorithmus angeben, die auf kontinuierlicher Zeit beruht ($net_j > 0$):


\begin{displaymath}
\frac{\partial w_{ij}}{\partial t} =
- \alpha x_{i}w_{ij}x_{...
...} x_{i}w_{ij}}
\sum_{k} \alpha x_{j}w_{jk}x_{k}
+ Ext_{ij}
\end{displaymath}

Ausschließlich positive Gewichte treten in dieser Formel auf, die inhibitorischen Verbindungen müssen ja starr bleiben. Bezeichnet man in suggestiver Weise $\sum_{k} w_{jk}x_{k}$ mit $back_{j}$, so beobachtet man (durch Gleichsetzung von $\frac{\partial w_{ij}}{\partial t}$ mit $0$), daß der Gewichtsfluß durch ein positives Gewicht $w_{ij}$, welches keine externe Gewichtssubstanz abbekommt, genau dann ein dynamisches Gleichgewicht erreicht hat, wenn stets $net_{j}= back_{j}$ gilt.

Es sollte angemerkt werden, daß es einen wichtigen Unterschied zwischen der kontinuierlichen Version basierend auf `On-center-off-surround'-Verdrahtung und der weiter oben behandelten diskreten Version gibt. Während die diskrete Version für den Fall des Ausschaltens einer Eingabe zu einer WTA-Einheit den `sofortigen Aktivitätsschwund' voraussetzt, wird unter der gleichen Voraussetzung bei `On-center-off-surround'-Verdrahtung kein sofortiges Abfallen der Aktivation zu messen sein. Es ist gegenwärtig unklar, ob die mögliche Erweiterung der neuronalen Eimerkette durch solche Hystereseeffekte in ihrer Funktionstüchtigkeit beeinträchtigt wird. Die im folgenden beschriebenen Experimente beziehen sich alle auf die diskrete Version.


next up previous contents
Nächste Seite: Die Experimente Aufwärts: Der grundlegende Algorithmus Vorherige Seite: Gleichungen für diskrete Zeit   Inhalt
Juergen Schmidhuber 2003-02-20


Related links in English: Recurrent neural networks - Subgoal learning - Reinforcement learning and POMDPs - Reinforcement learning economies - Selective attention
Deutsche Heimseite