Professional Documents
Culture Documents
[23]
24 J. Michalkiewicz
wana przez autora jest nieparametryczna, ponieważ nie zakłada się postaci
funkcji g.
Wewnętrzna funkcja aktywacji jest określona w węzłach siatki prze-
strzennej i może być nieciągła i dlatego jest nieróżniczkowalna. Girosi i Pog-
gio (Girosi, 1989) określili taką sieć jaką nieużyteczną do uczenia z dwóch
powodów:
1) ponieważ wewnętrzna funkcja aktywacji jest nieróżniczkowalna,
2) ponieważ sieć jest nieparametryzowalna.
Z poglądem tym polemizowała Kurkowa (Kurkova, 1991). W swoim ar-
tykule zakwestionowała tezę Girosi i Poggio udowadniając, że dla problemu
aproksymacji nie musi być spełniony warunek różniczkowalności i para-
metryzowalności. Poza tym zwróciła uwagę, że funkcje nieróżniczkowalne
można przybliżyć ciągiem funkcji różniczkowalnych. Podobnie uważa au-
tor, ponieważ nieciągłe funkcje można przybliżyć ciągiem funkcji ciągłych
lub różniczkowalnych (oczywiście bez wymagania jednostajnej zbieżności).
Poza tym autor formułuje problem w kategorii aproksymacji, stąd spełnione
są warunki twierdzeń w artykule Kurkowej.
Próby modyfikacji twierdzenia Kołmogorowa podejmowali się także Lo-
rentz i Sprecher, ale rozwiązania tych autorów są mało istotne lub bardzo
skomplikowane w obliczeniach i stąd mało użyteczne.
Lorentz wykazał, że można zastąpić funkcje gq przez jedną funkcje g,
a Sprecher zmodyfikował funkcje fp,q przez λp fq i twierdzenie Kołmogorowa
w tej wersji wyraża się wzorem
2n+1 n
(4) h(x1 , . . . , xn ) = g λp fq (xp )
q=1 p=1
Według Sprechera
2n+1
n
(5) h(x1 , . . . , xn ) = gq λp f (xp + (q − 1)a)
q=1 p=1
Próbę konkretnego określenia funkcji fp,q podjął Sprecher lecz jej postać
jest bardzo skomplikowana w obliczeniach.
Podane niżej zmodyfikowane twierdzenia Kołmogorowa można potrak-
tować jako schematy numeryczne nadające się do użycia w sieciach neuro-
nowych.
n
(7) Sk,i 1 ,...,in
= Aqk,ip
p=1
q
Lemat 1 (o pokryciu). Zbiór hipersześcianów Sk,i 1 ,...,in
przy ustalonym
k i zmiennym q oraz i1 , . . . , in pokrywa zbiór Dk tak , że każdy punkt z Dkn
n
zaś
q
(11) ςk,i p
∈ Aqk,ip
i są jego lewym końcem, a wq,p są współczynnikami spełniającymi warunek
(12) wq,p ≥ wq,p−1 ((9n)k + 1).
Dowód. Niech
n
(13) y= wq,p xp .
p=1
q
Funkcja określona wzorem (10) przekształca zbiór Sk,i 1 ,...,in
w pewien
zbiór ∆qk,i1 ,...,in . Ponieważ funkcja ta jest ciągła (jako suma funkcji cią-
głych), zatem na mocy twierdzenia o przekształceniu ciągłym przestrzeni
Zmodyfikowane twierdzenie Kołmogorowa 29
q
spójnej wnioskujemy, że obraz spójnego zbioru Sk,i 1 ,...,in
, tzn. ∆qk,i1 ,...,in ,
jest zbiorem spójnym.
Następnie należy tak dobrać wagi synaptyczne, aby przedziały ∆qk,i1 ,...,in
nie pokrywały się. Zauważmy, że rozpatrujemy wartości funkcji wyrażonej
wzorem (10) na „siatce przestrzennej” Dkn , wystarczy więc, aby obrazy wę-
złów „siatki przestrzennej” nie nakładały się. Jest wiele sposobów na dobór
współczynników funkcji liniowych. Wystarczy, aby zachodził wzór (12).
Są jeszcze inne metody doboru współczynników.
Dla funkcji n wymiarowej wq,j = log pj , gdzie pj , j = 1, 2, . . . , n, są
liczbami pierwszymi.
Funkcja
n
n
i
(14) ij log pj = log pjj
j=1 j=1
Rozpatrzmy
(16) M = sup |h| .
En
Niech
q
(17) ςk,i p
∈ Aqk,ip
są jego lewym końcem, wtedy
(18) y ∈ ∆qk,i1 ,...,in
są jego lewym końcem.
Wzór na gq jest następujący
1
gq (y) = h(ς q , . . . , ςk,i
q
).
2n + 1 k,i1 n
Dalej
(19) h(x1 , . . . , xn ) − ha(x1 , . . . , xn )
2n+1
n
= h(x1 , . . . , xn ) − gq wq,p xp .
q=1 p=1
30 J. Michalkiewicz
Niech
1 q q
(28) ζpq = i − 1 − .
(9n)k p 3n
Bibliografia
Chui C. K., Li X.: Approximation by ridge functions and neural network with one hidden
layer, Journal of Approximation Theory, 70, pp. 131–141, 1992.
Cybenko G.: Approximation by superposition of a sigmoidal function, Mathematics of
Control, Signals, and Systems, 2, pp. 303–314, 1989.
Engekling R., Sieklucki K.: Wprowadzenie do topologii, PWN Warszawa 1986.
Fichtenholz G. M.: Rachunek różniczkowy i całkowy. Tom I,II,III. PWN Warszawa 1980.
Girosi F., Poggio T.: Representation properties of networks: Kolmogorov’s theorem is
irrelevant, Neural Computation, 1, pp. 465–469, 1989.
Zmodyfikowane twierdzenie Kołmogorowa 37
Jarosław Michalkiewicz
ul. Kwiska 12/5
54-210 Wrocław
E-mail: jarekmichal@poczta.onet.pl
objects in the automatics. The modified Kolmogorov’s theorem enables the author to con-
struct a simple computer algorithm.
Keywords: approximation, Kolmogorov’s theorem, non-linear dynamical systems.