You are on page 1of 19

Rozdział 1

Wprowadzenie w tematykę
badań

1.1 Podstawowe twierdzenia i definicje


1.1.1 Jednowymiarowy automat komórkowy
Jednowymiarowym automatem komórkowym CA nazywana będzie uporząd-
kowana dwójka
CA = hC, fCA i, (1.1)
gdzie C jest dowolnym niepustym skończonym zbiorem, fCA jest funkcją
determinującą zasady ewolucji CA:
fCA (Lk ) = Lk+1 , Lk = hck1 , ck2 , . . . , ckm i, cki ∈ C. (1.2)
Po zadaniu konfiguracji początkowej L0 działanie jednowymiarowego auto-
matu komórkowego polega na cyklicznej zamianie układu Lk na kolejny Lk+1
zgodnie z regułami ewolucji określonymi funkcją fCA 1 .
Definicja 1.1 Niech dana będzie konfiguracja początkowa L0 i reguły ewolu-
cji fCA . N pierwszych wierszy ewolucji jednowymiarowego automatu komór-
kowego z układu L0 nazywane będą produktem CA.
1
Jeżeli funkcja fCA zależy od zmiennej losowej, automat komórkowy nazywa się proba-
bilistycznym. W całej pracy rozważane będą wyłącznie automaty komórkowe determini-
styczne, w których funkcja fCA nie zależy od zmiennej losowej. Patrz S. Wolfram, Cellular
Automata, Los Alamos Science, 9 (1983) s. 2-21, a także M.Garzon Models of Massive
Parallelism. Analysis of Cellular Automata and Neural Networks, Springer-Verlag, Berlin
1995.
1.1 Podstawowe twierdzenia i definicje 2

Funkcja fCA nazywana jest regułą globalną, w odróżnieniu od funkcji gCA ,


nazywanej regułą lokalną. Funkcja gCA determinuje przekształcenie komórki
cki układu Lk w komórkę c(k+1)i układu Lk+1 w zależności od cki i stanu
komórek ją otaczających. Charakterystyczne dla automatów komórkowych
jest stosowanie jednej reguły gCA dla każdej komórki konfiguracji Lk 2 . Reguła
lokalna gCA wraz z zasadą cyklicznego jej stosowania dla każdej komórki Lk
stanowi regułę globalną fCA . Funkcję fCA można opisać wzorem3

c(k+1)1 = gCA (ck1 , ck2 , . . . , ckm−1 , ckm )


c(k+1)2 = gCA (ck2 , ck3 , . . . , ckm , ck1 )
.. , (1.3)
.
c(k+1)m = gCA (ckm , ck1 , . . . , ckm−2 , ckm−1 )
gdzie cki ∈ Lk .

Fakt 1.1 Niech dany będzie automat komórkowy

CA = hC, fCA i,

niech D(fCA ) oznacza dziedzinę fCA oraz niech dany będzie zbiór A ⊂ D(fCA ).
Zbiór F zbudowany na produkcie CA
[
F = hLk , Lk+1 i
0¬k<n−2

stanowi funkcję fCA ograniczoną w dziedzinie do zbioru

A = {L0 , L1 , . . . , Ln−2 }.

2
Sposób traktowania komórek skrajnych układu Lk nazywany jest określaniem warun-
ków brzegowych CA. W większości przypadków przyjmuje się, że dla

Lk = hck1 , ck2 , . . . , ckm i,

zachodzi
ckm+l = ckl i ck1−l = ckm+1−l , 1 ¬ l ¬ m.

3
Należy zauważyć, że wzór jest uniwersalny dla funkcji fCA o dowolnie określonych
warunkach brzegowych.
1.1 Podstawowe twierdzenia i definicje 3

Rys. 1.1. Automat komórkowy przykładu 1.1

Przykład 1.1 Niech C = {0, 1} oraz niech reguły ewolucji gCA


dane będą wzorem
gCA (x1 , x2 , . . . , xm ) = (x1 + x2 ) mod 2, (1.4)
gdzie x mod y zwraca resztę z dzielenia całkowitego x przez y. Stan
i-tej komórki kroku (k + 1) zależy od stanu dwóch komórek kroku
poprzedniego: cki oraz cki+1 . Rysunek (1.1) przedstawia 20 kroków
ewolucji automatu komórkowego z ciągu początkowego
L0 = h1, 1, 0, 0, 1, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0i
(kolor biały odpowiada wartości 1, czarny wartości 0).

1.1.2 Twierdzenie o produkcie CA


Niech dany będzie niepusty zbiór C, liczba naturalna m oraz m-elementowy
układ uporządkowany L ∈ C m , gdzie C m oznacza m-krotny iloczyn karte-
zjański zbioru C przez siebie, tzn.
L = hc1 , c2 , . . . , cm i, gdzie ci ∈ C, i ∈ {1, 2, . . . , m}.
Przez CA oznaczany będzie n-elementowy (n > 1) ciąg
CA = hL0 , L1 , . . . , Ln−1 i, (1.5)
1.1 Podstawowe twierdzenia i definicje 4

gdzie
Lk = hck1 , ck2 , . . . , ckm i ∈ C m , k ∈ {0, 1, . . . , n − 1}.
Oczywiście
m
CA ∈ C
|
× C m {z
× . . . × C m} . (1.6)
n razy

Niech Lkp oznacza cykliczne przesunięcie Lk o p kroków w lewo

Lkp = hckp+1 , ckp+2 , . . . , ckm , ck1 , . . . , ckp i, (1.7)

gdzie 0 ¬ p < m. Niech dana też będzie para uporządkowana

Fkp = hLkp , c(k+1)p i, (0 ¬ k < n − 1). (1.8)

Zbiór wszystkich takich par oznaczany będzie F ∗ :


[
F∗ = Fkp . (1.9)
0¬k<n−1
0¬p<m

Należy zauważyć, że F ∗ jest relacją w iloczynie kartezjańskim zbiorów C m i


C:
F ∗ ⊂ C m × C.

Twierdzenie 1.1 Ciąg CA stanowi produkt jednowymiarowego automatu ko-


mórkowego wtedy, gdy F ∗ jest funkcją4 , czyli zachodzi następująca własność:
^ ^
Lkp = Lk∗ p∗ → c(k+1)p = c(k∗ +1)p∗ . (1.10)
0¬k<n−1 0¬p<m
0¬k∗ <n−1 0¬p∗ <m

Dowód: Dowód wynika bezpośrednio ze sposobu budowania zbioru F ∗


oraz z faktu 1.1.

Przykład 1.2 Niech C = {0, 1}, m = 4 oraz niech reguły ewolu-


cji określa wzór (1.4). Poniższa tabela prezentuje dwa pierwsze kroki
automatu komórkowego dla ciągu początkowego L0 = [0, 0, 1, 0]
4
We wszystkich przypadkach dotyczących zbioru F ∗ pojęcie funkcji będzie używane w
interpretacji teoriomnogościowej.
1.1 Podstawowe twierdzenia i definicje 5

0 0 1 0
0 1 1 0 .
1 0 1 0
Stąd  

 F00 = hh0010i, 0i, F01 = hh0100i, 1i, 


 F = hh1000i, 1i, 
02 F03 = hh0001i, 0i, 
F∗ = .
 10 = hh0110i, 1i,


F F11 = hh1100i, 0i, 


 
F12 = hh1001i, 1i, F13 = hh0011i, 0i

1.1.3 Pełne i niepełne produkty CA. Minimalizacja


zbioru F ∗
Niech dany będzie zbiór cyklicznych przesunięć n-elementowego ciągu CA
[
L∗ = Lip , (1.11)
0¬i<n−1
0¬p<m

gdzie Lip ∈ C m .

Definicja 1.2 Taki ciąg CA , że utworzona na nim klasa F ∗ par Fip stanowi
funkcję oraz jednocześnie zachodzi L∗ = C m nazywany będzie produktem
pełnym CA.

Definicja 1.3 Taki ciąg CA , że utworzona na nim klasa F ∗ par Fip stanowi
funkcję oraz jednocześnie zachodzi L∗ ⊂ C m nazywany będzie produktem
niepełnym CA.

Definicja 1.4 Niech dany będzie zbiór Z = {0, 1} oraz niech

NZ = hz0 , z1 , . . . , zm i, zi ∈ Z (1.12)

oznacza m-elementowy układ uporządkowany nazywany dalej otoczeniem.


Redukcją Lk względem otoczenia NZ nazywana będzie funkcja odwzoro-
wująca m-elementowy układ uporządkowany Lk w m0 -elementowy (m0 ¬ m)
układ uporządkowany Lk|NZ . Do Lk|NZ należeć będą tylko te elementy z Lk ,
dla których elementy z NZ o tym samym indeksie mają wartość 1.

Układ uporządkowany Lip zredukowany względem otoczenia NZ oznaczany


będzie Lip |NZ . Para Fip o pierwszym takim elemencie oznaczana będzie Fip |NZ .
Zbiór F ∗ złożony z powyższych par oznaczany będzie F ∗|NZ .
1.1 Podstawowe twierdzenia i definicje 6

Otoczenie NZ jest pojęciem występującym w teorii automatów komór-


kowych w związku z pojęciem reguły lokalnej. Wartość otoczenia zi = 1
oznacza, że stan i-tego sąsiada wobec komórki bieżącej ma wpływ na stan
komórki wynikowej5 .

Definicja 1.5 Liczba jedynek w redukującym elementy Lip otoczeniu NZ na-


zywana będzie nazywana będzie jego mocą i oznaczana będzie NZ :
m
X
NZ = zi . (1.13)
i=1

Z definicji wynika, że F ∗|NZ = F ∗ wtedy i tylko wtedy, gdy otoczenie NZ


składa się z samych jedynek.
Po wprowadzeniu pojęcia otoczenia możliwe staje się rozszerzenie poję-
cia produktu pełnego i niepełnego CA na przypadek zredukowanego zbioru
F ∗|NZ . Niech dany będzie zbiór cyklicznych przesunięć zredukowany wzglę-
dem otoczenia NZ [
L∗|NZ = Li|NZ . (1.14)
0¬i<n−1

Definicja 1.6 Taki ciąg CA , że utworzona na nim klasa F ∗|NZ par Fip |NZ
stanowi funkcję oraz jednocześnie zachodzi

L∗|NZ = C NZ

nazywany będzie produktem pełnym CA6 .

Definicja 1.7 Taki ciąg CA , że utworzona na nim klasa F ∗|NZ par Fip |NZ
stanowi funkcję oraz jednocześnie zachodzi

L∗|NZ ⊂ C NZ

nazywany będzie produktem niepełnym CA.

Definicja 1.8 Minimalizacją zbioru F ∗ nazywany będzie proces szukania ta-


kiego zbioru F ∗|NZ o jak najmniejszej mocy NZ , który nadal byłby funkcją.

5
Patrz wzór (1.3).
6
Zapis C NZ oznacza k-krotny iloczyn kartezjański zbioru C przez siebie, gdzie k = NZ .
1.1 Podstawowe twierdzenia i definicje 7

Fakt 1.2 Minimalizacja F ∗ oznacza poszukiwanie reguły lokalnej gCA auto-


matu komórkowego, którego produkt posłużył do skonstruowania zbioru F ∗ .

Przykład 1.3 Dany jest zbiór

F ∗ = {hh0110i, 1i, hh1100i, 0i, hh1111i, 0i}, (1.15)

co może odpowiadać następującym fragmentom ewolucji pewnego au-


tomatu komórkowego z jednego ciągu początkowego
..
.
0 1 1 0
1 0 . .
.. (1.16)
.
1 1 1 1
0 . . .
..
.

lub fragmentom ewolucji automatu komórkowego z trzech ciągów po-


czątkowych
.. .. ..
. . .
0 1 1 0 1 1 0 0 1 1 1 1
(1.17)
1 . . . 0 . . . 0 . . .
.. .. ..
. . .

Dla NZ = h1000i zredukowany zbiór F ∗|NZ ma postać

F ∗|NZ = {hh0i, 1i, hh1i, 0i}

i stanowi pełny produkt CA. Otoczenie NZ = h1000i jest dla zbioru


(1.15) jedyną możliwą redukcją o mocy NZ = 1, która tworzy pełny
produkt CA.

1.1.4 α-minimalizacja zbioru F ∗


Każdemu elementowi Fip |NZ ∈ F ∗|NZ można przypisać liczbę rzeczywistą µF
z przedziału [0, 1] w następujący sposób: niech s będzie liczbą tych par zbioru
1.1 Podstawowe twierdzenia i definicje 8

F ∗|NZ , których element Lip jest identyczny z pierwszym elementem pary ana-
lizowanej, a l niech oznacza ilość tych spośród s par, których element c(i+1)p
jest identyczny z drugim elementem pary analizowanej. Wtedy:
l
µF = , gdzie s > 0, l ¬ s. (1.18)
s
Funkcja µ przypisująca każdemu elementowi Fip |NZ ∈ F ∗|NZ wielkość µF
nazywana będzie funkcją charakterystyczną zbioru. Zbiór F ∗|NZ wraz z funk-
cją µ utożsamiany będzie ze zbiorem rozmytym (relacją rozmytą).

Definicja 1.9 α-przekrojem zbioru F ∗|NZ oznaczanym F ∗|NZ |α nazywany bę-


dzie następujący zbiór:

F ∗|NZ |α = {Fip ∈ F ∗|NZ : µ(Fip ) ­ α}. (1.19)

Twierdzenie 1.2 Dla każdego zbioru F ∗|NZ istnieje taki jego α-przekrój
F ∗|NZ |α , który jest funkcją.

Dowód: Dla dowodu wystarczy rozważyć dowolny α-przekrój, gdzie α >


0,5. Ponieważ suma wartości µF par o identycznych elementach Lip wynosi
1, dlatego jeśli istnieje element Fip |NZ dla którego µF > 0,5, to istnieje co
najwyżej jeden taki element. Jest to warunkiem wystarczającym, by zbiór
F ∗|NZ |α tworzył funkcję.
Niech zbiór F ∗ stanowi funkcję.

Definicja 1.10 Proces szukania takiego zbioru F ∗|NZ |α o jak najmniejszej


mocy NZ i jak największej wartości α, który byłby funkcją nazywany będzie
α-minimalizacją zbioru F ∗ .

Zadanie α-minimalizacji funkcji F ∗ polega na przeszukiwaniu dwuwymia-


rowej przestrzeni możliwych wartości α oraz NZ . Rozwiązaniem zadania jest
więc para uporządkowana hα, NZ i nazywana parą optymalną. Dla konkret-
nych zbiorów F ∗ może istnieć wiele różnych par optymalnych.

Przykład 1.4 Niech dany będzie zbiór


( )
hh1110i, 0i, hh0110i, 1i, hh0011i, 0i,
F∗ = ,
hh1001i, 1i, hh1111i, 0i, hh1111i, 1i
1.1 Podstawowe twierdzenia i definicje 9

który nie jest funkcją. Zbiór zredukowany dla otoczenia NZ = h1100i


tworzy zbiór rozmyty
( )
∗|NZ 1hh00i, 0i, 1hh01i, 1i, 1hh10i, 1i,
F = 2 1 .
3 hh11i, 0i, 3 hh11i, 1i

1 2
α-przekrój dla dowolnego 3 <α< 3 składa się z czterech elementów
( )
hh00i, 0i, hh01i, 1i,
F ∗|NZ |α =
hh10i, 1i, hh11i, 0i

i tworzy produkt pełny CA.

1.1.5 Wykres produktu CA


Niech dana będzie funkcja różnowartościowa δc (c) o dziedzinie w zbiorze C i
wartościach w przedziale domkniętym [0, rc ] zbioru liczb rzeczywistych R:

δc (c) = lc , gdzie c ∈ C, 0 ¬ lc ¬ rc . (1.20)

Niech dana też będzie funkcja różnowartościowa δL (L) o dziedzinie w zbiorze


C m i wartościach w przedziale domkniętym [0, rL ] zbioru liczb rzeczywistych
R:
δL (L) = lL , gdzie L ∈ C m , 0 ¬ lL ¬ rL . (1.21)

Definicja 1.11 Para uporządkowana

Fiδp = hδL (Lip ), δc (c(i+1)p )i (1.22)

nazywana będzie składową produktu CA 7 .

Z założeń funkcji (1.20) i (1.21) oraz z własności jednowymiarowego au-


tomatu komórkowego wynika, że nie istnieją dwie składowe Fiδp i Fiδ∗∗ takie,
p
że jednocześnie zachodzi δL (Lip ) = δL (Li∗p∗ ) oraz δc (c(i+1)p ) 6= δc (c(i∗ +1)p∗ ).

Definicja 1.12 Funkcja rozkładu składowych Fiδp na odcinku [0, rL ] nazy-


wana będzie wykresem produktu CA i oznaczana będzie F δ∗ .
7
W niniejszym paragrafie zakłada się, że zbiór CA spełnia warunek podany w twier-
dzeniu 1.1, a co z tego wynika, jest produktem CA
1.1 Podstawowe twierdzenia i definicje 10

Z powyższej definicji wynika, że wykres produktu CA przyjmuje wartości


F δ∗ (lL ) = δc (c(i+1)p ) w punktach lL = δL (Lip ), w pozostałych punktach przyj-
mując wielkość neutralną (na przykład 0).
Funkcja F δ∗ (lL ) tworzy rozkład dyskretny, jeżeli jej dziedziną jest zbiór
liczb naturalnych N (lL ∈ N). W tym przypadku wykres produktu CA należy
utożsamiać z wektorem o (C)m wyrazach, gdzie C jest mocą zbioru C, m jest
długością ciągu L. W większości przypadków należy oczekiwać, że produkt
CA będzie miał rozkład dysktretny, który można interpolować wielomianem
fi , gdzie punkty
fi (δL (Lip )) = δc (c(i+1)p ) (1.23)
stanowią węzły wielomianu interpolacyjnego. Tak skonstruowana funkcja fi
tworzy rozkład ciągły CA .

Przykład 1.5 Zanalizowany zostanie automat komórkowy z przy-


kładu 1.2, dla funkcji δc i δL określonych następująco

δc (c) = c,
4
X
δL (L) = ci 24−i , L = hc1 , c2 , c3 , c4 i.
i=1

Rysunek 1.2.a przedstawia wykres zbioru F ∗ z przykładu 1.2, rysunek


1.2.b przedstawia wykres pełnego produktu CA, który został zbudo-
wany na regułach z tego przykładu.

δc (c) 6
a)
1 s s s s
s s s s -
0 5 10 15 δL (L)

δc (c) 6
b)
1 s s s s s s s s
s s s s s s s s -
0 5 10 15 δL (L)
Rys. 1.2. Wykres a) zbioru F ∗ z przykładu 1.2. b) produktu
pełnego CA z przykładu 1.2.
1.1 Podstawowe twierdzenia i definicje 11

1.1.6 Postać ogólna funkcji gCA


W tym paragrafie i w dalszej części pracy zbiór C będzie utożsamiany ze
zbiorem liczbowym zawierającym element wyróżniony 0. Jak pokazano w
paragrafie poprzednim, nie zmniejsza to ogólności rozważań. Dodatkowo nie
nakłada się żadnych ograniczeń dotyczących mocy zbioru C.

Twierdzenie 1.3 Niech ciąg CA będzie produktem jednowymiarowego auto-


matu komórkowego CA = hC, fCA i oraz niech zbudowany na nim zbiór F ∗
zawiera n elementów Fi postaci

Fi = hLi , c0i i, (1.24)

gdzie
Li = hci1 , ci2 , . . . , cim i, c0i , cik ∈ C. (1.25)
Niech dana będzie określona na zbiorze C funkcja h spełniająca warunek
(
1, dla x = c,
h(x, c) = (1.26)
0, dla x 6= c.

Reguła lokalna gCA : C m → C produktu CA opisana wzorem


n
X m
Y
gCA (x1 , x2 , . . . , xm ) = c0i h(xk , cik ) (1.27)
i=1 k=1

jest równoważna funkcji F ∗ .

Dowód: Dla dowodu należy wykazać, że dla każdego 1 ¬ i ¬ n wartość


funkcji gCA w punkcie Li = hci1 , ci2 , . . . , cim i wynosi c0i . Z własności funkcji
Q
h wynika, że składnik c0i m
k=1 h(xk , cik ) sumy (1.27) przyjmuje wartość ci w
0

punkcie o współrzędnych Li = hci1 , ci2 , . . . , cim i, w innych punktach przyj-


mując wartość 0. Stąd
n
X m
Y
gCA (ci1 , ci2 , . . . , cim ) = c0i h(cik , cik ) =
i=1 k=1

m
Y m
Y m
Y m
Y
= c01 h(c1k , cik )+c02 h(c2k , cik )+. . .+c0i h(cik , cik )+. . .+c0n h(cnk , cik ) =
k=1 k=1 k=1 k=1

= 0 + 0 + . . . + c0i + . . . + 0 = c0i ,
co było do udowodnienia.
1.1 Podstawowe twierdzenia i definicje 12

Przykład 1.6 Niech dany będzie produkt CA

2 1 1 2 0 1
1 2 0 2 0 0 ,
0 2 2 1 2 2

gdzie C = {0, 1, 2}. Zbudowany na nim zbiór F ∗ ma postać


 

 F10 = hh2, 1, 1, 2, 0, 1i, 1i, 

 



 F11 = hh1, 1, 2, 0, 1, 2i, 2i, 



 


 F12 = hh1, 2, 0, 1, 2, 1i, 0i, 


 



 F13 = hh2, 0, 1, 2, 1, 1i, 2i, 



 


 F14 = hh0, 1, 2, 1, 1, 2i, 0i, 



 

F15 = hh1, 2, 1, 1, 2, 0i, 0i,
F∗ = .

 F20 = hh1, 2, 0, 2, 0, 0i, 0i, 


 



 F21 = hh2, 0, 2, 0, 0, 1i, 2i, 


 




F22 = hh0, 2, 0, 0, 1, 2i, 2i, 



 


 F23 = hh2, 0, 0, 1, 2, 0i, 1i, 


 




F24 = hh0, 0, 1, 2, 0, 2i, 2i, 



 
F25 = hh0, 1, 2, 0, 2, 0i, 2i,

Określona na zbiorze C = {c1 , c2 , . . . , cl } funkcja h opisana wzorem

(x−c1 )(x−c2 ) . . . (x−ci−1 )(x−ci+1 ) . . . (x−cl )


h(x, ci ) = ,
(ci −c1 )(ci −c2 ) . . . (ci −ci−1 )(ci −ci+1 ) . . . (ci −cl )

spełnia warunek (1.26). Powyższa funkcja dla zbioru C = {0, 1, 2}


przyjmuje postać
1 1
h(x, 0) = (x − 1)(x − 2), h(x, 1) = −x(x − 2), h(x, 2) = x(x − 1).
2 2
Stąd

gCA = h(x1 , 2) · h(x2 , 1) · h(x3 , 1) · h(x4 , 2) · h(x5 , 0) · h(x6 , 1)+


+2 · h(x1 , 1) · h(x2 , 1) · h(x3 , 2) · h(x4 , 0) · h(x5 , 1) · h(x6 , 2)+
+2 · h(x1 , 2) · h(x2 , 0) · h(x3 , 1) · h(x4 , 2) · h(x5 , 1) · h(x6 , 1)+
+2 · h(x1 , 2) · h(x2 , 0) · h(x3 , 2) · h(x4 , 0) · h(x5 , 0) · h(x6 , 1)+
.
+2 · h(x1 , 0) · h(x2 , 2) · h(x3 , 0) · h(x4 , 0) · h(x5 , 1) · h(x6 , 2)+
+h(x1 , 2) · h(x2 , 0) · h(x3 , 0) · h(x4 , 1) · h(x5 , 2) · h(x6 , 0)+
+2 · h(x1 , 0) · h(x2 , 0) · h(x3 , 1) · h(x4 , 2) · h(x5 , 0) · h(x6 , 2)+
+2 · h(x1 , 0) · h(x2 , 1) · h(x3 , 2) · h(x4 , 0) · h(x5 , 2) · h(x6 , 0)
1.2 Podstawy systemu uczącego się CELLS 13

1.2 Podstawy systemu uczącego się CELLS


1.2.1 Definicja procesu uczenia się systemu CELLS
Niech dany będzie dowolny niepusty zbiór W składający się z par uporząd-
kowanych
hWi , Wo i, (1.28)
nazywanych parami trenującymi. Niech zawarte w nich obiekty Wi i Wo sta-
nowią układy o skończonej liczbie elementów. Układ Wi nazywany będzie
układem wejściowym (zapytaniem), Wo układem wyjściowym (odpowiedzią).
Zbiór W nazywany będzie wiedzą.

Definicja 1.13 Informacją trenującą I nazywany będzie dowolny niepusty


podzbiór zbioru W .

Definicja 1.14 Systemem uczącym się z nadzorem nazywany będzie układ,


który za pomocą analizy skończonego zbioru informacji trenującej I jest zdolny
do wygenerowania algorytmu udzielania poprawnych odpowiedzi na zapytania
ze zbioru W 8 .

Niech moc zbioru W oznaczana będzie W , moc zbioru I - I. Niech W 0


oznacza moc takiego podzbioru zbioru W , dla którego system uczący się
znalazł algorytm przejść między układami Wi a Wo . Skuteczność systemu
uczącego się z nadzorem EL będzie wyrażana funkcją

EL : R3 → [−1, 1] (1.29)

zdefiniowaną wzorem

W0 − I
EL (W , W 0 , I) = , (1.30)
W
gdzie W > 0. Należy zauważyć, że wynik EL nie zależy od mocy zbioru
wiedzy, lecz od stosunku W do W 0 i I oraz W 0 do I. Wykres funkcji EL dla
stałej wartości W przedstawia rys. 1.39 .
8
Por. P. Cichosz, Systemy uczące się, Warszawa 2000, s. 31-55 oraz Z. Pawlak, Systemy
informacyjne. Podstawy teoretyczne, Warszawa 1983, s. 163-167.
9
Rysunek został sporządzony za pomocą programu Derive 5.
1.2 Podstawy systemu uczącego się CELLS 14

Rys. 1.3. Wykres zależności EL dla W = 100

System uczący się ma wysoką wartość EL w przypadku, gdy I jest dużo


mniejsze od W i W 0 nie różni się znacznie od W . To oznacza, że system
jest tym skuteczniejszy, im mniejszej mocy zbiór informacji trenującej jest
potrzebny w celu znalezienia algorytmu przejść dla jak największego zbioru
W 0 . Skuteczność systemu uczącego się EL przyjmuje wartość ujemną w przy-
padku, gdy W 0 < I. W przypadku W 0 = I wartość EL jest równa zeru.
Po wprowadzeniu powyższych definicji możliwe staje się zdefiniowanie
systemu uczącego się CELLS. CELLS jest typem systemu uczącego się z
nadzorem. Zasadniczym krokiem w konstrukcji systemu CELLS jest utożsa-
mienie w nim informacji trenującej I ze zbiorem F ∗ .

Definicja 1.15 Systemem uczącym się CELLS nazywany będzie system zdolny
do wykonania na zbiorze informacji trenującej F ∗ procesu minimalizacji (lub
α-minimalizacji)10.

Niech F ∗ , F ∗|NZ , C NZ mają znaczenie jak w paragrafie 1.1.3. Niech X


oznacza moc zbioru X. Skuteczność systemu uczącego się CELLS dla pro-
duktów CA o m elementowych układach L będzie obliczana dla następujących
10
Zgodnie z definicją 1.6 możliwość minimalizacji zbioru F ∗ oznacza odkrycie lokalnej
reguły ewolucji gCA automatu komórkowego.
1.2 Podstawy systemu uczącego się CELLS 15

podstawień:
W ⇐ C m,
I ⇐ F ∗, ! (1.31)
   
W0 ⇐ Cm · F ∗|NZ / C NZ ,

stąd
!
     
Cm · F ∗|NZ / C NZ − F∗
EL (C m , F ∗ , F ∗|NZ ) =   . (1.32)
Cm

Przykład 1.7 Niech dany będzie produkt CA

3 2 2 5 2
3 5 3 5 2 , (1.33)
5 5 2 2 2

gdzie C = {2, 3, 5} i 0 jest elementem wyróżnionym. Zbudowany na


CA zbiór F ∗ ma postać
 

 F10 = hh3, 2, 2, 5, 2i, 3i, 

 


 F11 = hh2, 2, 5, 2, 3i, 5i, 


 



 F12 = hh2, 5, 2, 3, 2i, 3i, 



 


 F13 = hh5, 2, 3, 2, 2i, 5i, 



 

F14 = hh2, 3, 2, 2, 5i, 2i,
F∗ = . (1.34)

 F20 = hh3, 5, 3, 5, 2i, 5i, 


 



 F21 = hh5, 3, 5, 2, 3i, 5i, 


 




F22 = hh3, 5, 2, 3, 5i, 2i, 



 


 F23 = hh5, 2, 3, 5, 3i, 2i, 


 
F24 = hh2, 3, 5, 3, 5i, 2i

Funkcja h opisana wzorem


2
h(x, c) = e−a(x−c)

spełnia warunek (1.26) dla a → ∞. Stąd równoważna F ∗ może być


funkcja
gCA (x1 , x2 , x3 , x4 , x5 ) =
1.2 Podstawy systemu uczącego się CELLS 16

2 2 2 2 2
= 3e−a[(x1 −3) +(x2 −2) +(x3 −2) +(x4 −5) +(x5 −2) ] +
2 2 2 2 2
+ 5e−a[(x1 −2) +(x2 −2) +(x3 −5) +(x4 −2) +(x5 −3) ] +
2 2 2 2 2
+ 3e−a[(x1 −2) +(x2 −5) +(x3 −2) +(x4 −3) +(x5 −2) ] +
2 2 2 2 2
+ 5e−a[(x1 −5) +(x2 −2) +(x3 −3) +(x4 −2) +(x5 −2) ] +
2 2 2 2 2
+ 2e−a[(x1 −2) +(x2 −3) +(x3 −2) +(x4 −2) +(x5 −5) ] +
2 2 2 2 2 ,
+ 5e−a[(x1 −3) +(x2 −5) +(x3 −3) +(x4 −5) +(x5 −2) ] +
2 2 2 2 2
+ 5e−a[(x1 −5) +(x2 −3) +(x3 −5) +(x4 −2) +(x5 −5) ] +
2 2 2 2 2
+ 2e−a[(x1 −3) +(x2 −5) +(x3 −2) +(x4 −3) +(x5 −5) ] +
2 2 2 2 2
+ 2e−a[(x1 −5) +(x2 −2) +(x3 −3) +(x4 −5) +(x5 −3) ] +
2 2 2 2 2
+ 2e−a[(x1 −2) +(x2 −3) +(x3 −5) +(x4 −3) +(x5 −5) ]
gdzie a → ∞11 . Zbudowana funkcja gCA jest określoną w R5 funkcją
gładką, która ma ciągłe pochodne cząstkowe
∂gCA ∂gCA ∂gCA ∂gCA ∂gCA
, , , , .
∂x1 ∂x2 ∂x3 ∂x4 ∂x5
Niech wektor o współrzędnych będących wartościami kolejnych po-
chodnych cząstkowych w punkcie F oznaczany będzie grad gCA (F )
 
∂gCA (F ) ∂gCA (F ) ∂gCA (F ) ∂gCA (F ) ∂gCA (F )
grad gCA (F ) = , , , , .
∂x1 ∂x2 ∂x3 ∂x4 ∂x5
Gradient funkcji gCA w punkcie F tworzy wektor prostopadły do tej
funkcji w F . Suma gradientów w punktach Fij dla zmniejszonej wiel-
kości a wskazuje rozkład wartości funkcji gCA w tych punktach. Ten
fakt można wykorzystać w celu zminimalizowania funkcji gCA . Niech
wektor v będzie sumą wartości bezwzględnych z gradientów funkcji
gCA w punktach Fij .

2 X
X 4
v= |grad gCA (Fij )|
i=1 j=0

Dla zbioru (1.34) wektor v przyjmuje współrzędne

v1 = 1,1661 · 10−257 ,
v2 = 1,3252 · 10−257 ,
v3 = 1,7492 · 10−257 ,
v4 = 1,4312 · 10−257 ,
v5 = 1,5372 · 10−257 .
11
W implementacji komputerowej wystarczy, by a  0.
1.2 Podstawy systemu uczącego się CELLS 17

Otoczenie NZ można znaleźć posługując się wzorem


(
1, gdy vi > d
zi = , 1 ¬ i ¬ 5,
0, gdy vi ¬ d

gdzie
NZ = hz1 , z2 , z3 , z4 , z5 i
oraz
1
d = vmin + (vmax − vmin ),
2
vmin i vmax oznaczają odpowiednio najmniejszą i największą współ-
rzędną wektora v. Stąd

NZ = [0, 0, 1, 0, 1].

Funkcja gCA po zminimalizowaniu przyjmuje postać


2 2
gCA (x1 , x2 , x3 , x4 , x5 ) = 3e−a[(x3 −2) +(x5 −2) ] +
2 2
+ 5e−a[(x3 −5) +(x5 −3) ] +
2 2
+ 5e−a[(x3 −3) +(x5 −2) ] +
2 2 .
+ 2e−a[(x3 −2) +(x5 −5) ] +
2 2
+ 5e−a[(x3 −5) +(x5 −5) ] +
2 2
+ 2e−a[(x3 −3) +(x5 −3) ]

Dla podanych w przykładzie danych zachodzi

C m = 243, C NZ = 9, F ∗ = 10, F ∗|NZ = 6.

Stąd skuteczność systemu dla powyższego algorytmu i przy podanych


danych wynosi
243 · 69 − 10
EL = = 0, 6255.
243
Opisana w przykładzie metoda redukcji funkcji F ∗ ma istotne wady:
1. znaleziony w ten sposób zbiór F ∗|NZ często nie jest funkcją i trzeba
poddać go α-minimalizacji;
2. algorytm można stosować tylko dla zbiorów F ∗ o niewielkiej liczbie
elementów.
W dalszej części pracy podane zostaną doskonalsze algorytmy minimalizacji
funkcji F ∗ .
1.2 Podstawy systemu uczącego się CELLS 18

1.2.2 Podstawowa struktura działania systemu CELLS


Konstruowanie programów uczących się ma sens tylko wtedy, gdy istnieje
możliwość skorzystania z nabytej przez system wiedzy. System CELLS zbu-
dowany jest z dwóch części, spełniających dwa odmienne zadania:

a) części poszukującej optymalnej funkcji przejść (minimalizującej zbiór


F ∗ ),

b) części przetwarzającej podane ciągi wejściowe na wyjściowe na podsta-


wie znalezionej funkcji przejść (gCA ).

Rysunek (1.4) przedstawia różnice w przepływie informacji między częścią


a) i b) systemu.

Wi Wo Wi

a) b)
? ? ?

@
CELLS
CELLS
(gCA )

? ?
gCA Wo
Rys. 1.4. Schemat przepływu informacji w systemie CELLS
a) w procesie nauki, b) w systemie eksperckim

System CELLS przetwarzający informacje trenujące stanowi część uczącą


się systemu. Odkryta w procesie nauki wiedza może być wykorzystana do
analizy danych, co na tym etapie działania systemu uprawnia do nazwania
go systemem eksperckim. Przykłady możliwego użycia systemu CELLS jako
systemu eksperckiego:

• klasyfikacja danych,

• wyszukiwanie znaczącej informacji z danych,


1.2 Podstawy systemu uczącego się CELLS 19

• przewidywanie ewolucji układu.

Przykład 1.8 Funkcja gCA zbioru danych (1.34) przykładu 1.7.


nie pozwala obliczyć dalszych etapów ewolucji automatu komórkowego
o produkcie przedstawionym w tablicy (1.33). Dzięki zminimalizowa-
nej w tym przykładzie funkcji gCA można otrzymać dwie nowe linie
CA :
3 2 2 5 2
3 5 3 5 2
5 5 2 2 2 .
3 2 2 0 0
0 0 0 5 0
Jak widać, są to linie w których nie wszystkie komórki mają określone
stany (0 oznacza brak określonej wartości komórki). Dzieje się tak
dlatego, gdyż dla znalezionego w przykładzie otoczenia NZ zachodzi
F ∗|NZ < C NZ .

You might also like