Professional Documents
Culture Documents
IU 2 - Masinsko Ucenje
IU 2 - Masinsko Ucenje
Mainsko uenje
Dr Samim Konjicija, dipl. ing. el.
Sadraj predavanja
Pojam mainskog uenja
Oblasti primjene mainskog uenja
Definicija problema uenja
Dizajniranje sistema koji ui
Zadatak uenja koncepta
Uenje stabla odluivanja
Osnovni algoritam uenja stabla odluivanja
Uenje na bazi instanci
Bayesovo uenje
Prepoznavanje govora
Raunarske igre
...
Mainsko uenje
Mainsko uenje je multidisciplinarna oblast, koja koristi rezultate
oblasti kao to su:
Vjetaka inteligencija
Vjerovatnoa i statistika
Teorija kompleksnosti
Teorija informacija
Filozofija
Psihologija
Neurobiologija
...
T: igranje dame
P: procenat pobjeda
E: vjebanje protiv sebe
dati
direktnu
ili
indirektnu
povratnu
odreivanja
B skup ploa
M skup poteza
b ,V t rai n b T R
train b
V b 2
...
Pristupi uenju
Osnovni pristupi uenju koje emo obraditi:
Bayesovo uenje
Reinforcement learning
[Klasterizacija, klasteriranje]
(Evolucioni algoritmi)
predstavlja problem
pretraivanja velikog
Stablo odluivanja
Instance se klasraju sortiranjem od korjena prema listovima
Svaki vor u stablu predstavlja testiranje nekog atributa
instance
Svaka grana koja izlazi iz vora predstavlja jednu moguu
vrijednost datog atributa
Instanca se klasira poevi od korjena stabla, testiranjem
atributa specificiranih vorovima i kretanjem du grana koje
odgovaraju vrijednostima atributa za datu instancu
Stablo odluivanja
Primjer: Klasiranje dana u pogledu pogodnosti za igranje
tenisa (stablo odluivanja za koncept Dan je pogodan za
igranje tenisa)
Stablo odluivanja
Primjer: Klasiranje potencijalnih kupaca raunara (stablo
odluivanja za koncept Kupac e kupiti raunar)
Stablo odluivanja
Stablo odluivanja predstavlja disjunktivnu formu
Svaka staza od korjena do lista predstavlja konjunkciju
testova atributa instance
Stablo kao cjelina predstavlja disjunkciju
Prethodno stablo moemo zapisati kao:
V rijem e = S u n ca n o V la zn o st = N o rm a ln a V rijem e = O b la cn o V rijem e = K isa V jeta r = S la b
dobro
klasira
testni
primjer
je
Ako su Atributi prazni, vrati stablo sa jednim vorom koji ima najeu vrijednost atributa
Ciljni_atribut za skup Primjeri
U ostalim sluajevima:
Kraj
Ispod nove grane dodati list koji ima najeu vrijednost atributa
Ciljni_atribut za skup Primjeri
Inae dodati podstablo ID3(Primjerivi , Ciljni_atribut, Atributi- {A})
E S = p i log 2 p i
i=1
9
9
5
5
log 2 log 2 =0,94
14
14 14
14
Informacioni dobitak
Informacioni dobitak predstavlja oekivano umanjenje
entropije dijeljenjem primjera na osnovu vrijednosti atributa:
G S , A = E S
vV A
S v
S
E S v
Primjer:
V Vjetar ={Slab , Jak }
S =[9 + , 5 - ]
S Slab=[6 + , 2 -]
S Jak =[3 + , 3 -]
8
6
8
6
G S ,Vjetar = E S
E S Slab
E S Jak =0,94 0,811 1=0,048
14
14
14
14
buys_computer
no
no
yes
yes
yes
no
yes
no
yes
yes
yes
yes
yes
no
9
9
5
5
E
(S
)=E
(9,5
)=
log
(
)
log
(
)=0 . 940
2
2
Klasa P: buys_computer = yes
14
14 14
14
Klasa N: buys_computer = no
Infoage ( D)=
5
4
E (2,3)+ E (4,0 )
14
14
5
E (3,2 )=0 . 694
14
5
E (2,3 ) znai da age <=30 ima 5
14 od 14 uzoraka, sa 2 yes i 3 no.
+
age
<=30
<=30
3140
>40
>40
>40
3140
<=30
<=30
>40
<=30
3140
3140
>40
buys_computer
no
no
yes
yes
yes
no
yes
no
yes
yes
yes
yes
yes
no
Case-based
Reasoning) predstavlja metod
uenja na bazi instanci, gdje
se
koriste
kompleksnije
simbolike
reprezentacije
instanci
Nedostatak uenja na bazi
instanci je u cijeni klasifikacije
nove instance cjelokupno
raunanje se provodi prilikom
klasifikacije
a r x i a r x j 2
r =1
Klasifikacija:
Vratiti:
k
f x q =argmax v , f x i
vV
i =1
a , b = 1 za a=b
0 inae
f x i
i=1
k
f x q = argmax w i v , f x i
vV
w i=
i=1
1
d x q , xi
f x q =
wi f x i
i=1
k
wi
i =1
Bayesovo uenje
Probabilistiki pristup zaljuivanju
Bayesov klasifikator
Statistiki klasifikator: omoguava probabilistiku predikciju pripadnosti
objekta klasi
Bayesov teorem
Bayesov teorem
P ( X H ) P ( H )
P ( H X )=
P(X )
P ( X C i ) P ( C i )
P ( C iX )=
P( X )
P ( X C i )= P( x C i )=P ( x Ci )P ( x C i ). ..P( x C i )
k =1
1
2 2
P ( X C i )=g ( x k , C , C )
g ( x , , )=
e
i
i
2
Klase:
C1: buys_computer = yes
C2: buys_computer = no
Uzorak:
X = (age <=30,
Income = medium,
Student = yes
Credit_rating = Fair)
age
<=30
<=30
3140
>40
>40
>40
3140
<=30
<=30
>40
<=30
3140
3140
>40
income
student
high
high
high
medium
low
low
low
medium
low
medium
medium
medium
high
medium
no
no
no
no
yes
yes
yes
no
yes
yes
yes
no
yes
no
credit_rating buys_computer
fair
excellent
fair
fair
fair
excellent
excellent
fair
fair
fair
excellent
excellent
fair
excellent
no
no
yes
yes
yes
no
yes
no
yes
yes
yes
yes
yes
no
k =1
Npr. neka se skup podataka sastoji od 1000 n-torki, od ega vrijednosti atributa
income imaju: income=low (0), income= medium (990), i income = high (10)
Prednosti:
Jednostavna implementacija
Dobri rezultati u veini sluajeva
Nedostaci:
Pretpostavka da su vjerovatnoe meusobno neovisne, to dovodi do
umanjenja tanosti