Professional Documents
Culture Documents
Predavanja 14. 1 Iz PMIS-A 2011 - 2012 - Statisti Ki Testovi
Predavanja 14. 1 Iz PMIS-A 2011 - 2012 - Statisti Ki Testovi
(statisticki testovi)
Broj na kocki
1 2
Broj pojavljivanja 13 19
3 4 5 6
11 8 5 4
Da li je kocka ispravna?
U ovom primjeru su moguce dvije hipoteze: Kocka je ispravna. i njoj
suprotna Kocka nije ispravna.
Za nultu hipotezu se najcesce uzima suprotno od onoga sto zelimo dokazati.
Iz tablice naslucujemo da kocka nije ispravna, pa hipoteze definiramo ovako:
H0 : kocka je ispravna i
H1 : kocka nije ispravna.
Statisticko obiljezje je X broj na kocki. Prirodno je ispitati da li se iz
tablice frekvencija moze zakljuciti da empirijska razdioba bitno ne odstupa
od teorijske diskretne uniformne razdiobe (vjerojatnosti pojavljivanja svakog
broja na kocki su jednake, tj. broj pojavljivanja -frekvencija svakog broja u
60 bacanja je 10). Stoga definiramo hipoteze:
H0 : X ima diskretnu uniformnu razdiobu i
H1 : X nema diskretnu uniformnu razdiobu.
Dakle, treba testirati hipotezu o tipu razdiobe, sto spada u neparametarske
testove.
U oba primjera treba na temelju uzorka donijeti odluku o prihvacanju ili
odbacivanju nulte hipoteze. Teorijski gledano, rijec je o tome da se iz n
mjerenja slucajne varijable X, odnosno na temelju vrijednosti (x1 , . . . , xn )
slucajnog uzorka (X1 , . . . , Xn ), donese odluka o prihvacanju ili odbacivanju
odredene hipoteze. Kako niti jedan statisticki zakljucak o populaciji na bazi
uzorka nije stopostotno siguran, tako i prihvacnje neke hipoteze na temelju
uzorka ne znaci da je ta hipoteza tocna. Stoga je umjesto hipotezu prihvacamo ispravnije reci na osnovi uzorka ne postoji razlog za odbacivanje
hipoteze. Prilikom donosenja odluke o istinitosti hipoteze postoje dvije vrste
mogucih pogresaka :
pogre
ska 1. vrste: odbacili smo nultu hipotezu ako je ona istinita
pogre
ska 2. vrste: prihvatili smo nultu hipotezu ako je ona neistinita.
Moguce situacije su prikazane tablicom:
prihvacamo H0
odbacujemo H0
H0 je tocna
pogreska 1. vrste
H0 je netocna
pogreska 2. vrste
prihvacamo H0
odbacujemo H0
H0 je tocna H0 je netocna
1
Test statistika
H0 : = 0
2 poznato
Z = X
n
Z N (0, 1)
H0 : = 0
2
nije poznato
H0 : 2 = 02
02 > 0
Alternativna hipoteza
H1 : 6= 0
Kriticno podru
S cje
C0 = h, z 2 ] [z 2 , i
H1 : > 0
C0 = [z , i
H1 : < 0
H1 : 6= 0
C0 = h, z
S ]
C0 = h, t 2 ] [t 2 , i
H1 : > 0
C0 = [t , i
H1 : < 0
H1 : 2 6= 02
C0 = h,St ]
C0 = [0, 21 ] [2 , i
H1 : 2 > 02
C0 = [2 , i
H1 : 2 < 02
C0 = [0, 21 ]
T = X
n
S
T (n 1)
U = n1
S2
2
U 2 (n 1)
Alternativna hipoteza
H1 : p 6= p0
Kriticno podru
S cje
C0 = h, z 2 ] [z 2 , i
H1 : p > p0
H1 : p < p0
C0 = [z , i
C0 = h, z ]
H0 : p = p0
0.055 0.07
11
= 0.055 = z =
200 = 0.83.
200
0.07 0.93
Kako izracunata vrijednost nije u kriticnom podrucju tj. z < z0.05 nultu
hipotezu H0 ne mozemo odbaciti, tj. mozemo zakljuciti da posiljke sadrze
najvise 7% defektnih proizvoda.
Usporedba o
cekivanja dviju normalno distribuiranih populacija
(t-test)
Promatramo statisticko obiljezje X na dvije razlicite populacije. Uz to pretpostavimo da u obje populacije promatrano obiljezje ima normalnu razdiobu.
Ako s X1 i X2 oznacimo obiljezje na prvoj, odnosno drugoj populaciji, onda
su pretpostavke:
X1 N (1 , 12 ) i X2 N (2 , 22 ).
Neka su realizirani uzorci uzeti iz prve, odnosno druge populacije opsega n1
i n2 redom. Testiramo hipotezu
H0 : 1 = 2
uz jednu od alternativnih:
H1 : 1 6= 2 ,
H1 : 1 > 2 ,
H1 : 1 < 2 .
Ovisno o tome da li su varijance poznate i jednake ili ne, imamo razlicite test
statistike, sto je prikazano u tablici:
Nulta hipoteza
Test statistika
Z=
12 i 22
poznato
Z N (0, 1)
T =
12 = 22 = 2
nije poznato
S2 =
Kriticno podrucje
H1 : 1 > 2
C0 = [z , i
H1 : 1 < 2
H1 : 1 6= 2
C0 = h, z ]
S
C0 = h, t 2 (n1 + n2 2)]
[t 2 (n1 + n2 2), i
H1 : 1 > 2
C0 = [t (n1 + n2 2), i
H1 : 1 < 2
C0 = h, t (n1 + n2 2)]
1 X
2
X
r
H0 : 1 = 2
H0 : 1 = 2
Alternativna
hipoteza
H1 : 1 6= 2
2
1
2
+ n2
n1
2
1 X
2
X
q
1
1
+
n
n
1
C0 = h, z 2 ]
[z 2 , i
T t(n1 + n2 2)
H1 : 12 > 22 ,
H1 : 12 < 22 .
S12
S22
koja (ako je H0 tocna hipoteza) ima F (Fisherovu) razdiobu s parom stupnjeva slobode (n1 1, n2 1) .
Kriticna podrucja su prikazana u tablici:
Nulta hipoteza
Alternativna hipoteza
H1 : 12 6= 22
H0 : 12 = 22
H1 : 12 > 22
H1 : 12 < 22
Kriticno podrucje
S
C0 = h0 , f1 2 (n1 1, n2 1)]
[f 2 (n1 1, n2 1), i
C0 = [f (n1 1, n2 1), i
C0 = h0, f1 (n1 1, n2 1)]
n1 p1 + n2 p2
n1 + n2
1
n2
H0 : p1 = p2
Primjer. Anketirano je 300 radnika iz tvornice A i 200 radnika iz tvornice B o uvjetima rada . 56% radnika iz tvornice A i 48% radnika iz tvornice
B su zadovoljni uvjetima rada. S razinom znacajnosti 0.05, testirati hipotezu
da
7
n1 = 300,
p1 = 0.56,
n2 = 200,
b) radnici iz tvornice A
p2 = 0.48
a) H0 : p1 = p2 , H1 : p1 6= p2
Procijenjena vjerojatnost je:
p =
1
1
300
= 1.75.
1
200
Kriti
no podrucje je :
C0 = h, z 2 ]
z 2 = z0.025 = (tablice) = 1.96,
[z 2 , i
C0 = h, 1.96]
[1.96, i.
Vrijednost test statistike nije u kriticnom podrucju, tj. 1.75 < z0.025 pa ne
mozemo odbaciti nultu hipotezu, tj. ne mozemo zakljuciti da postoji razlika
medu tvornicama.
b) H0 : p1 = p2 , H1 : p1 > p2
z = (tablice) = z0.05 = 1.64
C0 = [1.64, i