Predavanja 14. 1 Iz PMIS-A 2011 - 2012 - Statisti Ki Testovi

Testiranje statistickih hipoteza
(statisticki testovi)
Osnovna zadaca Statistike je na temelju uzorka ocijeniti kakvu razdiobu

ima promatrano (populacijsko) statisticko obiljezje X. Svaka pretpostavka
koja se odnosi na tu razdiobu je (statisti
cka) hipoteza, a provjera istinitosti te hipoteze je testiranje (statisti
cki test). Hipotezu koju testiramo
zovemo nulta hipoteza ili nul-hipoteza i obiljezavamo s H0 , a njoj alternativnu hipotezu obiljezavamo s H1 . Ako se testira hipoteza koja se
odnosi na parametar pretpostavljene razdiobe, onda govorimo o parametarskom testu, a ako se hipoteza odnosi na tip razdiobe govorimo o
neparametarskom testu. Hipoteza je jednostavna ako jednoznacno
zena. Priodreduje razdiobu satatistickog obiljezja X, u protivnom je slo
blizimo navedene pojmove primjerima.
Primjer 1.
Proizvodac nekog uredaja tvrdi da je uvodenjm nove tehnologije prosjecno
vrijeme potrebno za izradu uredaja smanjeno u odnosu na dotadasnje, koje
je bilo 10 sati.
U ovom primjeru promatrano statisticko obiljezje je X vrijeme izrade
uredaja. Pretpostavimo da vrijeme izrade svih uredaja proizvedenih uz
odredenu tehnologiju ima normalnu razdiobu. Moguce hipoteze su : Proizvodac
je u pravu ili Proizvodac nije u pravu. Hipoteze su alternative tj. tocnost
jedne povlaci netocnost druge i obratno. Pretpostavimo da je hipoteza
Proizvodac nije u pravu tocna. Dakle, nulta hipoteza je H0 : X = 10
sati, a alternativna H1 : X < 10 sati, gdje je X populacijsko ocekivanje.
Prema tome radi se o parametarskom testu. Hipoteza H0 je jednostavna
hipoteza, jer jednoznacno odreduju vrijednost parametra X , a time i pretpostavljenu razdiobu (ako je varijanca poznata) , dok je hipoteza H1 slo
zena
jer jednoznacno ne odreduje razdiobu
Primjer 2.
Kocka se baca 60 puta. Rezultati su dani u tablici:
Broj na kocki
1 2
Broj pojavljivanja 13 19
3 4 5 6
11 8 5 4
Da li je kocka ispravna?
U ovom primjeru su moguce dvije hipoteze: Kocka je ispravna. i njoj
suprotna Kocka nije ispravna.
Za nultu hipotezu se najcesce uzima suprotno od onoga sto zelimo dokazati.
Iz tablice naslucujemo da kocka nije ispravna, pa hipoteze definiramo ovako:
H0 : kocka je ispravna i
H1 : kocka nije ispravna.
Statisticko obiljezje je X broj na kocki. Prirodno je ispitati da li se iz
tablice frekvencija moze zakljuciti da empirijska razdioba bitno ne odstupa
od teorijske diskretne uniformne razdiobe (vjerojatnosti pojavljivanja svakog
broja na kocki su jednake, tj. broj pojavljivanja -frekvencija svakog broja u
60 bacanja je 10). Stoga definiramo hipoteze:
H0 : X ima diskretnu uniformnu razdiobu i
H1 : X nema diskretnu uniformnu razdiobu.
Dakle, treba testirati hipotezu o tipu razdiobe, sto spada u neparametarske
testove.
U oba primjera treba na temelju uzorka donijeti odluku o prihvacanju ili
odbacivanju nulte hipoteze. Teorijski gledano, rijec je o tome da se iz n
mjerenja slucajne varijable X, odnosno na temelju vrijednosti (x1 , . . . , xn )
slucajnog uzorka (X1 , . . . , Xn ), donese odluka o prihvacanju ili odbacivanju
odredene hipoteze. Kako niti jedan statisticki zakljucak o populaciji na bazi
uzorka nije stopostotno siguran, tako i prihvacnje neke hipoteze na temelju
uzorka ne znaci da je ta hipoteza tocna. Stoga je umjesto hipotezu prihvacamo ispravnije reci na osnovi uzorka ne postoji razlog za odbacivanje
hipoteze. Prilikom donosenja odluke o istinitosti hipoteze postoje dvije vrste
mogucih pogresaka :
pogre
ska 1. vrste: odbacili smo nultu hipotezu ako je ona istinita
pogre
ska 2. vrste: prihvatili smo nultu hipotezu ako je ona neistinita.
Moguce situacije su prikazane tablicom:
prihvacamo H0
odbacujemo H0
H0 je tocna
pogreska 1. vrste
H0 je netocna
pogreska 2. vrste
Vjerojatnosti tih pogresaka oznacavamo s:

= P(pogreska 1. vrste)= P(odbacujemo H0 | H0 tocna) i
2
= P(pogreska 2. vrste)= P(prihvacamo H0 | H0 netocna).

Sljedeca tablica prikazuje vjerojatnosti mogucih situacija
prihvacamo H0
odbacujemo H0
H0 je tocna H0 je netocna
1
je nivo signifikantnosti ili razina zna

cajnosti, a 1-=P(odbacujemo
H0 | H0 netocna) snaga testa. Pitanje da li je neki test najbolji u smislu
da su vjerojatnosti pogresaka minimalne cemo izostaviti! Naime, smanjenje
vjerojatnosti jedne pogreske ima za posljedicu povecanje vjerojatnosti druge.
Najcesce se problem rjesava tako da se zada vjerojatnost pogreske prve vrste
h0, 1i (najcesce 0,01 i 0,05, ali to nije pravilo!) U tom slucaju u mnogim
testovima je moguce postici da vjerojatnost pogreske 2. vrste bude minimalna. Opseg uzorka utjece na vjerojatnosti pogresaka. Naime, povecanjem
velicine uzorka smanjuju se vjerojatnosti pogresaka.
Za testiranje hipoteze treba:
(1 ) Definirati H0 i H1 ;
(2 ) Definirati test-statistiku na osnovi cijih vrijednosti se donose odluke;
(3 ) Za zadanu razinu znacajnosti odrediti kriti
cno podru
cje - skup svih
mogucih vrijednosti test-statistike za koje se odbacuje nulta hipoteza
u korist alternativne;
(4 ) Ispitati da li se vrijednost test-statistike izracunate iz uzorka nalazi u
kriticnom podrocju;
(5 ) Zakljuciti: Ako je izracunata vrijednost test-statistike u kriticnom podruju hipoteza H0 se odbacuje u korist alternativne hipoteze H1 . U
suprotnom se H0 prihvaca, tj. na osnovi uzorka hipotezu ne mozemo
odbaciti.
Napomena. U pravilu, za nul-hipoteze se uzimaju jednostavne hipoteze.
Parametarski testovi
Neka je nepoznati parametar o kojemu ovisi pretpostavljena razdioba. Tada
mozemo testirati slijedece hipoteze:
(i) H : = 0 (ii) H : 6= 0 (iii) H : > 0
(iv) H : < 0 (v) H : 0 (vi) H : 0 .
3
Uz svaku od od navedenih hipoteza definiramo alternativnu iz iste skupine,

ovisno o zadatku koji rjesavamo. Ako je hipotezu tipa (ii) govorimo o dvostranoj hipotezi tj. o dvostranom testu, a za slucajeve (iii), (iv), (v), ili
(vi) o jednostranoj hipotezi tj.o jednostranom testu.
Testovi o parametrima normalne razdiobe N (, 2 )
Nulta hipoteza
Test statistika
H0 : = 0
2 poznato
Z = X
n
Z N (0, 1)
H0 : = 0
2
nije poznato
H0 : 2 = 02
02 > 0
Alternativna hipoteza
H1 : 6= 0
Kriticno podru
S cje
C0 = h, z 2 ] [z 2 , i
H1 : > 0
C0 = [z , i
H1 : < 0
H1 : 6= 0
C0 = h, z
S ]
C0 = h, t 2 ] [t 2 , i
H1 : > 0
C0 = [t , i
H1 : < 0
H1 : 2 6= 02
C0 = h,St ]
C0 = [0, 21 ] [2 , i
H1 : 2 > 02
C0 = [2 , i
H1 : 2 < 02
C0 = [0, 21 ]
T = X
n
S
T (n 1)
U = n1
S2
2
U 2 (n 1)
Test o proporciji (vjerojatnosti)

Kao sto smo vec rekli, bez obzira kakvu razdiobu ima statisticko obiljezje,
sredina X, za dovoljno velike uzorke, ima priblizno normalnu razdiobu. Promatramo statisticko obiljezje koje ima binomnu razdiobu : X B(n, p). Testiramo hipotezu H0 : p = p0 . Za alternativnu uzimamo jednu od H1 : p 6= p0
ili H1 : p < p0 ili H1 : p < p0 . U sva tri slucaja koristimo test- statistiku:
X p0
n N (0, 1).
Z=p
p0 (1 p0 )
Nulta hipoteza
H1 : p 6= p0
Kriticno podru
S cje
C0 = h, z 2 ] [z 2 , i
H1 : p > p0
H1 : p < p0
C0 = [z , i
C0 = h, z ]
H0 : p = p0
Primjer Proizvodac tvrdi da njegove posiljke sadrze najvise 7% defektnih

proizvoda. Uzet je slucajni uzorak od 200 komada iz jedne posiljke i bilo je
11 defektnih. Da li biste prihvatili tvrdnju proizvodaca uz razinu znacajnosti
0.05?
Rjesenje. Postavljamo hipoteze:
H0 : p = 0.07
H1 : p < 0.07
Kada bi za alternativnu hipotezu postavili H1 : p 6= 0.07, u slucaju odbacivanja nulte hipoteze mogli bi zakljuciti samo da proporcija defektnih nije
0.07, a to moze znaciti da je veca, ali i da je manja od te vrijednosti sto je
jos bolje.Odredimo kriticno podrucje:
z = z0.05 = (tablice) = 1.65 = C0 = h, 1.65]

Izracunajmo vrijednost odgovarajuce test-statistike:
x = p =
0.055 0.07
11
= 0.055 = z =
200 = 0.83.
200
0.07 0.93
Kako izracunata vrijednost nije u kriticnom podrucju tj. z < z0.05 nultu
hipotezu H0 ne mozemo odbaciti, tj. mozemo zakljuciti da posiljke sadrze
najvise 7% defektnih proizvoda.
Usporedba o
cekivanja dviju normalno distribuiranih populacija
(t-test)
Promatramo statisticko obiljezje X na dvije razlicite populacije. Uz to pretpostavimo da u obje populacije promatrano obiljezje ima normalnu razdiobu.
Ako s X1 i X2 oznacimo obiljezje na prvoj, odnosno drugoj populaciji, onda
su pretpostavke:
X1 N (1 , 12 ) i X2 N (2 , 22 ).
Neka su realizirani uzorci uzeti iz prve, odnosno druge populacije opsega n1
i n2 redom. Testiramo hipotezu
H0 : 1 = 2
uz jednu od alternativnih:
H1 : 1 6= 2 ,
H1 : 1 > 2 ,
H1 : 1 < 2 .
Ovisno o tome da li su varijance poznate i jednake ili ne, imamo razlicite test
statistike, sto je prikazano u tablici:
Nulta hipoteza
Test statistika
Z=
12 i 22
poznato
Z N (0, 1)
T =
12 = 22 = 2
nije poznato
S2 =
Kriticno podrucje
H1 : 1 > 2
C0 = [z , i
H1 : 1 < 2
H1 : 1 6= 2
C0 = h, z ]
S
C0 = h, t 2 (n1 + n2 2)]
[t 2 (n1 + n2 2), i
H1 : 1 > 2
C0 = [t (n1 + n2 2), i
H1 : 1 < 2
C0 = h, t (n1 + n2 2)]
1 X
2
X
r
H0 : 1 = 2
H0 : 1 = 2
Alternativna
hipoteza
H1 : 1 6= 2
2
1
2
+ n2
n1
2
1 X
2
X
q
1
1
+
n
n
1
C0 = h, z 2 ]
[z 2 , i
(n1 1)S12 +(n2 1)S22

n1 +n2 2
T t(n1 + n2 2)
Usporedba varijanci dviju normalno distribuiranih populacija

(F-test)
Promatramo statisticko obiljezje X na dvije razlicite populacije. Uz to
pretpostavimo da u obje populacije promatrano obiljezje ima normalnu razdiobu. Ako s X1 i X2 oznacimo obiljezje na prvoj, odnosno drugoj populaciji,
onda su pretpostavke:
X1 N (1 , 12 ) i X2 N (2 , 22 ).
Neka su realizirani uzorci uzeti iz prve, odnosno druge populacije opsega n1
i n2 redom. Testiramo hipotezu
H0 : 12 = 22
u odnosu na jednu od alternativnih:
H1 : 12 6= 22 ,
H1 : 12 > 22 ,
H1 : 12 < 22 .
Test statistika je:

F =
S12
S22
koja (ako je H0 tocna hipoteza) ima F (Fisherovu) razdiobu s parom stupnjeva slobode (n1 1, n2 1) .
Kriticna podrucja su prikazana u tablici:
Nulta hipoteza
H1 : 12 6= 22
H0 : 12 = 22
H1 : 12 > 22
H1 : 12 < 22
Kriticno podrucje
S
C0 = h0 , f1 2 (n1 1, n2 1)]
[f 2 (n1 1, n2 1), i
C0 = [f (n1 1, n2 1), i
C0 = h0, f1 (n1 1, n2 1)]
Vrijednosti f (n1 1, n2 1) i f1 (n1 1, n2 1) citamo iz tablica za F

razdiobu.
Vrijedi:
1
f1 (n1 , n2 ) =
f (n2 , n1 )
Usporedba proporcija
Promatramo dvije populacije i Bernoullijevo statisticko obiljezje X. Oznacimo
sa X1 i X2 vrijednosti obiljezja X, a sa p1 , i p2 vjerojatnosti uspjeha na prvoj,
odnosno na drugoj populaciji. Neka su p1 i p2 procjenitelji za p1 i p2 , a n1 i
n2 duljine (nezavisnih) uzoraka. Tada je
p =
n1 p1 + n2 p2
n1 + n2
procjena zajednicke vjerojatnosti. Test-statistika je:

p1 p2
1
Z=p
q
1
p(1 p)
+
n1
1
n2
Za velike uzorke, tj. kada min(n1 , n2 ) +, vrijedi Z N (0, 1). Kriticna

podrucja su prikazana u tablici:
Nulta hipoteza
H0 : p1 = p2
Alternativna Kriticno podrucje

hipoteza
S
H1 : p1 6= p2 C0 = h, z 2 ]
[z 2 , i
H1 : p1 > p2
C0 = [z , i
H1 : p1 < p2
C0 = h, z ]
Primjer. Anketirano je 300 radnika iz tvornice A i 200 radnika iz tvornice B o uvjetima rada . 56% radnika iz tvornice A i 48% radnika iz tvornice
B su zadovoljni uvjetima rada. S razinom znacajnosti 0.05, testirati hipotezu
da
7
a) su radnici podjednako zadovoljni uvjetima rada;

su zadovoljniji uvjetima rada.
n1 = 300,
p1 = 0.56,
n2 = 200,
b) radnici iz tvornice A
p2 = 0.48
a) H0 : p1 = p2 , H1 : p1 6= p2
Procijenjena vjerojatnost je:
p =
300 0.56 + 200 0.48

n1 p1 + n2 p2
=
= 0.528.
n1 + n2
500
Vrijednost test statistike je:

0.56 0.48
z=
q
0.528 0.472
1
1
300
= 1.75.
1
200
Kriti
no podrucje je :
C0 = h, z 2 ]
z 2 = z0.025 = (tablice) = 1.96,
[z 2 , i
C0 = h, 1.96]
[1.96, i.
Vrijednost test statistike nije u kriticnom podrucju, tj. 1.75 < z0.025 pa ne
mozemo odbaciti nultu hipotezu, tj. ne mozemo zakljuciti da postoji razlika
medu tvornicama.
b) H0 : p1 = p2 , H1 : p1 > p2
z = (tablice) = z0.05 = 1.64
C0 = [1.64, i
Vrijednost test statistike z = 1.75 pripada kriticnom podrucju pa odbacujemo

nultu hipotezu, tj. mozemo zakljuciti da su radnici iz tvornice A zadovoljniji
uvjetima rada.

Predavanja 14. 1 Iz PMIS-A 2011 - 2012 - Statisti Ki Testovi

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Predavanja 14. 1 Iz PMIS-A 2011 - 2012 - Statisti Ki Testovi

Uploaded by

Copyright:

Available Formats

Testiranje statistickih hipoteza

Osnovna zadaca Statistike je na temelju uzorka ocijeniti kakvu razdiobu

Vjerojatnosti tih pogresaka oznacavamo s:

= P(pogreska 2. vrste)= P(prihvacamo H0 | H0 netocna).

je nivo signifikantnosti ili razina zna

Uz svaku od od navedenih hipoteza definiramo alternativnu iz iste skupine,

Test o proporciji (vjerojatnosti)

Primjer Proizvodac tvrdi da njegove posiljke sadrze najvise 7% defektnih

z = z0.05 = (tablice) = 1.65 = C0 = h, 1.65]

(n1 1)S12 +(n2 1)S22

Usporedba varijanci dviju normalno distribuiranih populacija

Test statistika je:

Vrijednosti f (n1 1, n2 1) i f1 (n1 1, n2 1) citamo iz tablica za F

procjena zajednicke vjerojatnosti. Test-statistika je:

Za velike uzorke, tj. kada min(n1 , n2 ) +, vrijedi Z N (0, 1). Kriticna

Alternativna Kriticno podrucje

a) su radnici podjednako zadovoljni uvjetima rada;

300 0.56 + 200 0.48

Vrijednost test statistike je:

Vrijednost test statistike z = 1.75 pripada kriticnom podrucju pa odbacujemo

You might also like