You are on page 1of 8

Testiranje statistickih hipoteza

(statisticki testovi)

Osnovna zadaca Statistike je na temelju uzorka ocijeniti kakvu razdiobu


ima promatrano (populacijsko) statisticko obiljezje X. Svaka pretpostavka
koja se odnosi na tu razdiobu je (statisti
cka) hipoteza, a provjera istinitosti te hipoteze je testiranje (statisti
cki test). Hipotezu koju testiramo
zovemo nulta hipoteza ili nul-hipoteza i obiljezavamo s H0 , a njoj alternativnu hipotezu obiljezavamo s H1 . Ako se testira hipoteza koja se
odnosi na parametar pretpostavljene razdiobe, onda govorimo o parametarskom testu, a ako se hipoteza odnosi na tip razdiobe govorimo o
neparametarskom testu. Hipoteza je jednostavna ako jednoznacno
zena. Priodreduje razdiobu satatistickog obiljezja X, u protivnom je slo
blizimo navedene pojmove primjerima.
Primjer 1.
Proizvodac nekog uredaja tvrdi da je uvodenjm nove tehnologije prosjecno
vrijeme potrebno za izradu uredaja smanjeno u odnosu na dotadasnje, koje
je bilo 10 sati.
U ovom primjeru promatrano statisticko obiljezje je X vrijeme izrade
uredaja. Pretpostavimo da vrijeme izrade svih uredaja proizvedenih uz
odredenu tehnologiju ima normalnu razdiobu. Moguce hipoteze su : Proizvodac
je u pravu ili Proizvodac nije u pravu. Hipoteze su alternative tj. tocnost
jedne povlaci netocnost druge i obratno. Pretpostavimo da je hipoteza
Proizvodac nije u pravu tocna. Dakle, nulta hipoteza je H0 : X = 10
sati, a alternativna H1 : X < 10 sati, gdje je X populacijsko ocekivanje.
Prema tome radi se o parametarskom testu. Hipoteza H0 je jednostavna
hipoteza, jer jednoznacno odreduju vrijednost parametra X , a time i pretpostavljenu razdiobu (ako je varijanca poznata) , dok je hipoteza H1 slo
zena
jer jednoznacno ne odreduje razdiobu
Primjer 2.
Kocka se baca 60 puta. Rezultati su dani u tablici:

Broj na kocki
1 2
Broj pojavljivanja 13 19

3 4 5 6
11 8 5 4

Da li je kocka ispravna?
U ovom primjeru su moguce dvije hipoteze: Kocka je ispravna. i njoj
suprotna Kocka nije ispravna.
Za nultu hipotezu se najcesce uzima suprotno od onoga sto zelimo dokazati.
Iz tablice naslucujemo da kocka nije ispravna, pa hipoteze definiramo ovako:
H0 : kocka je ispravna i
H1 : kocka nije ispravna.
Statisticko obiljezje je X broj na kocki. Prirodno je ispitati da li se iz
tablice frekvencija moze zakljuciti da empirijska razdioba bitno ne odstupa
od teorijske diskretne uniformne razdiobe (vjerojatnosti pojavljivanja svakog
broja na kocki su jednake, tj. broj pojavljivanja -frekvencija svakog broja u
60 bacanja je 10). Stoga definiramo hipoteze:
H0 : X ima diskretnu uniformnu razdiobu i
H1 : X nema diskretnu uniformnu razdiobu.
Dakle, treba testirati hipotezu o tipu razdiobe, sto spada u neparametarske
testove.
U oba primjera treba na temelju uzorka donijeti odluku o prihvacanju ili
odbacivanju nulte hipoteze. Teorijski gledano, rijec je o tome da se iz n
mjerenja slucajne varijable X, odnosno na temelju vrijednosti (x1 , . . . , xn )
slucajnog uzorka (X1 , . . . , Xn ), donese odluka o prihvacanju ili odbacivanju
odredene hipoteze. Kako niti jedan statisticki zakljucak o populaciji na bazi
uzorka nije stopostotno siguran, tako i prihvacnje neke hipoteze na temelju
uzorka ne znaci da je ta hipoteza tocna. Stoga je umjesto hipotezu prihvacamo ispravnije reci na osnovi uzorka ne postoji razlog za odbacivanje
hipoteze. Prilikom donosenja odluke o istinitosti hipoteze postoje dvije vrste
mogucih pogresaka :
pogre
ska 1. vrste: odbacili smo nultu hipotezu ako je ona istinita
pogre
ska 2. vrste: prihvatili smo nultu hipotezu ako je ona neistinita.
Moguce situacije su prikazane tablicom:

prihvacamo H0
odbacujemo H0

H0 je tocna

pogreska 1. vrste

H0 je netocna
pogreska 2. vrste

Vjerojatnosti tih pogresaka oznacavamo s:


= P(pogreska 1. vrste)= P(odbacujemo H0 | H0 tocna) i
2

= P(pogreska 2. vrste)= P(prihvacamo H0 | H0 netocna).


Sljedeca tablica prikazuje vjerojatnosti mogucih situacija

prihvacamo H0
odbacujemo H0

H0 je tocna H0 je netocna
1

je nivo signifikantnosti ili razina zna


cajnosti, a 1-=P(odbacujemo
H0 | H0 netocna) snaga testa. Pitanje da li je neki test najbolji u smislu
da su vjerojatnosti pogresaka minimalne cemo izostaviti! Naime, smanjenje
vjerojatnosti jedne pogreske ima za posljedicu povecanje vjerojatnosti druge.
Najcesce se problem rjesava tako da se zada vjerojatnost pogreske prve vrste
h0, 1i (najcesce 0,01 i 0,05, ali to nije pravilo!) U tom slucaju u mnogim
testovima je moguce postici da vjerojatnost pogreske 2. vrste bude minimalna. Opseg uzorka utjece na vjerojatnosti pogresaka. Naime, povecanjem
velicine uzorka smanjuju se vjerojatnosti pogresaka.
Za testiranje hipoteze treba:
(1 ) Definirati H0 i H1 ;
(2 ) Definirati test-statistiku na osnovi cijih vrijednosti se donose odluke;
(3 ) Za zadanu razinu znacajnosti odrediti kriti
cno podru
cje - skup svih
mogucih vrijednosti test-statistike za koje se odbacuje nulta hipoteza
u korist alternativne;
(4 ) Ispitati da li se vrijednost test-statistike izracunate iz uzorka nalazi u
kriticnom podrocju;
(5 ) Zakljuciti: Ako je izracunata vrijednost test-statistike u kriticnom podruju hipoteza H0 se odbacuje u korist alternativne hipoteze H1 . U
suprotnom se H0 prihvaca, tj. na osnovi uzorka hipotezu ne mozemo
odbaciti.
Napomena. U pravilu, za nul-hipoteze se uzimaju jednostavne hipoteze.
Parametarski testovi
Neka je nepoznati parametar o kojemu ovisi pretpostavljena razdioba. Tada
mozemo testirati slijedece hipoteze:
(i) H : = 0 (ii) H : 6= 0 (iii) H : > 0
(iv) H : < 0 (v) H : 0 (vi) H : 0 .
3

Uz svaku od od navedenih hipoteza definiramo alternativnu iz iste skupine,


ovisno o zadatku koji rjesavamo. Ako je hipotezu tipa (ii) govorimo o dvostranoj hipotezi tj. o dvostranom testu, a za slucajeve (iii), (iv), (v), ili
(vi) o jednostranoj hipotezi tj.o jednostranom testu.
Testovi o parametrima normalne razdiobe N (, 2 )
Nulta hipoteza

Test statistika

H0 : = 0
2 poznato

Z = X
n

Z N (0, 1)

H0 : = 0
2
nije poznato

H0 : 2 = 02
02 > 0

Alternativna hipoteza
H1 : 6= 0

Kriticno podru
S cje

C0 = h, z 2 ] [z 2 , i

H1 : > 0

C0 = [z , i

H1 : < 0
H1 : 6= 0

C0 = h, z
S ]
C0 = h, t 2 ] [t 2 , i

H1 : > 0

C0 = [t , i

H1 : < 0
H1 : 2 6= 02

C0 = h,St ]
C0 = [0, 21 ] [2 , i

H1 : 2 > 02

C0 = [2 , i

H1 : 2 < 02

C0 = [0, 21 ]

T = X
n
S
T (n 1)

U = n1
S2
2
U 2 (n 1)

Test o proporciji (vjerojatnosti)


Kao sto smo vec rekli, bez obzira kakvu razdiobu ima statisticko obiljezje,
sredina X, za dovoljno velike uzorke, ima priblizno normalnu razdiobu. Promatramo statisticko obiljezje koje ima binomnu razdiobu : X B(n, p). Testiramo hipotezu H0 : p = p0 . Za alternativnu uzimamo jednu od H1 : p 6= p0
ili H1 : p < p0 ili H1 : p < p0 . U sva tri slucaja koristimo test- statistiku:
X p0
n N (0, 1).
Z=p
p0 (1 p0 )
Nulta hipoteza

Alternativna hipoteza
H1 : p 6= p0

Kriticno podru
S cje
C0 = h, z 2 ] [z 2 , i

H1 : p > p0
H1 : p < p0

C0 = [z , i
C0 = h, z ]

H0 : p = p0

Primjer Proizvodac tvrdi da njegove posiljke sadrze najvise 7% defektnih


proizvoda. Uzet je slucajni uzorak od 200 komada iz jedne posiljke i bilo je
11 defektnih. Da li biste prihvatili tvrdnju proizvodaca uz razinu znacajnosti
0.05?
Rjesenje. Postavljamo hipoteze:
H0 : p = 0.07
H1 : p < 0.07
Kada bi za alternativnu hipotezu postavili H1 : p 6= 0.07, u slucaju odbacivanja nulte hipoteze mogli bi zakljuciti samo da proporcija defektnih nije
0.07, a to moze znaciti da je veca, ali i da je manja od te vrijednosti sto je
jos bolje.Odredimo kriticno podrucje:

z = z0.05 = (tablice) = 1.65 = C0 = h, 1.65]


Izracunajmo vrijednost odgovarajuce test-statistike:
x = p =

0.055 0.07
11
= 0.055 = z =
200 = 0.83.
200
0.07 0.93

Kako izracunata vrijednost nije u kriticnom podrucju tj. z < z0.05 nultu
hipotezu H0 ne mozemo odbaciti, tj. mozemo zakljuciti da posiljke sadrze
najvise 7% defektnih proizvoda.
Usporedba o
cekivanja dviju normalno distribuiranih populacija
(t-test)
Promatramo statisticko obiljezje X na dvije razlicite populacije. Uz to pretpostavimo da u obje populacije promatrano obiljezje ima normalnu razdiobu.
Ako s X1 i X2 oznacimo obiljezje na prvoj, odnosno drugoj populaciji, onda
su pretpostavke:
X1 N (1 , 12 ) i X2 N (2 , 22 ).
Neka su realizirani uzorci uzeti iz prve, odnosno druge populacije opsega n1
i n2 redom. Testiramo hipotezu
H0 : 1 = 2
uz jednu od alternativnih:
H1 : 1 6= 2 ,

H1 : 1 > 2 ,

H1 : 1 < 2 .

Ovisno o tome da li su varijance poznate i jednake ili ne, imamo razlicite test
statistike, sto je prikazano u tablici:

Nulta hipoteza

Test statistika

Z=

12 i 22
poznato

Z N (0, 1)

T =

12 = 22 = 2
nije poznato

S2 =

Kriticno podrucje

H1 : 1 > 2

C0 = [z , i

H1 : 1 < 2
H1 : 1 6= 2

C0 = h, z ]
S
C0 = h, t 2 (n1 + n2 2)]
[t 2 (n1 + n2 2), i

H1 : 1 > 2

C0 = [t (n1 + n2 2), i

H1 : 1 < 2

C0 = h, t (n1 + n2 2)]

1 X
2
X
r

H0 : 1 = 2

H0 : 1 = 2

Alternativna
hipoteza
H1 : 1 6= 2

2
1
2
+ n2
n1
2

1 X
2
X
q
1
1
+
n
n
1

C0 = h, z 2 ]
[z 2 , i

(n1 1)S12 +(n2 1)S22


n1 +n2 2

T t(n1 + n2 2)

Usporedba varijanci dviju normalno distribuiranih populacija


(F-test)
Promatramo statisticko obiljezje X na dvije razlicite populacije. Uz to
pretpostavimo da u obje populacije promatrano obiljezje ima normalnu razdiobu. Ako s X1 i X2 oznacimo obiljezje na prvoj, odnosno drugoj populaciji,
onda su pretpostavke:
X1 N (1 , 12 ) i X2 N (2 , 22 ).
Neka su realizirani uzorci uzeti iz prve, odnosno druge populacije opsega n1
i n2 redom. Testiramo hipotezu
H0 : 12 = 22
u odnosu na jednu od alternativnih:
H1 : 12 6= 22 ,

H1 : 12 > 22 ,

H1 : 12 < 22 .

Test statistika je:


F =

S12
S22

koja (ako je H0 tocna hipoteza) ima F (Fisherovu) razdiobu s parom stupnjeva slobode (n1 1, n2 1) .
Kriticna podrucja su prikazana u tablici:

Nulta hipoteza

Alternativna hipoteza
H1 : 12 6= 22

H0 : 12 = 22
H1 : 12 > 22
H1 : 12 < 22

Kriticno podrucje
S
C0 = h0 , f1 2 (n1 1, n2 1)]
[f 2 (n1 1, n2 1), i
C0 = [f (n1 1, n2 1), i
C0 = h0, f1 (n1 1, n2 1)]

Vrijednosti f (n1 1, n2 1) i f1 (n1 1, n2 1) citamo iz tablica za F


razdiobu.
Vrijedi:
1
f1 (n1 , n2 ) =
f (n2 , n1 )
Usporedba proporcija
Promatramo dvije populacije i Bernoullijevo statisticko obiljezje X. Oznacimo
sa X1 i X2 vrijednosti obiljezja X, a sa p1 , i p2 vjerojatnosti uspjeha na prvoj,
odnosno na drugoj populaciji. Neka su p1 i p2 procjenitelji za p1 i p2 , a n1 i
n2 duljine (nezavisnih) uzoraka. Tada je
p =

n1 p1 + n2 p2
n1 + n2

procjena zajednicke vjerojatnosti. Test-statistika je:


p1 p2
1
Z=p
q
1
p(1 p)
+
n1

1
n2

Za velike uzorke, tj. kada min(n1 , n2 ) +, vrijedi Z N (0, 1). Kriticna


podrucja su prikazana u tablici:
Nulta hipoteza

H0 : p1 = p2

Alternativna Kriticno podrucje


hipoteza
S
H1 : p1 6= p2 C0 = h, z 2 ]
[z 2 , i
H1 : p1 > p2
C0 = [z , i
H1 : p1 < p2
C0 = h, z ]

Primjer. Anketirano je 300 radnika iz tvornice A i 200 radnika iz tvornice B o uvjetima rada . 56% radnika iz tvornice A i 48% radnika iz tvornice
B su zadovoljni uvjetima rada. S razinom znacajnosti 0.05, testirati hipotezu
da
7

a) su radnici podjednako zadovoljni uvjetima rada;


su zadovoljniji uvjetima rada.

n1 = 300,

p1 = 0.56,

n2 = 200,

b) radnici iz tvornice A

p2 = 0.48

a) H0 : p1 = p2 , H1 : p1 6= p2
Procijenjena vjerojatnost je:
p =

300 0.56 + 200 0.48


n1 p1 + n2 p2
=
= 0.528.
n1 + n2
500

Vrijednost test statistike je:


0.56 0.48
z=
q
0.528 0.472

1
1
300

= 1.75.
1
200

Kriti
no podrucje je :
C0 = h, z 2 ]
z 2 = z0.025 = (tablice) = 1.96,

[z 2 , i

C0 = h, 1.96]

[1.96, i.

Vrijednost test statistike nije u kriticnom podrucju, tj. 1.75 < z0.025 pa ne
mozemo odbaciti nultu hipotezu, tj. ne mozemo zakljuciti da postoji razlika
medu tvornicama.
b) H0 : p1 = p2 , H1 : p1 > p2
z = (tablice) = z0.05 = 1.64

C0 = [1.64, i

Vrijednost test statistike z = 1.75 pripada kriticnom podrucju pa odbacujemo


nultu hipotezu, tj. mozemo zakljuciti da su radnici iz tvornice A zadovoljniji
uvjetima rada.

You might also like