Professional Documents
Culture Documents
Vrste testova:
- dvosmjeran (na dvije granice)
- jednosmjeran
na gornju granicu, ili
na donju granicu
Postupak:
1. postavljanje hipoteza
2. izabiranje uzorka
3. izračunavanje testovnih veličina
sampling distribucija uzoraka oblika je normalne distribucije bez obzira kako je
raspoređen osnovni skup, tj.
pˆ ≈ N ( P0 , σ pˆ )
p̂ - karakteristika uzroka (proporcija uzorka)
P - nepoznata proporcija osnovnog skupa
P0 - pretpostavljena proporcija osnovnog skupa
N - oznaka za normalnu distribuciju
σ p̂ - standardna greška, odnosno, standardna devijacija sampling distribucije
z-test
pˆ − P0
z=
se( pˆ )
Standardna greška se u slučajevima frakcije izabiranja veće od 0,05 korigira faktorom korekcije:
PQ
se( pˆ ) = o o f < 0,05
n
Po Q o N − n
se ( pˆ ) = f > 0 , 05
n N −1
kreiranje intervala prihvaćanja na temelju gornje tablice
p vrijednost
Hipoteze p-vrijednost
H0... P = P0 , H1... P ≠ P0 p =2P(Z>|z|)
H0... P ≤ P0 , H1... P > P0 p = P(Z> z )
H0... P ≥ P0 , H1... P < P0 p = P(Z>|z|)
Primjer 1.
Proporcija slučajnog uzorka 400 članova izabranog iz beskonačnog osnovnog skupa iznosi
0,49215. Može li se prihvatiti pretpostavka kako uzorak potječe iz populacije s proporcijom
0,51? Testirati na razini 5% signifikantnosti.
n = 400
P0 = 0,51
Q0 = 0,49
P0Q0 = 0,2499 varijanca osnovnog skupa
f se ne može provjeriti, u tom slučaju se standardna greška računa bez primjene faktora korekcije
p̂ = 0,49215
α = 0,05;
U cilju testiranja nul-hipoteze potrebno je provesti dvosmjeran test: zα/2 je z0,025 = 1,96
Postavljaju se hipoteze:
H0... P = 0,51
H1... P ≠ 0,51
STATISTIKA: Predavanje 9 3
Testiranje hipoteza o proporciji, analiza varijance, hi-kvadrat test
Testiranje
test (z-test)
pˆ − P0 pˆ − P0 0,49215 − 0,51
z= = = = −0,71
se( pˆ ) P0 Q0 0,2499
n 400
|z|<zα/2
|-0,71|< z0,025 = 1,96 prihvatiti H0
z0,025=1,96
α/2=0,025 α/2=0,025
(0,05:2) 0,475 (0,05:2)
0,95
L1 P0 = 0,51 L2
0,44 pˆ = 0 , 49215 0,54
p vrijednost
p = 2P(Z>|z|)
p = 2P(Z> |-0,71|) = 2P(,2611) = 0,5000-0,2611 = 0,2399
P(0,2399+0,2399) = 0,4798
alfa < p (ako je izračunata p vrijednost veća od razine
z,025 = 1,96 (0,05)
signifikantnosti α– H0 se prihvaća)
0,025 < 0,4798
Postavljenu nul-hipotezu iz zadatka treba prihvatiti sukladno pokazateljima sva tri provedena testa
4 STATISTIKA: Predavanje 9
Testiranje hipoteza o proporciji, analiza varijance, hi-kvadrat test
Primjer 2.
Testira se nul-hipoteza kako je proporcija osnovnog skupa jednaka 0,70, a pripadajuća
alternativna hipoteza sadrži tvrdnju da je proporcija osnovnog skupa veća od 0,70. Proporcija
slučajnog uzorka veličine 676 članova je 0,72. Uzorak je izabran iz osnovnog skupa opsega
11265 članova. Do koje se odluke dolazi provedbom testa? Vjerojatnost pogreške tipa I je 5%
n = 676
N = 11265
P0 = 0,70
Q0 = 0,30
P0Q0 = 0,21 varijanca osnovnog skupa
f = n/N = 676/11265 = 0,06 f>0,05
p̂ = 0,72
α = 0,05;
jednosmjeran test: zα je z,05 = 1,65
Testiranje
test (z-test)
pˆ − P0 pˆ − P0 0,72 − 0,70
z= = =
se( pˆ )
P0 Q0 N − n 0,70 ⋅ 0,30 11265− 676
n N −1 676 11264
0,02 0,02
z= = = 1,1715
0,21 10589 0,01709
676 11264
z <zα prihvatiti H0
1,17< z0,05 = 1,65 prihvatiti radnu nul-hipotezu, to jest odbaciti nul-hipotezu iz zadatka
p-vrijednost
p= P(Z > z )
p= P(Z > 1,1715 )
p= 0,5000-0,3790 = 0,1210
z0,05 = 1,65
z0,05 (1,65 ) 0,05< 0,1210
Primjer 3.
Testira se nul-hipoteza kako je proporcija osnovnog skupa manja od 0,30. Proporcija slučajnog
uzorka je 225 članova izabranog uz frakciju izbora 2% je 0,24. do koje se odluke dolazi
provedbom testa? Razina značajnosti je 6%!
f = 0,02 f<0,05
n = 225
f = n/N 0,02 = 225/N N = 11250
P0 = 0,30
Q0 = 0,70
P0Q0 = 0,21 varijanca osnovnog skupa
p̂ = 0,24
α = 0,06;
Testiranje
test (z-test)
pˆ − P0 pˆ − P0 0 , 24 − 0 ,30
z= = =
se ( pˆ ) P0 Q 0 0 ,30 ⋅ 0 ,70
n 225
− 0 ,06
z= = − 1,96
0 ,03055
z >-zα prihvatiti H0
-1,96< z0,06 = -1,56 odbaciti H0 radnu
6 STATISTIKA: Predavanje 9
Testiranje hipoteza o proporciji, analiza varijance, hi-kvadrat test
p-vrijednost
p = P(Z>|z| )
p = P(Z> |-1,96|)
p = 0,5000- 0,4750
p = 0,0250
|z0,06| = 1,56
z0,06 (0,06 ) > 0,0250 (p –vrijednost)
Testiranje hipoteze o razlici proporcija dva osnovna skupa pripada skupini dvosmjernih testova,
dakle testiraju se obje granice intervala (i donja i gornja).
Postupak:
1. postavljanje hipoteze
H0... P1 = P2; P1 - P2 = 0
H1... P1 ≠ P2; P1 - P2 ≠ 0
P1 – PROPORCIJA prvog osnovnog skupa (N1)
P2 – PROPORCIJA drugog osnovnog skupa (N2)
Pretpostavka zapisana u nul-hipotezi govori kako je razlika između proporcija dva osnovna
skupa jednaka nuli, to jest, kako razlike između proporcija dva osnovna skupa nema.
2. izabiranje uzorka iz svakog osnovnog skupa (dva uzorka)
3. izračunavanje testovnih veličina u svakom uzorku
z-test
pˆ1 − pˆ 2
z=
se( pˆ 1 − pˆ 2 )
|z|<zα/2 prihvatiti H0
|z|>zα/2 odbaciti H0
- ako je p vrijednost veća od razine signifikantnosti α, prihvatit će se H0
Primjer 4.
Iz dviju populacija izabrani su nezavisni uzorci veličine n1=100 i n2=200. Broj članova s
određenim modalitetom obilježja u prvom uzorku je m1=50, a u drugom m2=75. Na razini
signifikantnosti od 5% testirajte hipotezu o razlici proporcija dvaju populacija i donesite
zaključak.
1. postavljanje hipoteza
H0... P1 = P2; P1 P2 = 0
H1... P1 ≠ P2; P1 P2 ≠ 0
pˆ1 − pˆ 2
z=
se( pˆ1 − pˆ 2 )
0,500 − 0,375
z= = 2,07
0,0604
|z|<zα/2 prihvatiti H0
|z|>zα/2 odbaciti
|2,07|>z0,025 1,96 odbaciti H0
interval prihvaćanja
pˆ 1 − pˆ 2
0,5-0,375
0,125
4. zaključak o ishodu testa
Na temelju oba testa odbacuje se pretpostavka kako su proporcije uzoraka izabrane iz osnovnih
skupova sa jednakim proporcijama populacije. Zaključak je donesen na razini signifikantnosti
5%
Pretpostavke:
varijabla o čijoj se aritmetičkoj sredini provodi test u svakoj populaciji je normalno
distribuirana
distribucije populacija imaju jednake varijance (homoskedasticitet). Prisutnost navedene
pretpostavke potrebno je testirati, npr. Bartlettov-im testom!
uzorci izabrani iz populacija su nezavisni
df za maksimalnu varijancu
postavljanje hipoteza
H0… aritmetičke sredine triju ili više osnovnih skupova su jednake
H1… barem jedna populacija ima aritmetičku sredinu različitu od µ
H 0 ....µ1 = µ 2 = µ 3 = ... = µ K = µ
H 1 ....∃µ j ≠ µ j = 1,2,3,..., k
iz svakog od k osnovnih skupova izabrati jedan uzorak veličine n
provjeriti jednakost varijanci k uzoraka (npr. Bartlettovim testom)
zabilježiti sve vrijednosti obilježja Xij svakog od uzoraka
i – element u uzorku (i=1,2,..,n)
j – uzorak kojemu pripada element (j=1,2,3,...,k)
Element Uzorak
i 1 2 ... j ... k
1 x11 x11 .... x1j .... x1k
2 x21 x22 .... x1j .... x2k
.... .... .... .... .... .... ....
i xi1 xi2 .... xij .... xjk
.... .... .... .... .... .... ....
n xn1 xn2 .... xnj .... xnk
aritmetičke .... ....
sredine x
x. 1 x. 2 x. j x. k
∑X ij
X j = i=1 j =1,2,3,...,k
n
izračunati zajedničku aritmetičku sredinu svih k uzoraka
nj K
∑∑ X
i =1 j =1
ij
X =
n
12 STATISTIKA: Predavanje 9
Testiranje hipoteza o proporciji, analiza varijance, hi-kvadrat test
∑ ∑ (X
j =1 i =1
ij − X) = 2
∑n j =1
j (X j − X) + 2
∑ ∑ (X
j =1 i =1
ij − X j )2
∑∑(X ij − X )2 = ∑n j (X j − X )2 + ∑∑(X ij − X j )2
j =1 i =1 j =1 j =1 i =1
nj nj
K
1K
∑∑( X
j=1 i=1
ij − X ) = ∑nj ( X j − X ) + ∑∑( Xij − X j )2
2
j =1
2
j=1 i=1
2
K K T 1
∑n ( X − X) = ∑ 2
− (T..)2
j
j j
j =1 j =1 n j n
nj
Tj = ∑ X ij j = 1,2,...,k
i =1
K nj
T .. = ∑∑ X ij
j =1 i =1
T.. – zbroj vrijednosti varijable X svih uzoraka
Tj – zbroj vrijednosti varijable j-tog uzorka
STATISTIKA: Predavanje 9 13
Testiranje hipoteza o proporciji, analiza varijance, hi-kvadrat test
∑∑( X
j =1 i=1
ij − X ) = ∑n j ( X j − X ) + ∑∑( X ij − X j )2
2
j =1
2
j =1 i=1
K nj K nj K Tj2
∑∑( X
j =1 i=1
ij − X j ) = ∑∑X −∑
2
j =1 i=1
2
ij
j=1 nj
H0 se prihvaća ako je F < Fα[k-1,n-k], odnosno, ako je p vrijednost veća od razine signifikantnosti α
donošenje zaključka
Primjer 5.
Pogoni A, B i C proizvode isti proizvod. Ispituje se utrošak radnog vremena po proizvodu. Iz
pogona A u slučajni uzorak izabrano je 8 proizvoda, iz pogona B 7 proizvoda, iz pogona C 9
proizvoda. Utrošeno vrijeme u minutama za proizvode dano je u tablici.
Može li se prihvatiti pretpostavka kako ne postoji razlika u prosječnom utrošku radnog vremena
izrade proizvoda u pogonima A, B i C? Testirati na razini 5% i 1% signifikantnosti.
H 0 ...µ1 = µ 2 = µ 3 = µ
A B C
27 19 24
28 24 21
25 23 21
25 26 22
20 19 23
26 18 27
23 20 18
22 20
25
STATISTIKA: Predavanje 9 15
Testiranje hipoteza o proporciji, analiza varijance, hi-kvadrat test
A B C
27 19 24
28 24 21
25 23 21
25 26 22
20 19 23
26 18 27
23 20 18
22 20
25
Zbroj T1 = 196 T2 = 149 T3 = 201 T.. = 546
Sredine X 1 = 24,50000 X2 = 21,28571 X 3 = 22,33333 X =
546 = 22,75
24
Zbroj kvadrata 4852 3227 4549 12628
Veličine uzoraka n1 = 8 n2 = 7 n3 = 9 n = 24
STS
nj nj
K K
1
∑ ∑ ( X ij − X ) 2 = ∑ ∑ X ij2 −
j =1 i =1 j =1 i =1 n
(T ..)2
nj
K
1
∑ ∑ (X
j =1 i =1
ij − X ) 2 = 12628 −
24
(546 ) 2 =
K nj
∑ ∑ (X
j =1 i =1
ij − X ) 2 = 206 ,50000
SSB
K K T j21
∑n (X
j =1
j j − X) = ∑2
j =1
− (T ..)2
nj n
K
1962 1492 2012 1
∑n j (X j − X )2 =
j =1 8
+
7
+
9
− 5462
24
K
∑n (X
j =1
j j − X ) 2 = 41,07143
SSW = SST-SSB
SSW = 206,5 - 41,07143 = 165,42857
16 STATISTIKA: Predavanje 9
Testiranje hipoteza o proporciji, analiza varijance, hi-kvadrat test
Tablica ANOVA
Bartlettov test
sˆi2 max
F=
sˆi2 min
8,15
F= = 1,30 < 3,73
6,25
Hi-kvadrat test nalazi učestalu primjenu pri testiranju hipoteza kako su:
1. proporcije tri ili više osnovnih skupova međusobno jednake
2. distribucija osnovnog skupa ima određeni oblik
3. dva obilježja elemenata osnovnog skupa međusobno neovisna
Test pokazatelj:
k
(m i − ei )2
χ 2
= ∑
i =1 ei
1
m predstavlja broj povoljnih događaja u uzorku, a n broj jedinca uzorka
18 STATISTIKA: Predavanje 9
Testiranje hipoteza o proporciji, analiza varijance, hi-kvadrat test
Napomene:
- smije se računati samo na temelju frekvencija (ne smiju se unositi npr. aritmetička
sredina, postoci, itd.)
- niti jedna ei ne smije biti manja od 5 ako je u testiranju df = 1
- ako je veći broj stupnjeva slobode, hi-kvadrat se ne smije uporabiti ako je više od 20%
ei manje od 5, a niti jedna ei ne smije biti manja od 1
(tada je moguće zbrojiti dvije ili više ei, ako to ima smisla, te nakon toga odrediti df)
STATISTIKA: Predavanje 9 19
Testiranje hipoteza o proporciji, analiza varijance, hi-kvadrat test
Primjer 6.
Želi se provjeriti tvrdnja (signifikantnost 5%) kako je proporcija ženskih studenata jednaka na
svim godinama studija. Iz svakog godišta, izabran je određeni broj studenata u uzorak:
H0 … P 1 = P 2 = P 3 = … = P k … = P
H1 … P 1 ≠ P 2 ≠ P 3 ≠ … ≠ P k … ≠ P
m + m 2 + m3 + ... + m k
Pˆ = 1 =
n1 + n2 + n3 + ... + nk
19 + 16 + 21 + 14
Pˆ = = 0,4575
49 + 34 + 38 + 32
ei
I 49 19 22,42 11,6964 0,522
II 34 16 15,56 0,1936 0,012
III 38 21 17,38 13,1044 0,754
IV 32 14 14,64 0,4096 0,028
Ukupno 153 70 70 - 1,316
χ = ∑
2
k
(m i − ei )
i =1 ei
Kao i u prethodnom slučaju, potrebno je usporediti test pokazatelj s tabličnom vrijednosti!
Primjer 7.
Pretpostavlja se kako se prometne nezgode događaju ravnomjerno. Na razini 5% signifikantnosti
testirajte navedenu pretpostavku!
Dani tjedna Broj nezgoda mi
Ponedjeljak 5532
Utorak 5177
Srijeda 5289
Četvrtak 5263
Petak 5986
Subota 6167
Nedjelja 5723
Ukupno 39137
Radna hipoteza: nezgode se događaju ravnomjerno
Dani mi ei (mi − ei )2 (m i 2
− ei )
tjedna ei
P 5532 39137:7=5591 3481 0,62
U 5177 39137:7=5591 171396 30,65
S 5289 39137:7=5591 91204 16,31
Č 5263 39137:7=5591 107584 19,24
P 5986 39137:7=5591 156025 27,91
S 6167 39137:7=5591 331776 59,34
N 5723 39137:7=5591 17424 3,12
Ukupno 39137 39137 - 157,19
157,19 > 12,59
df = k-1 = 7-1 = 6 χ 2 0,05 = 12,59
0,05 signifikantnost
H0 se, na razini 5% signifikantnosti odbacuje kao neistinita, tj. odbacuje se pretpostavka kako se
prometne nezgode na cestama događaju ravnomjerno po danima u tjednu.
STATISTIKA: Predavanje 9 21
Testiranje hipoteza o proporciji, analiza varijance, hi-kvadrat test
moguće ih je izračunati:
a) s pomoću strukture zbirnog reda
b) s pomoću strukture zbirnog stupca
c) s pomoću složene vjerojatnosti
d) s pomoću marginalnih frekvencija
- test pokazatelj:
2
r c
(m i − ei )
χ 2
= ∑∑
i =1 i =1 ei
r = broj redova tablice
c = broj stupaca tablice
Odrediti tabličnu vrijednost test pokazatelja!
Vjerojatnost = signifikantnost/100
df = (r-1) (c-1)
Primjer 8.
Prigodom istraživanja uspješnosti studiranja studenata EFOS, postavljena je hipoteza kako ne
postoji veza između ocjene iz statistike i spola studenata.
24:77 = 0,312
20:77 = 0,260
18:77 = 0,234
15:77 = 0,195
Očekivane frekvencije se izračunavaju množenjem strukture zbirnog reda i ukupnog broja
studenata:
studentice studenti
0,312 · 53 =16,5 0,312 · 24 = 7,5
0,260 · 53 =13,8 0,260 · 24 = 6,2
0,234 · 53 =12,4 0,234 · 24 = 5,6
0,195 · 53 =10,3 0,195 · 24 = 4,7
pomnožiti ih sa n (77)
Spol Ocjene iz statistike
2 3 4 5 Ukupno
Ž 16,5 13,8 12,4 10,3 53
M 7,5 6,2 5,6 4,7 24
Ukupno 24 20 18 15 77
očekivane frekvencije
Spol Ocjene iz statistike
2 3 4 5 Ukupno
Ž 16,5 13,8 12,4 10,3 53
M 7,5 6,2 5,6 4,7 24
Ukupno 24 20 18 15 77
STATISTIKA: Predavanje 9 25
Testiranje hipoteza o proporciji, analiza varijance, hi-kvadrat test
i =1 i =1 ei
(m i − ei )2
Spol ei Ukupno
2 3 4 5
Ž 0,742 0,046 0,465 0,009 1,262
M 1,633 0,103 1,029 0,019 2,784
Ukupno 2,375 0,149 1,494 0,028 4,046