You are on page 1of 26

Darko Milunović, mr, asistent

darko.milunovic@ef.unibl.org

STATISTIKA
TESTIRANJE STATISTIČKIH HIPOTEZA
Testovi zasnovani na jednom i dva uzorka
Nakon ovog poglavlja možemo...

 Shvatiti značaj, logiku i ograničenja statističkog testiranja


 Spoznati tzv. p – vrijednost
 Primjenjivati najpoznatije parametarske testove (sa jednim ili dva uzorka)
 Tip greške I i II vrste
 Tumačiti kompjuterski izlaz za bilo koji test

2
Hipoteza
 Hipoteza je tvrdnja o parametru populacije:
Sredina
Primjer: Prosječni mjesečni račun za telefon u RS je μ = 42 KM

Proporcija
Primjer: Udio odraslih u RS koji imaju bar jedan mobilni telefon je p = 0.68

 Tradicionalno, testiranje se koristi kada imamo neko prethodno saznanje


o parametru skupa.

3
Postupak testiranja
 Formiraju se hipoteze (H0 i H1) – na bazi ranije definisanog
problema
 Izbor testa (uz provjeru pretpostavki) i nivo značajnosti
 Formuliše se pravilo odlučivanja
 Realizovana vrijednost Statistike testa (kriterijum za
odlučivanje...)
 Zaključak o postavljenom problemu
Nivo značajnosti i oblast odbacivanja hipoteze
a
Nivo značajnosti =
a /2 a /2
predstavlja
H0: μ = 3 Dvostrani test kritičnu vrijednost
H1: μ ≠ 0
3
a Kritična
H0: μ ≤ 3 oblast
Desnostrani test
H1: μ >
0
3

H0: μ ≥ 3
a
Ljevostrani test
H1: μ <
3 0 5
Greške pri testiranju
Mogući ishodi:

Trenutna situacija
Odluka H₀ istinita H₀ pogrešna
Nema greške Greška II vrste
H₀ nije odbačena
1-α β
Greška I vrste Nema greške
H₀ odbačena
α 1-β

6
Testiranje aritmetičke sredine
(jedan uzorak)
Zadatak br. 1
U izvještaju jednog preduzeća, koje ima 3.000 radnika, piše da je prosječna
plata 600 KM (sa prosječnim odstupanjem od 40 KM). Slučajno smo izabrali
80 radnika tog preduzeća i utvrdili prosječnu platu od 590 KM. Ispitati uz 5%
rizika da li navedenu tvrdnju možemo prihvatiti kao tačnu?
Podaci:
N  3000
0  600
n  80
  40
7
x  590
 formulisanje nulte i alternativne hipoteze

H0 :   600
H1:   600
 izbor statistike testa i nivoa značajnosti testa
Pošto je varijansa osnovnog skupa poznata, a uzorak veći od 30 elemenata,
koristi se statistika Z testa...
Zaključak se donosi uz 5% rizika!

 formulisanje pravila na osnovu kojih će se vršiti zaključivanje


Kritična oblast (oblast odbacivanja nulte hipoteze) je raspoređena simetrično
na krajevima Z rasporeda, pa kritičnu vrijednost nalazimo u Tablicama br. 3

8
Upravo, na osnovu kritične vrijednosti formiraju se pravila odlučivanja:

H0 ne treba odbaciti ako je Z  1,96

H0 treba odbaciti ako je Z  1.96


0,025  0,025

Z = -1,96 Z=0 Z = 1,96


određivanje realizovane vrijednosti:

x  0 x  0 590  600 10
Z Z    2,24
x  40 4,47
n 80
Zaključak...

9
Zadatak 2
Rukovodilac jednog odjela (Odnos sa korisnicima usluga) kompanije M:tel smatra
da se mjesečni iznos, koji klijenti plaćaju za korišćenje njihovih usluga, povećao
te
sada iznosi prosječno preko 52 KM.
Kompanija želi testirati ovu tvrdnju. (poznato je da odstupanje od prosjeka iznosi
10 KM).

H0: μ ≤ 52 prosječna potrošnja nije preko 52 KM mjesečno


H1: μ > 52 prosječna potrošnja jeste preko 52 KM mjesečno

10
Zadatak 2
Ako znamo da je nivo značajnosti testa .10, na sljedeći način
pronalazimo kritičnu oblast (što je ujedno i pravilo odlučivanja):

 = 0.10

Ne odbacujemo H0 Odbacujemo H0
1.28
0
11
Zadatak 2
Uzimamo uzorak...
 Na uzorku od 64 ispitanika dobijamo da je prosječna mjesečna
potrošnja 53,1 KM.
 Na osnovu ovih rezultata izračunavamo Statistiku testa Z:
x  μ0 53.1  52
z    0.88
σ 10
n 64

x  μ0
Odbacujemo H 0 ako je z   1.28
σ/ n
Nećemo odbaciti H0 jer je z = 0.88 < 1.28
Zaključujemo da potrošnja (mjesečna) nije veća od 52 KM...

12
Zadatak 3
Kruži priča da je prosječna cijena hotelske sobe u Čikagu $168 za polupansion.
Slučajno izaberemo 25 hotela i dobijemo sljedeće rezultate:
x = $172.50 i
s = $15.40. H0: μ = 168
Testirati tvrdnju na nivou značajnosti od  = 0.05.
H1: μ ¹ 168
(pretpostavka je da populacija ima normalnu distribuciju...)

13
Koristi se t-test
a = 0.05 a/2=.025
a/2=.025
n = 25
 je nepoznata, pa koristimo t statistic
Kritična vrijednost je:

t24 , .025 = ± 2.0639


Odb.H0 Prihvata se H0 Odb.H0
-t n-1,α/2 0
t n-1,α/2
-2.0639 2.0639

x μ 172.50  168
t n 1    1.46
s 15.40
n 25
14
Zadaci
Zadatak br. 4
Jedan poljoprivredni kombinat želi da utvrdi da li u tekućoj godini može očekivati sa
zasijanih površina prošlogodišnji prinos pšenice od 3 t/ha. Slučajno odabranih 16 ha
zasijane površine dalo je prosječan prinos od 2,6 t/ha, sa prosječnim odstupanjem od
0,23 t. Utvrditi uz 5% rizika da li se može očekivati prošlogodišnji prinos pšenice sa
zasijanih površina, ako znamo da su zasijane površine normalno raspoređene prema
prinosu.

Zadatak br. 5
Prema deklaraciji proizvođača sijalica prosječan vijek trajanja njegovih proizvoda iznosi
više od 2000 časova, sa prosječnim odstupanjem od 70 časova. Slučajno smo izabrali
30 sijalica i utvrdili prosječan vijek trajanja tih sijalica od 1988 časova. Provjeriti da li
možemo, uz 5% rizika, prihvatiti tvrdnju ovog proizvođača kao tačnu (pod
pretpostavkom da raspored sijalica prema vijeku trajanja ima karakteristike normalnog
rasporeda).
15
Testiranje proporcije (jedan uzorak)

Uključuje i kategorijalne varijable.


Dva ishoda se posmatraju, gdje je jedan okarakterisan kao:
“uspjeh” (na bazi osobine koja se posmatra)
“neuspjeh” (sve ostalo...)
Koriste se veliki uzorci (moraju se ispuniti određeni uslovi).

Kada je nP(1 – P) > 5, tada se prporcija uzorka može aproksimirati normalnom


distribucijom sa sredinom i std. devijacijom.

16
Zadatak 1
Na jednoj fudbalskoj utakmici slučajno je izabrano 500 gledalaca među kojima
je bilo 375 muškaraca. Ispitati, uz 5% rizika, pretpostavku da fudbalskoj
utakmici prisustvuje:
a) 70% muškaraca,
b) manje od 30% gledalaca ženskog pola.
n  500 f 375
f  375 p   0,75
 0  0,70
n 500

Hipoteze...
a) H 0 :   0,70
H1 :  0,70
17
Zadatak 1
Koristi se Statistika testa Z, ako su ispunjeni određeni uslovi:

Rizik je 5%, a kritične vrijednosti su raspoređene simetrično, na krajevima


normalnog raspreda...

0,025  0,025

Z = -1,96 Z=0 Z = 1,96


Pravilo odlučivanja glasi:
H0 nećemo odbaciti ako je: Z  Z / 2 (  1,96)
H0 ćemo odbaciti ako je: Z  Z / 2 (  1,96)
18
Zadatak 1
Statistika testa Z se dobije na osnovu naredne formule i iznosi:
p  0 p  0 0,75  0,70 0,05
Z     2,44
sp  0  1   0  0,70  1  0,70 0,0205144
Zaključak... n 500
Odbacujemo nultu hipotezu i uz 5% rizika zaključujemo da se učešće gledalaca
muškog pola statistički značajno razlikuje od 70%...

b) Ovde se radi o jednostranom testu (lijevo je kritična oblast...)

Hipoteze su:
H 0 :   0,30 


H1 :   0,30
Z  = -1,65 Z=0
19
Zadatak 1
Sa slike se jasno vidi da ćemo nultu hipotezu odbaciti ako je realizovana vrijednost
manja od -1,65 i obrnuto... Što je ujedno i pravilo odlučivanja.

Realizovana vrijednost: p   0 0,25  0,30


Z   2,44
sp 0,0205134
Zaključak:
Odbacujemo nultu hipotezu i uz 5% rizika konstatujemo da je učešće gledalaca
ženskog pola manje od 30%.

H 0 :   0,30 


H1 :   0,30
Z  = -1,65 Z=0
20
Zadaci
Zadatak br. 2
Procenat masnoće u jednoj litri mlijeka na jednoj farmi treba da iznosi
najmanje 3.5%. Slučajno smo izabrali 250 litara mlijeka i utvrdili da
procenat masnoće iznosi 3%. Ispitati uz koji najveći stepen rizika
možemo prihvatiti ovu hipotezu.

Zadatak br. 3
Marketing kompanija tvrdi da 8% njenih klijenata ekspresno odgovara
na mail. Da bi provjerili ovu pretpostavku, poslali su 500 upita na
različite mail-ove i ustanovili da je 25 klijenata odmah poslalo odgovor
na upit. Ispitati ovu tvrdnju (nivo pouzdanosti 95%)!

21
Testiranje hipoteza (2 uzorka)
Testovi sa 2 uzorka

Sredina populacija Sredina populacije Proporcija populacije


(zavisni uzorci) (nezavisni uzorci)

Ista grupa prije i Grupa 1 vs. Grupa 2 U dvije različite


poslije tretmana (dvije nezavisne grupe se posmatra
grupe) udio neke pojave...

22
Zadatak 1
Jedno preduzeće želi da uporedi kvalitet rada 2 mašine koje je nabavilo za
proizvodnju određenog proizvoda. Slučajno odabranih 120 proizvoda sa mašine A
imalo je prosječno vrijeme izrade 75 minuta, dok je 150 proizvoda sa mašine B imalo
prosječno vrijeme izrade 90 minuta. Ispitati uz 5% rizika da li je statistički značajna
razlika u kvalitetu rada mašina A i B pod pretpostavkom da su standardne devijacije
ova 2 skupa jednake i iznose 25 minuta.

n1  120 H 0 : 1  2
n2  150 H1: 1  2
x1  75
x 2  90 n1, n2i 
Pošto su varijanse poznate 30
1   2  25 koristimo statistiku Z testa.

23
Zadatak 1
Radi se o dvosmjernom testu pa imamo:

F Z / 2   1   0,975
2
0,025  0,025
Z / 2  1,96

Z = -1,96 Z=0 Z = 1,96


Pravilo odlučivanja:
H0 nećemo odbaciti ako je: Z  Z /2 H0 ćemo odbaciti ako je: Z  Z /2

Realizovana vrijednost Statistike testa Z:


x1  x 2 x1  x 2 75  90
Z     4 ,899
 x1  x2  12  22 25 2
25 2
 
Zaključak... n1 n2 120 150
24
Zadatak 2
Praćenjem gledanosti jedne TV emisije na području A slučajno je odabrano 1000
gledaoca od kojih 410 tu emisiju redovno prati, dok od 500 slučajno odabranih
gledaoca sa područja B 52% su redovni gledaoci te TV emisije.

a) Utvrditi uz 5% rizika da li su gledaoci sa područja B više zainteresovani za ovu TV


emisiju;

b) Odrediti najveći stepen rizika uz koji možemo prihvatiti pretpostavku da nema


značajne razlike u zainteresovanosti gledaoca na područjima A i B za ovu TV
emisiju.

25
Hvala na pažnji!

26

You might also like