You are on page 1of 10

5.

Testiranje hipoteze o aritmetičkoj sredini jednog osnovnog skupa


Razmotrimo nestatistički primer:

Postoje indikacije da je osoba počinila krivično delo zbog čega je izvedena pred sud. Na osnovu
dokaza sudija će donete jednu od dve moguće odluke:

1. Osoba nije kriva ( Nulta hipoteza)


2. Osoba je kriva (Alternativna hipoteza)

Na početku se smatra da osoba nije kriva.

Nulta hipoteza H0 je tvrđenje o nekom parametru osnovnog skupa koji se smatra istinitim sve
dok se ne dokaže suprotno. Alternativna hipoteza H1 je tvrđenje o nekom parametru osnovnog
skupa koje će biti istinito ako je nulta hipoteza neistinita.

Pri testiranju hipoteza, moguća su dva tipa grešaka.

H0 je istinito H0 nije istinito


H0 se ne odbacuje Ispravna odluka Greška II vrste
H0 se odbacuje Greška I vrste Ispravna odluka

Nivo značajnosti α predstavlja verovatnoću da je nulta hipoteza odbačena, iako je istinita, tj.
verovatnoću da smo napravili grešku prve vrste. Površina koja odgovara oblasti odbacivanja
nulte hipoteze, jednaka je nivou značajnosti.

U zavisnosti od znaka u alternativnoj hipotezi koristimo jedan od moguća tri smera testa:
dvostrani, levostrani i desnostrani test.

Prilikom testiranja hipoteze o μ primenom Normalne raspodele, slučajna promenljiva

𝑥𝑥𝑛𝑛 − 𝜇𝜇
���
𝑧𝑧 = 𝜎𝜎
√𝑛𝑛

se naziva statistika testa i predstavlja kriterijum koji koristimo pri donošenju odluke.

Primer 1: Utvrđeno je da je prosečna dužina međunarodnih razgovora koji su preko telefonske


kompanije obavljeni u jednoj godini bila 12,44 minuta. Uprava kompanije je želela da proveri da
li se prosečna dužina razgovora razlikuje od 12,44 min. U uzorku od 150 takvih razgovora
prosečna dužina je iznosila 13,71 minut. Standardna devijacija svih razgovora je 2,65 minuta. Da
li na nivou značajnosti od 2 % može da se zaključi da se prosečna dužina razgovora razlikuje od
12,44 minuta?

1
Rešenje: Neka je μ prosečna dužina razgovora koji se obavljaju preko ove kompanije, ���
𝑥𝑥𝑛𝑛
prosečna dužina razgovora u uzorku.

n = 150, ���
𝑥𝑥𝑛𝑛 = 13,71, σ = 2,65, α = 0,02
Formiramo nultu i alternativnu hipotezu:

H0: μ = 12,44

H1: μ ≠ 12,44

Kako je σ poznato i veličina uzorka veća od 30, za testiranje hipoteze koristimo normalnu
raspodelu. Kako je znak u alternativnoj hipotezi ≠, za testiranje koristimo dvostrani test. Iz
tablice normalne raspodele, pronalazimo kritične vrednosti -2,33 i 2,33.
����−𝜇𝜇
𝑥𝑥𝑛𝑛 13,71−12,44
Izračunavamo statistiku testa 𝑡𝑡 = 𝜎𝜎 = 2,65 = 5,87
√𝑛𝑛 √150

Kako se 5,87 nalazi u oblasti odbacivanja nulte hipoteze, zaključak je da se nulta hipoteza
odbacuje i prihvata alternativna. Dakle, na nivou značajnosti od 2 % možemo da zaključimo da
se prosečna dužina razgovora razlikuje od 12,44 minuta.

Primer 2: Gradonačelnik jednog velikog grada tvrdi da prosečna neto vrednost imovine
porodica koje žive u tom gradu iznosi najmanje 300 000$. U izabranom uzorku od 25 porodica,
prosečna neto vrednost imovine iznosi 288 000$. Pretpostavimo da neto vrednosti imovine svih
porodica u ovom gradu imaju normalnu raspodelu, sa standardnom devijacijom uzorka 80 000
$. Može li se zaključiti na nivou značajnosti od 2,5 % da je gradonačelnikova tvrdnja neistinita?

Rešenje:

Formiramo nultu i alternativnu hipotezu:

H0: μ ≥ 300 000

H1: μ < 300 000

Kako je σ nije poznato i veličina uzorka manja od 30, a osnovni skup ima normalnu raspodelu,
za testiranje hipoteze koristimo t raspodelu. Kako je znak u alternativnoj hipotezi < za testiranje
koristimo levostrani test. Iz tablice t raspodele, pronalazimo kritičnu vrednost -2.064.

𝑥𝑥𝑛𝑛 − 𝜇𝜇
��� 288000 − 300000
𝑡𝑡 = 𝑠𝑠 = = −0,75
80000
√𝑛𝑛 √25

2
Kako se - 0,75 > - 2.064 nalazi u oblasti neodbacivanja nulte hipoteze, zaključak je da se nulta
hipoteza ne odbacuje. Dakle, na nivou značajnosti od 2,5 % možemo da zaključimo da je
gradonačelnikova tvrdnja tačna.

Primer 3:

Postoji sumnja da mašina koja pakuje deterdžent, čija je propisana masa 1 kg, nije više precizna,
pa bi trebalo izvršiti njen remont. Da bismo doneli odluku o remontu, izabrali smo uzorak od 16
pakovanja i dobili sledeći rezultat:

1,020 1,010 1,050 1,015 1,002 1,008 1,025 0,998

1,012 1,033 1,017 1,001 1,008 1,011 1,024 1,006

Na osnovu dobijenih podataka proverićemo da li je sumnja u preciznost rada mašine


opravdana. Iz iskustva znamo da je masa pakovanja normalno raspoređena. Šta se moze
zaključiti kada je nivo značajnosti testa α=0,05?

Rešenje:

Formulisanje nulte i alternativne hipoteze:

H0: µ = 1 (Prosečna masa pakovanja je 1kg.)

H1: µ ≠ 1 (Prosečna masa pakovanja je različita od 1kg.)

Izbor raspodele koja će se koristiti se vrši na osnovu kriterijuma: σ nepoznata, n<30, pa ćemo za
testiranje hipoteze koristiti t raspodelu sa n-1 stepeni slobode.

Određivanje oblasti odbacivanja i neodbacivanja nulte hipoteze se vrši na osnovu znaka ≠ u


alternativnoj hipotezi koji ukazuje da je test dvostrani, sa dve oblasti odbacivanja koje su
simetrično raspoređene na krajevima krive t raspodele. Nivo značajnosti je 0,05 pa su površine
koje odgovaraju oblastima odbacivanja su na svakom kraju α/2=0,05/2=0,025.

Kritične vrednosti su t15; 0,025 = ± 2,131, za α=0,025 i df =16 -1=15.

Sledeći korak je izračunavanje vrednosti statistike testa. Sada izračunavamo realizovanu


vrednost statistike t testa

3
𝑥𝑥𝑛𝑛 − 𝜇𝜇 1,015 − 1,0
���
𝑡𝑡 = 𝑠𝑠 = = 4,6875
0,0032
√𝑛𝑛

Realizovana vrednost statistike je t = 4,6875

Na osnovu realizovane vrednosti t statistike t testa donosimo odluku o odbacivanju ili


neodbacivanju nulte hipoteze.

Kriterijum je: H0 ne treba odbaciti ako je |t| ≤ 2,1315

H0 treba odbaciti ako je |t| > 2,1315

Ova vrednost t=4,6875 je veća od kritične vrednosti t = 2,1315 i nalazi se u oblasti odbacivanja
nulte hipoteze.

Sledi da nultu hipotezu odbacujemo i zaključujemo da, na osnovu podataka u uzorku, prosečna
masa kutije deterdženta nije jednaka 1kg, pri riziku od 0,05 da smo odbacili istinitu nultu
hipotezu.

Primer 4. Isti zadatak kao prethodni, Primer 3. ali sumnjamo da je masa kutije deterdženta veća
od 1 kg. Testirati hipotezu na nivou značajnosti od 5%.

Rešenje: Formulisanje nulte i alternativne hipoteze:

H0: µ ≤ 1 (Prosečna masa pakovanja nije veća od 1kg.)

H1: µ > 1 (Prosečna masa pakovanja je veća od 1kg.)

Izbor raspodele koja će se koristiti: σ nepoznata, n<30, pa ćemo za testiranje hipoteze koristiti t
raspodelu sa n-1 stepeni slobode.

Određivanje oblasti odbacivanja i neodbacivanja: Znak > u alternativnoj hipotezi ukazuje da je


test desnostrani, sa jednom oblašću odbacivanja nulte hipoteze koja je na desnom kraju krive t
raspodele. Nivo značajnosti je 0,05. Površina koja odgovara oblasti odbacivanja je α=0,05.
Kritična vrednost je t15; 0,05 = 1,753, i za α=0,05 i df =16 -1=15 je očitana iz tablica t raspodele.

Sada izračunavamo realizovanu vrednost statistike t testa

4
𝑥𝑥𝑛𝑛 − 𝜇𝜇 1,015 − 1,0
���
𝑡𝑡 = 𝑠𝑠 = = 4,6875
0,0032
√𝑛𝑛
Realizovana vrednost statistike je t = 4,6875.

Na osnovu realizovane vrednosti t statistike t-testa donosimo odluku o odbacivanju ili


neodbacivanju nulte hipoteze.

Kriterijum je: H0 ne treba odbaciti ako je t ≤ 1,7531

H0 treba odbaciti ako je t > 1,7531

Ova vrednost t=4,6875 je veća od kritične vrednosti t = 1,7531 i nalazi se u oblasti odbacivanja
nulte hipoteze.

Sledi da nultu hipotezu odbacujemo i zaključujemo da je, na osnovu podataka u uzorku,


prosečna masa kutije deterdženta veća od 1kg, pri riziku od 0,05 da smo odbacili istinitu nultu
hipotezu.

Primer 5. Vreme trajanja remonta jedne vrste mašina je u proseku 10 dana. Kompanija koja
popravlja te mašine želi da testira pretpostavku da će popravka trajati više od 10 dana, sa
nivoom značajnosti od 0,01 , na uzorku od obima 121, ako se zna da aritmetička sredina uzorka
10,6 dana, a standardna devijacija osnovnog skupa je 2,2.

Rešenje: Formulisanje nulte i alternativne hipoteze:

H0: µ ≤ 10 (Prosečno trajanje popravke mašine nije veće od 10 dana)

H1: µ > 10 (Prosečno trajanje popravke mašine je veće od 10 dana)

Izbor raspodele koja će se koristiti: σ poznata, n>30, pa ćemo za testiranje hipoteze koristiti
Normalnu raspodelu.

Određivanje oblasti odbacivanja i neodbacivanja: Znak > u alternativnoj hipotezi ukazuje da je


test desnostrani, sa oblašću odbacivanja desno od kritične vrednosti na kraju krive približno
normalne uzoračke raspodele. Nivo značajnosti je 0,01. Površina koja odgovara oblasti
odbacivanja je α=0,01.

Kritična vrednost je z0,99 = 2,33 i za α=0,01 i je očitana iz tablica Normalne raspodele.

Sada izračunavamo realizovanu vrednost statistike z testa

𝑥𝑥𝑛𝑛 − 𝜇𝜇 10,6 − 10
���
𝑧𝑧 = 𝜎𝜎 = 0,02 = 3
√𝑛𝑛

5
Realizovana vrednost statistike je z = 3,0. Na osnovu realizovane vrednosti z statistike z testa
donosimo odluku o odbacivanju ili neodbacivanju nulte hipoteze.

Kriterijum je: H0 ne treba odbaciti ako je z ≤ 2,33

H0 treba odbaciti ako je z > 2,33

Ova vrednost z = 3,0 je veća od kritične vrednosti z0,99 = 2,33 i nalazi se u oblasti odbacivanja
nulte hipoteze.

Sledi da nultu hipotezu odbacujemo i zaključujemo da je, na osnovu podataka iz uzorka,


prosečno vreme potrebno za remont mašine veće od 10 dana, pri riziku od 1% da smo odbacili
istinitu nultu hipotezu.

Zadaci za vežbu:
1. Psiholog tvrdi da je aritmetička sredina starosti dece koja počinju da hodaju 12,5 meseci.
Izabran je slučajan uzorak od 18 dece i utvrđeno je da aritmetička sredina starosti dece koja
počinju da hodaju 12,9 meseci sa standardnom devijacijom od 0,8 meseci. Da li možete
koristeći nivo značajnosti od 1 % da zaključite da se aritmetička sredina starosti dece koja
počinju da hodaju razlikuje od 12,5 meseci, pod pretpostavkom da njihova starost ima približno
Normalnu raspodelu?

Rešenje: Formulisanje nulte i alternativne hipoteze:

H0: µ = 12,5 (Prosečna starost dece koja počinju da hodaju je 12,5 meseci.)

H1: µ ≠ 12,5 (Prosečna starost dece koja počinju da hodaju nije 12,5 meseci.)

Izbor raspodele koja će se koristiti: σ nepoznata, n=18<30, a osnovni skup ima Normalnu
raspodelu pa ćemo za testiranje hipoteze koristiti t raspodelu sa n-1=17 stepeni slobode.

Određivanje oblasti odbacivanja i neodbacivanja: Znak ≠ u alternativnoj hipotezi ukazuje da je


test dvostrani, sa dve oblasti odbacivanja nulte hipoteze koja je se nalaze na oba kraja krive t
raspodele. Nivo značajnosti je 0,01. Površina koja odgovara oblasti odbacivanja je
α/2=0,01/2=0.005. Kritična vrednost je t17; 0,005 = 2,898 i za α=0,005 i df =17 je očitana iz tablica
t raspodele.

Sada izračunavamo realizovanu vrednost statistike t testa


𝑥𝑥𝑛𝑛 − 𝜇𝜇
��� 12,9 − 12,5
𝑡𝑡 = 𝑠𝑠 = = 2,12
0,8
√𝑛𝑛 √18
Realizovana vrednost statistike testa je t = 2,12.

Na osnovu realizovane vrednosti t statistike t-testa donosimo odluku o odbacivanju ili


neodbacivanju nulte hipoteze.

6
Kriterijum je: H0 ne treba odbaciti ako je |t |≤ 2,898

H0 treba odbaciti ako je |t|> 2,898

Realizovana vrednost statistike testa je t = 2,12 je manja od druge kritične vrednosti t17; 0,005 =
2,898 i veća od prve kritične vrednosti t17; 0,005 = - 2,898 nalazi se u oblasti neodbacivanja nulte
hipoteze.

Sledi da nultu hipotezu ne odbacujemo i zaključujemo na osnovu podataka u uzorku da se


aritmetička sredina starosti dece koja počinju da hodaju ne razlikuje od 12,5 meseci pri nivou
značajnosti od 1 %.

2. Na osnovu jednog proučavanja pokazano je da je aritmetička sredina novca koji Amerikanke


troše na odeću 675$ godišnje. Istraživač je želeo da proveri da li je taj rezultat i dalje tačan.
Nedavno je izabran slučajan uzorak od 39 žena i dobijeni su sledeći podaci o iznosima koje troše
na odeću svake godine:

671 1284 328 1698 827 921 725 304 382 539

1070 854 669 328 537 849 930 1234 1195 738

341 189 867 923 721 125 298 473 876 932

973 931 460 1430 391 887 958 674 1482

Proverite na nivou značajnosti od 1% da li se aritmetička sredina iznosa koje Amerikanke troše


na odeću tokom poslednje godine razlikuje od 675$. Pretpostavimo da je standardna devijacija
osnovnog skupa 132$.

3. Novinarka tvrdi da odrasli stanovnici u njenom gradu provode u proseku 30 i više sati
mesečno u čitanju novina, časopisa, romana itd. Nedavno izabrani uzorak od 25 odraslih osoba
iz ovog grada je pokazao da su one u proseku provele 27 sati mesečno u čitanju. Poznato je da
osnovni skup vremena provedenog u čitanju ima normalnu raspodelu, sa standardnom
devijacijom od 7 sati. Možete li na nivou značajnosti od 1% da zaključite da je novinarkina
tvrdnja tačna?

4. Kompanija koja proizvodi boje tvrdi da aritmetička sredina vremena sušenja njihovih boja nije
duža od 45 min. Izabran je slučajan uzorak od 25 kanti boja i utvrđeno je da je aritmetička
sredina vremena sušenja u ovom uzorku bila 49,5 min sa standardnom devijacijom od 3 min.
Pretpostavimo da vreme sušenja ovih farbi ima normalnu raspodelu. Možete li da zaključite, na
nivou značajnosti od 1%, da je tvrđenje ove kompanije istinito?

Rešenje: Formulisanje nulte i alternativne hipoteze:

H0: µ ≤ 45 (Vreme sušenja njihovih boja nije duže od 45 min.)

H1: µ > 45 (Vreme sušenja njihovih boja duže od 45 min.)

7
Izbor raspodele koja će se koristiti: σ nepoznata, n=25<30, a osnovni skup ima Normalnu
raspodelu pa ćemo za testiranje hipoteze koristiti t raspodelu sa n-1=24 stepena slobode.
Koristi se desnostrani test. Određujemo t kritično za df=24 i za α=0,01. Kritična vrednost je t24;
0,01 = 2,492

𝑥𝑥
���𝑛𝑛 − 𝜇𝜇 49,5 − 45
𝑡𝑡 = 𝑠𝑠 = = 7,5
3
√𝑛𝑛 √25
Realizovana vrednost statistike testa je t = 7,5 je veća od kritične vrednosti t24; 0,01 = 2,492 i
nalazi se u oblasti odbacivanja nulte hipoteze.

Sledi da nultu hipotezu odbacujemo i zaključujemo na osnovu podataka u uzorku da je


aritmetička sredina vrema sušenja boja je veća 45 dana pri nivou značajnosti od 1 %.

6. Testiranje hipoteze o aritmetičkoj sredini dva osnovna skupa


Primer 1:
Iz dva nezavisna uzorka izabrana iz dva osnovna skupa sa normalnim raspodelama dobijene su
sledeće informacije:

Testirati hipotezu da je aritmetička sredina drugog osnovnog skupa veća od aritmetičke sredine
prvog osnovnog skupa sa nivoom značajnosti od 1%.

Rešenje:
Formulisanje nulte i alternativne hipoteze:

H0: µ1 = µ2 (Aritmetičke sredine osnovnih skupova se ne razlikuju)

H1: µ1 > µ2 (Aritmetička sredina prvog osnovnog skupa je veća od aritmetičke sredine drugog)

8
Izbor raspodele koja će se koristiti: Kako su σ1 i σ2 poznate, a oba uzorka su velika n1,n2 >30,
sledi da je uzoračka raspodela statistike aproksimativno normalna pa ćemo za testiranje
hipoteze koristiti normalnu raspodelu.

Određivanje oblasti odbacivanja i neodbacivanja: Znak > u alternativnoj hipotezi ukazuje da je


test desnostrani, sa desnom oblašću odbacivanja na kraju krive približno normalne uzoračke
raspodele. Nivo značajnosti je 0,01. Površina koja odgovara oblasti odbacivanja je na desnom
kraju α = 0,01.

Kritična vrednost funkcije z, za vrednosti funkcije raspodele 0,99 je približno jednaka 2,33 iz
tablice za standardizovanu normalnu raspodelu.

Izračunavanje vrednosti statistike testa

Vrednost statistike z testa izračunavamo na sledeći način:

Donošenje odluke: Kako se realizovana vrednost statistike testa z = -14,0 nalazi u oblasti
neodbacivanja nulte hipoteze, ne odbacujemo nultu hipotezu i zaključujemo da se aritmetičke
sredine ova dva osnovna skupa ne razlikuju.

Zadaci za vežbu:
1. Istraživač je želeo da ispita da li muškarci i žene koji rade u jednom gradu prelaze isto
rastojanje od kuće do posla. U uzorku od 25 muškaraca prosečno rastojanje je iznosilo 21 km,
dok je u uzorku od 30 žena ono iznosilo 20 km. Pretpostavimo da ova dva osnovna skupa imaju
normalnu raspodelu i da su njihove standardne devijacije jednake 5,2 km i 4,4 km, respektivno.

a. Neka su µ1 i µ2 aritmetičke sredine dva osnovna skupa (prosečna rastojanja od kuće do posla
svih muškaraca i žena u tom gradu). Izračunajte tačkastu ocenjenu vrednost za µ1 - µ2.

b. Da li, na nivou značajnosti od 5 % možete zaključiti da se rastojanja koja svi zaposleni


muškarci i žene u ovom gradu prelaze od kuće do posla, u proseku razlikuju? Hipotezu testirajte
pristupom kritičnih vrednosti.

2. Jedan poslovni konsultant je želeo da ispita da li postojanje vrtića u krugu firme smanjuje
odsustva sa posla njihovih majki. U uzorku od 45 majki dece predškolskog uzrasta, izabranom iz
kompanija koje u krugu firme imaju vrtić, prosečan broj dana odsustva u toku prošle godine je
bio 6,4 dana. U drugom uzorku od 50 majki, zaposlenih u kompanijama bez vrtića, prosečan

9
broj dana odsustva u prošloj godini je bio 9,3 dana. Pretpstavimo da su standardne devijacije
ova dva osnovna skupa 1,20 i 1,85 dana, respektivno.

a) Formirajte 98% interval poverenja za razliku aritmetičkih sredina dva osnovna skupa.
b) Da li na nivou značajnosti od 2,5% možete da zaključite da postoji razlika u prosečnom
broju dana odsustva sa posla majki zaposlenih u kompanijama sa i bez vrtića u okviru firme?

10

You might also like