You are on page 1of 18

TESTIRANJE STATISTIČKIH HIPOTEZA

Kao što smo napomenuli ukoliko postoje određene informacije o vrednostima parametra osnovnog
skupa tada se provodi postupak testiranja statističkih hipoteza.

Cilj testiranja je da se ispita prihvatljivost tvrdnji ili pretpostavki koje se tiču osobina
jednog ili više osnovnih skupova. Kao i kod ocenjivanja parametara do tačnih vrednosti se može
doći samo sveobuhvatnim posmatranjem jedinica skupa. Takođe, da bismo bili potpuno sigurni u
tačnost navedenih pretpostavki i tvrđenja morali bismo izvršiti popis. Kako to obično ne činimo,
prilikom testiranja hipoteza koristimo uzorak i na osnovu njega donosimo odluku da li su
postavljene pretpostavke prihvatljive ili nisu.

Statistička hipoteza je precizno formulisano tvrđenje ili pretpostavka o nekoj važnoj


karakteristici jednog ili više skupova.

Pošto odluku o prihvatanju ili odbacivanju statističke hipoteze donosimo na osnovu


informacija iz uzorka, prilikom testiranja hipoteza uvek je prisutan rizik da ćemo u odluci
pogrešiti. Moguće je napraviti dve vrste grešaka, ali treba naglasiti da verovatnoće javljanja ovih
grešaka možemo kontrolisati.

Statističke testove možemo klasifikovati na dva načina. Prema broju uzoraka koje
analiziramo testove delimo na:

• testove zasnovane na jednom uzorku,


• testove zasnovane na dva uzorka i
• testove zasnovane na tri i više uzoraka.

S obzirom na vrstu i jačinu pretpostavki na kojima se zasnivaju, testove delimo na


parametarske- klasične testove i neparametarske testove.

Parametarski (klasični) testovi formulisani su početkom XX veka. Njihova teorijska


podloga se zasniva na verovanju da u prirodi i društvu preovladava samo jedan raspored, normalan
raspored. Ukoliko je ovaj preduslov ispunjen, tada su parametarski testovi optimalan izbor.

Tek posle drugog svetskog rata počeo je ubrzan razvoj druge vrste testova, koji nemaju
preduslov normalnosti. U ovu grupu testova spadaju resampling testovi.U statističkoj teoriji
formulisan je veliki broj testova za različite namene, jer ne postoji jedan, „savršen“ test, koji bi
bio optimalan u svakoj mogućoj situaciji. Situacija se potpuno promenila poslednjih godina, sa
opštom dostupnošću računara i statističkih softvera. Zbog toga se naglasak stavlja, ne na puku
primenu nekog testa, već na ispitivanje preduslova na kojima se test zasniva i interpretaciji
rezultata.
Postupak testiranja hipoteze primenom pristupa zasnovanog na
kritičnoj vrednosti

Postupak statističkog testiranja hipoteza se sastoji od nekoliko etapa (koraka):

1. Na osnovu postavljenog problema formuliše se nulta H0 i alternativna hipoteza H1.


2. Uzima se slučajan uzorak, bira se odgovarajući test (raspodela) koji će se koristiti.
3. Određivanje oblasti odbacivanja i neodbacivanja nulte hipoteze (kritična oblast).
4. Izračunavanje vrednosti statistike testa
5. Formuliše se zaključak u kontekstu postavljenog problema (donošenje odluke).

Treba posebno naglasiti da su drugi i peti korak izuzetno važni. Preskakanje drugog koraka,
posledica je upotrebe neodgovarajućeg testa, a pogrešnim tumačenjem rezultata u petom koraku
može se izvući pogrešan zaključak.

Korak 1. Nulta i alternativna hipoteza

U statističkom testiranju pod nultom hipotezom H0 kao i alternativnom hipotezom H1


smatramo dva precizna, među sobom isključujuća tvrđenja o vrednosti nekog parametra osnovnog
skupa.

Nulta hipoteza je postavka, iskaz, o vrednosti nepoznatog parametra skupa, a testiranje je


tako koncipirano da se proceni jačina dokaza protiv te hipoteze. Da bi se ona odbacila potrebno je
naći dovoljno ubedljive dokaze u uzorku. Nulta hipoteza može biti prosta i složena. H0 je prosta
ako se njom tvrdi da je parametar jednak tačno jednoj, unapred poznatoj numeričkoj vrednosti,
tzv. hipotetičkoj vrednosti H0:(m=m0). Ako nulta hipoteza obuhvata više vrednosti, na primer H0:
μ≤x0, ona je složena.

Svakoj nultoj hipotezi suprotstavljamo alternativnu hipotezu H1. Alternativna hipoteza je


tvrđenje o parametru skupa koje će biti prihvaćeno samo kada se nađu dovoljno ubedljivi dokazi
u uzorku. Ova hipoteza sadrži sve vrednosti koje parametar može imati, a koje nisu obuhvaćene
nultom hipotezom, pa je data u obliku složene hipoteze. Često je nazivaju i istraživačkom
hipotezom jer se njom izražava mišljenje koje postupkom testiranja nastoji da se potvrdi. Hipotezu
H1, ponekad je potrebno prvo postaviti, pa tek nakon toga nultu.

Primer: H0:( μ=5cm) protiv H1:( μ≠5cm). H0 je prosta hipoteza jer se tvrdi da je prosečna
dužina tačno 5 cm, dok je H1 složena hipoteza jer prosečna dužina može biti bilo koja vrednost
različita od 5 cm.

Nulta i alternativna hipoteza se javljaju u tri varijante i to:

A H0 : μ = μ0 H1 : μ ≠ μ0
B H0 : μ ≤ μ0 H1 : μ > μ0
C H0 : μ ≥ μ0 H1 : μ < μ0
Prva varijanta podrazumeva dvosmerni test ili dvostrani test, dok druge dve varijante
podrazumevaju tzv. Jednosmerne testove (levostrani I desnostrani test). Ono što se u praksi ne sme
raditi je da primenimo dvosmerni test, a da nakon toga, nezadovoljni rezultatom, na istim
podacima koristimo jednosmerni test. U postupku testiranja naše uverenje formulišemo u obliku
alternativne hipoteze, a proveravamo samo nultu. Polazimo od pretpostavke da je H0 istinita i
nastojimo da na osnovu uzorka ovu pretpostavku osporimo. Alternativnu hipotezu ne
proveravamo, već je automatski prihvatamo kao istinu, ako podaci svedoče protiv nulte hipoteze.

U statistici nikad ne zaključujemo da je nulta hipoteza stvarno istinita, već samo da


nemamo dovoljno dokaza da je odbacimo.

Kod donošenja odluke o prihvatanju ili odbacivanju nulte hipoteze moguće su sledeće
greške:

Greška I vrste je verovatnoća da se odbaci hipoteza H0 kada je ona stvarno tačna i označavamo je
sa ∝ , ∝-verovatnoća greške prvog tipa i naziva se nivo ili prag značajnosti.

Greška II vrste je verovatnoća da se prihvati H0 kada je stvarno tačna hipoteza H1 i označavamo


je sa 𝛽.

Mora se voditi računa da rizik greške nije isto što i greška, rizik greške je verovatnoća da ćemo
napraviti grešku. Ishodi testiranja hipoteze u statističkom premeru takođe dovode do dve
mogućnosti. Nulta hipoteza može u stvarnosti biti istinita ili neistinita. S druge strane, podaci mogu
biti ili saglasni sa H0 ili joj protivrečiti. Dakle, postoji mogućnost da podaci uzorka dovedu do
ispravne odluke i podrže istinitu hipotezu ili da ospore pogrešnu nultu hipotezu. Međutim, kako
uzorak nikada nije savršeno reprezentativan, moguća su i sledeća dva ishoda, tj. da se informacija
uzorka saglasi sa neistinitom ili protivreči istinitoj nultoj hipotezi.

Stvarno stanje
H0 je istinita H0 nije istinita
H0 se ne ispravna odluka greška II vrste-
odbacuje 1- 𝜶 β
Odluka
H0 se odbacuje greška I vrste- ispravna odluka
α 1-β

Povećanje veličine uzorka utiče na smanjenje greške prve i druge vrste.

Najčešće se koristi dva nivoa značajnosti α = 0,05 ili α = 0,01, što znači da svesno unapred
prihvatamo da ćemo u proseku u 5% odnosno 1% slučajeva napraviti grešku ako se odbaciti
istinita nulta hipoteza.

Bilo za koji metod da se odlučimo nikada nećemo saznati da li smo doneli ispravnu odluku
pre svega što radimo samo sa uzorkom. Zato naše zaključke uvek moramo tumačiti tako da se
ogradimo i ukažemo na mogućnost greške.
Korak 2. Izbor testa

Optimalan izbor testa pri rešavanju postavljenog problema, uz uslov da je raspored skupa
normalan, svodi se na dva testa, ali u čak šest različitih vidova. Takođe, može se sagledati da nam
se pri testiranju aritmetičke sredine nude dve opcije, Z test i t-test. U praksi je gotovo uvek
standardna devijacija nepoznata, tako da se skoro isključivo koristi t-test. Dakle za svaki od
navedenih problema možemo koristiti jedan optimalan parametarski test.

Istrazivački problem Optimalan test


Testiranje aritmetičke sredine jednog skupa, σ Z test
poznata
Testiranje aritmetičke sredine jednog skupa, σ
t- test,
nije poznata, uzorak veličine n < 30
Testiranje aritmetičke sredine jednog skupa, σ Z test,
nije poznata, uzorak veličine n ≥ 30
Testiranje proporcije jednog skupa Z test
Testiranje jednakosti aritmetičkih sredina dva
Z test,
skupa, poznate σ oba skupa
Testiranje jednakosti aritmetičkih sredina dva
t- test,
skupa , σ su jednake u oba skupa
Testiranje jednakosti proporcija dva skupa Z test

Ako statistika testa ima normalan raspored koristićemo naravno tablice standardizovanog
normalnog rasporeda; ako ima t-raspored, kritične vrednosti nalazimo u t- tablicama. Jačina testa
je verovatnoća da se odbaci pogrešna nulta hipoteza obeležava se sa 1‒α.

Korak 3. Određivanje oblasti odbacivanja i neodbacivanja nulte hipoteze (kritične oblasti)


Za unapred izabran nivo značajnosti ∝, poznavanjem teorijskog rasporeda statistike testa i
u zavisnosti od alternativne hipoteze određuje se kritična vrednost testa ili prag značajnosti, a
oblasti koje ona definiše su kritične oblasti (intervali odbacivanja nulte hipoteze). Primer:

Oblast odbacivanja H0 Oblast prihvatanja H0 Oblast odbacivanja H0 Oblast prihvatanja H0 Oblast odbacivanja H0

Dve kritične vrednosti Kritična vrednost


Korak 4. Izračunavanje vrednosti statistike testa

Statistika testa je kriterijum na osnovu kojeg vršimo testiranje i na osnovu kojeg


konceptu testiranja donosimo odluku o odbacivanju ili ne odbacivanju nulte hipoteze.

Jasno je da mora da se formuliše neki indikator koji bi merio razliku između naše
hipotetičke vrednosti i empirijske evidencije iz uzorka. Ako bi taj indikator imao malu vrednost,
ne bismo mogli da tvrdimo da je nulta hipoteza netačna. Tu razliku, zbog pre svega mernih
jedinica, potrebno je još podeliti sa standardnom greškom ocene.

𝐎𝐜𝐞𝐧𝐚 𝐩𝐚𝐫𝐚𝐦𝐞𝐭𝐫𝐚−𝐇𝐢𝐩𝐨𝐭𝐞𝐭𝐢č𝐤𝐚 𝐯𝐫𝐞𝐝𝐧𝐨𝐬𝐭 𝐩𝐚𝐫𝐚𝐦𝐞𝐭𝐫𝐚


Statistika testa = 𝐒𝐭𝐚𝐧𝐝𝐚𝐫𝐝𝐧𝐚 𝐠𝐫𝐞š𝐤𝐚 𝐨𝐜𝐞𝐧𝐞

Na bazi izvučenog uzorka izračunava se statistika testa od koje zavisi da li će se nulta


hipoteza prihvatiti ili ne. Ona je kriterijum za procedure testiranja. Statistika testa uzima različite
vrednosti od uzorka do uzorka i te vrednosti je nemoguće predvideti. Po svojoj prirodi statistika
testa je slučajna promenljiva pa kao takva ima svoju raspodelu verovatnoće. Poznavanje tog
rasporeda omogućava nam izračunavanje različitih verovatnoća realizacija raznih statistika testa,
kao i onih dobijenih u konkretnom uzorku.

Korak 5. Donošenje odluke o nultoj hipotezi

Pravilo odlučivanja se postavlja poređenjem realizovane vrednosti statistike testa sa kritičnom


vrednošću. U zavisnosti od oblika testa postoje tri pravila:

• Ako je test dvosmeran, tada se posmatra apsolutna vrednost statistike testa, pa ako je ona
veća od tablične odbacuje se nulta hipoteza i usvaja alternativna.
• Ako je test jednosmeran, a alternativna hipoteza levostrana, tada statistika testa treba da
bude manja od kritične vrednosti, uz odgovarajući predznak.
• U slučaju jednosmernog ali desnostranog testa, statistika testa mora da bude veća od
tablične vrednosti da bi se nulta hipoteza odbacila.
Primer:
• H0 treba odbaciti ako je |𝐳| >zα/2,
u suprotnom H0 ne treba odbaciti;
• H0 treba odbaciti ako je z < - 𝒛𝜶;
u suprotnom H0 ne treba odbaciti;
• H0 treba odbaciti ako je z > 𝒛𝜶 ;
u suprotnom H0 ne treba odbaciti.
Testiranje hipoteze o aritmetičkoj sredini osnovnog skupa

1. Uslovi za primenu Z - testa su:

- Standardna devijacija skupa σ je poznata.


- Standardna devijacija skupa σ nije poznata

a) Osnovni skup ima normalan raspored, a uzorak je prozvoljne veličine, ili


b) Raspored osnovnog skupa nije poznat, a n ≥ 30.

𝑋̅ −𝜇0
Statistika testa je: 𝑍 = : N(0;1)
𝜎𝑋
̅

Postavljanje pravila odlučivanja i donošenje odluke o nultoj hipotezi:

A: H0 treba odbaciti ako je |𝑧|> zα/2; u suprotnom H0 ne treba odbaciti;

B: H0 treba odbaciti ako je z > zα; u suprotnom H0 ne treba odbaciti

C: H0 treba odbaciti ako je z < - zα ; u suprotnom H0 ne treba odbaciti.

gde je μ0 poznata hipotetička vrednost aritmetičke sredine skupa.

Primer 1.

Prosečna vrednost potrošačke korpe u uzorku od 100 slučajno odabranih četvoročlanih


porodica je 478 eura. Uz rizik greške 5% ispitati istinitost nulte hipoteze da je prosečna vrednost
potrošačke korpe četvoročlane porodice 485 eura. Osnovni skup je normalno raspoređen sa
standardnom devijacijom 27 eura.

Rešenje:
Sprovešćemo postupak testiranja po etapama:
1. Formiramo nultu i alternativnu hipotezu:
H0 : μ = 485, H1 : μ ≠ 485, α = 0,05.
2. Biramo statistiku testa i izračunavamo njenu vrednost na osnovu uzorka:
𝑋̅ −𝜇0 478−485
𝑍= 𝜎 = 27 =-2,59.
√𝑛 √100
3. Postavljamo pravilo odlučivanja na osnovu kojeg zadržavamo ili odbacujemo nultu hipotezu.
Kako je u pitanju dvosmerni test, za dati rizik greške od 0,05 kritična oblast je:
K = (−∞;−1,96)∪(1,96;+∞)
Kako vrednost statistike testa iz uzorka pripada kritičnoj oblasti
Z = −2,59∈K , možemo zaključiti da nultu hipotezu ne prihvatamo sa rizikom 5 %.

2. Uslovi za primenu Studentovog testa su:

- Osnovni skup je normalno raspoređen, varijansa osnovnog skupa nije


poznata, uzorak je proizvoljne veličine, ili

- Uzorak je veličine n<30.

𝑋̅ −𝜇0 𝑋̅ −𝜇0
Statistika testa: 𝑡 = = 𝑆𝑛 .
𝑆𝑋
̅
√𝑛

ima Studentov raspored sa n − 1 stepeni slobode.

Postavljanje pravila odlučivanja i donošenje odluke o nultoj hipotezi:

A:H0 treba odbaciti ako je |𝑡|> tn−1;α/2; u suprotnom H0 ne treba odbaciti;

B:H0 treba odbaciti ako je t > tn-1 ;α; u suprotnom H0 ne treba odbaciti;

C:H0 treba odbaciti ako je t < ‒ tn-1 ;α; u suprotnom H0 ne treba odbaciti.

Primer 2.

Potrebno je da procenat vlažnosti smokava pri sušenju bude manje od 10%. Na osnovu
uzorka od 20 kg izmereni procenat vlažnosti je 12,2%, sa standardnom devijacijom od 1,2%. Sa
rizikom od 5% proveriti da li je zadovoljen uslov o procentu vlažnosti.
Rešenje:

U primeru koristimo desnostrani test. Oblast odbacivanja je na desnom kraju krive


raspodele i površina oblasti odbacivanja je α = 0,05 .
(n=20<30, 𝜎 =? sledi t-test)
1. Formiramo nultu i alternativnu hipotezu:

H0 : μ ≤ 10, H1: μ > 10.

2. Vrednost statistike testa u uzorku je:

𝑋̅ −μ 12,2−10
𝑡= 𝑆𝑛 = 1,2 = 8,20.
√𝑛 √20

3. Kako je u pitanju jednosmerni test, za dati rizik greške od 0,05 I broj stepeni slobode n-1 čitamo
iz t-raspodele vrednost kritične tačke je t19;0,05=1,7291, sledi

kritična oblast je K = (1,7291; +∞)

Kako vrednost statistike testa iz uzorka pripada kritičnoj oblasti,

Z = 8,20 > 1,7291

zaključujemo da na osnovu uzorka možemo odbaciti tvrdnju proizvođača,


sa rizikom od 5%.

TESTIRANJE HIPOTEZE O PROPORCIJI OSNOVNOG SKUPA

Uslovi za primenu Z testa su nπ0 ≥ 5, n(1 - π0) ≥ 5, n ≥ 30,


gde je π0 hipotetička proporcija skupa. Izbor oblika nulte i alternativne hipoteze dat je
u sledećoj tabeli gde razlikujemo tri slučaja:

A H0 : π = π0 H1 : π ≠ π0

B H 0 : π ≤ π0 H1 : π > π0

C H0 : π ≥ π0 H1 : π < π0
Statistika testa je:

𝑝−𝜋0 𝜋0 (1−𝜋0 )
𝑍= , gde je 𝑆𝑃 =√ .
𝑆𝑝 𝑛

Pod uslovom da je H0 istinita statistika ima standardizovan normalan oblik

Z: N(0,1), tj. P: N(π0 , Sp).

Primer 3.
Od 150 klijenata banke “XY” njih 138 se izjasnilo da je zadovoljno uslugama banke. Na
nivou značajnosti od 0,05 ispitati da li se može zadržati hipoteza da je 85% klijenata zadovoljno
uslugama banke.
Rešenje:
H0 : π = 0,85; H1 : π ≠ 0,85; α = 0, 05.
138
Procenat klijenata zadovoljnih uslugama banke na osnovu uzorka je 𝑝 = 150 = 0,92;
Realizovana vrednost statistike Z testa za 𝑝 = 0,92 izračunava se:
0,85∙0,15
𝑆𝑝 = √ = 0,0292;
150

0,92 − 0,85
𝑍= = 2,397
0,0292
Koristimo normalnu raspodelu za α = 0,05 i zα/2=1,96.

Oblast odbacivanja nulte hipoteze (kritična oblast) je: (-∞,-1,96) (1,96,+ ).

Vrednost statistike Z = 2,397 pripada oblasti odbacivanja nulte hipoteze, pa mozemo


zaključiti da nemamo dovoljno argumenata da tvrdimo da je 85% klijenata posmatrane banke
zadovoljno uslugama uz rizik od 5%.

Primer 4.

Uprava jednog sportskog kluba tvrdi da njihovi članovi treniraju najmanje 15 časova
nedeljno. U nameri da se proveri ova tvrdnja na slučajan način je izabrano 35 članova tog kluba i
utvrđeno je da oni u proseku treniraju 13,8 h nedeljno. Poznato je da je standardna devijacija
osnovnog skupa 3,5. Da li se može prihvatiti tvrdnja uprave kluba sa 99% pouzdanosti?

Rešenje:

Na osnovu informacija u primeru koristi se levostrani test. Oblast odbacivanja se nalazi na


levom kraju krive raspodele i površina koja odgovara oblasti odbacivanja je α = 0,01.
1. Formiramo nultu i alternativnu hipotezu:
H0 : μ ≥ 15, H1 : μ < 15.
2. Vrednost statistike testa u uzorku je:
𝑋̅ −𝜇 13,8−15
𝑍= 𝜎 = 3,5 =‒ 2,33.
√𝑛 √35

3. Postavljamo pravilo odlučivanja na osnovu kojeg zadržavamo ili odbacujemo nultu hipotezu.
Kako je u pitanju jednosmerni test, za dati rizik greške od 0,01 kritična oblast je K = (‒∞; ‒ 2,33)
Kako vrednost statistike testa iz uzorka ne pripada kritičnoj oblasti,
Z = ‒2,03 > ‒2,33

Možemo zaključiti da na osnovu uzorka nemamo dovoljno argumenata da odbacimo tvrdnju


uprave kluba, sa rizikom od 1%.

Primer 5.

Od 2000 kutija pakovanja keksa sa deklarisanom teženom od 1700 g uzet je uzorak od 50


komada kutija i izračunata je prosečna težina 1677g sa standardnom devijacijom od 70 g. Da li
pakovanje kutija zadovoljava deklarisanu težinu uz rizik od 0,01?

Rešenje:

H0 : μ = 1700 i H1 : μ ≠ 1700, α = 0,01, n ≥ 30.

Statistika testa je
𝑋̅−μ 𝑆𝑛
𝑍= , gde je 𝜎𝑋̅ = .
𝜎𝑋
̅ √𝑛
Na osnovu uzorka izračunata vrednost je:
1677−1700
𝑍= 70 = -2,32.
√50
Postavljamo pravilo odlučivanja na osnovu kojeg zadržavamo ili odbacujemo nultu
hipotezu. Kako je u pitanju dvosmerni test, za dati rizik greške od 0,01 kritična oblast je:
K = (−∞;−2,58)∪(2,58;+∞)
Kako vrednost statistike testa iz uzorka ne pripada kritičnoj oblasti možemo zaključiti da
nemamo dovoljno argumenata da nultu hipotezu odbacimo sa rizikom 1%.

99%

0,5% 0,5%

Primer 6.

Prosečan broj pročitanih knjiga među članovima jedne biblioteke je 12,5 komada. U želji da se
proveri ovo tvrđenje izabran je slučajni uzorak od 18 članova i ustanovljeno je da je prosečan broj
pročitanih knjiga među ovim članovima 12,9, sa standardnom devijacijom 0,8. Da li se može reći,
pod pretpostavkom da broj pročitanih knjiga ima normalan raspored, da se na nivou značajnosti
od 1% prosečan broj pročitanih knjiga među članovima razlikuje od 12,5 komada.

Rešenje:

𝐻0 : 𝜇 = 12,5; 𝐻1 :𝜇 ≠ 12,5;
𝑡𝑛−1;𝛼⁄2 = 𝑡17;0,005 = 2,898 𝑠𝑙𝑒𝑑𝑖 kritična oblast je: 𝐾 = (−∞; −2,898) ∪ (2,898; ∞).
𝑋̅−𝜇 12,9−12,5
Vrednost statistike testa je: 𝑡𝑛−1;𝛼 = 𝑆 = 0,8 = 2,12
2
√𝑛 √18

Kako vrednost statistike testa iz uzorka ne pripada kritičnoj oblasti možemo zaključiti da
na osnovu uzorka nemamo dovoljno argumenata da odbacimo tvrđenje H0 da se prosečan broj
pročitanih knjiga razlikuje od 12,5 sa rizikom od 1 %.

Primer 7.

Proizvod odgovara standardima ako je njegov radni vek najmanje godinu dana. U uzorku od 100
proizvoda prosečno vreme trajanja bilo je 11,5 meseci, a standardna devijacija 0.9 meseci.
Odrediti, sa rizikom od 0.01, da li se proizvođač pridržava standarda.

Rešenje:
𝐻0 : 𝜇 ≥ 12; 𝐻1 :𝜇 < 12;

Kritična oblast je: 𝐾 = (−∞; −2,23)

𝑋̅−𝜇 11,5−12
Vrednost statistike testa je: 𝑍 = 𝜎 = 0.9 = -5,56;
√𝑛 √100

Kako vrednost statistike testa iz uzorka pripada kritičnoj oblasti možemo zaključiti da na
osnovu uzorka imamo dovoljno argumenata da odbacimo tvrdnju da proizvod odgovara standardu,
sa rizikom od 1%.

Primer 8.

Prosečna visina računa u jednom supermarketu je 1248 din. sa varijansom 166. Na osnovu uzetog
uzorka od 100 kupaca dobijeno je da je prosečna visina računa 1250 din. Da li se može reći sa
rizikom od 5% da je smanjena prosečna potrošnja?

Rešenje:

𝐻0 : 𝜇 ≤ 1248; 𝐻1 :𝜇 ≥ 1248;

Kritična oblast je: 𝐾 = (1,64; ∞)

𝑋̅−𝜇 1250−1248
Vrednost statistike testa je: 𝑍 = 𝜎 = √166
=1,55;
√𝑛 √100

Kako vrednost statistike testa iz uzorka ne pripada kritičnoj oblasti možemo zaključiti da
na osnovu uzorka nemamo dovoljno argumenata da odbacimo tvrđenje da prosečna potrošnja
opada sa rizikom od 5%.

Primer 9.

Proizvođač auto delova tvrdi da je procenat škarta u proizvodnji na mašini “A” najviše
2,5%. Da bi smo u svojstvu kupca te mašine proverili ovu tvrdnju izabrali smo uzorak od 250
proizvoda proizvedenih na mašini “A” i ustanovili da je broj škartnih proizvoda 5 komada. Ako je
nivo značajnosti 0,05 proveriti da li se moze prihvatiti tvrdnja proizvođača.
Rešenje:

H0 : π ≤ 0,025; H1 : π > 0,025; α = 0, 05.

Na osnovu podataka iz uzorka izračunavamo vrednost statistike Z:


5 0,025 ∙ 0,975
𝑝= = 0,02; 𝑆𝑝 = √ = 0,0099;
250 250
0,02 − 0,025
𝑍= = −0,5051.
0,0099
Vidi se da je
nπ0 = 250 ∙0,025 = 6,25 ≥ 5, n(1 ‒ π0) = 250∙ 0,975 = 243,75 ≥ 5.
Za dati rizik greške α = 0, 05, zα/2=1,64, kritična oblast je
K=(1,64; +∞).
Kako je z= ‒0,5051 < 1,64, to se prema pravilu odlučivanja u slučaju jednosmernog testa
može reći, da nemamo dovoljno argumenata da nultu hipotezu odbacimo odnosno da odbacimo
tvrdnju proizvođača da je procenat škarta u proizvodnji na mašini “A” najviše 2,5%.
Primer 10.
Kompanija koja vrši direktne isporuke na adrese kupca, prodaje kompjutere I kompjuterske
delove I tvrdi da se najmanje 90% svih porudžbina isporuči u roku od 72 sata nakon prijema.
Odeljenje za kontrolu kvaliteta u kompaniji često uzima uzorke da bi proverili da li je to tvrđenje
tačno. Nedavno izabran uzorak od 150 porudžbina pokazuje da je njih 129 bilo poslato u roku od
72 sata. Da li mislite da je tvrđenje kompanije tačno koristeći nivo značajnosti od 2,5%.
Rešenje:
129
n=150, 𝑝 = 150 = 0,86, α = 0, 025.

H0 : π0 ≥ 0,90 (tvrđenje kompanije je tačno)


H1 : π0 < 0,90 (tvrđenje kompanije je netačno)

nπ0 = 150(0,90) = 135 > 5, uzorak je veliki zato koristimo normalnu raspodelu da bi testirali
hipotezu.
Kritična oblast za dati nivo značajnosti α = 0, 025 je K: (−∞, −1,96)
Izračunavamo realizovanu vrednost statistike Z testa za 𝑝 = 0,86

0,90 ∙ 0,10
𝑆𝑝 = √ = 0,0244949;
150
0,86 − 0,90
𝑍= = −1,63 > −1,96
0,0244949

𝑍 = −1,63 ne pripada kritičnoj oblasti i zato ne odbacujemo tvrđenje


DODATAK (neće biti na drugom kolokvijumu)
χ2-kvadrat test i njegova primena
χ2-raspored je jedan od teorijskih rasporeda koji omogućava testiranje određenih
statističkih hipoteza. χ2- testovi koriste χ2- raspored. Kada broj stepeni slobode raste tada χ2-
raspored teži normalnom rasporedu (za n ≥ 30, a procedura testiranja je standardna).
χ2- test je vrlo praktičan test koji može poslužiti onda kad želimo utvrditi da li neke
dobijene frekvencije odstupaju od frekvencija koje očekujemo pod određenom pretpostavkom.
Ako pretpostavljamo da neka teorijska raspodela dobro opisuje empirijsku raspodelu
frekvencija, onda tu pretpostavku (hipotezu) proveravamo, primenom χ2- testa. Pomoću ovog
testa, takođe tražimo da li postoji povezanost između dve promenljive, a test pokazuje verovatnoću
te povezanosti.

Testiranje oblika rasporeda

Često želimo da saznamo da li se frekvencije koje smo dobili značajno razlikuju od


očekivanih frekvencija. Ta razlika se računa se prema sledećoj formuli:
𝑛
(𝑓0 − 𝑓𝑡 )2
χ2𝑟−𝑠−1 = ∑
𝑓𝑡
1

f0 − empirijska frekvencija,
ft − očekivana (teorijska) frekvencija,
r − broj modaliteta posmatrane slučajne veličine,
s − broj nepoznatih ocenjenih parametara na bazi uzorka.

Kako je Σf0 = Σft = n dobijamo da je:

(𝑓0 −𝑓𝑡 )2 𝑓02


χ2𝑟−𝑠−1 = ∑ =∑ – n.
𝑓𝑡 𝑓𝑡

Statistika testa ima χ2 - raspored sa ν= r‒s‒1 stepenom slobode. Broj stepeni slobode
definisan je kao broj nezavisnih promenljivih uključenih u izračunavanje.
Testira se hipoteza H0-obeležje X ima potpuno određenu raspodelu, protiv alternativne
hipoteze H1-obeležje X nema tu raspodelu, uz rizik α.
Uslov 𝑃𝐻0 (χ2𝑟−𝑠−1 ≥ χ2𝑟−𝑠−1,𝛼 ) = 𝛼

određuje kritičnu vrednost χ2𝑟−𝑠−1,𝛼 iz tablica χ2-rasporeda sa r‒s ‒1 stepenom slobode a uz rizik
𝛼.
Kritična oblast je: K: (χ2𝑟−𝑠−1,𝛼 ,+∞)
Primer 1.

Pomoću jednog testa testiramo 200 ljudi. Test je takve prirode da daje samo tri kategorije
rezultata: A = slab, B = prosečan, C = dobar. Kao rezultat merenja dobijene su frekvencije f0
prikazane u donjoj tabeli.

A B C
𝑓0 40 110 50

Postavlja se pitanje da li ovaj rezultat odstupa značajno od rezultata koji bismo očekivali
da je svojstvo među ispitanicima raspoređeno na sledeći način: 50 % prosečnih, 25% loših
(slabih) i 25% dobrih.
Rešenje:

A B C
𝑓𝑡 0,25 ∙ 200 = 50 0,5 ∙ 200 = 100 0,25 ∙ 200 = 50

Kad imamo samo jednu promenljivu s jednim nizom rezultata, broj stepeni slobode računa
se prema formuli n-1, pri čemu n znači ukupan broj kategorija (a ne ukupan broj frekvencija). U
ovom primeru imamo samo tri kategorije (A,B,C) pa je stepen slobode3-1=2.

Pošto želimo testirati na nivou značajnost od 5%, u tablici graničnih vrednost χ2 rasporeda
za 2 stepena slobode, granična vrednost je 5,991.

(𝑓0 − 𝑓𝑡 )2
⁄𝑓
𝑓0 𝑓𝑡 𝑓0 − 𝑓𝑡 (𝑓0 − 𝑓𝑡 )2 𝑡

40 50 -10 100 2
110 100 10 100 1
50 50 0 0 0 χ22 = 3

Kako je izračunata vrednost 3 manja od 5,991 zaključujemo da ne treba odbaciti


postavljenu hipotezu.
Dobijeni odgovor se statistički ne razlikuje značajno od odgovora koji bi očekivali das u
oni normalno raspoređeni među ispitanicima.
Sledeći postupak testiranja hipoteza najčešce primenjujemo ukoliko smo u mogućnosti da
koristimo neki od statističkih paketa za obradu podataka. Nije obavezno na pismenom zadatku.

Postupak testiranja zasnovan na p–vrednosti

Primenom ovog principa izračunavamo tzv. p-vrednost za realizovanu vrednost statistike


uzorka. Ako je nivo značajnosti unapred izabran, onda poredimo p-vrednost sa nivoom značajnosti
i donosimo odluku. Naglasimo da p-vrednost predstavlja verovatnoću, tako da se ovim u stvari
konvertuje vrednost bilo koje statistike testa na skalu od 0 do 1. Jednostavnim pravilom donosi se
odluka o tačnosti nulte hipoteze.
Pravilo odlučivanja na osnovu p-vrednosti glasi:

Ako je p-vrednost manja od nivoa značajnosti α, nulta hipoteza se odbacuje. U suprotnom,


kazaćemo da nemamo dovoljno argumenata da je odbacimo.

Zbog čestih grešaka potrebno je naglasiti sledeće:

• p-vrednost nije verovatnoća da je nulta hipoteza tačna,


• p-vrednost ništa ne govori o veličini između hipotetičke vrednosti i dobijenog rezultata
u uzorku.
• Ako je p-vrednost jednaka ili manja od nivoa značajnosti α, kažemo da je rezultat
statistički značajan na nivou α.

Praktična značajnost, međutim zavisi od veličine razlike, pa suviše male razlike između
hipotetičke i stvarne vrednosti nemaju nikakvu praktičnu ali imaju statističku značajnost. Pri tome
se često koristi tumačenje dobijene p- vrednosti kao u tabeli:

p-vrednost > 0,05 Nemamo dovoljno dokaza protiv H 0


p-vrednost < 0,05 Jaki dokazi da je H0 pogrešna
p-vrednost < 0,01 Veoma jaki dokazi da je H0 pogrešna
p-vrednost< 0,001 Izuzetno jaki dokazi da je H0 pogrešna

U slučaju ručne obrade podataka izračunavanje p-vrednosti moguće je kod relativno malog
broja testova, na primer kod Z testa.

Pokazaćemo ovaj postupak na sledećem primeru:

Od 2000 kutija pakovanja keksa sa deklarisanom teženom od 1700 g uzet je uzorak od 50


komada kutija i izračunata je prosečna težina 1677g sa standardnom devijacijom od 70 g. Da li
pakovanje kutija zadovoljava deklarisanu težinu uz rizik od 0,01?
i. Postavljanje hipoteza i određivanje nivoa značajnosti:

H0 : μ = 1700 i H1 : μ ≠ 1700, α = 0, 01

ii. Uzimamo podatke uzoraka i određujemo statistiku testa

𝑋̅ −μ 𝑆
𝑍= = −2,32, gde je 𝜎𝑋̅ = 𝑛𝑛.
𝜎𝑋
̅ √

𝑛
Kako je 𝑁=0,025<0,5 ne uzima se popravni factor.
Apsolutna vrednost ove statistike je 2,32, i postavlja se pitanje da li je dovoljno velika da
se sugeriše odbacivanje H0. Osnovni skup ima normalan raspored ili se može p rimeniti Centralna
granična teorema jer je n>30.

iii. Izračunavanje p-vrednosti

Kod dvosmernog testa gde su kritična odstupanja u oba smera. p-vrednost se množi sa 2,

2P(Z≥ |𝑧| = 2𝑃(𝑍 ≥ |−2,32|) = 2[1 − 𝑃(𝑍 < 2,32)] = 2(0,9898)=0,0204.

iv. Postavljanje pravila odlučivanja

1. Ako je p-vrednosti manja od nivoa značajnosti, H0 se odbacuje,


2. Ako je p-vrednosti veća od nivoa značajnosti, nema dovoljno argumenata da se H0 odbaci.
U posmatranom primeru je p-vrednost=0,0204>0,01 nema dovoljno argumenata da se H0
odbaci.

v. Donošenje odluke

Uz rizik od 1% zaključujemo da su ispunjeni uslovi da se prosečna težina kutija keksa ne


razlikuje od propisane.
Napomena: Da smo unapred izabrali drugi nivo značajnosti, npr. α = 0,05 pa sledi da je p-
vrednost=0,0204< 0,05. Tada ne bismo mogli prihvatiti nultu hipotezu i zaključili bi sa rizikom
od 5% da se pri pakovanju ne postiže deklarisana težina kutija keksa.

You might also like