Professional Documents
Culture Documents
Kao što smo napomenuli ukoliko postoje određene informacije o vrednostima parametra osnovnog
skupa tada se provodi postupak testiranja statističkih hipoteza.
Cilj testiranja je da se ispita prihvatljivost tvrdnji ili pretpostavki koje se tiču osobina
jednog ili više osnovnih skupova. Kao i kod ocenjivanja parametara do tačnih vrednosti se može
doći samo sveobuhvatnim posmatranjem jedinica skupa. Takođe, da bismo bili potpuno sigurni u
tačnost navedenih pretpostavki i tvrđenja morali bismo izvršiti popis. Kako to obično ne činimo,
prilikom testiranja hipoteza koristimo uzorak i na osnovu njega donosimo odluku da li su
postavljene pretpostavke prihvatljive ili nisu.
Statističke testove možemo klasifikovati na dva načina. Prema broju uzoraka koje
analiziramo testove delimo na:
Tek posle drugog svetskog rata počeo je ubrzan razvoj druge vrste testova, koji nemaju
preduslov normalnosti. U ovu grupu testova spadaju resampling testovi.U statističkoj teoriji
formulisan je veliki broj testova za različite namene, jer ne postoji jedan, „savršen“ test, koji bi
bio optimalan u svakoj mogućoj situaciji. Situacija se potpuno promenila poslednjih godina, sa
opštom dostupnošću računara i statističkih softvera. Zbog toga se naglasak stavlja, ne na puku
primenu nekog testa, već na ispitivanje preduslova na kojima se test zasniva i interpretaciji
rezultata.
Postupak testiranja hipoteze primenom pristupa zasnovanog na
kritičnoj vrednosti
Treba posebno naglasiti da su drugi i peti korak izuzetno važni. Preskakanje drugog koraka,
posledica je upotrebe neodgovarajućeg testa, a pogrešnim tumačenjem rezultata u petom koraku
može se izvući pogrešan zaključak.
Primer: H0:( μ=5cm) protiv H1:( μ≠5cm). H0 je prosta hipoteza jer se tvrdi da je prosečna
dužina tačno 5 cm, dok je H1 složena hipoteza jer prosečna dužina može biti bilo koja vrednost
različita od 5 cm.
A H0 : μ = μ0 H1 : μ ≠ μ0
B H0 : μ ≤ μ0 H1 : μ > μ0
C H0 : μ ≥ μ0 H1 : μ < μ0
Prva varijanta podrazumeva dvosmerni test ili dvostrani test, dok druge dve varijante
podrazumevaju tzv. Jednosmerne testove (levostrani I desnostrani test). Ono što se u praksi ne sme
raditi je da primenimo dvosmerni test, a da nakon toga, nezadovoljni rezultatom, na istim
podacima koristimo jednosmerni test. U postupku testiranja naše uverenje formulišemo u obliku
alternativne hipoteze, a proveravamo samo nultu. Polazimo od pretpostavke da je H0 istinita i
nastojimo da na osnovu uzorka ovu pretpostavku osporimo. Alternativnu hipotezu ne
proveravamo, već je automatski prihvatamo kao istinu, ako podaci svedoče protiv nulte hipoteze.
Kod donošenja odluke o prihvatanju ili odbacivanju nulte hipoteze moguće su sledeće
greške:
Greška I vrste je verovatnoća da se odbaci hipoteza H0 kada je ona stvarno tačna i označavamo je
sa ∝ , ∝-verovatnoća greške prvog tipa i naziva se nivo ili prag značajnosti.
Mora se voditi računa da rizik greške nije isto što i greška, rizik greške je verovatnoća da ćemo
napraviti grešku. Ishodi testiranja hipoteze u statističkom premeru takođe dovode do dve
mogućnosti. Nulta hipoteza može u stvarnosti biti istinita ili neistinita. S druge strane, podaci mogu
biti ili saglasni sa H0 ili joj protivrečiti. Dakle, postoji mogućnost da podaci uzorka dovedu do
ispravne odluke i podrže istinitu hipotezu ili da ospore pogrešnu nultu hipotezu. Međutim, kako
uzorak nikada nije savršeno reprezentativan, moguća su i sledeća dva ishoda, tj. da se informacija
uzorka saglasi sa neistinitom ili protivreči istinitoj nultoj hipotezi.
Stvarno stanje
H0 je istinita H0 nije istinita
H0 se ne ispravna odluka greška II vrste-
odbacuje 1- 𝜶 β
Odluka
H0 se odbacuje greška I vrste- ispravna odluka
α 1-β
Najčešće se koristi dva nivoa značajnosti α = 0,05 ili α = 0,01, što znači da svesno unapred
prihvatamo da ćemo u proseku u 5% odnosno 1% slučajeva napraviti grešku ako se odbaciti
istinita nulta hipoteza.
Bilo za koji metod da se odlučimo nikada nećemo saznati da li smo doneli ispravnu odluku
pre svega što radimo samo sa uzorkom. Zato naše zaključke uvek moramo tumačiti tako da se
ogradimo i ukažemo na mogućnost greške.
Korak 2. Izbor testa
Optimalan izbor testa pri rešavanju postavljenog problema, uz uslov da je raspored skupa
normalan, svodi se na dva testa, ali u čak šest različitih vidova. Takođe, može se sagledati da nam
se pri testiranju aritmetičke sredine nude dve opcije, Z test i t-test. U praksi je gotovo uvek
standardna devijacija nepoznata, tako da se skoro isključivo koristi t-test. Dakle za svaki od
navedenih problema možemo koristiti jedan optimalan parametarski test.
Ako statistika testa ima normalan raspored koristićemo naravno tablice standardizovanog
normalnog rasporeda; ako ima t-raspored, kritične vrednosti nalazimo u t- tablicama. Jačina testa
je verovatnoća da se odbaci pogrešna nulta hipoteza obeležava se sa 1‒α.
Oblast odbacivanja H0 Oblast prihvatanja H0 Oblast odbacivanja H0 Oblast prihvatanja H0 Oblast odbacivanja H0
Jasno je da mora da se formuliše neki indikator koji bi merio razliku između naše
hipotetičke vrednosti i empirijske evidencije iz uzorka. Ako bi taj indikator imao malu vrednost,
ne bismo mogli da tvrdimo da je nulta hipoteza netačna. Tu razliku, zbog pre svega mernih
jedinica, potrebno je još podeliti sa standardnom greškom ocene.
• Ako je test dvosmeran, tada se posmatra apsolutna vrednost statistike testa, pa ako je ona
veća od tablične odbacuje se nulta hipoteza i usvaja alternativna.
• Ako je test jednosmeran, a alternativna hipoteza levostrana, tada statistika testa treba da
bude manja od kritične vrednosti, uz odgovarajući predznak.
• U slučaju jednosmernog ali desnostranog testa, statistika testa mora da bude veća od
tablične vrednosti da bi se nulta hipoteza odbacila.
Primer:
• H0 treba odbaciti ako je |𝐳| >zα/2,
u suprotnom H0 ne treba odbaciti;
• H0 treba odbaciti ako je z < - 𝒛𝜶;
u suprotnom H0 ne treba odbaciti;
• H0 treba odbaciti ako je z > 𝒛𝜶 ;
u suprotnom H0 ne treba odbaciti.
Testiranje hipoteze o aritmetičkoj sredini osnovnog skupa
𝑋̅ −𝜇0
Statistika testa je: 𝑍 = : N(0;1)
𝜎𝑋
̅
Primer 1.
Rešenje:
Sprovešćemo postupak testiranja po etapama:
1. Formiramo nultu i alternativnu hipotezu:
H0 : μ = 485, H1 : μ ≠ 485, α = 0,05.
2. Biramo statistiku testa i izračunavamo njenu vrednost na osnovu uzorka:
𝑋̅ −𝜇0 478−485
𝑍= 𝜎 = 27 =-2,59.
√𝑛 √100
3. Postavljamo pravilo odlučivanja na osnovu kojeg zadržavamo ili odbacujemo nultu hipotezu.
Kako je u pitanju dvosmerni test, za dati rizik greške od 0,05 kritična oblast je:
K = (−∞;−1,96)∪(1,96;+∞)
Kako vrednost statistike testa iz uzorka pripada kritičnoj oblasti
Z = −2,59∈K , možemo zaključiti da nultu hipotezu ne prihvatamo sa rizikom 5 %.
𝑋̅ −𝜇0 𝑋̅ −𝜇0
Statistika testa: 𝑡 = = 𝑆𝑛 .
𝑆𝑋
̅
√𝑛
B:H0 treba odbaciti ako je t > tn-1 ;α; u suprotnom H0 ne treba odbaciti;
C:H0 treba odbaciti ako je t < ‒ tn-1 ;α; u suprotnom H0 ne treba odbaciti.
Primer 2.
Potrebno je da procenat vlažnosti smokava pri sušenju bude manje od 10%. Na osnovu
uzorka od 20 kg izmereni procenat vlažnosti je 12,2%, sa standardnom devijacijom od 1,2%. Sa
rizikom od 5% proveriti da li je zadovoljen uslov o procentu vlažnosti.
Rešenje:
𝑋̅ −μ 12,2−10
𝑡= 𝑆𝑛 = 1,2 = 8,20.
√𝑛 √20
3. Kako je u pitanju jednosmerni test, za dati rizik greške od 0,05 I broj stepeni slobode n-1 čitamo
iz t-raspodele vrednost kritične tačke je t19;0,05=1,7291, sledi
A H0 : π = π0 H1 : π ≠ π0
B H 0 : π ≤ π0 H1 : π > π0
C H0 : π ≥ π0 H1 : π < π0
Statistika testa je:
𝑝−𝜋0 𝜋0 (1−𝜋0 )
𝑍= , gde je 𝑆𝑃 =√ .
𝑆𝑝 𝑛
Primer 3.
Od 150 klijenata banke “XY” njih 138 se izjasnilo da je zadovoljno uslugama banke. Na
nivou značajnosti od 0,05 ispitati da li se može zadržati hipoteza da je 85% klijenata zadovoljno
uslugama banke.
Rešenje:
H0 : π = 0,85; H1 : π ≠ 0,85; α = 0, 05.
138
Procenat klijenata zadovoljnih uslugama banke na osnovu uzorka je 𝑝 = 150 = 0,92;
Realizovana vrednost statistike Z testa za 𝑝 = 0,92 izračunava se:
0,85∙0,15
𝑆𝑝 = √ = 0,0292;
150
0,92 − 0,85
𝑍= = 2,397
0,0292
Koristimo normalnu raspodelu za α = 0,05 i zα/2=1,96.
Primer 4.
Uprava jednog sportskog kluba tvrdi da njihovi članovi treniraju najmanje 15 časova
nedeljno. U nameri da se proveri ova tvrdnja na slučajan način je izabrano 35 članova tog kluba i
utvrđeno je da oni u proseku treniraju 13,8 h nedeljno. Poznato je da je standardna devijacija
osnovnog skupa 3,5. Da li se može prihvatiti tvrdnja uprave kluba sa 99% pouzdanosti?
Rešenje:
3. Postavljamo pravilo odlučivanja na osnovu kojeg zadržavamo ili odbacujemo nultu hipotezu.
Kako je u pitanju jednosmerni test, za dati rizik greške od 0,01 kritična oblast je K = (‒∞; ‒ 2,33)
Kako vrednost statistike testa iz uzorka ne pripada kritičnoj oblasti,
Z = ‒2,03 > ‒2,33
Primer 5.
Rešenje:
Statistika testa je
𝑋̅−μ 𝑆𝑛
𝑍= , gde je 𝜎𝑋̅ = .
𝜎𝑋
̅ √𝑛
Na osnovu uzorka izračunata vrednost je:
1677−1700
𝑍= 70 = -2,32.
√50
Postavljamo pravilo odlučivanja na osnovu kojeg zadržavamo ili odbacujemo nultu
hipotezu. Kako je u pitanju dvosmerni test, za dati rizik greške od 0,01 kritična oblast je:
K = (−∞;−2,58)∪(2,58;+∞)
Kako vrednost statistike testa iz uzorka ne pripada kritičnoj oblasti možemo zaključiti da
nemamo dovoljno argumenata da nultu hipotezu odbacimo sa rizikom 1%.
99%
0,5% 0,5%
Primer 6.
Prosečan broj pročitanih knjiga među članovima jedne biblioteke je 12,5 komada. U želji da se
proveri ovo tvrđenje izabran je slučajni uzorak od 18 članova i ustanovljeno je da je prosečan broj
pročitanih knjiga među ovim članovima 12,9, sa standardnom devijacijom 0,8. Da li se može reći,
pod pretpostavkom da broj pročitanih knjiga ima normalan raspored, da se na nivou značajnosti
od 1% prosečan broj pročitanih knjiga među članovima razlikuje od 12,5 komada.
Rešenje:
𝐻0 : 𝜇 = 12,5; 𝐻1 :𝜇 ≠ 12,5;
𝑡𝑛−1;𝛼⁄2 = 𝑡17;0,005 = 2,898 𝑠𝑙𝑒𝑑𝑖 kritična oblast je: 𝐾 = (−∞; −2,898) ∪ (2,898; ∞).
𝑋̅−𝜇 12,9−12,5
Vrednost statistike testa je: 𝑡𝑛−1;𝛼 = 𝑆 = 0,8 = 2,12
2
√𝑛 √18
Kako vrednost statistike testa iz uzorka ne pripada kritičnoj oblasti možemo zaključiti da
na osnovu uzorka nemamo dovoljno argumenata da odbacimo tvrđenje H0 da se prosečan broj
pročitanih knjiga razlikuje od 12,5 sa rizikom od 1 %.
Primer 7.
Proizvod odgovara standardima ako je njegov radni vek najmanje godinu dana. U uzorku od 100
proizvoda prosečno vreme trajanja bilo je 11,5 meseci, a standardna devijacija 0.9 meseci.
Odrediti, sa rizikom od 0.01, da li se proizvođač pridržava standarda.
Rešenje:
𝐻0 : 𝜇 ≥ 12; 𝐻1 :𝜇 < 12;
𝑋̅−𝜇 11,5−12
Vrednost statistike testa je: 𝑍 = 𝜎 = 0.9 = -5,56;
√𝑛 √100
Kako vrednost statistike testa iz uzorka pripada kritičnoj oblasti možemo zaključiti da na
osnovu uzorka imamo dovoljno argumenata da odbacimo tvrdnju da proizvod odgovara standardu,
sa rizikom od 1%.
Primer 8.
Prosečna visina računa u jednom supermarketu je 1248 din. sa varijansom 166. Na osnovu uzetog
uzorka od 100 kupaca dobijeno je da je prosečna visina računa 1250 din. Da li se može reći sa
rizikom od 5% da je smanjena prosečna potrošnja?
Rešenje:
𝐻0 : 𝜇 ≤ 1248; 𝐻1 :𝜇 ≥ 1248;
𝑋̅−𝜇 1250−1248
Vrednost statistike testa je: 𝑍 = 𝜎 = √166
=1,55;
√𝑛 √100
Kako vrednost statistike testa iz uzorka ne pripada kritičnoj oblasti možemo zaključiti da
na osnovu uzorka nemamo dovoljno argumenata da odbacimo tvrđenje da prosečna potrošnja
opada sa rizikom od 5%.
Primer 9.
Proizvođač auto delova tvrdi da je procenat škarta u proizvodnji na mašini “A” najviše
2,5%. Da bi smo u svojstvu kupca te mašine proverili ovu tvrdnju izabrali smo uzorak od 250
proizvoda proizvedenih na mašini “A” i ustanovili da je broj škartnih proizvoda 5 komada. Ako je
nivo značajnosti 0,05 proveriti da li se moze prihvatiti tvrdnja proizvođača.
Rešenje:
nπ0 = 150(0,90) = 135 > 5, uzorak je veliki zato koristimo normalnu raspodelu da bi testirali
hipotezu.
Kritična oblast za dati nivo značajnosti α = 0, 025 je K: (−∞, −1,96)
Izračunavamo realizovanu vrednost statistike Z testa za 𝑝 = 0,86
0,90 ∙ 0,10
𝑆𝑝 = √ = 0,0244949;
150
0,86 − 0,90
𝑍= = −1,63 > −1,96
0,0244949
f0 − empirijska frekvencija,
ft − očekivana (teorijska) frekvencija,
r − broj modaliteta posmatrane slučajne veličine,
s − broj nepoznatih ocenjenih parametara na bazi uzorka.
Statistika testa ima χ2 - raspored sa ν= r‒s‒1 stepenom slobode. Broj stepeni slobode
definisan je kao broj nezavisnih promenljivih uključenih u izračunavanje.
Testira se hipoteza H0-obeležje X ima potpuno određenu raspodelu, protiv alternativne
hipoteze H1-obeležje X nema tu raspodelu, uz rizik α.
Uslov 𝑃𝐻0 (χ2𝑟−𝑠−1 ≥ χ2𝑟−𝑠−1,𝛼 ) = 𝛼
određuje kritičnu vrednost χ2𝑟−𝑠−1,𝛼 iz tablica χ2-rasporeda sa r‒s ‒1 stepenom slobode a uz rizik
𝛼.
Kritična oblast je: K: (χ2𝑟−𝑠−1,𝛼 ,+∞)
Primer 1.
Pomoću jednog testa testiramo 200 ljudi. Test je takve prirode da daje samo tri kategorije
rezultata: A = slab, B = prosečan, C = dobar. Kao rezultat merenja dobijene su frekvencije f0
prikazane u donjoj tabeli.
A B C
𝑓0 40 110 50
Postavlja se pitanje da li ovaj rezultat odstupa značajno od rezultata koji bismo očekivali
da je svojstvo među ispitanicima raspoređeno na sledeći način: 50 % prosečnih, 25% loših
(slabih) i 25% dobrih.
Rešenje:
A B C
𝑓𝑡 0,25 ∙ 200 = 50 0,5 ∙ 200 = 100 0,25 ∙ 200 = 50
Kad imamo samo jednu promenljivu s jednim nizom rezultata, broj stepeni slobode računa
se prema formuli n-1, pri čemu n znači ukupan broj kategorija (a ne ukupan broj frekvencija). U
ovom primeru imamo samo tri kategorije (A,B,C) pa je stepen slobode3-1=2.
Pošto želimo testirati na nivou značajnost od 5%, u tablici graničnih vrednost χ2 rasporeda
za 2 stepena slobode, granična vrednost je 5,991.
(𝑓0 − 𝑓𝑡 )2
⁄𝑓
𝑓0 𝑓𝑡 𝑓0 − 𝑓𝑡 (𝑓0 − 𝑓𝑡 )2 𝑡
40 50 -10 100 2
110 100 10 100 1
50 50 0 0 0 χ22 = 3
Praktična značajnost, međutim zavisi od veličine razlike, pa suviše male razlike između
hipotetičke i stvarne vrednosti nemaju nikakvu praktičnu ali imaju statističku značajnost. Pri tome
se često koristi tumačenje dobijene p- vrednosti kao u tabeli:
U slučaju ručne obrade podataka izračunavanje p-vrednosti moguće je kod relativno malog
broja testova, na primer kod Z testa.
H0 : μ = 1700 i H1 : μ ≠ 1700, α = 0, 01
𝑋̅ −μ 𝑆
𝑍= = −2,32, gde je 𝜎𝑋̅ = 𝑛𝑛.
𝜎𝑋
̅ √
𝑛
Kako je 𝑁=0,025<0,5 ne uzima se popravni factor.
Apsolutna vrednost ove statistike je 2,32, i postavlja se pitanje da li je dovoljno velika da
se sugeriše odbacivanje H0. Osnovni skup ima normalan raspored ili se može p rimeniti Centralna
granična teorema jer je n>30.
Kod dvosmernog testa gde su kritična odstupanja u oba smera. p-vrednost se množi sa 2,
v. Donošenje odluke