Professional Documents
Culture Documents
Uvod
Statistička hipoteza je tvrdnja ili pretpostavka koja se odnosi na jednu ili više populacija. Struktura
testiranja hipoteza je formulisana s pojmom nulte hipoteze, koja se odnosi na hipotezu koja se želi testirati
i označava se s 𝐻0 . Odbijanje nulte hipoteze vodi k prihvatanju alternativne hipoteze označene s 𝐻1 .
Ukoliko se tvrdnja odnosi na matematičku relaciju između dvije vrijednosti, obično se ona u nultoj hipotezi
postavlja s znakom jednakosti, a u alternativnoj hipotezi s drugim znakom vezano za tvrdnju koju treba
ispitati (≠, <, >, ≤, ≥).
Postupak testiranja statističke hipoteze može dovesti do dva tipa pogrešnih zaključaka.
Odbijanje nulte hipoteze kada je ona tačna se naziva greškom I vrste i vjerovatnoća te greške je 𝛼.
Neodbijanje nulte hipoteze kada je ona pogrešna se naziva greškom II vrste i vjerovatnoća te greške je 𝛽.
Prvi se odnosi na situaciju kada je fiksirana vjerovatnoća greške I vrste i procedura se sastoji od sljedećih
koraka:
1. Postaviti nultu i alternativnu hipotezu.
2. Odabrati fiksni nivo značajnosti 𝛼.
3. Odabrati odgovarajuću test statistiku i formirati kritični region u ovisnosti od vrijednosti 𝛼.
4. Odbiti nultu hipotezu 𝐻0 ukoliko je proračunata test statistika u kritičnom regionu. U suprotnom,
ne treba odbiti ovu hipotezu.
1
Vjerovatnoća i statistika – Tutorijal 10
Elektrotehnički fakultet u Sarajevu, odsjek za Računarstvo i informatiku
2019/2020
Različiti tipovi statistika koji se mogu koristiti za testiranje hipoteza vezanih za srednje vrijednosti su
prikazani u nastavku:
Zadatak 1. Proporcija punoljetnih ljudi koji žive u malome gradu i posjeduju fakultetsku diplomu iznosi
otprilike 𝒑 = 𝟎. 𝟔. Za testiranje odgovarajuće hipoteze, odabran je proizvoljni uzorak od 𝟏𝟓 punoljetnih
ljudi. Ukoliko je broj onih (od odabranih) sa svršenim fakultetskim nivoom obrazovanja između 𝟔 i 𝟏𝟐,
ne treba odbiti nultu hipotezu da je 𝒑 = 𝟎. 𝟔; a u drugom slučaju, treba se zaključiti da je 𝒑 ≠ 𝟎. 𝟔.
Rješenje:
2
Vjerovatnoća i statistika – Tutorijal 10
Elektrotehnički fakultet u Sarajevu, odsjek za Računarstvo i informatiku
2019/2020
b) 𝛽 = 𝑃(6 ≤ 𝑋 ≤ 12|𝑝 = 0.5) = 𝑃(𝑋 ≤ 12|𝑝 = 0.5) − 𝑃(𝑋 ≤ 6|𝑝 = 0.5) = 0.9963 −
0.1509 = 0.8454.
𝛽 = 𝑃(6 ≤ 𝑋 ≤ 12|𝑝 = 0.7) = 𝑃(𝑋 ≤ 12|𝑝 = 0.7) − 𝑃(𝑋 ≤ 6|𝑝 = 0.7) = 0.8732 − 0.0037
= 0.8695
c) Ovaj test ne daje dobre rezultate za detektovanje razlika od 0.1 za vrijednost 𝑝.
Zadatak 2. Proizvoljnih 𝟒𝟎𝟎 ljudi iz nekoga grada je anketirano o tome da li se slažu s povećanjem poreza
na prodaju benzina za 𝟒% (a sredstva dobivena od povećanja poreza bi se iskoristila za popravak
gradskih ulica). Ukoliko je više od 𝟐𝟐𝟎, a manje od 𝟐𝟔𝟎 ljudi glasalo za novu poreznu taksu, može se
zaključiti da je bilo 𝟔𝟎% glasača za ovu taksu.
a) Odrediti vjerovatnoću da se dogodi greška tipa I ukoliko 𝟔𝟎% ljudi favorizuju povećanje poreza
na prodaju benzina.
b) Kolika je vjerovatnoća da se dogodi greška tipa II korištenjem ove test procedure ukoliko je
zapravo samo 𝟒𝟖% ljudi glasalo za dodatni porez na prodaju benzina?
Rješenje:
Podaci dati u postavci zadatka sugerišu da je riječ o binomnoj raspodjeli. Procedura proračuna uključuje
aproksimaciju binomne raspodjele normalnom, te proračun vjerovatnoće greške korištenjem z vrijednosti
i tabele A.3.
Zadatak 3. Prosječni životni vijek uzorka od 𝟏𝟎𝟎 umrlih u Sjedinjenim Američkim Državama je 𝟕𝟏. 𝟖
godina. Uz pretpostavku standardne devijacije od 𝟖. 𝟗 godina, treba ispitati da li navedeni podaci
sugerišu da će dužina životnog vijeka biti veća od 𝟕𝟎 godina. Pri proračunu koristiti nivo značajnosti od
𝟎. 𝟎𝟓.
3
Vjerovatnoća i statistika – Tutorijal 10
Elektrotehnički fakultet u Sarajevu, odsjek za Računarstvo i informatiku
2019/2020
Rješenje:
Za nivo značajnosti od 0.05, vrijednost 𝑧0.05 = 1.645 (tabela A.3), pa je kritični region 𝑧 > 1.645 gdje je
𝑥̅ −𝜇
𝑧 = 𝜎/ 𝑛0.
√
Finalna odluka je da se odbije hipoteza 𝐻0 i zaključi da je dužina životnog vijeka, u prosjeku, veća od 70
godina.
Rješenje:
U ovom slučaju će se koristiti t-vrijednosti za testiranje hipoteze (jer je poznata standardna devijacija
uzorka, a ne populacije). Isčitavanje odgovarajuće t-vrijednosti se vrši iz tabele A.4.
Za nivo značajnosti od 0.05 i broj stepeni slobode 20 − 1 = 19, vrijednost 𝑡0.05 = 1.729, pa je kritični
𝑥̅ −𝜇0
region 𝑡 < −1.729 gdje je 𝑡 = .
𝑠/√𝑛
Finalna odluka je da se odbije hipoteza 𝐻0 i zaključi da je, u prosjeku, manje od 35 minuta, potrebno da
se uradi ispit.
Zadatak 5. Graditelj tvrdi da su u 𝟕𝟎% novih kuća u (gradu) Richmondu instalirane toplotne pumpe.
Ispitati tačnost ove tvrdnje ukoliko je proizvoljno istraživanje novih kuća u ovome gradu pokazalo da je
njih 𝟖 (od 𝟏𝟓) imalo instalirano topolotne pumpe? Koristiti nivo značajnosti 𝟎. 𝟏 u samome proračunu.
Rješenje:
Nivo značajnosti je 0.1 i vrši se ispitivanje test statistike na binomnu varijablu 𝑋 sa 𝑝 = 0.7 i 𝑛 = 15.
4
Vjerovatnoća i statistika – Tutorijal 10
Elektrotehnički fakultet u Sarajevu, odsjek za Računarstvo i informatiku
2019/2020
Finalna odluka je da se ne odbija (prihvata) hipoteza 𝐻0 i ne treba sumnjati u tačnost razmatrane tvrdnje.
Zadatak 6. Provedeno je anketiranje stanovnika nekog grada i okolnog ruralnog područja oko
konstrukcije novih (predloženih) hemijskih postrojenja. Ukoliko je 𝟏𝟐𝟎 (od 𝟐𝟎𝟎) anketiranih iz grada,
te 𝟐𝟒𝟎 (od 𝟓𝟎𝟎) iz okolnog ruralnog područja podržalo prijedlog, ispitati tvrdnju da je veća proporcija
anketiranih iz grada koji podržavaju navedeni prijedlog, nego proporcija anketiranih iz okolnog ruralnog
područja. Pri proračunu koristiti nivo značajnosti 𝜶 = 𝟎. 𝟎𝟓.
Rješenje:
Neka 𝑝1 i 𝑝2 predstavljaju stvarne proporcije glasača iz grada i ruralnog područja, koji podržavaju prijedlog,
respektivno.
Za nivo značajnosti od 0.05, vrijednost 𝑧0.05 = 1.645 (tabela A.3), pa je kritični region 𝑧 > 1.645 (region
se postavlja na ovaj način jer je alternativna hipoteza 𝑝1 > 𝑝2 ). Da bi se izračunala vrijednost 𝑧, prvo treba
𝑥 𝑥 𝑥 +𝑥
̂1 = 𝑛1 = 0.6, 𝑝
odrediti sljedeće vrijednosti: 𝑝 ̂2 = 𝑛2 = 0.48 i 𝑝̂ = 𝑛1 +𝑛2 = 0.51.
1 2 1 2
𝑝
̂1 − 𝑝
̂2
𝑧= = 2.9
1 1
√𝑝̂ (1 − 𝑝̂ ) ( + )
𝑛1 𝑛2
Finalna odluka je da se odbije hipoteza 𝐻0 i zaključi da je proporcija glasača u gradu koji favoriziraju
prijedlog veća nego proporcija takvih glasača u ruralim područjima.