You are on page 1of 5

Vjerovatnoća i statistika – Tutorijal 10

Elektrotehnički fakultet u Sarajevu, odsjek za Računarstvo i informatiku


2019/2020

Uvod
Statistička hipoteza je tvrdnja ili pretpostavka koja se odnosi na jednu ili više populacija. Struktura
testiranja hipoteza je formulisana s pojmom nulte hipoteze, koja se odnosi na hipotezu koja se želi testirati
i označava se s 𝐻0 . Odbijanje nulte hipoteze vodi k prihvatanju alternativne hipoteze označene s 𝐻1 .
Ukoliko se tvrdnja odnosi na matematičku relaciju između dvije vrijednosti, obično se ona u nultoj hipotezi
postavlja s znakom jednakosti, a u alternativnoj hipotezi s drugim znakom vezano za tvrdnju koju treba
ispitati (≠, <, >, ≤, ≥).

Postupak testiranja statističke hipoteze može dovesti do dva tipa pogrešnih zaključaka.
Odbijanje nulte hipoteze kada je ona tačna se naziva greškom I vrste i vjerovatnoća te greške je 𝛼.
Neodbijanje nulte hipoteze kada je ona pogrešna se naziva greškom II vrste i vjerovatnoća te greške je 𝛽.

Općenito, postoje dva česta pristupa u postupku testiranja hipoteza.

Prvi se odnosi na situaciju kada je fiksirana vjerovatnoća greške I vrste i procedura se sastoji od sljedećih
koraka:
1. Postaviti nultu i alternativnu hipotezu.
2. Odabrati fiksni nivo značajnosti 𝛼.
3. Odabrati odgovarajuću test statistiku i formirati kritični region u ovisnosti od vrijednosti 𝛼.
4. Odbiti nultu hipotezu 𝐻0 ukoliko je proračunata test statistika u kritičnom regionu. U suprotnom,
ne treba odbiti ovu hipotezu.

Drugi se zasniva na proračunu 𝑃 vrijednosti (testiranje značajnosti) i procedura se sastoji od sljedećih


koraka:
1. Postaviti nultu i alternativnu hipotezu.
2. Odabrati odgovarajuću testnu statistiku.
3. Izračunati 𝑃 vrijednost bazirano na izračunatoj vrijednosti iz test statistike.
4. Izvršiti odlučivanje bazirano na 𝑃 vrijednosti i znanju čitavog sistema.

Testiranje hipoteze vezane za proporciju se sastoji iz sljedećih koraka:


1. Postaviti nultu i alternativnu hipotezu.
2. Odabrati fiksni nivo značajnosti 𝛼.
3. Testna statistika se odnosi na binomnu varijablu 𝑋 s vjerovatnoćom uspjeha 𝑝 = 𝑝0 .
4. Odrediti 𝑥, prosječni broj uspjeha i izračunati odgovarajuću 𝑃 vrijednost.
5. Odbiti nultu hipotezu 𝐻0 ukoliko je 𝑃 ≤ 𝛼. U suprotnom, ne treba odbiti ovu hipotezu.

1
Vjerovatnoća i statistika – Tutorijal 10
Elektrotehnički fakultet u Sarajevu, odsjek za Računarstvo i informatiku
2019/2020

Različiti tipovi statistika koji se mogu koristiti za testiranje hipoteza vezanih za srednje vrijednosti su
prikazani u nastavku:

Zadatak 1. Proporcija punoljetnih ljudi koji žive u malome gradu i posjeduju fakultetsku diplomu iznosi
otprilike 𝒑 = 𝟎. 𝟔. Za testiranje odgovarajuće hipoteze, odabran je proizvoljni uzorak od 𝟏𝟓 punoljetnih
ljudi. Ukoliko je broj onih (od odabranih) sa svršenim fakultetskim nivoom obrazovanja između 𝟔 i 𝟏𝟐,
ne treba odbiti nultu hipotezu da je 𝒑 = 𝟎. 𝟔; a u drugom slučaju, treba se zaključiti da je 𝒑 ≠ 𝟎. 𝟔.

a) Izračunati 𝜶 uz pretpostavku da je 𝒑 = 𝟎. 𝟔. Pri proračunu koristiti binomijalnu raspodjelu.


b) Izračunati 𝜷 za alternativne vrijednosti 𝒑 = 𝟎. 𝟓 i 𝒑 = 𝟎. 𝟕.
c) Da li je ovo dobra testna procedura? (Obrazložiti odgovor)

Rješenje:

a) 𝛼 = 𝑃(𝑋 ≤ 5|𝑝 = 0.6) + 𝑃(𝑋 ≥ 13|𝑝 = 0.6) = 0.0338 + (1 − 0.9948) = 0.039;

2
Vjerovatnoća i statistika – Tutorijal 10
Elektrotehnički fakultet u Sarajevu, odsjek za Računarstvo i informatiku
2019/2020

b) 𝛽 = 𝑃(6 ≤ 𝑋 ≤ 12|𝑝 = 0.5) = 𝑃(𝑋 ≤ 12|𝑝 = 0.5) − 𝑃(𝑋 ≤ 6|𝑝 = 0.5) = 0.9963 −
0.1509 = 0.8454.

𝛽 = 𝑃(6 ≤ 𝑋 ≤ 12|𝑝 = 0.7) = 𝑃(𝑋 ≤ 12|𝑝 = 0.7) − 𝑃(𝑋 ≤ 6|𝑝 = 0.7) = 0.8732 − 0.0037
= 0.8695
c) Ovaj test ne daje dobre rezultate za detektovanje razlika od 0.1 za vrijednost 𝑝.

Zadatak 2. Proizvoljnih 𝟒𝟎𝟎 ljudi iz nekoga grada je anketirano o tome da li se slažu s povećanjem poreza
na prodaju benzina za 𝟒% (a sredstva dobivena od povećanja poreza bi se iskoristila za popravak
gradskih ulica). Ukoliko je više od 𝟐𝟐𝟎, a manje od 𝟐𝟔𝟎 ljudi glasalo za novu poreznu taksu, može se
zaključiti da je bilo 𝟔𝟎% glasača za ovu taksu.

a) Odrediti vjerovatnoću da se dogodi greška tipa I ukoliko 𝟔𝟎% ljudi favorizuju povećanje poreza
na prodaju benzina.
b) Kolika je vjerovatnoća da se dogodi greška tipa II korištenjem ove test procedure ukoliko je
zapravo samo 𝟒𝟖% ljudi glasalo za dodatni porez na prodaju benzina?

Rješenje:

Podaci dati u postavci zadatka sugerišu da je riječ o binomnoj raspodjeli. Procedura proračuna uključuje
aproksimaciju binomne raspodjele normalnom, te proračun vjerovatnoće greške korištenjem z vrijednosti
i tabele A.3.

a) 𝑛 = 500, 𝑝 = 0.6, 𝜇 = 𝑛𝑝 = 240, 𝜎 = √𝑛𝑝𝑞 = 9.798


260−240 220−240
Z-vrijednosti su: 𝑧1 = 9.798
= 2.04, 𝑧2 = 9.798
= −2.04
Tražena vjerovatnoća greške tipa I je:
𝛼 = 𝑃(𝑍 < −2.04) + 𝑃(𝑍 > 2.04) = 𝑃(𝑍 < −2.04) + 1 − 𝑃(𝑍 < 2.04)
= 0.0207 + 1 − 0.9793 = 0.0414

b) Kada je 𝑝 = 0.48, onda 𝜇 = 192 i 𝜎 = 9.992 s Z-vrijednostima:


220 − 192 260 − 192
𝑧1 = = 2.8, 𝑧2 = = 6.94
9.992 9.798
Tražena vjerovatnoća greške tipa II je:
𝛽 = 𝑃(2.8 < 𝑍 < 6.94) = 𝑃(𝑍 < 6.94) − 𝑃(𝑍 < 2.8) = 1 − 0.9974 = 0.0026

Zadatak 3. Prosječni životni vijek uzorka od 𝟏𝟎𝟎 umrlih u Sjedinjenim Američkim Državama je 𝟕𝟏. 𝟖
godina. Uz pretpostavku standardne devijacije od 𝟖. 𝟗 godina, treba ispitati da li navedeni podaci
sugerišu da će dužina životnog vijeka biti veća od 𝟕𝟎 godina. Pri proračunu koristiti nivo značajnosti od
𝟎. 𝟎𝟓.

3
Vjerovatnoća i statistika – Tutorijal 10
Elektrotehnički fakultet u Sarajevu, odsjek za Računarstvo i informatiku
2019/2020

Rješenje:

Postavljaju se hipoteze na sljedeći način: 𝐻0 : 𝜇 = 70 (godina), 𝐻1 : 𝜇 > 70 (godina).

Za nivo značajnosti od 0.05, vrijednost 𝑧0.05 = 1.645 (tabela A.3), pa je kritični region 𝑧 > 1.645 gdje je
𝑥̅ −𝜇
𝑧 = 𝜎/ 𝑛0.

Uvrštavanjem vrijednosti datih u zadatku se izračunava: 𝑧 = 2.02.

Finalna odluka je da se odbije hipoteza 𝐻0 i zaključi da je dužina životnog vijeka, u prosjeku, veća od 70
godina.

Zadatak 4. Prema ranijim iskustvima bi se moglo zaključiti da je vrijeme neophodno maturantima da


urade (standadizirani) finalni test normalna slučajna varijabla s srednjom vrijednosti od 𝟑𝟓 minuta.
Ukoliko je proizvoljnom skupu od 𝟐𝟎 maturanata trebalo u prosjeku 𝟑𝟑. 𝟏 minuta da riješe ovaj test (uz
standardnu devijaciju od 𝟒. 𝟑 minute), testirajte hipotezu (s nivoom značajnosti 𝟎. 𝟎𝟓) da je 𝝁 = 𝟑𝟓
(minuta), u odnosu na suprotnu da je 𝝁 < 𝟑𝟓.

Rješenje:

U ovom slučaju će se koristiti t-vrijednosti za testiranje hipoteze (jer je poznata standardna devijacija
uzorka, a ne populacije). Isčitavanje odgovarajuće t-vrijednosti se vrši iz tabele A.4.

Postavljaju se hipoteze na sljedeći način: 𝐻0 : 𝜇 = 35 (minuta), 𝐻1 : 𝜇 < 35 (minuta).

Za nivo značajnosti od 0.05 i broj stepeni slobode 20 − 1 = 19, vrijednost 𝑡0.05 = 1.729, pa je kritični
𝑥̅ −𝜇0
region 𝑡 < −1.729 gdje je 𝑡 = .
𝑠/√𝑛

Uvrštavanjem vrijednosti datih u zadatku se izračunava: 𝑡 = −1.98.

Finalna odluka je da se odbije hipoteza 𝐻0 i zaključi da je, u prosjeku, manje od 35 minuta, potrebno da
se uradi ispit.

Zadatak 5. Graditelj tvrdi da su u 𝟕𝟎% novih kuća u (gradu) Richmondu instalirane toplotne pumpe.
Ispitati tačnost ove tvrdnje ukoliko je proizvoljno istraživanje novih kuća u ovome gradu pokazalo da je
njih 𝟖 (od 𝟏𝟓) imalo instalirano topolotne pumpe? Koristiti nivo značajnosti 𝟎. 𝟏 u samome proračunu.

Rješenje:

Postavljaju se hipoteze na sljedeći način: 𝐻0 : 𝑝 = 0.7, 𝐻1 : 𝑝 ≠ 0.7.

Nivo značajnosti je 0.1 i vrši se ispitivanje test statistike na binomnu varijablu 𝑋 sa 𝑝 = 0.7 i 𝑛 = 15.

Za 𝑥 = 8 i 𝑛𝑝0 = 15 ∙ 0.7 = 10.5 se pročunava P vrijednost kao:


8

𝑃 = 2𝑃(𝑋 ≤ 8, 𝑝 = 0.7) = 2 ∑ 𝑏(𝑥; 15,0.7) = (isčitava se iz tabele A. 1) = 0.2622 > 0.1


𝑥=0

4
Vjerovatnoća i statistika – Tutorijal 10
Elektrotehnički fakultet u Sarajevu, odsjek za Računarstvo i informatiku
2019/2020

Finalna odluka je da se ne odbija (prihvata) hipoteza 𝐻0 i ne treba sumnjati u tačnost razmatrane tvrdnje.

Zadatak 6. Provedeno je anketiranje stanovnika nekog grada i okolnog ruralnog područja oko
konstrukcije novih (predloženih) hemijskih postrojenja. Ukoliko je 𝟏𝟐𝟎 (od 𝟐𝟎𝟎) anketiranih iz grada,
te 𝟐𝟒𝟎 (od 𝟓𝟎𝟎) iz okolnog ruralnog područja podržalo prijedlog, ispitati tvrdnju da je veća proporcija
anketiranih iz grada koji podržavaju navedeni prijedlog, nego proporcija anketiranih iz okolnog ruralnog
područja. Pri proračunu koristiti nivo značajnosti 𝜶 = 𝟎. 𝟎𝟓.

Rješenje:

Neka 𝑝1 i 𝑝2 predstavljaju stvarne proporcije glasača iz grada i ruralnog područja, koji podržavaju prijedlog,
respektivno.

Postavljaju se hipoteze na sljedeći način: 𝐻0 : 𝑝1 = 𝑝2 , 𝐻1 : 𝑝1 > 𝑝2 .

Za nivo značajnosti od 0.05, vrijednost 𝑧0.05 = 1.645 (tabela A.3), pa je kritični region 𝑧 > 1.645 (region
se postavlja na ovaj način jer je alternativna hipoteza 𝑝1 > 𝑝2 ). Da bi se izračunala vrijednost 𝑧, prvo treba
𝑥 𝑥 𝑥 +𝑥
̂1 = 𝑛1 = 0.6, 𝑝
odrediti sljedeće vrijednosti: 𝑝 ̂2 = 𝑛2 = 0.48 i 𝑝̂ = 𝑛1 +𝑛2 = 0.51.
1 2 1 2

𝑝
̂1 − 𝑝
̂2
𝑧= = 2.9
1 1
√𝑝̂ (1 − 𝑝̂ ) ( + )
𝑛1 𝑛2

Finalna odluka je da se odbije hipoteza 𝐻0 i zaključi da je proporcija glasača u gradu koji favoriziraju
prijedlog veća nego proporcija takvih glasača u ruralim područjima.

You might also like