You are on page 1of 25

Kolegij: Statistika

Akademska godina: 2021./2022.


Grupa: MAE-NEM (prof.dr.sc. Nataša Kurnoga;
asistent: Tomislav Korotaj, mag. oec.)
Demonstrator: Marijan Mandić
a) Procijenite jednim brojem i intervalom prosječan broj otkaza rezervacija leta na navedenoj
liniji. Pouzdanost procjene je 95%. Pri tome koristite podatke da je u promatranih 36 dana
ukupno otkazano 74 rezervacije. Nepristrana procjena standardne devijacije populacije je
1,7038. Sampling distribucija aritmetičkih sredina je normalnog oblika, n<<N.
b)Može li se uz razinu signifikantnosti 5% prihvatiti pretpostavka da se dnevno u spomenutoj
aviokompaniji prosječno otkazuje manje od 2 leta. Obavezno zapišite hipoteze i skicirajte postupak
testiranja. Testiranje provedite pomoću empirijskog z omjera i pomoću p-vrijednosti.
▪ a)
▪ Uz 95% pouzdanosti procjenjuje se da je
▪ n=36 prosječni broj otkazanih rezervacija u cijeloj
populaciji između 1,499 i 2,612 rezervacija.
▪ 1-α=0,95

▪ α=0,05

▪ σ xi = 74
σ xi 74
ത=
▪ x = 36
n

ത=2,0556
▪ x

▪ σ
ෝ = 1,7038
▪ zα/2 =1,96

▪ n<<N -> f<0,05 (uzorak višestruko manji od populacije)

x − zα/2 ∗ σ𝑥ҧ < μ< xത + zα/2 ∗ σ𝑥ҧ )= 1-α


▪ p(ത

σ 1,7038
▪ σxത = = =
n 36

▪ σxത =0,284

▪ p(2,0556−1,96 ∗ 0,284<μ< 2,0556 + 1,96 ∗ 0,284)= 0,95

▪ p(1,499<μ<2,612)=0,95
▪ b)

▪ μo=2

▪ manje od …test na donju granicu

▪ H0: μ≥2 H1: μ<2 (ono što tvrdimo uvijek ide u H1)
▪ α=0,05

ത =2,0556
▪ x

▪ σxത =0,284
xത −μ𝑜 2,0556−2
▪ z= =
σxഥ 0,284

▪ =0,1958 (empirijski z)

▪ zα = 1,65 (teorijski z)

▪ z > -zα -> H0


▪ p(z<0,2)=0,5+0,0793=0,5793 H1

▪ p>α -> H0 zα =-1,65


▪ Uz razinu signifikantnosti od 5% ne odbacuje se nulta
hipoteza odnosno ne može se prihvatiti pretpostavka
da se u ovoj aviokompaniji dnevno prosječno otkazuje
manje od dva leta.
(a) Uz 5% signifikantnosti testirajte pretpostavku da je prosječna cijena kvadratnog metra
stanova iste kategorije kao u uzorku, u veljači 2015. godine bila veća od € 1200. Pretpostavite
da je distribucija cijena stanova normalnog oblika.
(b) Provedena je intervalna procjena ukupnih izdataka za internetske račune kućanstava na
području grada M, u svibnju 2015. godine. U jednostavni slučajni uzorak izabrano je 250
(individualnih) internetskih pretplatnika i uz 90% pouzdanosti utvrđen slijedeći interval
p(195,26 < μ < 312,74) = 0,90. Ako je standardna pogreška procjene aritmetičke sredine 35,6,
kolika je procjena prosječnih mjesečnih izdataka za internetske račune jednim brojem?
▪ a)
1131,15−1200
▪ n=13 ▪ t=
47,368

▪ α=0,05 ▪ =-1,4535 (empirijski t-omjer)

▪ μo=1200 ▪ t< t α → H0

ത=
▪ x
σ xi
=
14705
= 1131,15 ▪ Uz razinu signifikantnosti od 5% ne odbacuje se H0, odnosno ne
n 13
može se prihvatiti pretpostavka da je prosječna cijena kvadratnog
▪ veća od 1200 …test na gornju granicu metra stana bila veća od 1200 €.
▪ H0: μ≤1200 H1: μ>1200
▪ uzorak mali, varijanca nepoznata … t-distribucija

▪ df=n-1=12
(12)
▪ t 0,05 = 1,7823 (teorijski t-omjer)
xത −μo
▪ t=
σxഥ

σ
▪ σxത =
n
H1
σ x2i −nതx2 16983525−13∗1131,152
σ=
▪ ෝ = t α =1,7823
n−1 12

▪ =170,7876
170,7876
▪ σxത =
13

▪ =47,368
▪ b)

▪ n=250

▪ p(195,26 < μ < 312,74)

▪ 1-α=0,9

▪ α=0,1

▪ σxത =35,6

▪ 195,26 = x
ത − zα/2 ∗ σ𝑥ҧ
▪ zα/2 =1,65

▪ 195,26 = x
ത − 1,65 ∗ 35,6
ത=254
▪ x

▪ Uz razinu pouzdanosti od 90% procjenjuje se da su prosječni izdaci za internetske račune


kućanstava na području grada M u svibnju 2015.g. iznosili 254 kn.
▪ (a) Do kojeg se zaključka dolazi na temelju rezultata iz uzorka? Razina signifikantnosti 3%. Test provedite
na temelju empirijske razine signifikantnosti (p-vrijednost). Obavezno zapišite hipoteze i skicirajte
postupak testiranja hipoteza.
▪ (b) Postavljene su slijedeće hipoteze: H0: μ=2000, H1: μ≠2000. Nulta hipoteza se ne odbacuje ako je
aritmetička sredina uzorka između 1938,75 i 2061,25. Testiranje se provodi na razini signifikantnosti 5%.
Jednostavni slučajni uzorak veličine 37 izabran je iz normalno distribuirane populacije. Kolika je
standardna devijacija sampling-distribucije aritmetičkih sredina. Do kojeg se zaključka dolazi u postupku
testiranje hipoteze ako je empirijski z-omjer (test veličina) -2.08?
▪ a) ▪ Empirijski z omjer
▪ N=65299 ▪ z=
ෝ −po
p
σp

▪ n=220
poqo 0,75∗0,25
▪ frakcija odabiranja
n 220
f=N= 65299 ෝ=
▪ σp
n
= 220
=

▪ f=0,0034 ෝ =0,0292
▪ σp
0,8409−0,75
▪ f<0,05 m=185 ▪ z= =
0,0292
▪ po= 0,75 (pretpostavljena proporcija)
▪ z=3,11
m 185
▪ proporcija uzorka p
ො= = 220 ▪ već možemo reći da je empirijski
n
z veći od teorijskog, pa smo u
▪ p
ො = 0,8409 području hipoteze H1 i
▪ više od 75% …test na gornju granicu odbacujemo nultu hipotezu
▪ H0: p≤0,75 H1: p>0,75 ▪ ipak, u zadatku nas traži odgovor
preko p-vrijednosti
▪ α=0,03

▪ zα =1,88

H1
zα =1,88
▪ p vrijednost
▪ b)
▪ p(z>3,11)
▪ H0: μ=2000 H1: μ≠2000 …dvosmjerni test
iz tablice iščitavamo kolika je vjerojatnost da je varijabla z od 0
do 3,11 ▪ c1 = 1938,75 c2 = 2061,25 …područje nulte
hipoteze
▪ p=0,5-0,4991=0,0009
▪ α=0,05
▪ p< α
▪ n=37
▪ 0,009 < 0,03 -> H1
▪ σ𝑥ҧ =? (standardna devijacija sampling-
▪ Uz razinu signifikantnosti od 3% odbacuje se nulta hipoteza,
distribucije aritmetičkih sredina)
odnosno može se prihvatiti da pretpostavka da više od 75%
komitenata plaća svoje račune u roku duljem od 60 dana ▪ z=-2,08

▪ c1 = μo- zα/2 ∗ σ𝑥ҧ

▪ 1938,75=2000-1,96σ𝑥ҧ

▪ -61,25=-1,96 σ𝑥ҧ /:-1,96

▪ σ𝑥ҧ =31,25

▪ |z| > zα/2 -> H1


H1 H1
▪ 2,08 > 1,96
-zα/2 =-1,96 zα/2 =1,96
Uz razinu signifikantnosti od 5% odbacuje se nulta hipoteza,
odnosno ne možemo prihvatiti pretpostavku da je μ=2000
R2 = 0,553442762
SS = MS ∗ df = 842,531717

1044,195556 + 842,531717=1866,727273

Coeff Coeff
tstat = → SE =
SE tstat
0,066810635
SE = = 0,02000445
3,33978912

𝑧𝑎 𝑑𝑣𝑜𝑠𝑚𝑗𝑒𝑟𝑛𝑖 𝑡𝑒𝑠𝑡, 𝑧𝑎 𝑗𝑒𝑑𝑛𝑜𝑠𝑚𝑗𝑒𝑟𝑛𝑖 𝑚𝑜𝑟𝑎𝑚𝑜 𝑝𝑜𝑑𝑖𝑗𝑒𝑙𝑖𝑡𝑖 𝑠 2


▪ a) Koristeći navedene rezultate zapišite jednadžbu jednostavne linearne regresije.

▪ b) Procijenjenu vrijednost konkretno protumačite.

▪ c) Nadopunite nedostajuće rezultate.

▪ d) Provedite intervalnu procjenu parametra (pouzdanost procjene 95%).

෢𝑜 + β
▪ a) 𝑦ෝ𝑖 = β ෢1 ∗ 𝑥
▪ 𝑦𝑖 =11,3892+0,0668x

▪ b) Ako se broj izlagača na sajamskim priredbama poveća za 1 izlagača, broj posjetitelja će se linearno i u
prosjeku povećati za 0,0668 tisuća posjetitelja (66,8 posjetitelja).
▪ d) (mali uzorak)

෢1 − t(n−2) ෢1 + t (n−2) ∗ σ ෢ )=1-α


▪ p(β α/2 ∗ σβ෢1 < β1 < β α/2 β1
9
▪ t 0,025 =2,2622

▪ p(0,0668 − 2,2622 ∗ 0,02< β1 <0,0668 + 2,2622 ∗ 0,02)=0,95

▪ p(0,0216< β1 <0,112)=0,95

▪ Uz razinu pouzdanosti od 95% procjenjuje se da će se s povećanjem broja izlagača na sajamskim


priredbama za 1 izlagača, broj posjetitelja linearno i u prosjeku povećati za između 21,6 i 112 posjetitelja.
▪ e) Testirajte značajnost parametra na razini signifikantnosti 5%. Provedite
dvosmjerni test. Pri testiranju koristite p-vrijednost (iz računalnog ispisa).
▪ H0: 𝛃𝟏 =0 H1: 𝛃𝟏 ≠0
▪ |t| > t α/2

▪ 3,3397>2,2622 -> H1
α=0,03
▪ p<α H1
H1
▪ 0,0087 < 0,05 -> H1 −t α/2 =-2,2622 t α/2 =2,2622
▪ Uz razinu signifikantnosti od 5% odbacuje se nulta hipoteza, odnosno nezavisna
varijabla broj izlagača statistički je značajna za tumačenje promjena zavisne
varijable broja posjetitelja.
a) Zapišite regresijsku jednadžbu s ocijenjenim
parametrima. Regresijski koeficijent
protumačite.
b) Na razini signifikantnosti 5%, testirajte hipotezu o
značajnosti regresorske (nezavisne)
varijable u modelu. Provedite odgovarajući
jednosmjerni test.

H0: 𝛃𝟏 ≤0 H1: 𝛃𝟏 >0


Nemamo empirijski-t pa se koristimo p-
vrijednosti:
p<α
9,265*10−13 <0,05 -> H1
b)Pošto je procjena parametra Uz razinu signifikantnosti 5% odbacuje se
෢o + β
a) yෝi = β ෢1 ∗ x pozitivna, koristit ćemo test na nulta hipoteza, odnosno prihvaća se
yi =0,9111+0,0012x gornju granicu (provjeravamo pretpostavka da visina mjesečnih primanja
Ako se mjesečna primanja utječe li nezavisna varijabla statistički značajno i pozitivno utječe na
obitelji povećaju za 1kn, visina statistički značajno i pozitivno visinu zatraženih kredita.
zatraženog kratkoročnog na zavisnu varijablu).
kredita će linearno i u
prosjeku povećati za 1,2 €.
c) Koliko je odstupanja ostalo neprotumačeno
procijenjenim regresijskim modelom? Što
zaključujete?
d) Kolika je procjena standardne devijacije
regresije?

SP 4867,579635 𝑆𝑅 363,3727464
c)1-R2 = 1 − ST = 1 − 5230,952381 d)ෝ
σ= =
𝑛−2 19
=0,0695 =4,37 tis €
*ili SR/ST
Procijenjenim regresijskim modelom ostalo je
neprotumačeno 6,95% svih odstupanja.
Coeff 3,641466889
tstat = = = 1,9927
SE 1,82739027

ഥ2 =1- n−1 (1 − R2 )
R n− k+1

20−1
0,27595331=1-20− 1 − R2
2+1 Coeff −27,93814919
SE = = = 75,6832
tstat −0,369146
1,117647059 1 − R2 = 0,72404669
-1,117647059 R2 =-0,3936003688
R2 =0,3522
R=0,5935
▪ a) Procijenite parametar uz drugu nezavisnu varijablu intervalom uz 95% pouzdanosti.

▪ b) Procjenu navedenog parametra brojem i intervalom konkretno protumačite.

▪ c) Nadopunite nedostajuće rezultate obrade.

▪ d) Testirajte značajnost prve nezavisne varijable u modelu. Provedite odgovarajući jednosmjerni test, razina
signifikantnosti je 5%. Obavezno zapišite hipoteze.
෢2 − t(n−(k+1)) ෢2 + t (n−(k+1)) ∗ σ ෢ )=1-α
▪ a) p(β α/2 ∗ σβ෢2 < β2 < β α/2 β2
17
▪ t 0,025 =2,1098

▪ p(−27,9381 − 2,1098 ∗ 75,6832<β2 < − 27,9381 + 2,1098 ∗ 75,6832)=0,95

▪ p(-187,6145<β2 <131,7383)=0,95

▪ b)Ako se broj poduzeća poveća za 1 poduzeće, uz nepromijenjeni prihod od prodaje, godišnja bruto plaća po
zaposlenom će se linearno i u prosjeku smanjiti za 27,94 kn.
▪ Uz razinu pouzdanosti od 95% procjenjuje se da će se, godišnja bruto plaća po zaposlenom, ako se broj poduzeća
poveća za 1 poduzeće, uz nepromijenjeni prihod od prodaje, promijeniti za između -187,61 i 131,74 kn
▪ d)test na gornju granicu H0: 𝛃𝟏 ≤0 H1: 𝛃𝟏 >0
▪ t > t α -> H1
H1
▪ 1,9927>1,7396
17
𝑡0,05 =1,7396
▪ Uz razinu signifikantnosti od 5% odbacuje se nulta hipoteza, odnosno zaključuje se da prihod od prodaje
statistički značajno i pozitivno utječe na godišnje bruto plaće po zaposlenom.
𝑆𝑃 592124957,2
=
𝑑𝑓 2
= 296062478,6

SR = ST − SP
= 1681367114 − 592124957,2 𝑆𝑅 1089242157
=
=1089242157 𝑑𝑓 17
=64073068,06

296062478,6
F=
64073068,06
=4,6207
▪ a) Zapišite jednadžbu višestruke linearne regresije s procijenjenim parametrima. Regresijski koeficijent uz
prvu nezavisnu varijablu konkretno protumačite.
▪ b) Nadopunite nedostajuće rezultate kompjutorske obrade u tabeli ANOVA.
▪ c) Kolika je procjena standardne devijacije regresije?
▪ d) Testirajte značajnost svih varijabli u modelu (skupni test) uz 5% signifikantnosti. Obavezno obrazložite
odluku.
෢o + β
▪ a) yෝi = β ෢1 ∗ x1 + β
෢2 * x2
yෝi = 45980,573 + 3,6415x1 − 27,9381x2
Ako se prihod od prodaje poveća za 1 milijun kuna, uz nepromijenjen broj poduzeća, godišnje bruto plaće po
zaposlenom će se linearno i u prosjeku povećati za 3,64 kn.
𝑆𝑅 1089242157
▪ c)ෝ
σ= =
𝑛−(𝑘+1) 17

▪ =8004,57 kn
▪ d)F-test

▪ H0: 𝛃𝟏 = 𝛃𝟐 = 𝟎 H1: ∃𝛃𝐉 ≠0 H1


2,17
2,17
▪ F0,05 = 3,59 F0,05 = 3,59
▪ F>Fα -> H1
▪ Uz razinu signifikantnosti od 5% odbacuje se nulta hipoteza odnosno u modelu postoji barem jedna
nezavisna varijabla koja je statistička značajna za tumačenje promjena zavisne varijable.
▪ a)prosječna stopa promjene ▪ c)𝑦
ො𝑛+τ = 4041,4 ∗ 2,078𝑛+τ = 4041,4 ∗ 2,0785+2
෢1 -1)*100=(2,078-1)*100
▪ 𝑠ҧ𝑦ො = (β ▪ =676161,81

▪ =107,8% ▪ d)Ne može se očekivati da će se broj internetskih


pretplatnika i nakon 2014. povećavati po prosječnoj stopi od
▪ Broj internetskih pretplatnika se u 107,8% (ubrzo bi se prestigao broj stanovnika RH).
periodu od 2010. do 2014. povećavao
za prosječno godišnje 107,8%
▪ b)𝑠ҧ𝑦ො =107,8%
c)σ yt − yത 2 = 3307078,89 = ST
SP
R2 =
ST
SP=ST-SR
SR= σෝ2 ∗ n − k + 1
n=9 (od 1996. do 2004.)
SR=142655,65*7=998589,55
SP=2308489,34
2308489,34
R2 =
3307078,89
R2 = 0,698045
Ovim modelom je protumačeno 69,8%
a)Broj diplomiranih studenata u Hrvatskoj se u periodu svih odstupanja.
od 1996. do 2004. povećavao prosječno godišnje za
196,15 studenata.

𝑆𝑅
b)ෝ
σ2 = 𝑛−(𝑘+1) = 142655,65
σ
ෝ= ෝ2 = 377,698 studena
σ
Hvala na pažnji i
sretno ☺

You might also like