You are on page 1of 5

Nina Logar, KOM-TM, 1.

letnik statistina naloga, ifra:534

NALOGA III (analiza odvisnosti in preverjanja domnev)

III.1
a) izraunajte naslednje statistine koeficiente: hi kvadrat, kontingenni koeficient, Cramerjev
koeficient. Za vsak izraunani koeficient pojasnite njegov statistini pomen in interpretirajte
rezultate v statistinem pomenu.

D39 narodnost
1 slovenec 2 druge Total
narodnosti
Q79 Ne 1 ne velja 700/696.10 53/56.90 753
nadaljevati 2 srednje velja 253/251.45 19/20.55 272
solanja, kjer 3 velja
197/202.45 22/16.55 219
elim
Total 1150 94 1244

Primer za izraun teoretine frekvence: fi`= 1150*753/1244=696.10


2 je mera povezanosti pri dveh nominalnih spremenljivkah, je tudi statistika, ki omogoa
primerjavo empirinih in teoretinih frekvenc. Porazdeljuje se po hi kvadrat porazdelitvi s (s-
1)*(v-1) prostostnimi stopnjami. Statistika hi kvadrat je le pozitivna in zavzema vrednost na

intervalu 0; 2 max . na irino intervala vplivata le velikost vzorca in tabela.

k
2 ( fi fi ) 2 / fi `
i 1

2 0.022 0.0095 0.15 0.267 0.12 1.79

2 2.36

2 max n * (k 1) 1244 * (2 1) 1244

k minimalno tevilo (v,s)

Vrednost moje karakteristike znaa 2.36 in se nahaja na intervalu 0;1244 .

Kontingenni koeficient je mera povezanosti dveh nominalnih spremenljivk. Pri tej


statistini karakteristiki raunamo tudi Cmax in Cpop. C je definiran na intervalu 0; C max . Ob
izraunu Cmax pa C popravimo in je nato definiran na intervalu 0;1 . Za vrednosti velja, da
e se nahaja na intervalu:

0 - 0.1 ni nikakrne povezanosti

0.1 0.3 je ibka povezanost

0.3 1 gre za mono povezanost

-1-
Nina Logar, KOM-TM, 1.letnik statistina naloga, ifra:534

C 2 /( 2 n) 2.36 /(2.36 1244) 0.043


C max (k 1) / k (2 1) / 2 0.71
C pop C / C max 0.06

Moja vrednost kontingennega koeficienta znaa 0.043, Cpop pa znaa 0.06. Izraun nam
pokae, da v obeh primerih ni povezanosti med spremenljivkama.

Cramerjev koeficient je mera povezanosti za dve nominalni spremenljivki. Definiran je na


intervalu 0;1 . Ta koeficient je namenjen temu, da stisne hi kvadrat v intervalu 0;1 , s
imer izloi vpliv tevila enot in tabele. e se vrednosti nahajajo na intervalu:
0 0.05 ni nikakrne povezanosti
0.05 0.3 je ibka povezanost
0.3 1 gre za mono povezanost

2 2.36
n 1244
k 3

2 /( n * (k 1)) 2.36 /(1244 *1) 0.044

Vrednost Cramerjevega koeficienta znaa v mojem primeru 0.044, kar kae na to, da ni
povezanosti med spremenljivkama.

b) Z 1 % stopnjo znailnosti preverite domnevo o povezanosti med spremnljivkama in


ugotovitev vsebinsko interpretirajte! Pomagajte si tudi s tabelo strukturnih odstotkov in
grafom iz toke I.2.c.

0.01
H0: 2 0
H1: 2 0

12 ( s 1)(v 1) 02.99 ( 2) 9.21

Eksperimentalna vrednost ne pade v kritino obmoje, zato nielne domneve (H0) ne moremo
zavrniti. Tako lahko z 1 % tveganjem trdimo, da spremenljivki nista povezani.

c) Ali se zgornji rezultati ujemajo z rezultati iz naloge I.2.d?

Da, zgornji rezultati se ujemajo z rezultati iz naloge I.2.d.

III.2

X103 odstotek neaktivnega prebivalstva


Y120 vrednost BDP na prebivalca

b) Izraunajte Pearsonov koeficient in preverite ( 5% ) ali obstaja linearna povezanost.

-2-
Nina Logar, KOM-TM, 1.letnik statistina naloga, ifra:534

X103 Y120 xi X yi Y ( xi X ) 2 ( y i y ) 2 ( xi X )( y i Y )
Avstrija 54,41 22782 -1.34 6462.92 1.7956 41769334.93 -8660.31
Belgija 60,6 21037 4.85 4717.92 23.5225 22258769.13 22881.91
Danska 49,12 26204 -6.63 9884.92 43.9569 97711643.41 -65537.02
Finska 53,57 16540 -2.18 220.92 4.7524 48805.64 -481.61
Francija 59,79 21706 4.04 5386.92 16.3216 29018907.09 21763.16
Grija 62,88 7071 7.13 -9248.92 50.8369 85542521.17 -65944.80
Irska 54,53 13392 -1.22 -2927.08 1.4884 8567797.33 3571.04
Nemija 55,55 23537 -0.2 7217.92 0.04 52098369.13 -1443.58
Portugalska 51,19 8688 -4.56 -7631.08 20.7936 58233381.97 34797.72
Slovenija 54,07 6366 -1.68 -9953.08 2.8224 99063801.49 16721.17
panija 60,23 12227 4.48 -4092.08 20.0704 16745118.73 -18332.52
Velika -2.6 -40.08 6.76 1606.40 104.21
Britanija 53,15 16279
skupaj 669,09 195829 0 0 193.16 511060056.4 -60560.63

n
X 1 / n xi 55.75
i 1
n
Y 1 / n y i 16319.08
i 1

Pearsonov koeficient meri povezanost med spremenljivkama. Nahaja se na intervalu 1;1 .


n

(x i X ) * ( yi Y )
r i 1
n n

( xi X ) 2 * ( y i Y ) 2
i 1 i 1
60560.63
r
193.16 * 511060056 .4
r 0.19

Spremenljivki sta negativno povezani, vendar je ta povezanost zelo majhna.

0.05
n 12
H0: 0
H1: 0

r* n2 0.19 * 3.16
t 0.61
1 r 2 0.98
t / 2 ( n 2) t 0.025 (10) 2.23

Eksperimentalna vrednost ne pade v kritino obmoje, zato nielne domneve ne moremo


zavrniti. Tako lahko s 5 % tveganjem trdimo, da spremenljivki nista povezani.

c) Glede na vsebino spremenljivk doloite odvisno in neodvisno spremenljivko. Izraunajte


ustrezno regresijsko premico in jo vriite v razsevni grafikon iz toke III.2.a!

-3-
Nina Logar, KOM-TM, 1.letnik statistina naloga, ifra:534

Glede na vsebino spremenljivk menim, da je neodvisna spremenljivka X103 odstotek


neaktivnega prebivalstva, odvisna spremenljivka pa Y120 vrednost BDP na prebivalca.

C XY
Y` Y *(X X )
X2
60560.63
Y ` 16319.08 ( X 55.75)
193.16
Y ` 33798.14 313.53 X

d) Izraunajte determinacijski koeficient in standardno napako ocene za izraunano


regresijsko premico!

Y2` 1537490.66
R 0.036
2
Y 42588338.03

n
511060056.4
Y2 1 / n ( yi Y ) 2 42588338.03 Y 6525.97
i 1 12

2 0.0361

e Y * 1 2 6525.97 * 0.98 6407.09 e 41050847.37


2

Y2 Y2` e2 Y2` Y2 e2 42588338.03 41050847.37 1537490.66

Determinacijski koeficient znaa 0.036 ( dele pojasnjene variance je torej 3.6 %), standardna
napaka regresijske ocene pa je 6407.09.

e) Vsebinska interpretacija rezultatov za izbrane evropske drave.

Najbolje se razmerje med spremenljivkama vidi iz razsevnega grafikona, kjer je mono


razvideti, da odstotek BDP na prebivalca ni odvisen od delea neaktivnega prebivalstva.
Drave, kot so Danska, Nemija in Belgija imajo v povpreju isto tevilo neaktivnega
prebivalstva, kot drave z manj BDP na prebivalca. Spremenljivki sta torej precej ibko
povezani oz. sploh nista.
Od regresijske premice v glavnem odstopajo vse, najbolj pa Danska in Slovenija. Danska ima
najve BDP na prebivalca in najmanj neaktivnega prebivalstva, Slovenija pa ravno obratno.
Najve neaktivnega prebivalstva pa ima Grija.
Dele pojasnjene variance je precej nizek, kar kae da spremenljivka neaktivnega prebivalstva
ni povezana z BDP na prebivalca v dravi in da zato obstajajo neki drugi vzroki.

-4-
Nina Logar, KOM-TM, 1.letnik statistina naloga, ifra:534

-5-

You might also like