You are on page 1of 10

I.

Analýza závislosti kvantitativních znaků


Jednoduchá korelace a regrese

funkce lineární (přímka):


y′ = a + b ⋅ x i

Soustava normálních rovnic


n n
na yx + b yx ⋅ ∑ x i = ∑ y i
i =1 i =1
n n n
a yx ∑ x i + b yx ⋅ ∑ x i2 = ∑ x i y i
i =1 i =1 i =1

Výpočtové vzorce
n ∑ x i y i − ∑ x i ∑ yi n ∑ x i y i − ∑ x i ∑ yi
b yx = b xy =
n ∑ x i2 − (∑ x i ) n ∑ y i2 − (∑ y i )
2 2

cov xy cov xy
b yx = b xy =
s 2x s 2y

sy sx
b yx = r ⋅ b xy = r ⋅
sx sy

a yx = y − b yx ⋅ x a xy = x − b xy ⋅ y

cov xy = xy − x ⋅ y

Síla závislosti – korelační koeficient

cov xy
rxy = ryx = ryx = rxy = ± b yx ⋅ b xy
sx ⋅ sy

n ∑ x i yi − ∑ x i ∑ yi
ryx = rxy =
[n∑ x 2
i
2
][
− (∑ x i ) ⋅ n ∑ y i2 − (∑ y i )
2
]

Síla závislosti – Spearmanův koeficient pořadové korelace

6 ⋅ ∑ d i2
rS = 1 − , kde di = rozdíly pořadí Rx a Ry
n ⋅ (n 2 − 1)
funkce logaritmická:
y′ = a + b ⋅ log x i
n a + b∑ log x i = ∑ yi
a ∑ log x i + b∑ (log x i ) = ∑ (log x i ) ⋅ y i
2

funkce kvadratická (parabola):


y′ = a + b ⋅ x i + c ⋅ x i2
n a + b∑ x i + c∑ x i2 = ∑ yi
a ∑ x i + b∑ x i2 + c∑ x 3i = ∑ yi x i
a ∑ x i2 + b ∑ x 3i + c∑ x i4 = ∑ y i x i2

funkce kubická:
y′ = a + b ⋅ x i + c ⋅ x i2 + d ⋅ x 3i
n a + b ∑ x i + c∑ x i2 + d ∑ x 3i = ∑ y i
a ∑ x i + b ∑ x i2 + c∑ x 3i + d ∑ x i4 = ∑ x i y i
a ∑ x i2 + b∑ x 3i + c∑ x i4 + d ∑ x 5i = ∑ x i2 y i
a ∑ x i2 + b∑ x i4 + c∑ x 5i + d ∑ x 6i = ∑ x 3i y i

funkce hyperbolická (funkce lomená):


1
y′ = a + b ⋅
xi
1
n a + b∑ = ∑ yi
xi
1 1 y
a∑ + b∑ 2 = ∑ i
xi xi xi

funkce mocninná:
y′ = a ⋅ x ib
n log a + b∑ log x i = ∑ log y i
log a ∑ log x i + b∑ (log x i ) 2 = ∑ (log y i )(log x i )

funkce exponenciální:
y′ = a ⋅ b x i
n log a + log b∑ x i = ∑ log y i
log a ∑ x i + log b∑ x i2 = ∑ x i log y i
Index korelace
1
∑ y′ i− (∑ y i ) 2
n
2
∑ (y − y′ ) 2

I yx = , I yx = 1− i i
1
∑ y i − n (∑ y i )
2 2 ∑ (y − y ) i
2

∑ y′ i
2
= (∑ yi ) ⋅ y′i

s ε2 1 n
I yx = 1 − 2 s ε2 = ∑ ( y i − y′i ) 2
sy n i =1

Vícenásobná lineární regrese a korelace

Rovina: y′ = a + b yx1 ⋅x 2 ⋅ x1 + b yx 2 ⋅x1 ⋅ x 2

b yx1 − b yx 2 ⋅ b x 2 x1 s y ryx1 − rx1x 2 ⋅ ryx 2


b yx1 ⋅x 2 = b yx1 ⋅x 2 = ⋅
1 − b x 2 x1 ⋅ b x1 x 2 s x1 1 − rx21x 2

b yx 2 − b yx1 ⋅ b x1x 2 s y ryx 2 − rx1x 2 ⋅ ryx1


b yx 2 ⋅x1 = b yx 2 x1 = ⋅
1 − b x 2 x1 ⋅ b x1 x 2 sx2 1 − rx21x 2

a = y − b yx1 ⋅x 2 ⋅ x1 − b yx 2 ⋅x1 ⋅ x 2

Síla závislosti

a) úplný korelační koeficient

ryx2 1 + ryx2 2 − 2 ⋅ rx1 x 2 ⋅ ryx1 ⋅ ryx 2


R y.x1 x 2 =
1 − rx21 x 2

b) parciální korelační koeficienty


ryx1 − ryx 2 ⋅ rx1x 2 ryx 2 − ryx1 ⋅ rx1x 2
ryx1 ⋅x 2 = ryx 2 ⋅x1 =
(1 − ryx2 2 )(1 − rx21x 2 ) (1 − ryx2 1 )(1 − rx21x 2 )

β − koeficienty
s x1 sx2
β yx1x 2 = b yx1 ⋅x 2 ⋅ β yx 2 x1 = b yx 2 ⋅x1 ⋅
sy sy
Maticový počet

Regresní funkce
r r r
y = Χb + ε

Soustavu normálních rovnic lze zapsat


r r
XT ⋅ y = XT ⋅ X ⋅ b

Index korelace
r
b T ⋅ X T ⋅ y − (Σyi )
r 1 2

I yx = n
y ⋅ y − (Σy i )
rT r 1 2

Testování výběrových charakteristik korelace a regrese


Test korelačního koeficientu

ryx
tr =
1 − ryx2
n−2

tr má Studentovo t-rozdělení pro (n − 2) stupně volnosti

Test dílčího korelačního koeficientu


ryx1 ⋅ x 2 .....x k
t=
1 − ryx2 1 ⋅ x 2 ....x k
n − k −1

k ..... počet nezávisle proměnných


Testovací kritérium má Studentovo t-rozdělení pro (n − k − 1) stupňů volnosti.

Test totálního korelačního koeficientu

R 2y⋅ x 1 x 2 .....x k
F= k
1 − R 2y⋅ x 1x 2 ....x k
n − k −1

Testovací kritérium má F-rozdělení pro počet stupňů volnosti (k; n − k − 1), kde k je počet
nezávisle proměnných.
Test regresního koeficientu
b yx sy 1 − ryx2
tb = s b yx = ⋅
s b yx sx n−2

s x 1 − ryx
2
b xy
tb = s b xy = ⋅
s b xy sy n−2

tb má Studentovo t-rozdělení pro (n − 2) stupně volnosti

Test o dílčím regresním koeficientu


b yx1 ⋅ x 2 .......x k sy 1 − R 2y⋅ x1 x 2 ....x k
t= s b yx1⋅x 2 ......xk = ⋅
s b yx ⋅x
1 2 ...x k
s x (1 − R 2y⋅ x 1 x 2 .....x k )(n − k − 1)

Testovací kritérium má Studentovo t-rozdělení pro počet stupňů volnosti (n − k − 1).

Testování regresní funkce pomocí analýzy rozptylu


Stupně Testovací
Variabilita Součet čtverců Rozptyl
volnosti statistika
n
S1
regrese S1 = ∑ ( y′i − y) 2 p−1 s12 =
i =1 p −1 s12
F=
kolem
n
S s 2r
Sr = ∑ ( y i − y′i ) 2 n−p s 2r = r
regrese i =1 n−p
p = počet parametrů regresní funkce
Statistika F má Snedecorovo F-rozdělení o [(p − 1), (n − p )] stupních volnosti.

Bodový odhad korelačního koeficientu ρ̂ yx

n −1
ρˆ yx = 1 − (1 − r ) ⋅
2

n −2

Intervalový odhad korelačního koeficientu ρyx

je-li n < 100, potom Fisherova z-transformace


z ∈ (zr ± uα ⋅ sz)
1
sz =
n −3

je-li n > 100, potom ryx ± uα ⋅ sr

1 − ryx2
sr =
n−2
Interval spolehlivosti pro dílčí korelační koeficient
ryx1 ⋅ x 2 ....x k ± u α ⋅ s z

1
sz =
n−k−2

Intervalový odhad regresního koeficientu βyx:

sy 1 − ryx2
b yx ± t α ( n −2) ⋅ s b yx , kde s byx = ⋅
sx n−2

s x 1 − ryx
2

b xy ± t α ( n −2) ⋅ s b xy , kde s bxy = ⋅


sy n−2

Interval spolehlivosti pro dílčí regresní koeficient β yx1 .x 2 .....x k

sy 1 − R 2y ⋅ x 1x 2 ....x k
b yx1 ⋅ x 2 ....x k ± t α(n − k −1) ⋅ s b , kde s b yx1⋅x 2 ......xk = ⋅
s x (1 − R 2y ⋅ x 1x 2 ......x k )(n − k − 1)

II. Analýza závislosti kvalitativních znaků

1. Asociace (2 x 2)
Průběh závislosti (asociační přímka)

(a + c)′ = A + B (a + b )
n n

n (a ) − (a + b ) ⋅ (a + c )
B =
(a + b ) ⋅ (c + d )
A =
(a + c ) − B ⋅ (a + b )
n n

Síla závislosti
ad − bc
Koeficient asociace V=
(a + b )(c + d )(a + c)(b + d )
ad − bc
Yuleův koeficient asociace Q=
ad + bc
bc
1−
Koeficient koligace Y= ad
bc
1+
ad

Testování v asociační tabulce

χ2- test
n (ad − bc )
2
χ2 =
(a + b ) ⋅ (c + d ) ⋅ (a + c) ⋅ (b + d )
Statistika χ2 má χ2 -rozdělení pro [(2 − 1) ⋅ (2 − 1)] = 1 stupeň volnosti.

Fisherův test

pi =
(a + b ) ! (c + d ) ! (a + c) ! (b + d ) !
n ! a ! b! c! d !

testové kritérium p = ∑ pi
Hodnota p se porovnává se zvolenou hladinou významnosti α.

2. Kontingence (r x s)
Síla závislosti
χ2
Pearsonův koeficient kontingence C=
n + χ2

C h −1
Normovaný koeficient kontingence Cn = , C max = , kde h = min (r,s)
C max h

χ2
Čuprovův koeficient kontingence K=
n (r − 1)(s − 1)

χ2
Cramérův koeficient kontingence V=
n (h − 1)

Testování kontingenční tabulky

χ = ∑∑
2
r s (n ij − o ij )
2

, kde oij =
n i• ⋅ n • j
i =1 j=1 o ij n
r s n ⋅ (n ij ) 2
χ = ∑∑
2
−n
i =1 j =1 n i• ⋅ n • j

Testové kritérium má χ2-rozdělení pro [(r − 1) ⋅ (s − 1)] stupeň volnosti.

III. Analýza časových řad

Vyrovnání časové řady přímkou

ui = a + b ⋅ ti

jestliže ∑ ti ≠ 0

an + b ∑ t i = ∑ y i
a ∑ t i + b ∑ t i2 = ∑ t i y i

jestliže ∑ ti = 0

a=
∑y i
, b=
∑t y i i

n ∑t 2
i

Další typy trendových funkcí viz. kapitola III. Závislost kvantitativních znaků.

Index korelace

I= 1−
∑ (y − u ) i i
2
s2
= 1 − ε2 , kde εi = yi − ui, s 2
=
∑ (y i − ui )
2

∑ (y − y )
2 ε
i
sy n

Náhodné kolísání

absolutní průměrná odchylka v časových řadách s trendem


yi − u i
d=∑
n
relativní průměrná odchylka v časových řadách s trendem
yi − u i
∑ ui
d′ =
n
absolutní průměrná odchylka ve stacionárních časových řadách
yi − y
d=∑
n
relativní průměrná odchylka ve stacionárních časových řadách

yi − y
∑ y
d′ =
n

Intervalová predikce

u n +1 − t α ( n −2 ) ⋅ s′y n +1 ≤ y′n +1 ≤ u n +1 + t α ( n − 2) ⋅ s′y n+1 ,

kde un+1 ... bodová předpověď na období (n + 1)

s′yn +1 ... směrodatná chyba předpovídané hodnoty

n (n 2 − 1) + 12 k 2
s′yn +1 = s y ⋅ (1 − I 2 ) ⋅ , kde k je počet kroků dopředu
(n 2 − 1)(n − 2)

IV. Indexní analýza

1. Individuální indexy

∑p q 1 1 ∑p q 0 1 ∑p q
1 1

∑q 1
=
∑q 1

∑q 1

∑p q 0 0 ∑p q 0 0 ∑p q
0 1

∑q 0 ∑q 0 ∑q 1

∑p q 1 1 ∑p q 1 0 ∑p q
1 1

∑q 1
=
∑q 0

∑q 1

∑p q 0 0 ∑p q 0 0 ∑p q
1 0

∑q 0 ∑q 0 ∑q 0
2. Souhrnné indexy

a) indexy množství

c0 I1( q/ 0) =
∑q c1 0
; [ ]
∆ c 0 I1( q/ 0) = ∑ q1c 0 − ∑ q 0 c 0
∑q c0 0

c1I1( q/ 0) =
∑q c1 1
; [ ]
∆ c1I1(q/ 0) = ∑ q1c1 − ∑ q 0c1
∑q c0 1

b) indexy úrovně

Laspeyresův index q 0 I1( c/ 0) =


∑q c 0 1

∑q c 0 0

Paascheho index q1I1( c/ 0) =


∑q c 1 1

∑q c 1 0

Fisherův index q 0q1I1( c/ 0) =


∑q c ⋅ ∑q c 0 1 1 1

∑q c ∑q c 0 0 1 0

Loweho index qI1( c/ )0 =


∑ q.c 1
, kde q je stálé množství
∑ qc 0

rozklad indexů dvoufaktorových ukazatelů

∑q p 1 1
=
∑q p 1 1

∑q p 1 0

∑q p 0 0 ∑q p 1 0 ∑q p 0 0

∑q p 1 1
=
∑q p 1 1

∑q p 0 1

∑q p 0 0 ∑q p 0 1 ∑q p 0 0

rozklad indexů třífaktorových ukazatelů, např.

∑q p c 1 1 1
=
∑q p c 1 0 0

∑q p c 1 1 0

∑q p c1 1 1
⋅ z
∑q p c 0 0 0 ∑q p c 0 0 0 ∑q p c 1 0 0 ∑q p c1 1 0

∑q p c 1 1 1
=
∑q p c 1 0 0

∑q p c 0 1 0

∑q p c0 0 1
⋅ z
∑q p c 0 0 0 ∑q p c 0 0 0 ∑q p c 0 0 0 ∑q p c0 0 0

You might also like