You are on page 1of 10

VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE

FAKULTA INFORMATIKY A STATISTIKY


Katedra statistiky a pravděpodobnosti

STATISTIKA
VZORCE PRO 4ST201 a 4ST210

verze 2018
poslední aktualizace: 1. 9. 2018

KSTP 2018
Popisná statistika
ni k k
pi =
n
 ni = n  pi = 1 i = 1, 2, ..., k
i =1 i =1

x(1)  x(2)  ...  x( n )


xP , 0  P  1 xP = x( zP ) , nP  z P  nP + 1,
x( zP ) + x( zP +1)
xP = , nP = z P
2
n k

 xi xn i i k
x =  xi pi
i =1 i =1
x= x= k

n
n i =1
i
i =1

n
n i =1
i
1
xH = n
xH = k
xH = k
1 ni pi
x
i =1
x
i =1
x i =1
i i i

n
xG = n x
i =1
i = n x1  x2  ...  xn

R = xmax − xmin
2
n n
 n 
 ( xi − x ) 2
 xi2   xi 
i =1 i =1
s =
2 i =1
sx2 = x 2 − x 2 = − 
 n 
x
n n
 
 
2
k
 k k

 (x − x ) n i
2
i  x n   xi ni
2
i i 
− k 
i =1 i =1 i =1
s =
2
sx = x − x = k
2 2 2

 
x k

n i  ni   ni 
i =1 i =1  i =1 
k k k
sx2 =  (xi − x ) 2 pi sx2 = x 2 − x 2 =  xi2 pi − ( xi pi )2
i =1 i =1 i =1

k k k

 six2 ni
i =1
 (xi − x )2ni
i =1
xn
i =1
i i

s =s +s =
2
x
2 2
x k
+ k
x= k

 ni
i =1
n
i =1
i n
i =1
i

k k k
sx2 =  six2 pi +  (xi − x ) 2 pi x =  xi pi
i =1 i =1 i =1

sx
sx = sx2 vx =
x

1
Pravděpodobnost
Počet pravděpodobnosti
P ( A ) = 1 − P(A)
m
P(A) =
n
P(A  B) ≤ min(P(A), P(B)) P(A  B) = P(A) P(B)
P(A  B) = P(A) + P(B) − P(A  B) P(A  B) = P(A) + P(B)

Náhodné veličiny
P(x) = P(X = x) F(x) = P(X  x) =  P( x j ) P(x1  X  x2 ) =  P(x) = F (x2 ) − F (x1 )
xj x x1  x  x2

2
 
E (X ) =  x P(x) D(X ) = E (X ) −  E (X )  =  x P(x) −  xP(x) 
2 2 2

x x  x 
 x
f (x) = F (x)  f (x )dx = 1 F(x) = P(X  x) =  f (t )dt
− −
x2

P(x1 < X  x2) =  f ( x)dx = F(x2) − F(x1)


x1

xP , 0 < P < 1 F ( xP ) = P xP = F −1 ( P )
 2
  
 x f (x)dx D( X ) =  x f ( x)dx −   xf ( x)dx  = D(X )
2
E (X ) =
− − −  

Pravděpodobnostní rozdělení
Alternativní rozdělení A()
P ( x ) =  x (1 −  )1− x x = 0, 1, 0    1
E(X) =  D ( X ) =  (1 −  )

Binomické rozdělení Bi(n,)


n
P( x ) =    x (1 −  ) n − x x = 0, 1, 2, ..., n, n  N , 0    1
 x
E ( X ) = n D ( X ) = n (1 −  )
Poissonovo rozdělení Po()
x
P(x) = e− x = 0, 1, ... ,  > 0,
x!
E(X) =  D(X) = 

2
pravděpodobnost
Hypergeometrické rozdělení Hg(M, N, n)
M  N −M 
   
 x   n−x 
P (x ) = , x = max ( 0,M − N + n ) , ..., min(M, n), 1 ≤ n < N, 1 ≤ M < N
N
 
 n
M M  M  N −n
E (X ) = n D(X ) = n 1 − 
N N  N  N −1

Normované normální rozdělení N(0,1)


X −
U= -  u   E(U) = 0 D(U) = 1

 (u ) = 1 −  ( − u) uP = −u1− P

Normální rozdělení N(µ,2)


-  x  , -  µ  , 2 > 0 E(X) =  D(X) = 2
x−  x− 
u= F ( x) =  (u ) =    xP =  +  u P
   
 x −  X −  x2 −  
P(x1  X  x2 ) = P  1   = P(u1  U  u2 ) =  (u2 ) −  (u1 )
    

Chí-kvadrát rozdělení 2() x  0,   N

Rozdělení t (Studentovo) t() -  x  ,   N tP(ν) = −t1-P(ν)

F rozdělení (Fisherovo – Snedecorovo) F(1,2) x  0, 1 , 2  N


1
FP ( 1 , 2 ) =
F1− P ( 2 ,  1 )

3
Matematická statistika
n

 (X i − X )2
S= i =1

n −1
Bodové a intervalové odhady parametrů (teoretické intervaly spolehlivosti)

střední hodnota ˆ = X N  = NX
normální rozdělení
a) 2 známý
   
P  X − u1− / 2    X + u1− / 2  = 1− 
 n n

     
P  X − u1−    = 1− , P    X + u1−  = 1− 
 n   n

b) 2 neznámý
 S S 
P  X − t1− / 2    X + t1− / 2  = 1− T ~ t(n – 1)
 n n

 S   S 
P  X − t1−    = 1− , P    X + t1−  = 1− 
 n   n

obecné rozdělení, 2 neznámý, velký výběr (n > 30)


 S S 
P  X − u1− / 2  E (X )  X + u1− / 2  = 1− 
 n n

 S   S 
P  X − u1−  E (X )  = 1 −  , P  E (X )  X + u1−  = 1−
 n   n

rozptyl 2 (normální rozdělení) ̂ 2 = S 2

Parametr  alternativního rozdělení (odhad relativní četnosti základního souboru)



ˆ = P N = NP

 P(1 − P) P(1 − P) 
P  P − u1− / 2    P + u1− / 2  = 1 − 
 n n 
 P(1 − P)   P(1 − P) 
P  P − u1−    = 1 −  P    P + u1−  = 1 − 
 n   n 

4
matematická statistika
Testování statistických hypotéz
Střední hodnota normálního rozdělení
H0 H1 Testové kritérium Kritický obor
 = 0  > 0 2 známý W ={u; u  u1-}
 < 0 X − 0 W ={u; u  -u1-}
  0 U= n U ~ N(0,1) W ={u; u  u1-/2}

2 neznámý W ={t; t  t1-}
X − 0 W ={t; t  -t1-}
T= n T ~ t(n – 1) W ={t; t  t1-/2}
S

Střední hodnota, obecné rozdělení, velký výběr


H0 H1 Testové kritérium Kritický obor
E(X) =0 E(X) > 0 2 neznámý (n > 30) W ={u; u  u1-}
E(X) < 0 X − 0 W ={u; u  -u1-}
E(X)  0 U= n U ≈ N(0,1) W ={u; u  u1-/2}
S

Parametr  alternativního rozdělení (velké výběry)


H0 H1 Testové kritérium Kritický obor
 = 0  > 0 P −0 W ={u; u  u1-}
U= U ≈ N(0,1)
 < 0  0 (1 −  0 ) W ={u; u  -u1-}
  0 n W ={u; u  u1-/2}

Rovnost středních hodnot dvou rozdělení


velké nezávislé výběry
H0 H1 Testové kritérium Kritický obor
E(X1) = E(X2) E(X1) > E(X2) 12 a 22 neznámé W ={u; u  u1-}
E(X1) − E(X2) = 0 E(X1) < E(X2) X − X2 W ={u; u  -u1-}
E(X1)  E(X2) U = 12 U ≈ N(0,1)
S1 S 22 W ={u; u  u1-/2}
+
n1 n2
závislé výběry z normálního rozdělení (párový t-test)
H0 H1 Testové kritérium Kritický obor
1 = 2 1 > 2 nD W ={t; t  t1-}
1 − 2 = 0 1 < 2 T= T ~ t(n – 1) W ={t; t  -t1-}
SD
1  2 W ={t; t  t1-/2}
Di = X1i – X2i, i = 1, 2, ..., n

Chí-kvadrát test dobré shody


H0 a H1 Testové kritérium Kritický obor
H0: j = 0,j j = 1, …, k k (n j − n 0 , j ) 2

H1: non H0 G= G ≈ 2(k −1) W ={g; g  21-}


j =1 n 0 , j
n j  5

5
Analýza závislostí
Kontingenční tabulka (r x s)
r s r s ni+ n+ j
  nij =  ni+ =  n+ j = n nij =
n
nij  5
i=1 j =1 i=1 j =1

H0 H1 Testové kritérium Kritický obor


znaky non H0 r s (nij − ni+ n+ j / n) 2 W ={g; g ≥ 21-}
jsou G =  G ≈ 2((r − 1)(s − 1))
nezávislé i=1 j =1 ni+ n+ j / n

G G
C= V= , m = min (r, s)
G+n n (m − 1)

n(n11n22 − n12 n21 ) 2


Tabulka 2  2 G=
n1+ n+1n2+ n+2

Analýza rozptylu
nj nj

S y .m =  ( y j − y ) n j
k
S y =  ( y ji − y ) = Sy.m + Sy.ν S y. =  ( y ji − y j )
k 2 k
2 2

j =1 i =1 j =1 j =1 i =1

S y .m
P2 =
Sy

H0 H1 Testové kritérium Kritický obor


1 = 2 = ...=k non H0 S y .m W ={F; F  F1-α}

F = k −1 F ~ F(k – 1, n – k)
S y .v
n−k

Regrese a korelace
regresní přímka y = 0 + 1x +  ,
n
Y = b0 + b1 x, yˆ = ˆ0 + ˆ1 x minimum 0 , 1  (y − 
i =1
i 0 − 1 xi ) 2
n

 ( x − x )( y − y )
i i
sxy = i =1
= xy − x . y
n
n yi xi −  xi
 yi = xy − x . y = sxy
b1 = ˆ1 =
n xi2 − (  xi )
2
x2 − x 2 sx2

ˆ
b0 = 0 =
 yi  xi2 −  yi xi  xi
= y − ˆ1x
n xi − ( xi )
2 2

Jiné regresní funkce Y = b0 + b1 x + b2 x 2 , yˆ = ˆ0 + ˆ1 x + ˆ2 x 2


Y = b0 + b1 x1 + b2 x2 + ... + bk xk , yˆ = ˆ0 + ˆ1 x1 + ˆ2 x2 + ... + ˆk xk

6
analýza závislostí
n
S y =  ( yi − y )
n n n
ST =  ( yˆi − y ) S R =  ( yi − yˆi ) =  ˆi2
2 2 2

i =1 i=1 i=1 i=1

SR SR
Sy = ST + SR sR2 = sR = = sR2
n− p n− p
ST n −1
R2 = I 2 = 2
I ADJ = RADJ
2
= 1 − (1 − I 2 )
Sy n− p

Test hypotézy o regresním parametru


H0 H1 Testové kritérium Kritický obor
j = 0 j  0 ˆ j W ={t; t ≥ t1-/2}
T= T ~ t(n – p)
sˆ
j

Test o modelu p=k+1


H0 H1 Testové kritérium Kritický obor
0 = c non H0 ST W = {F; F ≥ F1-}
1 = 0 p −1
... F= F ~ F(p – 1, n – p)
SR
k = 0
n− p

korelační koeficient
n n n
n xi yi −  xi  yi
xy − x y sxy
ryx = rxy = i =1 i =1 i =1
= =
n
n xi2 − ( xi ) 2
n n
n yi2 − ( yi ) 2
n
(x 2
− x2 )( y 2
− y2 ) sx s y
i =1 i =1 i =1 i =1

H0 H1 Testové kritérium Kritický obor


ρXY = 0 ρXY  0 rxy n − 2 W ={t; t ≥ t1-/2}
T= T ~ t(n –2)
1 − rxy2

7
Časové řady
T T −1
y1 + y2 y2 + y3 y +y
t =1
y t + + ... + T −1 T
1
2
1
y1 +  yt + yT
2
y= y= 2 2 2 = t =2
T T −1 T −1
y1 + y2 y + y3 y +y
d1 + 2 d 2 + ... + T −1 T dT −1
y= 2 2 2
d1 + d 2 + ... + dT −1
T
  yt yT − y1
yt = yt − yt−1 y = t =2
=
T −1 T −1
yt yT
kt = k = T −1 k2  k3  ...  kT = T −1  t = kt − 1  = k −1
yt −1 y1

Dekompozice časové řady


yt = Tt + Ct + St + t yt = Tt  Ct  St  t

Modelování trendu
Trendové funkce
Tt = 0 + 1t Tˆt = ˆ0 + ˆ1t Tt = 0 + 1t + 2t2 Tˆt = ˆ0 + ˆ1t + ˆ2t 2

T
 ( yt − yˆt )2
T
 (ˆt − ˆt −1 )
2

t =1 t =2
MSE = DW = T
T
 ˆt2
t =1

Klouzavé průměry
yt − p + ... + yt −1 + yt + yt +1 + ... + yt + p
m = 2p + 1 Tˆt = yt =
m

m = 2p Tˆt = yt =
1
2m
(
yt − p + 2 yt − p +1 + ... + 2 yt −1 + 2 yt + 2 yt +1 + ... + 2 yt + p −1 + yt + p )

Modelování sezónnosti
Regresní metoda s umělými proměnnými (lineární trend, sezónnost délky 4)
yt = Tt + St + εt = 0 + 1t + 1D1t + 2D2t + 3D3t + 4D4t + t
yt* = 0* + 1*t + 1*D1t + 2*D2t + 3*D3t + t
ˆ1* + ˆ2* + ˆ3*
sˆ = Sˆ j = ˆ j = ˆ j − sˆ, j = 1, 2, 3 Sˆ4 = ˆ4 = − sˆ ˆ0 = ˆ0* + sˆ
4
s
 Sˆ j = 0
j =1

8
Indexní analýza
Individuální indexy jednoduché
Q
p= IQ = Iq  Ip
q
p q Q1
Ip = 1  p = p1 − p0 Iq = 1 q = q1 − q0 IQ = Q = Q1 − Q0
p0 q0 Q0

yt yt I
I t /1 = = I 2/1 I 3/2 ... I t / t −1 I t / t −1 = = t /1
y1 yt −1 I t −1/1

Individuální indexy složené

I Σq =
 q1 =  Iq . q0 =  q1  q =  q1 −  q0
 q0  q0  q1
Iq

I ΣQ =
Q =  p q
1 1 1
=
 IQ . Q =  Q0 1
 Q =  Q1 −  Q0
Q  p q0 0 0 Q 0
Q
 IQ 1

Q
 Q1  p1q1
1
Q
p 1

 q1 =  q1 =  p = p1 − p0 =  p q
p p1q1
Ip = 1 = 1
− 0 0

p0  Q0  p0 q0 Q 0  q1 q 0

 q0  q0 Q
p 0

Souhrnné indexy

Ip ( L ) =
 p1q0 =  Ip . p0q0 =  Ip . Q0 Ip ( P ) =
pq = pq
1 1 1 1
=
Q 1

 p0q0  p0q0  Q0 p q  pq
0 1 1 1 Q
 Ip 1
Ip
Ip ( F ) = Ip ( L ) . Ip ( P )

Iq ( L ) =
p q 0 1
=
 Iq . p q 0 0
=
 Iq . Q 0
Iq ( P ) =
pq
1 1
=
pq 1 1
=
Q 1

p q 0 0 p q 0 0 Q 0 pq
1 0
pq
 Iq 1 1 Q
 Iq 1

Iq ( F ) = Iq ( L )  Iq ( P )

You might also like