You are on page 1of 25

4ST201 Statistika

2. cvičení

Jiří Novák
ZS 2019/2020
STATISTIKA 4ST201 - CVIČENÍ

Doplňkový materiál ke cvičení ze 4ST201.

Tyto slidy berte pouze jako doplňkový materiál


– není v nich obsaženo zdaleka všechno, co byste měli umět.
Dalším studijním materiálem je také učebnice, cvičebnice a
poznámky z přednášek a cvičení!

2
Základní informace
• Ing. Jiří Novák

• email: xnovj159@vse.cz

• Konzultační hodiny na MS Teams dle emailové domluvy

• materiály ke cvičení: e-mail / dokumentový server

• web Katedry statistiky a pravděpodobnosti:


– http://kstp.vse.cz/

• web předmětu:
– https://kstp.vse.cz/predmety-4st201-4st210-a-4st204/
Plán cvičení
1. Úvod, popisná statistika
2. Popisná statistika
3. Míry variability, pravděpodobnost
4. Pravděpodobnost, náhodné veličiny a jejich charakteristiky
5. Pravděpodobnostní rozdělení
6. TEST, odhady parametrů
7. Testování hypotéz
8. Chí-kvadrát test dobré shody , kontingenční tabulky, ANOVA
9. Regrese
10. Regrese, korelace
11. TEST, časové řady, bazické a řetězové indexy
12. Časové řady
13. Indexní analýza 4
kvartily - příklad z minulé hodiny
věk • Obecný vzorec pro výpočet kvantilů – sudé n:
1. 20 p p
2. 20 n  zp  n  +1
100 100
3. 21 n
4. 22 • Dolní kvartil:
5. 22
6. 23
7. 23
8. 24
9. 24 • Horní kvartil:
10. 24

5
kvartily - příklad z minulé hodiny
věk • Obecný vzorec pro výpočet kvantilů – sudé n:
1. 20 p p
2. 20 n  zp  n  +1
100 100
3. 21 n
4. 22 • Dolní kvartil:
5. 22 2,5  z p  2,5 + 1
6. 23 25 25
10   z p  10  +1
7. 23 100 100  x0,25 = x(3) = 21
8. 24
9. 24 • Horní kvartil:
10. 24 7,5  z p  7,5 + 1
75 75
10   z p  10  +1
100 100  x0,75 = x(8) = 24
6
Opakování z minulého cvičení
n n!
• Kombinační čísla  =
 k  (n − k )! k !
• Četnosti
absolutní relativní
– Absolutní ni , i = 1, 2, ,k
n1 + n2 + p1 + p2 +
n
– Relativní pi = i k k
n n i =n p i =1
– Kumulativní i =1 i =1

• Charakteristiky úrovně n

– Průměr x i
k

xn k

n
i i
x= i =1
x= i =1
• Prostý aritmetický n k
n i
n i xH = n
, xH = i =1
k
• Vážený aritmetický 1 ni
 
i =1

• Harmonický/vážený harmonický i =1 xi i =1 xi

• Geometrický
Dolní Horní
– Medián a kvartily Medián
kvartil 7
kvartil
21 21 22 22 22 23 24
Opakování - průměry
n
• Prostý aritmetický průměr x i
x= i =1

n
• Při zpracování studie o průměrné výši měsíčních příjmů v České republice
jsme získali data celkem od 5-ti tazatelů. Každý z těchto pěti souborů
(firem) dat obsahoval údaje o deseti statistických jednotkách
(respondentech (zaměstnancích) - těch, kteří odpověděli).

soubor 1. 2. 3. 4. 5.
Počet respondentů 10 10 10 10 10
Průměr v souboru (tis. Kč) 18,5 21,2 24,2 19 26,2

• Vypočítejte celkový průměrný měsíční příjem ze


všech získaných dat. 8
Opakování - průměry
• Prostý aritmetický průměr
soubor 1. 2. 3. 4. 5.
Počet respondentů 10 10 10 10 10
Průměr v souboru (tis. Kč) 18,5 21,2 24,2 19 26,2

x i
18,5 + 21, 2 + 24, 2 + 19 + 26, 2 109,1
x= i =1
= = = 21,82
n 5 5

9
Opakování - průměry
k

• Vážený aritmetický průměr


xn i i
x= i =1
k

n
i =1
i

• Při zpracování studie o průměrné výši měsíčních příjmů v České republice


jsme získali data celkem od 5-ti tazatelů. Každý z těchto pěti souborů (firem)
dat obsahoval odlišný počet údajů o statistických jednotkách
(respondentech (zaměstnancích) - těch, kteří odpověděli).

soubor 1. 2. 3. 4. 5.
Počet respondentů 10 13 15 7 5
Průměr v souboru (tis. Kč) 18,5 21,2 24,2 19 26,2

• Vypočítejte celkový průměrný měsíční příjem ze


všech získaných dat. 10
Opakování - průměry
• Vážený aritmetický průměr
soubor 1. 2. 3. 4. 5.
Počet respondentů 10 13 15 7 5
Průměr v souboru (tis. Kč) 18,5 21,2 24,2 19 26,2

xn i i
18,5 10 + 21, 2 13 + 24, 2 15 + 19  7 + 26,3  5 1087, 6
x= i =1
= = = 21, 75
k
10 + 13 + 15 + 7 + 5 50
n
i =1
i

11
Opakování - medián
• Jak je možné, že průměrná mzda v České republice je 34,1 tis Kč
a více jak 60 % obyvatel ČR má plat nižší ???

Datový soubor od prvního tazatele:


respondent 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. průměr
příjem 10,5 11 9,5 11,5 15,5 16,5 16 15 16,5 63 18,5

x i
10,5 + 11 + 9,5 + 11,5 + 15,5 + 16,5 + 16 + 15 + 16,5 + 63
x= i =1
= = 18,5
n 10

• Určete medián datového souboru od prvního tazatele.


12
Opakování - medián
1) Seřadit podle velikosti
Pořadí (1) (2) (3) (4) (5) (6) (7) (8) (9) (10)
průměr
respondent 3. 2. 1. 4. 8. 5. 7. 6. 9. 10.
příjem 9,5 10,5 11 11,5 15 15,5 16 16,5 16,5 63 18,5
Medián Průměr
9
9,5
10
10,5
11
11,5
12
12,5
13
13,5
14
14,5
15
15,5
16
16,5
17
17,5
18
18,5
19
19,5
20
20,5
21
21,5
22
22,5
23
...
63
2) Určit prostřední hodnotu
x(5) + x(6) 15 + 15,5
x0,5 = = = 15, 25
2 2
90 % hodnot menších než průměr !!! 13
Opakování - kvartily
1) Seřadit podle velikosti
Pořadí (1) (2) (3) (4) (5) (6) (7) (8) (9) (10)
průměr
respondent 3. 2. 1. 4. 8. 5. 7. 6. 9. 10.
příjem 9,5 10,5 11 11,5 15 15,5 16 16,5 16,5 63 18,5
Medián Průměr
9
9,5
10
10,5
11
11,5
12
12,5
13
13,5
14
14,5
15
15,5
16
16,5
17
17,5
18
18,5
19
19,5
20
20,5
21
21,5
22
22,5
23
...
63
2) Určit 1. kvartil  x0,25 = x(3) = 11
p p
n  zp  n  +1
3) Určit 3. kvartil  x0,75 = x(8) = 16,5 100 100
14
Modus
• Modus (modální hodnota) je taková hodnota, která je v souboru
nejčastěji zastoupena (má největší četnost)
Modus

Medián Průměr
9
9,5
10
10,5
11
11,5
12
12,5
13
13,5
14
14,5
15
15,5
16
16,5
17
17,5
18
18,5
19
19,5
20
20,5
21
21,5
22
22,5
23
...
63
• Průměr 18,5 tis Kč „průměrná hodnota“
• Modus 16,5 tis Kč „nejčastěji zastoupená hodnota“
• Medián 15,25 tis Kč „prostřední hodnota“
15
Míry variability
• Rozptyl
– směrodatná odchylka

– variační koeficient

– variační rozpětí

• Rozklad rozptylu
– vnitroskupinový rozptyl

– meziskupinový rozptyl

• Vlastnosti rozptylu
16
K čemu to potřebujeme ?
Sociální nůžky
• Představme si dvě městečka Levicov a Pravicov. V obou městech bylo
provedeno šetření o průměrném měsíčním příjmu obyvatel. Z výzkumu
vyšlo, že v obou městech je průměrný měsíční příjem stejný a to 20 tis. Kč.

• Zdá se, že se v průměru daří obyvatelům obou měst stejně. Pokud se však
podíváme na bodový graf podrobněji v něčem se tato města liší. Přestože
průměrný příjem jejich obyvatel je stejný.

Průměr

9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 3 4 35 36 37 38 39 40

Pravicov

9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 3 4 35 36 37 38 39 40

Průměr Levicov
17
Jak to ale číselně vyjádřit?
Míry variability
• Na minulém cvičení – míry polohy (průměry, medián, modus)
• Často je však zapotřebí kromě typické hodnotové úrovně poznat i to, jak moc
se jednotlivé hodnoty souboru od sebe odlišují
• K tomuto účelu slouží právě míry variability. Abychom zachytili vzájemnou
odlišnost hodnot souboru, můžeme studovat například to, jak se jednotlivé
hodnoty liší od průměru.

– Průměrná absolutní odchylka

– Průměrná kvadratická odchylka


• Právě průměrná kvadratická odchylka hodnot souboru od průměru je
základem definice rozptylu jako jedné z nejvýznamnějších měr variability
souboru.

• Existují i jiné míry variability


18
Míry variability
• Absolutní
– Rozptyl –> průměrná kvadratická odchylka od průměru
• (Klasický) rozptyl – známe všechny hodnoty všech jednotek (v každém městě žije pouze 10 obyvatel)
1 n
s =  ( xi − x ) 2
2
x
n i =1
• Výběrový rozptyl – známe pouze některé hodnoty ze souboru (v každém městě je víc jak 10 obyvatel)
n
1
s '2x =  i
n − 1 i =1
( x − x ) 2

– Směrodatná odchylka – je druhá odmocnina z rozptylu sx s 'x


– Variační rozpětí – nejvyšší hodnota mínus nejnižší R = xmax − xmin
• Relativní sx s 'x
– Variační koeficient
Vx = V 'x =
x x
• směrodatná odchylka dělená průměrem („relativní směrodatná odchylka“)
19
Míry variability – příklad 1
• Vypočítejte míry polohy
– Průměr
– Modus
– Medián
– Dolní kvartil
– Horní kvartil

• a variability pro města Levicov a Pravicov


– Rozptyl
– Směrodatná odchylka
– Variační rozpětí
– Variační koeficient
– Výběrový rozptyl
– Výběrová směrodatná odchylka

20
Míry variability
• Vlastnosti průměru
– Jak by se změnil průměr, pokud by Česká republika vstoupila do měnové unie se
směnným kurzem 26 CZK/EUR?
– Kolik se rovná součet odchylek hodnot od průměru?
n

 (x − x ) = ?
i =1
i

• Vlastnosti rozptylu
– Jaká by byla hodnota rozptylu pokud bychom měli pouze jeden údaj od jednoho
respondenta?
– Jaký by byl rozptyl pokud by všichni respondenti odpověděli stejně?
– Pokud by měli všichni obyvatelé dluhy a xi < 0 byl by rozptyl (resp. Směrodatná
odchylka) záporný?
– Co by se stalo s měrami variability v těchto městech, pokud by ČR vstoupila do
měnové unie se směnným kurzem 26 CZK/EUR? Příklad 2
Zamyslete se nejprve nad změnou rozptylu
(Lze vyhodnotit numericky) 21
VIDEO: Míry variability

• Video od doktora Tomáše Karla


– https://www.youtube.com/watch?v=tkTRPvfcoZ8

22
Děkuji za pozornost
Na domácí přípravu mohu doporučit

• Statistika v ekonomii
– Řešené příklady s postupem:

– 1.6; 1.7; 1.8 – geometrický průměr – procvičit sami

– Míry variability: 1.9; 1.10; 1.11; 1.12; 1.13 – projít si postup řešení

• Seznam kapitol a příkladů z učebnice a cvičebnice, které jsou náplní


kurzu 4ST201:
– http://statistika.vse.cz/download/materialy/4ST201_co_se_ucit.pdf
23
24
25

You might also like