You are on page 1of 22

Úloha za 5 bodů

1. U každé z následujících vlastností uveďte, o jaký typ znaku se jedná – zda je v kvantitativní či
kvalitativní, kardinální, ordinální či nominální, alternativní, spojité či kategoriální. Odůvodněte
a. Míra souhlasu s anketní otázkou, při možnostech odpovědi ANO-NE kategoriální –
alternativní, pouze 2 hodnoty ano/ne
b. Míra souhlasu s anketní otázkou, při možnostech odpovědi v rámci bipolární škály
reprezentované orientovanou úsečkou kategoriální, ordinální, možnost porovnání
c. Míra souhlasu s anketní otázkou, při možnostech odpovědi v rámci čtyřstupňového
sémantického diferenciálu
d. Míra souhlasu s anketní otázkou, při možnostech odpovědi na škále (1=určitě ano, 2=spíše
ano, 3=nevím, 4=spíše ne, 5= určitě ne) kategoriální, ordinální, má smysl porrovnávání větší/menší
e. Míra souhlasu s anketní otázkou, při možnostech odpovědi na Likertově škále s nabídkou
pěti možností kategoriální, kardinální, má smysl porovnávání větší/menší

2. Jak byste vyšetřovali, zda v rámci firmy nejvyšší dosažené vzdělání zaměstnance ovlivňuje vývoj
jeho kariérního zařazení za posledních 10 let? Jak by vypadal datový soubor a jaké údaje by k tomuto
vyšetření použily? Jakou stat. Metodu byste ve vašem případě použili?
Nejprve otázka: jaké je vaše nejvyšší dosažené vzdělání?
- Ovlivnuje dosažené vzdělání vaše karierní zařazení?
- Jaká je vaše pracovní pozice?
-hypotéza: Čím vyšší je dosažené vzdělání respondenta, tím vyšší je jeho pracovní pozice ve firmě
- poté bychom zkoumali závislost vzdělání na pozici
- použili bychom Chí kvadrát test nezávislosti

3. U jakých dat můžeme sestrojit sloupcový graf, ale nemůžeme sestrojit histogram? A proč?
Histogram je sloupcový graf, nelze u regrese
histogram je určen pro popis zkategorizovaných spojitých veličin, není primárně určen pro
kategoriální veličiny, pokud chceme pohlížet na kategoriální veličiny koukat úhlem pohledu spojitých,
tak je vhodný

4. Vysvětlete princip mediánového testu


neparametrický test
- zkoumá se shoda populačního mediánu neboli stejné rozdělení X v R populacích
- škála měření je alespoň ordinální
- máme z nezávislých náhodných výběrů o rozsahu n (velikost výběru)
- Výběry jsou vždy rozděleny do 2 skupiny
- 1. Představuje hodnoty, které jsou větší než společný medián a skupina
- 2. Představuje hodnoty, které jsou menší nebo rovny společnému mediánu
H0: všechny populace mají stejný medián
H1: alespoň 1 populace má jiný medián

5. Vysvětlete co nejpodrobněji, co to je p-hodnota. Kde a k čemu se používá, princip jejího použití,


čím by šla nahradit a jak?
- nejmenší hladina významnosti testu, při níž na daných testech ještě zamítáme H0 (vždy mezi 0-1)
- když je p-hodnota menší než 0,05, tak zamítáme H0.. když máme 95% pravděpodobnost
- náhrada p-hodnoty lze pomocí metody nejmenších čtverců nebo pomocí intervalů spolehlivosti a
síly testů

6. Nakreslete do jednoho obrázky tři boxploty (=krabicové grafy) vytvořené na základě kvantilů.
Každý z nich je popisem měsíčních hrubých mezd v rámci jedné vzdělanostní kategorie (ZŠ, SŠ, VŠ).
Interpretujte
akorát změním popisky

Úlohy za 10 bodů
7. Na 5% hladině významnosti ověřte, zda je datový soubor výběrovým souborem z populace, v níž je
hodnota mediánu rovna 100.
- pomocí kterého testu můžeme daný problém vyřešit? A proč? 1-výběrový test pro
pravděpodobnost
- Formulujte dvojici stat. Hypotéz
H0: pí =0,05
H1: pí není rovno 0,05
- Vyhodnoťte a interpretujte následující možný výsledek testu (nesouhlasí se skutečným výsledkem):
- Testové kritérium T = 3,65
- Patřiční kvantil = 4,26
W = (-nekonečno;-4,26 > U <4,46;nekonečno)
T není prvkem W… H0 nelze zamítnout
Datový soubor je výběrovým souborem z populace

8. Ověřte, zda byly srovnatelné názory různě vzdělaných respondentů na zavedení Eura. Výběrový
soubor obsahuje mimo jiné odpovědi na otázku, zda je by bylo zavedení Eura prospěšné pro naši
ekonomiku, a to na škále od 1 do 5 (1=určitě ano, 2=spíše ano, 3=nevím, 4=spíše ne, 5= určitě ne)
- pomocí kterého testu můžeme daný problém vyřešit? A proč? Máme respondenty rozděleny podle
vzdělání, poté odpověď na otázku ano/ne.. 2 kategoriální veličiny, chí kvadrát nezávislosti
- Formulujte dvojici stat. Hypotéz
H0: nezávislost
H1: non H0
- Vyhodnoťte a interpretujte následující možný výsledek testu (nesouhlasí se skutečným výsledkem):
- P-hodnota = 0,0631
P-hodnota je větší než 0,05… H0 nelze zamítnout .. To znamená, že názory na přímou volbu
prezidenta mohou být srovnatelné

9. Ministerstvo sledovalo počty ubytovaných v českých luxusních hotelích dle zemí, a to v rozmezí od
ledna 2012 do září 2017. Byla provedena regresní analýza sledující vztah počtu ubytovaných za
všechny cizí země (Austrálie, Čína a USA). Vyhodnoťte a interpretujte co nejpřesněji následující tři
výstupy z excelu. Interpretujte všechny 3 směrnice. Vyberte model popisující nejsilnější vztah. Jak
byste v tomto modelu odhalili počet ubytovaných této země v lednu 2018?
Úloha za 5 bodů
1. U každé z následujících vlastností uveďte, o jaký typ znaku se jedná – zda je v kvantitativní či
kvalitativní, kardinální, ordinální či nominální, alternativní, spojité či kategoriální. Odůvodněte
a. studijní průměr studentů prezenčního studia FSE kategoriální – ordinální, možnost
porovnání lepší/horší
b. číslo studenta ve školním systému kategoriální – ordinální, možnost srovnání větší/menší
c. Minimální mzda ve státech EU v daném období nekategoriální – kardinální , má smysl
počítat
d. Míra prokrastinace studentů FSE na bipolární škále – kategoriální – ordinální, smysl říkat
lepší/menší
e. Počet dětí zaměstnanců firmy nekategoriální – kardinální, má smysl počítat

2.Jak byste vyšetřovali postoj pracovníků k vedení firmy? Jak by vypadal výběrový soubor a jaké
otázky v dotazníku by k tomuto vyšetření posloužily? Jaké veličiny by obsahoval datový soubor?
Jakou stat. Metodu byste ve vašem případě použili?
- pomocí anonymního dotazníku, na Likertově škále 1-nejvíce spokojen až 5- nejméně spokojen)
-Otázka: na škále od 1 až 5 rozhodněte jak moc jste s vedením firmy spokojeni
- Vyhodnocení by bylo pomocí intervalu spolehlivosti pro střední hodnotu
- H0: střední hodnota je rovna všem hodnotám v intervalu spolehlivosti
H1: non H0

3. U jakých proměnných můžeme sestrojit bodový graf, ale nemůžeme sestrojit koláčový graf?
bodový graf u regrese, kde jsou dvě proměnné a vyjadřujeme jejich „protnutí“ v určitém bodu.
Koláčový graf se tvoří u 1 proměnné, kde chceme vědět zastoupení prvků v celku. Př. počet
pracovníků s VŠ. SŠ,ŽŠ v „koláči“

4. Vysvětlete princip Mediánového testu?


neparametrický test
- zkoumá se shoda populačního mediánu neboli stejné rozdělení X v R populacích
- škála měření je alespoň ordinální
- máme z nezávislých náhodných výběrů o rozsahu n (velikost výběru)
- Výběry jsou vždy rozděleny do 2 skupiny
- 1. Představuje hodnoty, které jsou větší než společný medián a skupina
- 2. Představuje hodnoty, které jsou menší nebo rovny společnému mediánu
H0: všechny populace mají stejný medián
H1: alespoň 1 populace má jiný medián

5. Vyjmenujte 3 způsoby škálování a stručně popište jejich principy


● Likertova škála
○ pětibodová škála 1-5
○ výroky a stupnice + vyjadřuje ses tupeň souhlasu a nesouhlasu
● Intervalová škála
○ polohám lze přiřadit čísla na stupnici
○ například “od často po nikdy”
● Pořadová škála
○ nelze zvolit dvakrát stejné místo
○ jevy jsou v pořadí (např. dle oblíbenosti)
● Bipolární škála (sémantický diferenciál)
○ polohám lze přiřadit číslo na stupnici
○ opět dva extrémy
○ na škále musí být stejný slovní druh na obou stranách

6. Nakreslete situaci dat, pro která jsme vytvořili dva regresní modely. Při výpočtech jsme zjistili, že
korelační koeficient má hodnotu -0,07 a index determinace kvadratického modelu má hodnotu 0,91.
Interpretujte!
Obrázek v souboru 30)

Úlohy za 10 bodů
7. Na 10% hladině významnosti ověřte, zda lidé s různými názory mají srovnatelnou úroveň platů.
Osloveno bylo 258 respondentů a byli dotázáni, zda souhlasí s podmínkami EU na vstup nového státu
(možnosti: ano-ne-nevím) a na výši průměrného měsíčního platu v minulém roce. Platy se
pohybovaly v rozmezí 15 000- 30 000 Kč.?
- pomocí kterého testu můžeme daný problém vyřešit? A proč? Máme 2 veličiny – kategoriální a
spojitou a sledujeme jejich vzájemný vliv, takže anova
- Formulujte dvojici stat. Hypotéz
H0: mí1 = mí2 = mí3
H1: non H0
- Vyhodnoťte a interpretujte následující možný výsledek testu (nesouhlasí se skutečným výsledkem):
- Testové kritérium T = 5,65
- Patřiční kvantil = 4,26
W = <4,26;nekonečno)
T je prvkem W… H0 zamítáme.. lidé s různými názory nemají srovnatelnou úroveˇN

8. Ověřte zda byly srovnatelné počty odpracovaných hodin studentů a studentek. Výběrový soubor
obsahuje následující údaje o odpracovaných hodinách.

Ženy 50 32 46 39 230 35 43 49 38
Muži 1 38 34 49 52 50 46 37 41
- pomocí kterého testu můžeme daný problém vyřešit? A proč? 2-výběrový t-test pro střední hodnotu
( 2 nezávislé výběry)
- Formulujte dvojici stat. Hypotéz
H0: mí1 = mí2
H1: mí1 není rovno mí2
- Vyhodnoťte a interpretujte následující možný výsledek testu (nesouhlasí se skutečným výsledkem):
- P-hodnota =0,0831
p-hodnota je větší než 0,05… h0 nelze zamítnout
Počty odpracovaných hodin studentů a studentek jsou srovnatelné

9. Byl sledován vývoj míry vytížení tří skupin ve 167 po sobě jdoucích obdobích. Následně byla
zpracována regresní analýza. Vyhodnoťte a interpretujte co nejpřesněji následující tři výstupy
z excelu, a to včetně směrnic! Vyberte model se statisticky nejvýznamněji rostoucím trendem a
vypočítejte odhad trendu dané skupiny na následující období.
Skup. 1

Regresní statistika
Násobné R 0,783377
Hodnota spolehlivosti R 0,613679
Nastavená hodnota spolehlivosti
R 0,611338
Chyba stř. hodnoty 0,077126
Úloha za 5 bodů
1. U každé z následujících vlastností uveďte, o jaký typ znaku se jedná – zda je v kvantitativní či
kvalitativní, kardinální, ordinální či nominální, alternativní, spojité či kategoriální. Odůvodněte
a. Studijní obor studentů prezenčního studia FSE kategoriální- kardinální, kvantitativní, má
smysl počítání
b. Pořadové číslo studenta přihlášeného na zkoušku kategoriální- nominální, má smysl pouze
porovnat je/není rovno
c. Průměrný starobní důchod ve státech EU v daném období nekategoriální – kardinální, má
smysl počítání
d. Míra souhlasu studentů FSE se změnou zkušebního řádu na biopolární škále kategori ální –
ordinální (slovně uspořádaná), má smysl říkat větší/menší
e. Počet sourozenců studentů prezenčního studia FSE kategoriální- kardínální, má smysl počítat

2. Jak byste vyšetřovali úspěšnost investic do reorganizace firmy? Jak by vypadal datový soubor a jaké
údaje by k tomuto vyšetření posloužily? Jakou stat. Metodu byste ve vašem případě použili?
Záleží na tom o jakou reorganizaci se jedná a jestli je hmatatelná (např. jestli se dá číselně vyjádřit
její úspěch), takto by se například dala hodnotit reorganizace reklamy a marketingové propagace.
To znamená, že by se dala takováto reorrganizace dala hodnotit pomocí srovnání počtu prodaných
výrobků před investicí a po investici do reklamy a marketingu
- budeme mít 2 spojitý ddata – před investicí a po a chceme vědět, jestli zavedená reorganizace měla
smysl , použijeme párový T-test

3. U jakých dat můžeme sestrojit bodový graf, ale nemůžeme sestrojit spojnicový graf? A proč?
- bodový graf lze sestrojit u regrese – u 2 spojitých veličin, ale nelze spojnicový
- u časových řad – nemůžu dělat bodový graf, protože zde nemám jen číselné veličiny, musím použít
spojnicový graf

4. Vysvětlete princip párového t-testu


- v párovém t testu ověřujeme, zda rozdíl středních hodnot rozdělení pro veličiny X a rozdělení pro
veličiny Y je roven určitému číslu (často nule)
- předpokladem je, že tento rozdíl (nikoli nutně samotné y a z) má normální rozdělení
- 2 závislé výběry náhodných veličin X a Y
- klasickým příkladem párových pozorování jsou hodnoty dvou po sobě jdoucích měření na stejném
pacientovi, které samozřejmě nelze považovat za nezávislé, neboť jsou vázány osobou pacienta
- cílem testu o rozdílu párových pozoroání, párového t-testu je ověřit, zda se střední hodnoty
náhodných veličin X a Y liší o předem danou hodnotu 0.
- předpokládáme tedy realizaci dvourozměrného náhodného vektoru o rozsahu n

5. Vyjmenujte tři míry polohy. Uveďte v jakém případě se používají.


- Aritmetický průměr – (inter. Měřítko, symetr rozdělení, stat testy – smysl sčítat
- Medián (ordinální měř., chceme znát střed rozdělení dat) – dělí řadu na 2 stejné početní skupiny
- modus ( rozdělení s více vrcholy, kat., ordinální i nominální)
- geografický průměr – tam kde má smysl násobit, ale nemá smysl sčítat (koef. Růstu pro výpočet
prům. tempa růstu)
- harmonický průměr – pro vel. S jednotkami ve tvaru zlomku (prům. rychlost na úsecích st. Délky)
6. Nakreslete situaci dat, pro která jsme vytvořili dva regresní modely. Při výpočtech jsme zjistili, že
korelační koeficient má hodnotu -0,97 a index determinace kvadratického modelu má hodnotu 0,11
Obázek v souboru 21)

Úlohy za 10 bodů
7. Na 5% hladině významnosti ověřte, zda datový soubor výběrovým souborem z populace, v níž je
hodnota horního kvartilu rovna 45.
- Pomocí kterého testu můžeme daný problém vyřešit? A proč? 1-výběrový test pro
pravděpodobnost
- Formulujte dvojici stat. Hypotéz
H0: pí=25
H1: pí není rovno 0,25
- Vyhodnoťte a interpretujte následující možný výsledek testu (nesouhlasí se skutečným výsledkem):
- Testové kritérium T = 5,65
- Patřičný kvantil = 4,26
W = (-nekonečno;-4,26> U <4,26; nekonečno)
T je prvkem W… H0 zamítáme
Datový soubor není výběrovým souborem

8. Ověřte, zda byly srovnatelné názory studentů a studentek na přímou volbu prezidenta. Výběrový
soubor obsahuje mimo jiné odpovědi na otázku, zda je přímá volba prezidenta vhodná, a to na škále
od 1 do 5 (1=určitě ano, 2=spíše ano, 3=nevím, 4=spíše ne, 5= určitě ne)
- Pomocí kterého testu můžeme daný problém vyřešit? A proč? 2-výběrový test pro střední hodnotu,
protože máme dvoje data (studentky a studenti) a srovnáváme to, jestli jsou jejich názory
srovnatelné (mají srovnatelné mí)
- Formulujte dvojici stat. Hypotéz názory studentů a studentek nejsou srovnatelné
H0: mí1 = mí2
H1: mí1 se nerovná mí 2
- Vyhodnoťte a interpretujte následující možný výsledek testu (nesouhlasí se skutečným výsledkem):
- P-hodnota = 0,0631
p-hodnota je větší než hladina významnosti 0,05… H0 nelze zamítnout.. Neprokázalo se, že by názory
byly rozdílné. Střední hodnoty jsou srovnatelné

9. Ministerstvo sledovalo průměrné měsíční platy v rozmezí let 2000 až 2017 ve třech odvětvích
(A=zemědělství, lesnictví a rybářství; B= těžba a dobývání; C= Zpracovatelský průmysl). Byla
provedena regresní analýza sledující vzájemný vztah platů vzájemně mezi těmito odvětvími.
Vyhodnoťte a interpretujte co nejpřesněji následující 3 výstupy z Excelu. Interpretujte všechny tři
směrnice. Vyberte model popisující nejsilnější vztah. Jak byste v tomto modelu odhadli plat v daném
odvětví, pokud byl plat v nezávislém odvětví 24 000 Kč.

Výsledek A-B

Regresní statistika
Násobné R 0,94583
Hodnota spolehlivosti R 0,894594
Nastavená hodnota spolehlivosti
R 0,89373
Chyba stř. hodnoty 1328,237
Pozorování 70
Úloha za 5 bodů
1. U každé z následujících vlastností uveďte, o jaký typ znaku se jedná – zda je v kvantitativní či
kvalitativní, kardinální, ordinální či nominální, alternativní, spojité či kategoriální. Odůvodněte
a. Počet studentů VŠ ve státech EU kategoriální – kardinální číselné, má smysl počítání
(sčítání) nekategoriální, kvantitativní, kardinální
b. Počet členů vlády účastnících se na jednotlivých jednání poslanecké sněmovny kategoriální
– kardinální, má smysl počít nekategoriální, kvantitativní, kardinální
c. číslo pasu občanů ČR kategoriální – nominální, má smysl pouze porovnání je/není rovno
nekategoriální, kvalitativní, nominální
d. Výše státního rozpočtu (v eurech) státu EU v daném období nekategoriální – kardinální, má
smysl počítání nekategoriální, kvantitativní, kardinální
e. Míra souhlasu obyvatel na škále (1=určitě ne, 2=spíše ano, 3= spíše ne, 4=určitě ne)
kategoriální, má smysl porovnávání větší/menší kategoriální, kvalitativní, ordinální

2. Jak byste vyšetřovali, zda jsou pracovníci firmy spokojeni s finančním odměňování dle
odpracovaných let, jak by vypadal výběrový soubor a jaké otázky v dotazníku by k tomuto vyšetření
posloužily? Co by obsahoval datový soubor? Jakou stat. Metodu byste ve vašem případě použili?
- vytvoření dotazníků
- otázky v dotazníků: kolik let v této firmě pracujete? 1,2,3,4,5,6,7,…;Jste spokojeni s finančním
ohodnocením? Ano/ne; Jaká je vaše pracovní pozice?
- použili bychom Chí kvadrát test nezávislosti, protože sledujeme dvojici kategoriálních veličin XY –
jak dlouho pracují v naší firmě a zda jsou spokojeni s finančním ohodnocením
H0 = H1
H1 = non H0

Podle mě spíš regrese

3. Uveďte princip či postup Friedmanova testu, uveďte příklady vhodného použití.


● Neparametrický test pro více než 2 záv. Výběry
● Rozšiřuje Wilcoxonův test
● Určen pro spojitou vel., možnost využití i ordinální škála
● test ověřuje, zda úroveň sledovaného znaku závisí nebo nezávisí na změně podmínek
● test je pro spojitou veličinu nebo pro ordinální škálu měření
● máme k, s tím, že k je větší nebo rovno 2 závislých náhodných výběrů každý o rozsahu n a n je větší
než 5
● hodnoty ze všech výběrů vytváří matici o velikosti n * k
● v rámci každého řádku se jednotlivým hodnotám přiřadí hodnota od 1 do k
● shodným hodnotám se přiřadí průměrné pořadí čísel, která by jim připadla
● H0: shodná )roveň veličiny X ve všech výběrech
● H1: non H0

4. Uveďte, co to jsou extenzitní (absolutní) ukazatele a intenzivní (relativní) ukazatele


extenzitní ukazatele – měří množství, objem rozsah
intenzivní ukazatele – charakterizují míru, v jaké jsou extenzivní ukazatele podnikem využívány a jak
silně či rychle se mění
5. Vyjmenujte 5 způsobů ověřování normality dat
● Histogram,
q-q,
p-p,
Kolmogorův-Smirnovův test,
Shapiro-Wilk test

6. Nakreslete situaci dat, pro která jsme vytvořili dva regresní modely. Při výpočtech jsme zjistili, že
korelační koeficient má hodnotu -0,57; reziduální rozptyl lineárního modelu má hodnotu 3,41 a
reziduální rozptyl kvadratického modelu má hodnotu 2,11.
Obrázek v souboru 27) úloha

Úlohy za 10 bodů
7. Manažer prodeje hodnotí dva nově vzdělávací kurzy. Patnáct zaměstnanců, kteří dostávají
standartní školení, rozdělí do tří skupin. Skupina 2 obdrží navíc technický výcvik a skupina 3 obdrží
navíc aktivní tutoriál. Každý zaměstnanec byl testován na konci výcvikového kurzu. Výsledky jsou
zaznamenávány v následující tabulce. Na základě údajů v tabulce zjistěte, zda mají nová školení
přínos.

Skupina 1 Skupina 2 Skupina 3


29,51 30,54 33,95
21,54 31,52 38,98
39,46 33,45 34,12
29,46 36,95 35,16
4,31 33,79 37,59
- pomocí kterého testu můžeme daný problém vyřešit? A proč? ANOVA, protože jsou to spojité
veličiny ve 3 kategoriích
- Formulujte dvojici stat. Hypotéz
H0: mí1 = mí2 = mí3
H1: non H0
- Vyhodnoťte a interpretujte následující možný výsledek testu (nesouhlasí se skutečným výsledkem):
- Testové kritérium T = 5,65
- Patřiční kvantil = 6,26
W = <6,26;nekonečno)
T není prvkem W.. H0 nelze zamítnout, školení nemá význam, výsledky jsou podobné či stejné

8. 1 200 náhodně vybraných žáku psalo po sobě dva různé diktáty. Poté se zjistil počet chyb u
každého žáka v jednotlivých diktátech. Vedení soukromé školy chce dát do přijímacích zkoušek těžší
z těchto diktátů.
- Pomocí kterého testu můžeme daný problém vyřešit? A proč? Dvouvýběrový T test pro střední
hodnotu, protože jde o 2 různé testy (diktáty), které nejsou nijak závislé
- Formulujte dvojici stat. Hypotéz
H0: mí1 = mí2
H1: mí1 < mí2
- Vyhodnoťte, diskutujte a interpretujte následný možný výsledek testu (nesouhlasí se skutečným
výsledkem):
- P-hodnota = 0,0793
p-hodnota je větší než 0,05… H0 nelze zamítnout. Lze tedy říci, že testy jsou podobně težké a nelze
vybrat těžší

9. Ministerstvo sledovalo průměrné měsíční platy od 1. čtvrtletí 2000 do 3. Čtvrtletí 2017 (včetně) ve
třech odvětvích (A=zemědělství, lesnictví a rybářství; B= těžba a dobývání; C= Zpracovatelský
průmysl). Byla provedena regresní analýza pro vyjádření trendu jednotlivých časových řad.
Vyhodnoťte a interpretujte co nejpřesněji následující 3 výstupy z Excelu. Interpretujte všechny tři
směrnice. Vyberte model popisující nejsilnější vztah. Jak byste v tomto modelu odhadli plat v daném
odvětví pro 1. čtvrtletí roku 2018.
Úloha za 5 bodů
1. U každé z následujících vlastností uveďte, o jaký typ znaku se jedná – zda je v kvantitativní či
kvalitativní, kardinální, ordinální či nominální, alternativní, spojité či kategoriální. Odůvodněte
a. Počet žen ve vládách EU kategoriální – kardinální, má cenu počítání nekategoriální,
kvantitativní, kardinální
b. Číslo verze SW kategoriální, kvalitativní, ordinální
c. Informace o účasti prezidenta na jednotlivých jednáních poslanecké sněmovny kategoriální
– kvalitativné, nominální, alternativní
d. výše státního rozpočtu v eurech států EU v daném období nekategoriální, kvantitativní,
kardinální
e. Míra souhlasu obyvatel na škále (1=určitě ano, 2=spíše ano, 3=nevím, 4=spíše ne, 5= určitě
ne) kategoriální, kvalitativní, ordinální

2. Jak byste vyšetřovali, jak moc jsou pracovníci firmy spokojeni s finančním odměňováním dle
odpracovaných let? Jak by vypadal výběrový soubor a jaké otázky v dotazníku by k tomuto vyšetření
posloužily? Jakou stat. Metodu byste ve vašem případě použili?

Možná regrese protože porovnáváš dve jiné hodnoty jednoho respondenta jako to finanční
odměňování a odpracované roky …. Ale nejsem si jistá

3. uveďte princip či postup Wilcoxonova testu, uveďte příklady vhodného použití.


použití: neparametrický statistický test hypotéz, který se používá k porovnání dvou souvisejících
vzorků, párovaných vzorků nebo opakovaných měření na jednom vzorku k posouzení, zda se jejich
průměrné hodnoty populace liší

4. Uveďte dva typově různé případy dat, kdy je nutno použít Spearmanův korelační koeficient místo
Pearsnova korelačního koeficientu. Odůvodněte proč.

Spearmanův = vychází z pořadí

Pearsonova = vychází z hodnot

5. Vyjmenujte 3 míry variability. Uveďte v jakém případě se používají.


● Variační koeficient
● Kvartilové rozpětí
● Rozptyl
● Směrodatná odchylka

6. Nakreslete situaci dat, pro která jsme vytvořili dva regresní modely. Při výpočtech jsme zjistili, že
korelační koeficient má hodnotu 0,17 a index determinace kvadratického modelu má hodnotu 0,11.
Vypracováno v souboru, úkol 29)

Úlohy za 10 bodů
7. V tabulce jsou zaznamenány výsledky „reakční doby“ jednotlivých řidičů před podáním alkoholu a
po konzumaci alkoholu. Mělo by se na základě vyhodnocení testu uvažovat o tolerování požití
malého množství alkoholu před jízdou?

Řidič před po
1 0,69 0,84
2 0,56 0,75 Řidič před po
3 0,87 0,61 6 0,68 0,57
4 0,74 0,81 7 0,63 0,54
5 0,65 0,72 8 0,52 0,63
9 0,71 2,83
10 0,59 0,79

- pomocí kterého testu můžeme daný problém vyřešit? A proč? Párový t-test, protože máme jednoho
zaměstnance a k němu 2 data, který jsou závislá na lkoholu
- Formulujte dvojici stat. Hypotéz
H0: mí1 = mí2
H1: mí1 < mí2
- Vyhodnoťte, diskutujte a interpretujte následný možný výsledek testu (nesouhlasí se skutečným
výsledkem):
- p-hodnota = 0,0913
p-hodnota je větší než 0,05, tudíž H0 nelze zamítnout, to znamená, že by se mohlo malé množství
podávat před jízdou

8.Pojišťovna zavádí nový způsob pojistek. Uvažuje o výši pojistného dle věkových kategorií.
K dispozici jsou údaje (věk a počty pojistných událostí) o náhodně vybraných klientech v určitém
regionu. Zjistěte, zda existuje riziková věková kategorie, pro kterou by mělo být nastavení zvýšené
pojistné a naopak prémiová kategorie, v rámci níž by klienti mohli platit snížené pojistné.
- Pomocí kterého testu můžeme daný problém vyřešit? A proč? Pomocí dvouvýběrového t-testu
předem nutno provést F-test (test o shodě rozptylů) a nezávislé proměnné (různé věkové kategorie)
- Formulujte dvojici stat. Hypotéz
- Vyhodnoťte a interpretujte následující výsledek testu (nesouhlasí se skutečným výsledkem):
- Testové kritérium T=8,65
- Patřiční kvantil = 6,26

9. Ministerstvo sledovalo průměrné měsíční platy od 3. čtvrtletí 2000 do 3. Čtvrtletí 2017 (včetně) ve
třech odvětvích (A=zemědělství, lesnictví a rybářství; B= těžba a dobývání; C= Zpracovatelský
průmysl). Byla provedena regresní analýza pro vyjádření vztahu jednotlivých časových řad s časovou
řadou dat za celou ČR. Vyhodnoťte a interpretujte co nejpřesněji následující 3 výstupy z Excelu.
Interpretujte všechny tři směrnice. Vyberte model popisující nejpřesnější vztah ve kterém „?“
Odvětví rozdělené do A, B, C
Úloha za 5 bodů
1. U každé z následujících vlastností uveďte, o jaký typ znaku se jedná – zda je v kvantitativní či
kvalitativní, kardinální, ordinální či nominální, alternativní, spojité či kategoriální. Odůvodněte
a. Nejvyšší dosažené vzdělání zaměstnance firmy kategoriální – ordinální, můžeme
porovnávat a říkat, jestli je lepší nebo horší kategoriální, kvalitativní, ordinální
b. Počet dní nevyčerpané dovolené zaměstnance firmy nekategoriální spojitá veličina, která
se dá rozdělit na kategoriální, například počet dnů zaměstnance nekategoriální, kvantitativní,
kardinální
c. Informace o členství zaměstnance firmy v odborech kategoriální – nominální, nelze počítat,
pouze rovno nebo není rovno kategoriální, kvalitativní, nominální, alternativní
d. Telefonní číslo zaměstnance firmy kategoriální – nominální, lze pouze říci rovno/není rovno

Nekategoriální, kvalitativní, nominální


e. Délka práce zaměstnance firmy kategoriální – kardinální číselné, má smysl počítání
nekategoriální, kvantitativní, kardinální

2. Jak byste vyšetřovali, zda v rámci EU komunistická historie státu ovlivňuje vývoj nezaměstnanosti
po roce 2000? Jak by vypadal datový soubor a jaké údaje by k tomuto vyšetření posloužili? Jakou stat.
Metodu byste ve vašem případě použili?
● Pracovali bysme s daty od ČSÚ - vývoj nezaměstnanosti od roku 2000 do roku 2020 pro jednotlivé
státy EU
● přes statistické úřady jednotlivých zemí bychom zjistili, jak se měnila volba komunistické strany v
jednotlivých zemích EU - procento volby, úspěšnost
● Zjistit data po roce 2000 až do roku 2020 pro obě veličiny a sloučit data pro všechny státy (za celou
EU) - vzniknou nám dvě veličiny X a Y, které budou spojité.
● Budeme zkoumat jejich závislost pomocí regrese - jaký je mezi nimi vztah a jestli existuje vztah mezi
nezaměstnaností a volbou komunistické strany.
● Ho: model je nevýznamný; H1: model je významný podle P hodnoty

Ne pomocí časových řad – máš tam vývoj nezaměstnanosti během let

3. U jakých dat můžeme počítat relativní četnosti a nemůžeme počítat kumulované a relativní
četnosti? A proč?

● kumulované četnosti mají smysl počítat jen u ordinálních a kardinálních diskrétních veličin
● u číselných dat - škály, počty...
● Kumulované mají smysl jen tam, kde se dají data řadit (více, méně..)

4. Vysvětlete princip X^2 (X na druhou) testů

Chí kvadrát testy

Porovnání dvou kategoriálních veličin

Dva typy nezávislosti a dobré shody kdyžtak si zbytek doplň co chceš říct

5. Uveďte příklady situací (=dotazníkových otázek), kdy by míra souhlasu byla reprezentována
veličinou kardinální-spojitou; kardinální-diskrétní; ordinální; nominální; alternativní.
Tohle jsem měla já a nevěděla jsem, ale tohle je špatně má to být míra souhlasu
kardinální spojitou – Kolik Vám je let? kardinální diskrétní – Kolik válců má automobil?
ordinální – Jaké máte nejvyšší vzdělání?
nominální – Jakou máte barvu očí?
alternativní – muž/žena?

6. Nakreslete do jednoho obrázku dva boxploty (=krabicové grafy) vytvořené na základě momentů.
První z nich je popisem výšky žen a druhý z nich je popisem výšky mužů. Interpretujte! Akorát to
vyměním za výšku žen a mužů

zase momenty to samé jako v 1. testu

Úlohy za 10 bodů
7. Na 5% hladině významnosti ověřte, zda má smysl zavést nový vzdělávací kurz, pokud jsme zkoumali
přínos tohoto kurzu na vybrané skupině zaměstnanců pomocí kontrolního testu.

zaměstnanec Body před Body po zaměstnanec Body před Body po


1. 35 40 5. 36 37
2. 38 41 6. 4 3
3. 42 39 7. 39 34
4. 39 40 8. 40 40
- pomocí kterého testu můžeme daný problém vyřešit? A proč? Párový T-test, protože máme jedny
zaměstnance a k nim dvoje data, která jsou závislá na školení
- Formulujte dvojici stat. Hypotéz
H0: mí1 = mí2
H1: mí1 < mí2
- Vyhodnoťte a interpretujte následující možný výsledek testu (nesouhlasí se skutečným výsledkem):
- Testové kritérium T = 5,65
- Patřiční kvantil = 4,26
W = (-nekonečno;-4,26>
T nespadá do souboru hodnot, H0 nelze zamítnout. Školení nemá významný vliv

8. Ověřte, zda byly srovnatelné názory studentů a studentek na přímou volbu prezidenta. Výběrový
soubor obsahuje mimo jiné 328 odpovědí na otázku, zda je přímá volba prezidenta vhodná, a to na
škále od 1 do 5 (1=určitě ano, 2=spíše ano, 3=neutrální postoj, 4=spíše ne, 5= určitě ne)
- Pomocí kterého testu můžeme daný problém vyřešit? A proč? 2-výběrový test pro střední hodnotu,
protože máme dvoje data (studentky a studenti) a srovnáváme to, jestli jsou jejich názory
srovnatelné (mají srovnatelný mí)
- Formulujte dvojici stat. Hypotéz názory studentů a studentek nejsou srovnatelné
H0: mí1 =mí2
H1: mí1 se nerovná mí2
- Vyhodnoťte, diskutujte a interpretujte následující možný výsledek (nesouhlasí se skutečným
výsledkem):
- P-hodnota = 0,0731
p-hodnota je větší než hladina významnosti 0,05 H0 nelze zamítnout...Neprokázalo se, že by názory
byly rozdílné. střední hodnoty jsou srovnatelné

9. Ministerstvo sledovalo počty ubytovaných v českých luxusních hotelích dle zemí, a to v rozmezí od
ledna 2012 do září 2017. Byla provedena regresní analýza sledující trend ubytovaných ze tří vybrných
zemí (Austrálie, Čína a USA). Vyhodnoťte a interpretujte co nejpřesněji následující tři výstupy
z excelu. Interpretujte všechny 3 směrnice. Vyberte model popisující nejsilnější vztah. Jak byste
v tomto modelu odhalili počet ubytovaných této země v lednu 2018?
Úlohy za 5 bodů
1. U každé z následujících vlastností uveďte, o jaký typ znaku se jedná – zda je v kvantitativní či
kvalitativní, kardinální, ordinální či nominální, alternativní, spojité či kategoriální. Odůvodněte
a. Počet zkoušek jednotlivých studentů FSE v daném semestru kategoriální, kardinální – má
smysl počítat – kolik zkoušek kategoriální, kvantitativní, kardinální
b. číslo licence SW - SW má většinou 3 čísla - to znamená, že to může být libovolné
trojmístné číslo - velmi mnoho možností, které nemá smysl sčítat ani kategorizovat.
● ordinální veličina (pořadové) - má smysl maximálně srovnávat větší menší, horší lepší

Kategoriální, kvalitativní, ordinální


c. Vojenská hodnost – kategoriální – ordinální, lepší/horší kategoriální, kvalitativní, ordinální
d. Počet občanů států EU v daném období kategoriální – kardinální, číselné, má smysl počítání
nekategoriální, kvantitativní, kardinální
e. Míra spokojenosti obyvatel města v Sémantickém diferenciálu kategoriální – ordininální,
má smysl srovnání lepší/horší kategoriální, kvalitativní, ordinální

2. Jak byste vyšetřovali, zda jsou pracovníci firmy finančně odměňování dle odpracovaných let, jak by
vypadal výběrový soubor a jaké otázky v dotazníku by k tomuto vyšetření posloužily? Co by obsahoval
datový soubor? Jakou stat. Metodu byste ve vašem případě použili?

Tohle taky nevím, ty 2. cvičení mi dělala problém

3. Uveďte v čem je principiální shoda a v čem rozdíl použití dvouvýběrového t-testu


U obou uveďte příklady vhodného použití.
● dvouvýběrový t-test
○ předem nutno provést F-test (test o shodě rozptylů)
○ nezávislé proměnné (žáci různých škol)
● párový test
○ dva závislé výběry náhodných veličin X a Y
○ napsal test před a po třeba doučování
● u obou se jedná o střední hodnoty mí

4. Vysvětlete princip tvorby intervalů spolehlivost. K čemu se využívají?

● jsou to intervalové odhady neznámého parametru


● odvozují se z příslušné CLV
● je to pravděpodobnost, že neznámá hodnota parametru je intervalem pokryta (nejčastěji 95%
interval spolehlivosti)
● spolehlivost = 1 - alfa
● oboustranné intervaly pro střední hodnotu (2 typy)
○ při známém a při neznámém o (o = směrodatná odchylka)

5. Vyjmenujte 5 různých typů průměrů. Uveďte v jaké případě se používají.


● aritmetický - vhodné pro data, která má smysl sčítat
● geometrický - vhodný pro data, které je vhodné násobit, ne sčítat (průměrné tempo růstu) ●
harmonický - pro jednotky ve tvaru zlomku
● kvadratický
harmonický
● modus - nejpočetněji zastoupená skupiny (četnost)
● medián - rozdělení dat na dvě stejné početní skupiny
● vážený průměr - průměr z průměrů

6. Nakreslete situaci dat, pro která jsme vytvořili dva regresní modely. Při výpočtu korelační
koeficient má hodnotu -0,87 a index determinace kvadratického modelu 0,7569
V souboru obrázek 28)

Úlohy za 10 bodů
7. Na základě údajů v tabulce zjistěte, zda výše nájemného závisí na počtu pokojů.

Počet pokojů Výše nájmu v Kč


0 3 200 3 800 4 000
1 3 000 3 900 4 200 4 900
2 3 600 3 800 4 600 4 600 6 000
3 3 000 4 300 5 500 6 500 9 500
- pomocí kterého testu můžeme daný problém vyřešit? A Proč? Asi anova
- Formulujte dvojici stat. Hypotéz H0: mí1 = mí2 = mí3 = mí4 H1: non H0
- Vyhodnoťte a interpretujte následující možný výsledek testu (nesouhlasí
- Testové kritérium T = 8,65
- Patříčný kvantil = 6,26 T je větší než W …. T leží ve W zamítáme H0

8. Ověřte, zda byly srovnatelné investice do reklamy ve vybraných firmách „?“


Výběrový soubor obsahuje pro rok 2005 údaj o 350 firmách a firmách
- pomocí kterého testu můžeme daný problém vyřešit? A proč? Dvouvýběrový t-test o shodě
středních hodnot – zkoumáme shodu rozptylů dvou nezávislých výběrů
- formulujte dvojici stat. Hypotéz
H0: mí1 = mí2
H1: mí1 není rovno mí2
- vyhodnoťte, diskutujte a interpretujte následný možný výsledek „?“ výsledkem):
- p-hodnota = 0,0593
p-hodnota je větší než 0,05..H0 nelze zamítnout
Nelze říci, že by investice do reklamy nebyly srovnatelné

9. špatně vyfoceno
Úloha za 5 bodů
1. U každé z následujících vlastností uveďte, o jaký typ znaku se jedná – zda je v kvantitativní či
kvalitativní, kardinální, ordinální či nominální, alternativní, spojité či kategoriální. Odůvodněte
a. Platová třída zaměstnance firmy kardinální spojité – široké spektrum hodnot, např věk,
hmotnost, plat tady musíš psát vždycky všechna rozdělení – takže kategoriální, kvantitativní,
kardinální
b. Počet předchozích zaměstnání zaměstnance firmy kategeoriální – kardinální číselné, má
smysl počítání kategoriální, kvantitativní, kardinální
c. Informace o znalostí práce s Microsoft Office kategoriální – ordinální, má smysl srovnání
větší/menší, lepší/horší nekategoriální, kvalitativní, nominální
d. Číslo kanceláře zaměstnance firmy kategoriální, nominální nekategoriální, kvalitativní,
nominální
e. Počet odpracovaných let zaměstnance firmy kategoriální - kardinální, má smysl počítání

Nekategoriální, kvantitativní, kardinální

2. Jak byste vyšetřovali, jak se v rámci ČR projevilo zavedení protikuřáckého zákona? Jak by vypadal
datový soubor a jaké údaje by k tomuto vyšetření posloužily? Jakou stat. Metodu byste ve vašem
případě použili?

● porovnání sekundárních dat v ČSÚ před a po zavedení protikuřáckého zákona v ČR


○ počet kuřáků před a po zavedení zákona nebo počet prodaných krabiček cigaret před a po
● test na porovnání dvou středních hodnot (párový test)
● H0: mí1 = mí2
● H1: mí1 < mí2

3. Jak bychom převedli neekvidistantní časovou řadu na ekvidistantní? Jaký je mezi těmito dvěma
druhy časových řad rozdíl? Uveďte příklady

● Ekvidistantní= jednotlivé hodnoty. Zahrnují stejně dlouhá období


● Neekvidistantní= čas. Řady s různou časovou vzdáleností mezi jedn. Hodnotami
● Převést např. doplněním hodnot řady

4. Vysvětlete princip metody nejmenších čtverců.

● Součet čtverců (druhých mocnin) rozdílů naměřených hodnot Yi a funkčních hodnot F (Xi) pro
stejnou hodnotu byl co nejmenší
● určena pro nekompatibilní soustavy lineárních rovnic
● obecně slouží k eliminaci chyb

5. Jaký je rozdíl mezi mírami polohy a mírami variability? Jaký je rozdíl jejich použití? Uveďte příklady
situací, kdybyste který typ míry použili.

● Míry variability= vzájemná blízkost či vzdálenost hodnot jedn. Prvků


○ Rozptyl, směr. Odchylka, var. Koef.
● Míry polohy= typická hodnota dat, určují, kde na číselné ose je vzorek rozložen
○ Aritmetický průměr, medián, modus, všechny průměry
6. Nakreslete do jednoho obrázku dva boxploty (=krabicové grafy) vytvořené na základě momentů.
První z nich je popisem platů v ČR a druhý v Německu (platy obou zemí budou uvedeny ve stejné
měně). Interpretujte

máš dělat na momenty ne na kvantily….. takže


místo hodniho a doního kvartylu budou směrodatné odchylky a místo mediánu bude průměr

Úlohy za 10 bodů
V experimentu byl sledován vliv vitamínového přídavku do krmiva na zvyšování váhových přírůstků u
selat. U 8 z 16 náhodně vybraných selat byl aplikován vitamínový přípravek v krmné směsi (pokusný
zásah „B“). Standartní krmná směs =pokusný zásah „A“. Váhové přírůstky v kg byly následující:

Pokusný zásah „A“ Pokusný zásah „B“ Pokusný zásah „A“ Pokusný zásah „B“
35 40 36 37
38 41 4 36
32 39 34 35
31 60 30 40
- Pomocí kterého testu můžeme daný problém vyřešit? A proč? Párový t-test … protože máme závislý
výběr pro 1 sele 2 váhy před a po
- Formulujte dvojici stat. Hypotéz i
mí1 - váha před vitaminem a mí2 je po vitamínu
H0: mí1 = mí2; H0: d = 0
H1: mí1 < mí2; H1: d > 0
- Vyhodnoťte a interpretujte následující možný výsledek testu (nesouhlasí se skutečným výsledkem):
- Testové kritérium T = 5,65
- Patříčný kvantil = 4,26

W = <4,26; nekonečno) --- T spadá do tohoto intervalu, zamítáme H0 – vitamín je účinný a zvyšuje
váhový přírůstek u selat

8. Ověřte, zda byly srovnatelné názory studentů a studentek na přímou volbu prezidenta. Výběrový
soubor obsahuje mimo jiné 328 odpovědí na otázku, zda je přímá volba prezidenta vhodná, a to na
škále od 1 do 5 (1=určitě ano, 2=spíše ano, 3=nevím, 4=spíše ne, 5=určitě ne)
- Pomocí kterého testu můžeme daný problém vyřešit a proc? 2-výběrový test pro střední hodnotu,
protože máme dvoje data (studentky a studenti) a srovnáváme to, jestli jsou jejich názory
srovnatelné (mají srovnatelný mí)
- Formulujte dvojici stat. Hypotéz
Názory studentů a studentek nejsou srovnatelné.
H0: mí1 = mí2
H1: mí1 se nerovná mí2
- Vyhodnoťte, diskutujte a interpretujte následný možný výsledek testu (nesouhlasí se skutečným
výsledkem):
- P-hodnota = 0,0531

p-hodnota je větší než hladina významnosti 0,05 H0 nelze zamítnout...Neprokázalo se, že by názory
byly rozdílné. střední hodnoty jsou srovnatelné

9. Ministerstvo sledovalo průměrné platy v ČR a ve vybraných odvětvích od počátku roku 20xx do 3.


Čtvrtletí 2017. Byla provedena regresní analýza sledující vztah mezi platy v ČR a jednotlivými
odvětvími. Vyhodnoťte a interpretujte co nejpřesněji následující výstupy z excelu. Interpretujte

You might also like