You are on page 1of 4

Vybrané příklady

před
druhým průběžným
testem
4ST204 Statistika pro informatiky

4. května 2022

Obsah
1 Úvod . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

2 Zadání úloh . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

3 Reference . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1 Úvod
Uvedený výběr příkladů je zaměřen na procvičení nejzákladnějších typů úloh z předmětu
4ST204 Statistika pro informatiky, které lze očekávat v druhém průběžném testu.
Bližší poučení pro řešení úloh lze nalézt v prezentacích z prvních týdnů výuky nebo
v publikacích [1], [2], [3] a [4]. Z didaktických důvodů bude autorské řešení úloh publikováno
až později, nicméně rozumně brzo před samotným prvním průběžným testem.
V mezičase je možné oslovit cvičícího pro případnou pomoc či radu s řešením úloh, a to cestou
chatu na MS Teams® nebo na emailu lubomir.stepanek@vse.cz , eventuálně lze vyčkat na
autorské řešení.

2 Zadání úloh
1. úloha
V jednom českém městečku bylo osloveno náhodně sto respondentů, z nichž 63 souhlasí
s očkováním proti covidu-19, a zbylých 37 nesouhlasí s očkováním proti covidu-19.

Vysázeno TEXem, R-kem a Lubomírem Štěpánkem


Vybrané příklady před druhým průběžným testem 4ST204 Statistika pro informatiky

(i) Sestavte 90 % interval spolehlivosti průměrného počtu procent respondentů, kteří souhlasí
s očkováním proti covidu-19.
(ii) Pokud bychom chtěli sestavit stejný interval jako v zadání (i), ale s přípustnou chybou1
nejvýše 5 procentních bodů, kolik minimálně bychom za předpokladu konstantního
populačního procenta souhlasícího s očkováním proti covidu-19 potřebovali oslovit
respondentů?
(iii) Sestavte 95 % jednostranný interval spolehlivosti, který odhadne dolní hranici počtu
procent respondentů, kteří souhlasí s očkováním proti covidu-19.
(iv) Znáte-li na hladině významnosti 95 % dolní odhad procenta respondentů, kteří souhlasí
s očkováním proti covidu-19, kolik by to bylo v absolutním měřítku nejméně obyvatel
městečka, pokud má městečko 17 000 obyvatel?

2. úloha
Inspekce v pivovaru chtěla ověřit, zda výrobní linka plní půllitrové lahve dostatečně přesně.
Vybrala proto náhodných dvacet jedna lahví naplněných výrobní linkou a zjistila jednotlivé
naplněné objemy; zjištěné hodnoty (v mililitrech) jsou v tabulce níže.

i xi i xi i xi
1 495,2 8 501,5 15 500,2
2 496,8 9 501,8 16 501,1
3 502,1 10 499,1 17 499,9
4 498,5 11 500,9 18 500,2
5 501,0 12 502,2 19 501,1
6 503,0 13 501,7 20 500,8
7 500,7 14 500,4 21 499,3

Mohla inspekce na hladině významnosti 0,05 učinit závěr, že průměrný objem piva plněný
výrobní linkou je 500 mililitrů?

3. úloha
Ze 100 hodů jednou mincí padla hlava 60-krát.
(i) Je pravděpodobnost padnutí hlavy a orla shodná na hladině významnosti 0,05? Testujte
pomocí testu o parametru pro alternativního rozdělení.
(ii) Nyní pomocí následující kontingenční tabulky

strana mince
hlava orel
počet padnutí 60 40

1
Přípustnou chybou myslíme poloviční šířku oboustranného intervalu spolehlivosti.

2
Vybrané příklady před druhým průběžným testem 4ST204 Statistika pro informatiky

a vhodného χ2 testu otestujte zcela shodnou hypotézu, opět na hladině významnosti


0,05. Docházíte ke stejnému závěru? Je možné legitimně použít oba předchozí přístupy?
Krátce vysvětlete.
(iii) Kolikrát by během 100 hodů musela padnout hlava, abychom zamítli hypotézu o shodné
pravděpodobnosti padnutí hlavy a orla na hladině významnosti 0,01? Jsou oba před-
chozí testy hypotéz k vyřešení zadání (iii) ekvivalentně vhodné, nebo je jeden z nich
„vhodnější“?

4. úloha
Mezi třiceti očkovanými pacienty proti covidu-19 bylo zaznamenáno celkem šest manifestních
průběhů tohoto onemocnění, zatímco mezi čtyřiceti neočkovanými pacienty bylo pozorováno
celkem osmnáct těchto onemocnění.
(i) Testujte na hladině významnosti 0,05, zda očkování proti covidu-19 souvisí s výskytem
tohoto onemocnění.
(ii) Nyní testujte na hladině významnosti 0,01, zda očkování proti covidu-19 souvisí
s výskytem tohoto onemocnění.
(iii) Liší se nějak závěry z části (i) a (ii)? Vysvětlete případný rozdíl v kontextu pravděpo-
dobnosti chyby prvního typu.

5. úloha
V rámci vyučování bylo testováno několik variant písemné závěrečné zkoušky. Každou variantu
složil stejný počet studentů, jejichž znalosti jsou srovnatelné. Pomocí dosažených skóre studentů
byly porovnávány obtížnosti jednotlivých variant, a to pomocí jednofaktorové analýzy rozptylu,
jejíž originální R-kový sumář je v tabulce 1.

Df Sum Sq Mean Sq F value Pr(>F)


varianta 2 279.97
residuals 27 782.26

Tabulka 1: Sumář analýzy rozptylu porovnávající průměrné obtížnosti několika variant závě-
rečné zkoušky pomocí dosažených skóre studentů .

(i) Doplňte prázdná políčka v tabulce 1.


(ii) Kolik bylo porovnávaných variant závěrečné písemné zkoušky?
(iii) Kolik studentů skládalo každou z variant závěrečné zkoušky?
(iv) Lze na hladině významnosti 0,001 považovat obtížnost variant závěrečné písemné zkoušky
za statisticky rozdílnou?

6. úloha
V následující tabulce 2 jsou uvedeny hmotnosti těl různých zvířecích druhů (v kilogramech)
a současně i hmotnosti jejich mozků (v gramech).

3
Vybrané příklady před druhým průběžným testem 4ST204 Statistika pro informatiky

pořadí druhu, i 1 2 3 4 5 6 7 8 9 10
hmotnost těla druhu [kg], xi 4 5 7 12 15 16 20 25 28 35
hmotnost mozku druhu [g], yi 40 45 42 50 55 60 75 79 80 88

Tabulka 2: Hmotnosti těl a mozku vybraných deseti zvířecích druhů .

(i) Modelujte závislost hmotnosti mozku druhů na hmotnosti těla druhů pomocí regresní
přímky založené na minimalizaci součtu čtverců reziduí. Odhadněte parametry regresní
přímky a zapište tuto přímku ve tvaru

ŷ = β̂0 + β̂1 x.
(ii) Zhodnoťte kvalitu regresního modelu pomocí indexu determinace.
(iii) Najděte hodnotu korelačního koeficientu mezi hmotností mozku druhů na hmotností
těla druhů.
(iv) Interpretujte věcně hodnotu odhadu regresního koeficientu β̂0 a odhadu koeficientu β̂1 .
(v) Odhadněte střední hodnotu hmotnosti mozku zvířecího druhu, jehož hmotnost těla je
22 kg.
(vi) Proveďte test o regresním modelu a test o regresních parametrech. Pomocí jejích závěrů
rozhodněte, zda model jako celek a použité regresní parametry jsou vhodné, resp. nutné
pro popis závislosti hmotnosti mozku druhů na hmotnosti těla druhů.
(vii) Porovnejte lineární přímkový model ze zadání (i) s lineárním modelem, ve kterém
hmotnost mozku druhů závisí nejen na lineárním členu, ale i na kvadratickém členu
hmotnosti těla druhů. Zvolte vhodný způsob porování obou modelů a vyslovte, zda je
nutné pro dostatečný popis závislosti hmotnosti mozku druhů na hmotnosti těla druhů
uvažovat i kvadratický člen hmotnotnosti těla druhů.

3 Reference
[1] HINDLS, Richard, Stanislava HRONOVÁ, Jan SEGER a Jakub FISCHER. Statistika pro
ekonomy. Praha: Professional Publishing, 2007. ISBN 978-80-86946-43-6.
[2] MAREK, Luboš. Statistika v příkladech. Praha: Professional Publishing, 2015. ISBN 978-
80-7431-153-6.
[3] KONEČNÁ, Kateřina a Jan KOLÁČEK. Jak pracovat s jazykem R. nedatováno.
[4] DANKO, Jakub a Karel ŠAFR. R snadno a rychle 1 – Úvod do jazyka. Praha, Česká
republika: Oeconomia, 2020. ISBN 978-80-245-2381-1.

You might also like