You are on page 1of 31

Statistika

doc. Mgr. Veronika Blašková, Ph.D.


veronika.blaskova@mendelu.cz

Přednáška 1
Úvodnı́ informace

Informace ke cvičenı́
Docházka je nepovinná, v rámci cvičenı́ lze ovšem zı́skat až 5 bodů za
aktivnı́ účast na svém cvičenı́. Tyto body sloužı́ jako bonusové body
u zkoušky.

V poslednı́m týdnu bude mı́sto cvičenı́ zpracováván praktický úkol,


který bude hodnocen maximálně 10 body.

Zápočtový test na 35 bodů (15+20), minimum na splněnı́ je 50 %


bodů z každé části.

Malý zápočet bude za splněnı́ 25 bodů v součtu za zápočtový test


a individuálnı́ praktický úkol.
Veškeré informace k předmětu jsou na DS.

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 2 / 31


Úvodnı́ informace

Zápočtový test

Test je na 35 bodů (15+20), pouze přı́klady a to z látky cvičenı́.


Hodnotı́ se i postup.

Na test má každý student dva pokusy.

Test rozdělený na dvě části – 8.a 13. týden semestru

Náhradnı́ (opravný test) – v prvnı́m zkouškovém týdnu.

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 3 / 31


Úvodnı́ informace

Informace ke zkoušce:

e-test: nastavena korekce hádánı́ (maximálnı́ počet 45 bodů)

ústnı́ zkouška: ověřuje pochopenı́ problematiky (maximum 10 bodů)

V přı́padě neúspěšné ústnı́ zkoušky student opakuje i e-test.

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 4 / 31


Základnı́ pojmy

statistický soubor

statistická jednotka

statistický znak

jev

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 5 / 31


Etapy statistické činnosti

zjišt’ovánı́

zpracovánı́

analýza

prezentace výsledků

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 6 / 31


Statistické zjišt’ovánı́

Statistické zjišt’ovánı́ spočı́vá ve shromažd’ovánı́ údajů kvantitativnı́ či


kvalitativnı́ povahy o zkoumaném hromadném jevu.

v rámci zjišt’ovánı́ se zabýváme hromadnými jevy,

zajı́majı́ nás variabilnı́ vlastnosti jevů.

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 7 / 31


Statistické zjišt’ovánı́

Úplné

Neúplné

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 8 / 31


Statistické znaky

Statistické analýzy se odlišujı́ i podle toho jaké znaky máme. Statistické


znaky dělı́me na:
Kvalitativnı́ – nominálnı́ – u těchto znaků nemá smysl srovnávat
hodnoty.
Ordinálnı́ – kategorie znaku lze mezi sebou porovnávat a určit jejich
pořadı́. U těchto znaků nemá smysl počı́tat napřı́klad součty nebo
rozdı́ly.
Kvantitativnı́:
intervalové – můžeme počı́tat veliksot rozdı́lu mezi hodnotami, nemá
smysl zı́skávat jejich podı́l – např. teplota
poměrové – reálný význam má i podı́l hodnot – jedna osoba jela
dvakrát rychleji...

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 9 / 31


Statistické zpracovánı́

Při zı́skávánı́ primárnı́ch dat může dojı́t k nějaké chybě.

Abychom při zpracovánı́ nevyužı́vali chybové hodnoty, je dobré data seřadit


bud’ do neklesajı́cı́ posloupnosti nebo utřı́dit do tabulky.

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 10 / 31


Statistické zpracovánı́ – třı́děnı́

Pro prezentaci dat je vhodná tabulka četnostı́.


úroveň absolutnı́ relativnı́ kumulativnı́ kumulativnı́
znaku četnost četnost abs. četnost rel. četnost
fi
xi fi pi = kfi kpi
n
f1 f1
x1 f1 f1
n n
f2 f1 + f2
x2 f2 f1 + f2
n n
.. .. .. .. ..
. . . . .
fk f1 + · · · + fk
xk fk f1 + · · · + fk
n n

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 11 / 31


Statistické zpracovánı́ – třı́děnı́

Přı́klad tabulky prostého a skupinového třı́děnı́ – budeme využı́vat


v indukčnı́ statistice.

znak absolutnı́ znak absolutnı́


počet dětı́ četnost velikost mzdy četnost
0 10 h15; 20) 15
1 25 h20; 25) 40
2 50 h25; 30) 25
3 25 h30; 35) 25
4 a vı́ce 15 h35 a vı́ce 10

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 12 / 31


Grafické znázorněnı́ dat

Jednou z možných prezentacı́ diskrétnı́ho nebo slovnı́ho znaku je využitı́


koláčového grafu.Tento graf je přehledný pokud prezentujeme jednu
datovou řadu.

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 13 / 31


Grafické znázorněnı́ dat
Sloupcový graf x histogram

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 14 / 31


Grafické znázorněnı́ dat

V přı́padě, že chceme srovnávat vı́ce datových řad, je možné využı́t


sloupcový graf, do kterého lze tyto informace přehledně znázornit.

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 15 / 31


Grafické znázorněnı́ dat
Jednı́m z významů znázorněnı́ dat pomocı́ box-plotu je identifikace
hodnot, které vypadajı́ jako odlehlé, přı́p. jsou identifikovány jako extrém.

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 16 / 31


Grafické znázorněnı́ dat
Spojnicový graf se často využı́vá při znázorněnı́ několika časových řad.
Pokud majı́ dané řady jinou jendotku nebo se hodnoty řádově lišı́, je
možné vytvořit graf, který má dvě osy Y.

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 17 / 31


Grafické znázorněnı́ dat
Pavučinový graf znázorňuje průměrné hodnoty, přı́p. různé indexy.

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 18 / 31


Statistická analýza

Popisná statistika
Využı́vá se pokud chceme o datovém souboru zı́skat základnı́
informace.
Popisná statistika se zabývá předevšı́m popisem statistických dat
pomocı́ různých tabulek, grafů, diagramů či různých popisných
charakteristik.
Cı́lem tak je výsledky statistického zkoumánı́ vyjádřit v přehledné
formě a zpřehlednit informace obsažené v datových souborech.
Nevýhodou je, že závěry nelze zobecnit, jelikož se týkajı́ pouze daného
souboru.

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 19 / 31


Statistické charakteristiky

Charakteristiky polohy = úrovně


min, max, kvantily, modus, průměry
Charakteristiky variability
rozpětı́, průměrná absolutnı́ odchylka, rozptyl, variačnı́ koeficient
Dalšı́ charakteristiky
šikmost, špičatost

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 20 / 31


Charakteristiky úrovně
Extrémy – minimum, maximum

Minimum a maximum sloužı́ k rychlé představě o naměřených informacı́ch.


V přı́padě, že extrém vznikne v důsledku hrubé chyby, může existence
extrému ovlivnit statistické analýzy.
Modus

Modem je nejčetnějšı́ hodnota souboru.

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 21 / 31


Charakteristiky úrovně – kvantily

Kvantil je hodnota, která dělı́ uspořádaný soubor v poměru p:(1-p).

Mezi nejvýznamnějšı́ kvantily řadı́me kvartily, které dělı́ řadu na čtvrtiny a


označujı́ se:

dolnı́ kvartil x0,25


medián x̃
hornı́ kvartil x0,75

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 22 / 31


Charakteristiky úrovně – kvartily

Přı́klad:

Změřili jsme výšku u 6 kamarádů. Nalezněte kvartily této výšky. Naměřené


hodnoty jsou: 168; 185; 174; 170; 180; 169.

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 23 / 31


Charakteristiky úrovně

Aritmetický průměr – nerobustnı́ mı́ra úrovně.

Aritmetický průměr konstanty je roven této konstantě.


Kladné a záporné odchylky od průměru se kompenzujı́, aritmetický
průměr má vlastnost těžiště.
Podrobı́me-li hodnoty znaku x lineárnı́ transformaci, podrobı́ se této
transformaci i aritmetický průměr.
Aritmetický průměr je konstantou, kolem které jsou hodnoty
nejtěsněji nakupeny ve smyslu čtverců odchylek.
n
1X
x̄ = xi
n
i=1

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 24 / 31


Aritmetický průměr

Přı́klad:

Student zı́skal během roku pět 1, dvanáct 2, čtyři 3 a dvě 5. Vypočı́tejte


jaká průměrná známka mu vycházı́.

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 25 / 31


Aritmetický průměr
Aritmetický průměr z vı́ce souborů

x̄1 · f1 + x̄2 · f2 + . . . + x̄n · fn


x̄ =
f1 + f2 + . . . + fn

Přı́klad:

Firma prodává produkci ve třech obchodech. Průměrná cena výrobku v


daném roce u obchodu 1 byla 35 Kč, u obchodu 2 byla 45 Kč a u obchodu
3 činı́ 37 Kč. Poměr objemu prodeje jednotlivých obchodů je 2:1:2.
Vypočı́tejte průměrný zisk pro firmu, pokud náklady na výrobek jsou stále
stejné a jsou 30 Kč.

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 26 / 31


Statistické charakteristiky – průměr

Ne vždy děláme charakteristiky úrovně z naměřených dat, někdy je vhodné


data nějakým způsobem upravit. Jednou z možnostı́ je z dat vypočı́tat
absolutnı́ přı́růstek neboli diferenci.

dt = xt − xt−1
Průměr je potom
n
1 X xn − x1
d¯ = dt =
n−1 n−1
t=2

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 27 / 31


Statistické charakteristiky – průměr

Přı́klad:
V následujı́cı́ tabulce máte tržby v tis. Kč pro 7 po sobě jdoucı́ch dnı́.
Vypočı́tejte průměrnou mezidennı́ tržbu v tomto obdobı́.

den 1 2 3 4 5 6 7
tržba 12 20 17 18 25 23 30

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 28 / 31


Statistické charakteristiky
Dalšı́ z možnostı́ pro úpravu dat je vypočı́tat koeficienty růstu.

xt
kt =
xt−1
Z koeficientu růstu můžeme vyjádřit ještě koeficient přı́růstku

δt = kt − 1
Budeme-li koeficient růstu nebo přı́růstku vyjadřovat v procentech,
mluvı́me o tempu růstu, přı́p. přı́růstku.
Zı́skáme-li z dat koeficienty růstu, potom již k průměrovánı́ nemůžeme
využı́t aritmetický průměr, ale musı́me mı́t průměr geometrický.
Koeficienty přı́růstku nelze průměrovat ani aritmetickým a ani
geometrickým průměrem.

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 29 / 31


Statistické charakteristiky

Geometrický průměr

Geometrický průměr lze použı́vat pouze pro znaky s kladnými hodnotami.

Vyjadřuje průměrnou velikost změny.

v
u n
uY
n
x̄g = t xi
i=1

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 30 / 31


Geometrický průměr

Přı́klad:
V prvnı́m čtvrtletı́ rostla produkce ve stavebnictvı́ o 1 %, ve druhém
čtvrtletı́ rostla o 5 % a ve čtvrtém poklesla o 10 %. Vypočı́tejte informaci
o tom, jak to bylo ve třetı́m čtvrtletı́, pokud vı́te, že průměrný měsı́čnı́
nárůst produkce ve stavebnictvı́ je 2 %.

Veronika Blašková (ÚSO) Statistika LS 2022/2023 14.2.2023 31 / 31

You might also like