You are on page 1of 100

1.

Hodina Štatistické
spracovanie dát

Grafické LS 2020/2021

metódy Ing. Ľubomíra


Gabániová, PhD.
▪ Každé štatistické zisťovanie prechádza do fázy štatistického
spracovania údajov, ktorého cieľom je zistiť určité vlastnosti
skúmaných javov - procesov, ktoré sú následne prehľadne
usporiadané podľa určitých kritérií.

GRAFICKÉ ▪ Grafické metódy a metódy popisnej štatistiky sú určené na


efektívne zobrazovanie skúmaného problému príslušnou

METÓDY grafickou reprezentáciou.

▪ Niektoré nástroje vychádzajú zo základných štatistických


prepočtov a tieto výsledky interpretujú formou grafu alebo
skúmaný objekt, či už sú to zdroje, materiál, proces a ľudia,
vlastnými značkami a postupmi.
▪ Tieto metódy majú veľkú výhodu v tom, že sú základom vizualizácie.
A vizualizácia riešených problémov vedie k rýchlejšej a najmä
jednoduchšej identifikácii príležitosti na zlepšovanie kvality.

▪ Ak je na verejne dostupnom mieste v organizácii, napríklad na

GRAFICKÉ výveske o kvalite zobrazený graf alebo postupový diagram, všetci


zamestnanci, ktorí sa zúčastňujú na zlepšovaní kvality, získajú rýchly

METÓDY prehľad o výsledkoch a problémoch manažérstva kvality.

▪ Každý graf sa skladá z grafického obrazu a prostriedkov výkladu


grafu, ktoré musia spĺňať požiadavky grafickej excelentnosti. Graf
musí byť čitateľný, prehľadný, jasný a zrozumiteľný.
▪zloženie grafu z grafického obrazu a prostriedkov výkladu grafu,

▪Vhodný výber grafu k prezentácii premenných,

▪Doladenie farieb v grafe – estetické vnímanie,

Grafická ▪Podrobný popis grafu a jeho prvkov (výška, šírka, hrúbka)

excelentnosť ▪Výstižné označenie grafu,

je zameraná ▪Prehľadnosť a zrozumiteľnosť grafu,

na: ▪Dodržiavanie proporcionálnosti grafu (text, obraz, číslo)

▪Výber vhodnej stupnice grafu (aritmetická, logaritmická,


semilogaritmická)

▪Formálne znaky grafu (popis osí, mierka)


▪Výsledkom štatistického spracovania dáta môže byť rozsiahly
systém ukazovateľov, ktoré potrebujeme vhodne vyhodnotiť
a interpretovať, čo je najvhodnejšie pomocou prevádzania do
grafickej podoby.

Najznámejšie sú:
Klasifikácia ∙ Spojnicový graf
∙ Stĺpcový graf

grafov ∙ Pruhový graf


∙ Kruhový, výsečový graf

v ekonomickej ∙ Radarový diagram


∙ Bodový graf

štatistike ∙ Sieťový graf


∙ Krabičkový graf
∙ Histogram
∙ Z- diagram,
∙ Kartogram,
∙ Kartodiagram,
v akomkoľvek implementačnom programe kvality je potrebne
hodnotiť proces priebežne

základným nástrojom je graf časovej postupnosti

jeden zo základných nástrojov manažérstva kvality

je používaný na poznanie významnejších posunov priemerov údajov,


Spojnicový zhromaždených za určitú časovú jednotku.

graf sú často považované za ukazovatele kvality.

Používa sa na znázornenie ekonomických ukazovateľov vyvíjajúcich


sa v čase. Taktiež môžu byť použité na monitorovanie výkonu
mnohých ukazovateľov kvality produktov, s cieľom zistiť trendy a
očakávania alebo na meranie účinnosti úsilia manažmentu pri
zabezpečovaní kvality
umožňujú manažmentu zistiť potenciálne problémy, ktoré sa odlišujú od
každodenných výkyvov vo výkone

Vzniká spájaním bodov úsečkami. Body sa stanovujú priradením hodnoty


Yi na osi y-ovej, hodnote X, na osi X-ovej.

Spojnicový Vyjadruje absolútne aj relatívne početnosti hodnôt. V grafe je možné


uvádzať trendy, kĺzavé priemery, chybové úsečky.
graf
Na x-ovej osi sú väčšinou poradové premenné napr. čísla merania, čísla
vzoriek, časové úseky. V ekonomickej štatistike ich využívame pri
prezentovaní vývoja ukazovateľov v čase napr. vývoj produkcie, vývoj
miezd, vývoj fixného kapitálu podniku, vývoj nákladov, vývoj zisku
v dlhšom časovom období
Postup zostrojenia diagramu:

1. Nakreslite súradný systém s osou X a s osou Y

1. Priraďte osi X časovú postupnosť

1. Priraďte osi Y meraný znak

Spojnicový 1. Zozbierajte údaje. (v niektorých prípadoch možno musíte

graf definovať sledovanú premennú)

1. Znázorníte dáta na základe postupnosti, pospájajte každý


bod dať

1. Keď mate dosť bodov vypočítajte priemer, zakreslite krivku


predstavujúcu priemer do grafu
Interpretácia grafu časovej postupnosti

náš ciel je hľadať stabilitu a zmenu

to čo na zaujíma v znázorňovaní, je, čo sa deje s premennou za

Spojnicový časové obdobie: Pokračuje sledovaný proces k stabilite, alebo


ukazuje stúpajúcu (klesajúcu) tendenciu?

graf graf časovej postupnosti môžu byt použité na zhodnotenie či sú


veci pod kontrolou a môžu poskytnúť varovanie o postupnom
zhoršovaní situácie

grafy časovej postupnosti môžu byt využite na vytvorenie


regulačných diagramov, ktoré môžu sledovať proces kvality
kvantitatívne
Zobrazuje veľkosť a početnosť skúmaného javu pomocou stĺpcov
zodpovedajúcej výšky.

Stĺpce sa zobrazujú v súradnicovom systéme na X-ovej osi stojace


vertikálne .

Môže byť jednoduchý a zložený


o jednoduchý graf zobrazuje jeden ekonomický ukazovateľ
Stĺpcový v grafe, jeden stĺpec prislúchajúci jednej hodnote na X-ovej osi
(napr. výška zisku, objem produkcie, hodnota zásob).
graf o zložený graf prezentuje niekoľko ekonomických ukazovateľov
v jednom grafe a ich porovnanie v časovom období.
(v ekonomickej štatistike sa stĺpcový graf používa na vyjadrenie
výšky nákladov, miezd, výšky zisku, produkcie, počet
pracovníkov na jednotlivých oddeleniach, výšky zásob
v jednotlivých kategóriách a pod).
Postup zostrojenia diagramu:

1. rozhodnite sa, ktoré kategórie chcete sledovať

1. ubezpečte sa, že vybrane kategórie nie sú ani príliš široké


Stĺpcový ani príliš úzke (neprimerane kategórie zakryjú podstatne
charakteristiky)
graf 1. Vytvorte stĺpce tak, aby výška bola primeraná množstvu
pozorovaní na každú kategóriu, zabezpečte aby boli stĺpce
rovnako široké
Interpretácia stĺpcového diagramu:

identifikovaním charakteristík, ktoré sú základom udalosti, nám


stĺpcové diagramy môžu pomôcť dostať sa k dôležitým záverom

Stĺpcový pretože sú sledovane položky oddelene, môžeme ich poradie zmeniť

graf (napríklad usporiadať stĺpce v zostupnom poradí)

lepšie je nepoužívať trojdimenzionalný stĺpcový diagram, pretože


majú tendenciu skresľovať porovnávania, najlepšie je udržať ich
jednoduché.
Zobrazuje veľkosť a početnosť skúmaného javu pomocou
pruhov zodpovedajúcej dĺžky

Riadky sa zobrazujú v súradnicovom systéme na y-ovej osi


Pruhový horizontálne

graf Môže byť jednoduchý a zložený


Jednoduchý graf zobrazuje jeden ukazovateľ tzn. Jeden
riadok prislúchajúci jednej hodnote na y-ovej osi (napr.
výška zisku, objem produkcie, hodnota zásob)
Zložený pruhový graf sa využíva na prezentáciu
viacerých ukazovateľov v jednom grafe a slúži na
porovnanie hodnôt.

Obr. Pruhový graf nákladov pri porovnaní


Používa sa zriedkavo, najčastejšie pri porovnávaní hodnôt
súčasnej a cieľovej hodnoty
ukazovateľov ako napr. nákladov, výdavkov, výnosov podľa
kategórií členenia alebo časového obdobia.
Je vhodný na zobrazenie štruktúry štatistického súboru podľa číselných
a slovných (kvalitatívnych) znakov.

Tvorí ho kruh, ktorý sa delí na výseky.

Plocha je úmerná príslušnej početnosti, čím sa prezentuje vnútorná


štruktúra skúmaného súboru.

Populárny spôsob vizuálnej prezentácie údajov

Kruhový prostriedok na znázornenie relatívnej veľkosti individuálnych častí k


ostatným častiam ako aj k celku
(výsečový) poskytuje prehľadný obraz o analyzovanej situácii.

graf Výhodou je rozdelenie na sektory, ktorých obsah je vyjadrený


percentuálne

Najčastejšie sa používa na prezentáciu štruktúry kvalitatívnych znakov


súboru.
(slúži na zobrazenie napr.: štruktúry pracovníkov, štruktúry fixného
kapitálu, štruktúry zásob, štruktúry zdrojov, podielu na trhu, sortimentu
výroby, prezentácie štatistických, demografických údajov, výsledkov
ankiet a pod.)
Kruhový ▪Postup zostrojenia diagramu:

(výsečový) 1. Zhromaždenie údajov, ktoré chceme zhrnúť do grafu

graf 1. Výpočet celkovej sumy ako sumy absolútnych


čiastkových hodnôt, čo predstavuje 100%

1. Výpočet čiastkových percentuálnych hodnôt

1. Výpočet príslušného rozsahu čiastkovej hodnoty v


stupňoch na kružnici pre každú čiastkovú hodnotu
2. Zakreslenie diagramu

Obr. Kruhový graf štruktúry výrobného


sortimentu [Zdroj: ŠGÚDŠ]
v radarovom diagrame sú body v dátovom rade nakreslene v
kružniciach okolo stredového bodu, kde stredový bod v
diagrame predstavuje os Y

Každý dátový bod ma svoj vlastný lúč, alebo os X a hodnota


dátového bodu je zobrazená jeho polohou na tomto lúči

Radarový používa sa na zakreslenie množstva premenných na jednoduchú


schému

diagram umožňuje nám porovnať naše výsledky s konkurenčnými alebo


s očakávaniami zákazníka

taktiež nám ukazujú naše silne a slabé stránky, zvýrazňujú


medzeru medzi naším skutočným a želaným umiestnením v
rozličných oblastiach, ukazujú kde potrebujeme nápravu a kde
sme vpredu pred ideálom alebo konkurenciou
▪Postup zostrojenia diagramu:
1. Zostaviť tím, pozostávajúci z ľudí ktorí sa vyznajú v danej oblasti
produktov
2. Určiť najvýznamnejšie hodnotiace kategórie (najlepšie nie viac
ako 8)
3. Požiadať zúčastnených aby zhodnotili rôzne aspekty produktov
poskytovaných organizáciou. V prípade veľkých nezrovnalosti v
hodnoteniach, objasniť ich prostredníctvom diskusie. Bežné

Radarový 4.
definície odsúhlasiť tímom, neurčíte predefinovať a z každého
hodnotenia zúčastnených vypočítať priemer
Na skonštruovanie diagramu nakresliť kruh, polomer ktorého
diagram bude predstavovať použitú hodnotiacu skalu. (ak je použitá
5-bodova skala na hodnotenie, napr. reštaurácie, potom bude
polomer kruhu 5 jednotiek)
5. Určiť stred kruhu a nakresliť toľko lúčov, koľko je znakov (zapíšte
znak ktorý zodpovedá každému lúču na koniec kruhu)
6. Na každý lúč zaznačiť pozíciu priemerného hodnotenia a spojiť
body
Interpretácia radarových diagramov

Rozdiel medzi požadovaným hodnotením a skutočným


Radarový hodnotením na každom lúči je medzerou medzi

diagram ideálom a skutočnosťou. Je to preto, že sme


predpokladali, že koncové body sú ideálne

Znak s najväčšou medzerou – odchýlkou , si obyčajné


vyžaduje najväčšiu pozornosť

rozhodca však môže vybrať významnejší znak, na ktorý


by sa zameral ako na prvý, aj keď nemá najväčšiu
odchýlku.
Obr. Radový diagram
používa sa na vyjadrenie závislosti rôznymi ukazovateľmi
alebo parametrami
metóda korelácie sa používa na objasnenie
kauzálno-dôsledkových relácií
môžeme hovoriť o: Párovej korelácii = závislosť medzi
dvoma ukazovateľmi, Množinovej korelácii = analyzuje sa
závislosť medzi niekoľkými veličinami. Plní významnú úlohu
v regresnej analýze, kde sa pomocou neho sleduje vzájomná
závislosť hodnôt.
Bodový (používa sa pri zisťovaní závislosti výšky výnosov od výšky
nákladov, výšky miezd od výkonu pracovníkov, výšky zásob
graf od objemu produkcie a pod.). (Často sa ním zobrazujú aj
údaje časového radu.)
na vyjadrenie závislosti medzi dvoma javmi X a Y je
potrebne urobiť vyber „n“ a pre každú jednotku výberu
ukazovatele X a Y ohodnotiť (Zobrazuje hodnoty pomocou
bodov, ktoré vznikajú ako priesečníky hodnôt
zaznamenaných na x-ovej osi a ich absolútnych alebo
relatívnych početností na y-ovej osi)
výsledky treba zaznamenať do tabuľky
stupeň závislosti je možné vyjadriť koeficientom korelácie:

kde: Xi a Yi - hodnoty parametrov X a Y pre i-ty objekt (produkt)


X-, Y- - aritmeticky priemer parametrov X a Y
sx a sy - smerodajne odchýlky veličín X a Y
n - rozsah výberového súboru

Bodový na vykonanie korelačnej analýzy sa odporúča rozsah výberového


súboru n=30

graf body nanesené do grafu zobrazujú pole korelácie


ak sú veličiny nezávislé, tak pole korelácie je paralelne s jednou z osi,
alebo ma tvar kružnice
je treba poznať koeficient korelácie r. Ak hodnota r je v intervale +-1,
ide o funkčnú závislosť, ak r=0, tak sú veličiny nezávislé
čím je hodnota koeficientu korelácie bližšie k 1, tým je závislosť medzi
parametrami tesnejšia
Plní významnú úlohu v regresnej analýze, kde sa pomocou neho
sleduje vzájomná závislosť hodnôt (používa sa pri zisťovaní závislosti
výšky výnosov od výšky nákladov, výšky miezd od výkonu
pracovníkov, výšky zásob od objemu produkcie a pod.).
▪Postup zostrojenia diagramu:

1. Definujte vzťah, o ktorý sa zaujímate (napríklad vzťah medzi


počtom odpracovaných hodín a počtom chyb urobených za
deň)

1. Zbierajte informácie o údajových charakteristikách


Bodový 1. Nakreslite horizontálnu a vertikálnu os (x a y). Ak ste
graf presvedčení, že jedna premenná je príčinou správania sa
druhej, mala by príčinná premenná byt na osi x

1. Identifikujte a kalibrujte mierky oboch osi

1. Pre každé pozorovanie identifikujte priesečník osi x a y


Interpretácia korelačného diagram

Bodový korelačné diagramy môžu byt vytvorene použitím

graf štandardného tabuľkového programu. Ak je vzťah nejasný,


program môže vypočítať korelačný koeficient, ktorý by
naznačoval smer a silu vzťahu medzi spomínanými
premennými

korelačné diagramy jednoducho znázorňujú vzťahy

nemôžeme automaticky predpokladať existenciu vzťahu


príčina – následok.

Obr. Bodový graf závislosti medzi


počtom detí a počtom rodín
Využíva sa na hodnotenie javov a na hľadanie
optimálnych parametrom – kritická cesta v doprave.

Je systém, ktorý sa skladá z množiny bodov (uzlov)

Sieťový graf a väzieb (hrán) medzi uzlami

uzol je prvok systému predstavujúci okamih začatia


alebo ukončenia jednej alebo viacerých činností,
pričom počet uzlov je konečný a vždy je jeden uzol
východiskový a jeden uzol koncový

hrana je prvok systému, ktorý spája uzly navzájom


(využíva sa napr.: na určenie optimálnej dopravnej
vzdialenosti medzi strediskami, skladmi zásob, optimálnej
Obr. Sieťový graf vzdialenosti medzi pracovnými pozíciami, na stanovenie
optimálnej výšky nákladov, na údržbu strojov a výrobných
zariadení a pod).
Krabičkový Používa sa na znázornenie minimálnej a maximálnej hodnoty

graf (BOX štatistického súboru, prvého, tretieho kvartilu a mediánu.

PLOT)
Dĺžka obdĺžnika predstavuje medzikvartilové
rozpätie.(používa sa na zobrazenie: charakteristiky polohy
pre mzdy pracovníkov, stav zásob, hodnotu fixného kapitálu
podniku, výšku priemerných nákladov a výnosov podniku
a pod).

Obr.: Krabičkový graf


najznámejšia a najpoužívanejšia metóda popisnej štatistiky

Predstavuje stĺpcový graf, ktorý je vhodný na zobrazenie intervalových


premenných, ktoré sa nachádzajú na x-ovej osi a absolútnych alebo
relatívnych početnosti, ktorých výška sa nanáša na y-ovú os.(využíva sa na
vyjadrenie početnosti pracovníkov pre jednotlivé kategórie miezd, vyjadrenie
počtu strojov a zariadení v hodnotovej kategórii, vyjadrenie početnosti
v jednotlivých kategóriách zásob a pod)
možno z neho získať tieto informácie:
odhad polohy a rozptylu hodnôt sledovaného znaku kvality alebo
parametra procesu

Histogram odhad tvaru rozdelenia sledovaného znaku kvality alebo parametra


procesu
identifikácia zmien procesu - porovnávaním histogramov medzi sebou
a porovnávaním odhadov polohy a rozptylu alebo analýzou tvaru
histogramu
primárne informácie o spôsobilosti procesu

Jeho súčasťou môže byť aj spojnicový graf vyjadrený z relatívnej početnosti


hodnôt, ktorý sa nazýva polygón a spojnicový graf vyjadrený
prostredníctvom kumulatívnej relatívnej početnosti, ktorý sa nazýva „ogivná
krivka“.
Postup zostrojenia diagramu:
1. Výpočet variačného rozpätia súboru R: R= xmax - xmin
2. Stanovenie série triedneho intervalu h (šírku intervalu h dostaneme
tak, že najprv stanovíme počet intervalov k, napr. k= 5 * log n, kde n je
rozsah skúmaného súboru, potom h = R/k)
3. Zostavenie tabuľky početnosti
4. Stanovenie hranice intervalu tak, aby xmin bolo zahrnuté v 1. intervale
a xmax v poslednom intervale. Dolnú hranicu 1. intervalu xD1 stanovíme
tak, že platí xD1 < xmin a súčasné pre hodnotu xD1 platí, že ak sú
namerane hodnoty v tisícinách, potom hodnota hranice intervalu
konci číslicou 5 na mieste desaťtisícin. Hodnoty hraníc zapíšeme do
tabuľky početnosti.
Histogram 5. Stanovenie stredov intervalov, čiže triednych znakov, tak, že
spočítame hodnoty xH a xD a delíme dvoma. Hodnoty zapíšeme do
tabuľky početnosti
6. Priradenie nameraných hodnôt do jednotlivých intervalov v tabuľke
početností pomocou čiarkovacej metódy
7. Zostrojenie vlastného histogramu
∙ na os x nanesieme hranice intervalov
∙ na os y nanesieme hodnoty triedenej početnosti
∙ zostrojíme stĺpce grafu
∙ v grafe sa potom uvádza počet nameraných hodnôt, stredná hodnota,
a smerodajná odchylka
Interpretácia výsledkov histogramu

ak ma sledovaný znak normálne rozdelenie, histogram by


mal mat zvonovitý tvar (na proces pôsobia iba náhodné
Histogram vplyvy a je v štatisticky zvládnutom stave)

každá odchýlka od tohto tvaru signalizuje pravdepodobne


pôsobenie vymedziteľných vplyvov

ak sú do histogramov zaznačené tolerančné hranice,


možno vykonať odhad spôsobilosti procesu a pripadne
zvážiť možné riešenia zvýšenia spôsobilosti
Obr. Histogram
patri k zložitejším metódam popisnej štatistiky

je určený na sledovanie vývoja plánovaných položiek a na ich


porovnávanie so žiaducim trendom

Zobrazuje časové rady v jednom spojnicovom grafe

Jednotlivé spojnice vyjadrujú znázornenie hodnôt priebehu


vývoja daného javu v bežnom období, znázornenie
Z- diagram kumulovaných hodnôt – vývoj skúmaného javu od začiatku
sledovaného obdobia až po koniec sledovaného obdobia,
znázornenie kĺzavých súčtov, úhrnov – vývoj javu v bežnom
období oproti minulému obdobiu.

Tento typ grafu sa využíva v podniku pri sledovaní vývoja


ekonomických ukazovateľov a stanovení trendov do
budúcnosti.
Postup zostrojenia diagramu:
1. Zaznamenanie skutočných hodnôt sledovaného
ukazovateľa v predchádzajúcom období

1. Definovanie cieľových hodnôt na nasledujúce časové


obdobie

1. Zostrojenie cieľovej čiary. Cieľová čiara vychádza z bodu 0.


Z- diagram 1. Evidencia skutočných hodnôt daného ukazovateľa v
sledovanom období

1. Výpočet kumulatívneho súčtu

1. Výpočet celkového poctu (kĺzavý úhrn)


Interpretácia diagramu Z

kĺzavý úhrn môže byť konštantný alebo môže mat rastúcu, či


klesajúcu tendenciu

Z- diagram všetky časové rady môžu byt zakreslene súčasné a tak


vytvárajú diagram Z

pokiaľ nedochádza k požadovanej zmene vo vývoji


sledovaných údajov, musí manažér prikročiť k realizácii
opatrení, ktoré povedú k náprave nežiaduceho vývoja

diagram Z je možné zostavovať pre mesačné, kvartálne ale aj


týždenné a denne intervaly
Obr. Z diagram
Vyjadruje rozmiestnenie skúmaného javu v priestore.

Je to druh mapy rozdelený podľa určitého kritéria na oblasti,


ktoré rozlišujeme vzhľadom na intenzitu sledovaného javu
Kartogram farebne alebo šrafovaním.

Jednoduchý kartogram sa používa v kartografii. Pre každé


územie je stanovená farba, ktorá vyjadruje práve jednu
charakteristickú vlastnosť.(taktiež sa môže využívať pri
sledovaní makroekonomických ukazovateľov, pri sledovaní
vývoja priemernej mzdy v jednotlivých regiónoch).

Obr. Kartogram – Voľba prezidenta


Vzniká spojením mapy a iného druhu grafu.

Vyjadruje rozloženie ekonomického javu v priestore.

Kartodiagram Najčastejšie sa do mapy vkresľujú koláčové alebo stĺpcové grafy,


ktoré prezentujú početnosť sledovaného javu (absolútnu alebo
relatívnu početnosť).(dá sa využiť pri sledovaní ukazovateľov
v rámci daného regiónu, okresu a sledujú ekonomické ukazovatele
ako počet obyvateľov, počet mužov, žien, počet pracovníkov
v pobočkách firiem a pod.).

Obr.: Kartodiagram – zobrazenie podielu obyvateľov


slovenskej národnosti z celkového počtu obyvateľov
▪ MATEIDES, Alexander a kolektiv: Manazerstvo kvality. vyd.
Použitá Epos, 2006. ;
http://syque.com/quality_tools/tools/tools.htm
literatúra:
Ďakujem
za
pozornosť
2.Hodina
Štatistické
spracovanie dát
Číselné
charakteristiky Ing. Ľubomíra
Gabániová, PhD.
Nazývajú sa aj opisné alebo štatistické charakteristiky.

Delia sa na
Charakteristiky polohy
Charakteristiky variability
Číselné Charakteristiky šikmosti a špicatosti

charakteristiky Výpočet opisných charakteristík realizuje redukciu dát.

Keďže sú dáta zadané vo forme rozdelenia početností,


hovoríme, že sú triedené.
Zvyčajne sa najprv hľadá taká charakteristika, ktorá poskytne
predstavu o polohe rozdelenia početností. Najznámejšie sú
priemery.

Patria sem :
Charakteristiky Aritmetický priemer
Vážený aritmetický priemer
polohy Modus
Kvantily
Medián
Zastrihnutý priemer
Winsorizovaný priemer
Geometrický priemer

Aritmetický
priemer

Vážený
aritmetický
priemer

Príklad

Počet detí Absolútne triedne Relatívne triedne Kumulované absolútne Kumulované relatívne
xi početnosti ni početnosti fi triedne početnosti Ni početnosti Fi
0 25 0,1000 25 0,1000
1 49 0,1960 74 0,2960
2 56 0,2240 130 0,5200
3 68 0,2720 198 0,7920
4 40 0,1600 238 0,9520
5 12 0,0480 250 1,000
Spolu 250 1 x x

Príklad

Modus

Kvantily

Medián

Kvantily

Príklad

Príklad

Príklad

Príklad

Zastrihnutý
priemer

Winsorizovaný
priemer

Geometrický
priemer
Patria sem :
Rozpätie
Charakteristiky Kvartilové rozpätie

variability Priemerná odchýlka


Priemerná (stredná) kvadratická odchýlka
Rozptyl a smerodajná (štandardná)odchýlka
Variačný koeficient

Rozpätie

Kvartilové
rozpätie

Príklad

Príklad

Priemerná
odchýlka

Priemerná
(stredná)
kvadratická
odchýlka

Príklad

Príklad

Rozptyl a
smerodajná
(štandardná)odc
hýlka

Variačný
koeficient

Príklad

Príklad
Šikmosť
Charakteristiky
šikmosti a
špicatosti
Špicatosť
Viac informácií, postupov a príkladov si preštudujte na:

http://www.km.fpv.ukf.sk/upload_publikacie/20120130_90405_
_1.pdf
Pozrite si
strany: 21- 44
Ďakujem za
pozornosť
5.Hodina Štatistické
Intervaly spracovanie dát

spoľahlivosti Ing. Ľubomíra


Gabániová, PhD.
Intervaly spoľahlivosti

▪ Nám hovoria o tom, s akou pravdepodobnosťou sa skúmané parametre nachádzajú v danom


intervale
Interval - Počet hodnôt v súbore je 30 a viac

spoľahlivosti - ide o súbor dát = náhodný alebo výberový

pre μ (mí), keď ▪ náhodný /výberový súbor

▪ar. priemer I
I
μ (mí)
základný súbor
= stredná hodnota „mí“
2
je σ (sigma na ▪rozptyl (s2) I σ2 = sigma na 2

2) ZNÁME

Interval
spoľahlivosti
pre μ (mí),
2
keď je σ
(sigma na 2)
ZNÁME

Interval
spoľahlivosti
pre μ (mí),
2
keď je σ
(sigma na 2)
ZNÁME

Interval
spoľahlivosti
pre μ (mí),
2
keď je σ
(sigma na 2)
ZNÁME Takýmto postupom by sme sa mali dostať k výsledku intervalu
spoľahlivosti v ktorom sa bude nachádzať 95% nameraných
údajov (rátali sme s 5% chyby. 95% interval + 5% chyby je
100%)

Príklad

Príklad

Interval
spoľahlivosti
pre μ (mí),
2
keď je σ
(sigma na 2)
NEZNÁME

Interval
spoľahlivosti
pre μ (mí),
2
keď je σ
(sigma na 2)
NEZNÁME
▪Na začiatok je potrebné určiť si percento chyby, ktoré môže byť 5% (t.j. α =
0,05) alebo 1% (t.j. α = 0,01)

Interval ▪A hodnotu ν = „ní“, ktorú vypočítame = n-1 (čiže ak máme počet hodnôt n=10
tak ν=n-1 = 10-1=9.)

spoľahlivosti ▪Tieto určené hodnoty zadáme do funkcie TINV (všetko veľkým PÍSMOM)

pre μ (mí), ▪Pravdepodobnosť = sem zadáme hodnotu alfa = α = 0,05 alebo α = 0,01

2
keď je σ ▪Stupeň voľnosti = ν=n-1

(sigma na 2) ▪Zadaním hodnôt do funkcie dostaneme hodnotu, ktorú taktiež zaokrúhlime na

NEZNÁME dve desatinné čísla.

▪Túto cez funkciu určenú hodnotu zadáme do vzorca (vynásobíme so zlomkom


a tento súčin odpočítame alebo pripočítame k aritmetickému priemeru)
Interval
spoľahlivosti ▪ Pri výpočte intervalu spoľahlivosti pre μ (mí), keď je σ 2
(sigma na 2) NEZNÁME postupujeme podobne ako pri
pre μ (mí), predchádzajúcom intervale len s tým rozdielom, že v tomto
prípade je potrebné určiť pomocou funkcie TINV hodnotu pre
2
keď je σ „t“ a v zlomku máme odmocninu z „n-1“.

(sigma na 2)
NEZNÁME
▪Majú VYŠŠIU SPOĽAHLIVOSŤ no MENŠIU PRESNOSŤ!

- V nich môžeme s 95% (alebo s 99%) istotou tvrdiť, že sa


hodnota hľadaného parametra nachádza v príslušnom
Intervalové intervale.
- Šírka intervalu vyjadruje vlastnú variabilitu hodnôt

odhady v základom súbore a je nepriamo úmerná rozsahu vzorky


▪ čím je rozsah NIŽŠÍ, tým je interval ŠIRŠÍ
Viac informácií, postupov a príkladov si preštudujte na:

http://www.km.fpv.ukf.sk/upload_publikacie/2012013
Pozrite si 0_90405__1.pdf

▪ strany: 104- 114


Ďakujem
za
pozornosť
9.Hodina Štatistické
spracovanie dát

T-testy Ing. Ľubomíra


Gabániová, PhD.
▪ Sú vhodné ak si chceme overiť hypotézu (tvrdenie). Pre overenie,
používame rovnaký postup (5 krokov).

▪ 1. Zvolíme si hladinu významnosti α (tá predstavuje 5% chyby = 0,05


alebo 1% chyby = 0,01)
T-testy ▪ 2. Stanovíme si hypotézu H0 – potvrdzuje skúmané tvrdenie, H1 –
vyvracia skúmané tvrdenie
▪ 3. Určiť testovacie kritérium TK

▪ 4. Určiť kritickú hodnotu KH

▪ 5. Porovnanie

TK < KH - platí H0 potvrdzuje sa hypotéza


TK > KH - platí H1 vyvracia sa hypotéza H0 a platí hypotéza H1
▪ Ide o test zhody strednej hodnoty so známou konštantou
(stredná hodnota je x𝑥̅ a známa konštanta je μ)

Jednovzorkový /
výberový ▪ Táto konštanta je porovnávaná s 1 výberovým súborom.

t-test

▪ Studentov t-test sa používa na testovanie H0, ktorá tvrdí, že


priemer základného súboru sa = zadanej konštante.
Postup krokov testovania:
1. Zvolíme si hladinu významnosti α, ktorú budeme používať pri overovaní(tá
predstavuje 5% chyby = 0,05 alebo 1% chyby = 0,01)
2. Stanovíme si hypotézu H0 – potvrdzuje skúmané tvrdenie, H1 – vyvracia
skúmané tvrdenie
H0: μ=μ0 oproti H1: μ≠μ0
3. Určiť testovacie kritérium TK
Jednovzorkový /
výberový
▪ Hodnota μ („mí“) je daná, resp. pri testovaní, si ju určite vy, lebo budete chcieť
t-test overiť H0 k určitej hodnote. Je to konštanta, ktorá tvrdí, že je to tak!
4. Určiť kritickú hodnotu KH
▪ Pre určenie KH pri jednovzorkovom / výberovom t-teste použijeme funkciu
TINV
▪ Funkcia TINV: do 1.bunky hodnotu zadáme hodnotu hladiny významnosti α -
alfa 0,05 alebo 0,01 a do 2.bunky zadáme hodnotu "ní" "ν" = n-1
5. Porovnanie
TK < KH - platí H0 potvrdzuje sa hypotéza
TK > KH - platí H1 vyvracia sa hypotéza H0 a platí hypotéza H1
Test zhody ▪ Robí sa pred tým ako sa začneme venovať
dvoch dvojvzorkovému / výberovému t-testu aby sme
zistili či rozptyly v dvoch skúmaných
rozptylov skupinách/vzorkách/súboroch sú zhodné alebo
rôzne.
F-test

Test zhody
dvoch
rozptylov
F-test
▪ Používa sa aj chceme vedieť či namerané hodnoty v dvoch súboroch sú
zhodné alebo rozdielne (napríklad výška u 14.ročných chlapcov a
dievčat, priemerná mzda za 10 rokov na Slovensku a v Česku)

▪ Postup krokov je rovnaký v krokoch 1. 2, a 5. rozdiel nastane v 3. pri


Dvojvzorkový / určení TK a 4. pri určení KH:
1. Zvolíme si hladinu významnosti α, ktorú budeme používať pri overovaní
výberový (tá predstavuje 5% chyby = 0,05 alebo 1% chyby = 0,01)
2. Stanovíme si hypotézu H0 – potvrdzuje skúmané tvrdenie, H1 – vyvracia
T-test skúmané tvrdenie H0: μ1=μ2 - skúmané údaje medzi dvoma skupinami
budú totožné
▪ oproti H1: μ1≠μ2 - skúmané údaje medzi dvoma skupinami sa budú
odlišovať
5. Porovnanie
TK < KH - platí H0 potvrdzuje sa hypotéza
TK > KH - platí H1 vyvracia sa hypotéza H0 a platí hypotéza H1
▪ V prípade, že nám v F-teste vyšlo, že s2 sa zhodujú tak pri
dvojvzorkovom/výberom t-teste pre ZHODNÉ s2 postupujeme v krokoch
3 a 4 nasledovne:

3. Testovacie kritérium určíme pomocou vzorca

Dvojvzorkový /
výberový
T-test 4. Kritická hodnota
▪ Pre určenie KH pri dvojvzorkovom/výberovom t-teste pri zhodných
rozptyloch použijeme funkciu TINV
▪ Funkcia TINV: do 1.bunky hodnotu zadáme hodnotu hladiny významnosti
α - alfa 0,05 alebo 0,01 a do 2.bunky zadáme vypočítanú hodnotu n1 +
n2 - 2

▪ Následne porovnáme hodnoty TK a KH a vyvodíme záver. (krok č. 5)


▪ V prípade, že nám v F-teste vyšlo, že s2 sú rôzne tak pri
dvojvzorkovom/výberom t-teste pre rôzne s2 postupujeme v krokoch 3 a
4 nasledovne:

3. Testovacie kritérium určíme pomocou vzorca

Dvojvzorkový /
výberový 4. Kritickú hodnotu
▪ Pre určenie KH pri dvojvzorkovom/výberovom t-teste pri rôznych
T-test rozptyloch použijeme funkciu TINV
▪ Funkcia TINV: do 1.bunky hodnotu zadáme hodnotu hladiny
významnosti α - alfa 0,05 alebo 0,01 a do 2.bunky zadáme vypočítanú
hodnotu „ν“, ktorej hodnotu musíme vypočítať pomocou vzorca:

▪ Následne porovnáme hodnoty TK a KH a vyvodíme záver. (krok č. 5)


▪ Pri párovom t-teste je potrebné si uvedomiť, že je ho možné
robiť len v prípade, keď na 1 vzorke vieme vykonať testovanie
„pred“ a „po“

Párový ▪ V takomto prípade je nutné si zapamätať, že nie je možné

T-test zamieňať poradie testovaných hodnôt pred a po!

▪ Z daných hodnôt „pred“ a „po“ sa urobí rozdiel a následne z


nich sa vypočíta aritmetický priemer 𝑥̅ a rozptyl S2.
Postup krokov je obdobný ako pri predchádzajúcich testovaniach ale
nezabudneme si predtým vypočítať premenné 𝑥̅ a S2:
1. Zvolíme si hladinu významnosti α, ktorú budeme používať pri overovaní(tá
predstavuje 5% chyby = 0,05 alebo 1% chyby = 0,01)
2. Stanovíme si hypotézu H0 – potvrdzuje skúmané tvrdenie, H1 – vyvracia
skúmané tvrdenie
▪ H0: μ1 = μ2 platí H0: - potvrdzuje skúmané tvrdenie

Párový oproti
▪ H1 : μ1 ≠ μ2 platí H1: - vyvracia skúmané tvrdenie

T-test 3. Určiť testovacie kritérium TK

4. Určiť kritickú hodnotu KH


▪ Pre určenie KH pri párovom t-teste použijeme funkciu TINV
▪ Funkcia TINV: do 1.bunky hodnotu zadáme hodnotu hladiny významnosti α - alfa
0,05 alebo 0,01 a do 2.bunky zadáme hodnotu "ní" "ν" = n-1
5. Porovnanie
TK < KH - platí H0 potvrdzuje sa hypotéza
TK > KH - platí H1 vyvracia sa hypotéza H0 a platí hypotéza H1
Viac informácií, postupov a príkladov pre si preštudujte na:

http://www.km.fpv.ukf.sk/upload_publikacie/20120130_90405_
_1.pdf
Pozrite si
strany: 115-168
Ďakujem
za pozornosť
Štatistické
11.Hodina spracovanie dát

Regresia a LS 2020/2021
korelácia Ing. Ľubomíra
Gabániová, PhD.
▪ Ide o skúmanie vzťahov medzi kvantitatívnymi
a štatistickými znakmi.

Dve základné úlohy Regresnej a Korelačnej analýzy


∙ Regresná úloha
Regresia a ∙ jej podstatou je nájsť funkčný vzťah, podľa ktorého sa
mení závisle premenná so zmenou nezávisle
Korelácia premenných = nájsť vhodnú regresnú funkciu
∙ súčasne je potrebné odhadnúť parametre regresnej
funkcie

∙ Korelačná úloha
∙ jej podstatou je merať tesnosť – silu skúmanej závislosti
▪Jednoduchá závislosť – kedy uvažujeme len s jednou nezávisle
premennou X; teda skúmame vzťah medzi X a Y.

Regresia a ▪Viacnásobná závislosť – pri ktorej uvažujeme minimálne

Korelácia s dvomi nezávisle premennými veličinami (znakmi) X1, X2, X3...


pričom „k“ je väčšie alebo rovné 2
▪Uvažuje o štatistických znakoch X a Y, medzi ktorými je v základnom súbore
„lineárna závislosť“.
▪Y = B0 + B1X + e

▪Bodovým odhadom tejto regresnej funkcie je priamka, ktorej koeficienty


vypočítame z výberových údajov.

Jednoduchá Postup:
∙ Z údajov vytvoríme BODOVÝ GRAF
regresná a ∙ Pravou myšou ťukneme na jednu z bodiek a dáme „pridať trendovú čiaru“
o vyberieme „typ trendu alebo regresie“ a dole zaškrtneme
▪ Zobraziť v grafe rovnicu
korelačná ▪ Zobraziť v grafe rovnicu spoľahlivosti R2

analýza Nami zadaný typ trendu / regresie vyjadruje koeficient determinácie „R2“, ktorý
hovorí o tom na koľko % je daný typ vhodný.

Napr. R2=0,8365 vynásobením 100 = 83,65% koeficient determinácie, čiže je


vhodný na 83,65% => pri ktorom odchýlky (body, ktoré neležia na priamke) od
trendovej čiary predstavujú 16,35%. (súčet odchýlok a koeficientu = 100%)
▪ analyzuje hodnoty za viac premenných.

▪ Skladá sa z vypočítaných hodnôt koeficientov korelácie medzi


všetkými možnými dvojicami premenných.

▪ Koef. Korelácie medzi hodnotami nejakej premennej a tej istej


Korelačná premennej sa = 1 (všetky možné body ležia na priamke)

matica ▪ Čím je korelačná matica väčšia, tým geometricky viac času


treba venovať jej analýze. Pomocnými otázkami môžu byť:
▪ medzi ktorými dvojicami je najväčšia závislosť?
▪ medzi ktorými dvojicami nie je závislosť?
▪ medzi ktorými dvojicami je kladná (priama) závislosť?

▪ medzi ktorými dvojicami je záporná (nepriama) závislosť?


▪Údaje – Dáta Analysis – Correlation (ok)
▪V zobrazenom okne zadáme do jednotlivých častí:
------------------------------------------------------------------------------------------------------
▪Input

Výpočet ▪Input Range - špecifikujeme (označíme) oblasť, v ktorej sa nachádzajú


hodnoty jednotlivých premenných
▪Grouped by (spôsob určenia kde sú údaje zapísané)
korelačnej Columns – stĺpce

matice Rows – riadky


▪Ak sa názvy premenných nachádzajú v označenej oblasti tak je potrebné
zaškrtnúť okienko, ak nie sú, tak ostáva nezaškrtnuté
pomocou
Excelu: ▪Output options (tu si vyberáme z troch možností, v ktorých chceme aby sa
nám zobrazili výsledky)
▪Output Range (výstupná oblasť) – po zaznačení tohto výstupu, klikneme najprv
do daného okienka a až tak označíme voľnú bundu v exceli, kde sa nám
zobrazia výstupné údaje.
----------------------------------------------------------------------------------------------------
▪Analýza vzájomnej závislosti medzi hodnotami viacerých
premenných a modelovanie závislosti hodnôt jednej premennej
od hodnôt inej – iných premennej-ných.

Analýza
štatistickej ▪Umožňuje nám zistiť či je medzi jednotlivými dvojicami
hodnôt vzájomná závislosť
závislosti
premenných Ak áno tak: aký je charakter tejto závislosti
Aká je miera tejto závislosti
▪korelačný koeficient – predstavuje mieru vzájomnej lineárnej závislosti medzi
hodnotami dvoch premenných. Obe oblasti MUSIA mať ROVNAKÝ počet / rozmer
hodnôt

▪korelačný koeficient nadobúda hodnoty od -1 po +1

▪0 – ak medzi hodnotami 2 premenných NIE JE VZÁJOMNÁ ZÁVISLOSŤ, korelačný


koeficient nadobúda hodnotu 0
Korelačná
▪ Resp. ak korelačný koeficient sa = 0 potom medzi hodnotami analyzovaných
analýza premenných NIE JE závislosť.

Ak všetky body ležia na priamke pričom funkcia má:


▪RASTÚCI charakter, tak potom sa korelačný koeficient = +1, resp. kladné hodnoty

▪KLESAJÚCI charakter, tak potom sa korelačný koeficient = -1, resp. záporné


hodnoty
▪Ak je priamka ROVNOBEŽNÁ s osou X alebo Y potom sa korelačný koeficient = 0
▪Čím sa korelačný koeficient viac blíži k +1 alebo -1 tým je väčšia miera
vzájomnej závislosti.
▪Čím sa korelačný koeficient viac blíži k 0, tým je väčšia Nezávislosť
medzi dvojicami hodnôt = NIE JE medzi nimi vzájomná závislosť.

▪Hodnoty ↑ako 0,8 resp. ↓ ako – 0,8 vyjadrujú VYŠŠIU mieru vzájomnej

Korelačná závislosti
▪Hodnoty medzi +0,4 až + 0,8 resp. od -0,8 až -0,4 vyjadrujú STREDNÚ

analýza mieru vzájomnej závislosti


▪Hodnoty od +0,1 po + 0,4 resp. od -0,4 po -0,1 vyjadrujú MALÚ mieru
vzájomnej závislosti

▪Mieru vzájomnej závislosti môžeme posúdiť už spomínaným Bodovým


grafom.
Viac informácií, postupov a príkladov pre Koreláciu a Regresiu si
preštudujte na:

Pozrite si http://www.km.fpv.ukf.sk/upload_publikacie/20120130_90405__1.pdf

strany: 241 – 270, 278-289


Ďakujem
za
pozornosť

You might also like