Professional Documents
Culture Documents
1.hodina Grafické Metódy: Štatistické Spracovanie Dát
1.hodina Grafické Metódy: Štatistické Spracovanie Dát
Hodina Štatistické
spracovanie dát
Grafické LS 2020/2021
Najznámejšie sú:
Klasifikácia ∙ Spojnicový graf
∙ Stĺpcový graf
Radarový 4.
definície odsúhlasiť tímom, neurčíte predefinovať a z každého
hodnotenia zúčastnených vypočítať priemer
Na skonštruovanie diagramu nakresliť kruh, polomer ktorého
diagram bude predstavovať použitú hodnotiacu skalu. (ak je použitá
5-bodova skala na hodnotenie, napr. reštaurácie, potom bude
polomer kruhu 5 jednotiek)
5. Určiť stred kruhu a nakresliť toľko lúčov, koľko je znakov (zapíšte
znak ktorý zodpovedá každému lúču na koniec kruhu)
6. Na každý lúč zaznačiť pozíciu priemerného hodnotenia a spojiť
body
Interpretácia radarových diagramov
PLOT)
Dĺžka obdĺžnika predstavuje medzikvartilové
rozpätie.(používa sa na zobrazenie: charakteristiky polohy
pre mzdy pracovníkov, stav zásob, hodnotu fixného kapitálu
podniku, výšku priemerných nákladov a výnosov podniku
a pod).
Delia sa na
Charakteristiky polohy
Charakteristiky variability
Číselné Charakteristiky šikmosti a špicatosti
Patria sem :
Charakteristiky Aritmetický priemer
Vážený aritmetický priemer
polohy Modus
Kvantily
Medián
Zastrihnutý priemer
Winsorizovaný priemer
Geometrický priemer
▪
Aritmetický
priemer
Vážený
aritmetický
priemer
▪
Príklad
▪
Počet detí Absolútne triedne Relatívne triedne Kumulované absolútne Kumulované relatívne
xi početnosti ni početnosti fi triedne početnosti Ni početnosti Fi
0 25 0,1000 25 0,1000
1 49 0,1960 74 0,2960
2 56 0,2240 130 0,5200
3 68 0,2720 198 0,7920
4 40 0,1600 238 0,9520
5 12 0,0480 250 1,000
Spolu 250 1 x x
Príklad
▪
Modus
Kvantily
Medián
▪
Kvantily
▪
Príklad
▪
Príklad
▪
Príklad
▪
Príklad
▪
Zastrihnutý
priemer
Winsorizovaný
priemer
Geometrický
priemer
Patria sem :
Rozpätie
Charakteristiky Kvartilové rozpätie
Rozpätie
Kvartilové
rozpätie
▪
Príklad
▪
Príklad
▪
Priemerná
odchýlka
Priemerná
(stredná)
kvadratická
odchýlka
▪
Príklad
▪
Príklad
▪
Rozptyl a
smerodajná
(štandardná)odc
hýlka
Variačný
koeficient
▪
Príklad
▪
Príklad
Šikmosť
Charakteristiky
šikmosti a
špicatosti
Špicatosť
Viac informácií, postupov a príkladov si preštudujte na:
http://www.km.fpv.ukf.sk/upload_publikacie/20120130_90405_
_1.pdf
Pozrite si
strany: 21- 44
Ďakujem za
pozornosť
5.Hodina Štatistické
Intervaly spracovanie dát
▪ar. priemer I
I
μ (mí)
základný súbor
= stredná hodnota „mí“
2
je σ (sigma na ▪rozptyl (s2) I σ2 = sigma na 2
2) ZNÁME
▪
Interval
spoľahlivosti
pre μ (mí),
2
keď je σ
(sigma na 2)
ZNÁME
▪
Interval
spoľahlivosti
pre μ (mí),
2
keď je σ
(sigma na 2)
ZNÁME
▪
Interval
spoľahlivosti
pre μ (mí),
2
keď je σ
(sigma na 2)
ZNÁME Takýmto postupom by sme sa mali dostať k výsledku intervalu
spoľahlivosti v ktorom sa bude nachádzať 95% nameraných
údajov (rátali sme s 5% chyby. 95% interval + 5% chyby je
100%)
▪
Príklad
▪
Príklad
▪
Interval
spoľahlivosti
pre μ (mí),
2
keď je σ
(sigma na 2)
NEZNÁME
▪
Interval
spoľahlivosti
pre μ (mí),
2
keď je σ
(sigma na 2)
NEZNÁME
▪Na začiatok je potrebné určiť si percento chyby, ktoré môže byť 5% (t.j. α =
0,05) alebo 1% (t.j. α = 0,01)
Interval ▪A hodnotu ν = „ní“, ktorú vypočítame = n-1 (čiže ak máme počet hodnôt n=10
tak ν=n-1 = 10-1=9.)
spoľahlivosti ▪Tieto určené hodnoty zadáme do funkcie TINV (všetko veľkým PÍSMOM)
pre μ (mí), ▪Pravdepodobnosť = sem zadáme hodnotu alfa = α = 0,05 alebo α = 0,01
2
keď je σ ▪Stupeň voľnosti = ν=n-1
(sigma na 2)
NEZNÁME
▪Majú VYŠŠIU SPOĽAHLIVOSŤ no MENŠIU PRESNOSŤ!
http://www.km.fpv.ukf.sk/upload_publikacie/2012013
Pozrite si 0_90405__1.pdf
▪ 5. Porovnanie
Jednovzorkový /
výberový ▪ Táto konštanta je porovnávaná s 1 výberovým súborom.
t-test
Test zhody
dvoch
rozptylov
F-test
▪ Používa sa aj chceme vedieť či namerané hodnoty v dvoch súboroch sú
zhodné alebo rozdielne (napríklad výška u 14.ročných chlapcov a
dievčat, priemerná mzda za 10 rokov na Slovensku a v Česku)
Dvojvzorkový /
výberový
T-test 4. Kritická hodnota
▪ Pre určenie KH pri dvojvzorkovom/výberovom t-teste pri zhodných
rozptyloch použijeme funkciu TINV
▪ Funkcia TINV: do 1.bunky hodnotu zadáme hodnotu hladiny významnosti
α - alfa 0,05 alebo 0,01 a do 2.bunky zadáme vypočítanú hodnotu n1 +
n2 - 2
Dvojvzorkový /
výberový 4. Kritickú hodnotu
▪ Pre určenie KH pri dvojvzorkovom/výberovom t-teste pri rôznych
T-test rozptyloch použijeme funkciu TINV
▪ Funkcia TINV: do 1.bunky hodnotu zadáme hodnotu hladiny
významnosti α - alfa 0,05 alebo 0,01 a do 2.bunky zadáme vypočítanú
hodnotu „ν“, ktorej hodnotu musíme vypočítať pomocou vzorca:
Párový oproti
▪ H1 : μ1 ≠ μ2 platí H1: - vyvracia skúmané tvrdenie
http://www.km.fpv.ukf.sk/upload_publikacie/20120130_90405_
_1.pdf
Pozrite si
strany: 115-168
Ďakujem
za pozornosť
Štatistické
11.Hodina spracovanie dát
Regresia a LS 2020/2021
korelácia Ing. Ľubomíra
Gabániová, PhD.
▪ Ide o skúmanie vzťahov medzi kvantitatívnymi
a štatistickými znakmi.
∙ Korelačná úloha
∙ jej podstatou je merať tesnosť – silu skúmanej závislosti
▪Jednoduchá závislosť – kedy uvažujeme len s jednou nezávisle
premennou X; teda skúmame vzťah medzi X a Y.
Jednoduchá Postup:
∙ Z údajov vytvoríme BODOVÝ GRAF
regresná a ∙ Pravou myšou ťukneme na jednu z bodiek a dáme „pridať trendovú čiaru“
o vyberieme „typ trendu alebo regresie“ a dole zaškrtneme
▪ Zobraziť v grafe rovnicu
korelačná ▪ Zobraziť v grafe rovnicu spoľahlivosti R2
analýza Nami zadaný typ trendu / regresie vyjadruje koeficient determinácie „R2“, ktorý
hovorí o tom na koľko % je daný typ vhodný.
Analýza
štatistickej ▪Umožňuje nám zistiť či je medzi jednotlivými dvojicami
hodnôt vzájomná závislosť
závislosti
premenných Ak áno tak: aký je charakter tejto závislosti
Aká je miera tejto závislosti
▪korelačný koeficient – predstavuje mieru vzájomnej lineárnej závislosti medzi
hodnotami dvoch premenných. Obe oblasti MUSIA mať ROVNAKÝ počet / rozmer
hodnôt
▪Hodnoty ↑ako 0,8 resp. ↓ ako – 0,8 vyjadrujú VYŠŠIU mieru vzájomnej
Korelačná závislosti
▪Hodnoty medzi +0,4 až + 0,8 resp. od -0,8 až -0,4 vyjadrujú STREDNÚ
Pozrite si http://www.km.fpv.ukf.sk/upload_publikacie/20120130_90405__1.pdf