Professional Documents
Culture Documents
Material Na Prvni Zapoctovy Test
Material Na Prvni Zapoctovy Test
Co je dobré vědět:
Chí-kvadrát test: testuje shodu rozdělení
Kolmogovo-Smirnoův test: testuje normalitu
Shapiro-Wilkův: testuje normalitu, ale jen při malém rozsahu souboru (pod 40)
Fischerův test: používáme, když se nějaká hodnota vyskytuje méně, než 5x
Korelační analýza: určuje sílu závislosti
Korelační koeficient: je průběh závislosti
Závislá proměnná: Y
Nezávislá proměnná: X
Chi-test: používáme pro tabulky 2x2
Kontigenční tabulky: používáme pro větší tabulky
1) stanovení hypotéz
2) stanovení hodnoty alfa (pokud nemáme zadanou jinak, volíme vždy 0,05)
3) stanovení testu, který budeme používat
4) hodnota t, nebo chí (nepodstatná informace, ale musí se psát)
5) hodnota p (podle té porovnáváme alfa, najdeme ji většinou u “sig”)
6) samotné porovnání p>alfa (je platná H0), p<alfa (je platná H1)
7) slovní interpretace výsledku
Testy dobré shody
VÝSLEDEK:
ZÁPIS:
VÝSLEDEK:
ZÁPIS:
a) Ovčření normality
POSTUP
analyze – descriptive statistics – explore (do depended list dát váha a poté
rozkliknout plots a zaškrtnout normality plots with test)
VÝSLEDEK:
ZÁPIS:
1) H0 = rozdělení je normální
H1 = rozdělení není normální
2) Alfa = 0,05
3) Test normality
4) t = 0,044
5) p = 0,2
6) p > alfa
7) Nezamítáme nulovou hypotézu. Rozdělení je normální.
b) Testování, zda bonbony mají 3g.
POSTUP:
VÝSLEDEK:
ZÁPIS:
Účast na přednáškách
Ano Ne
Úspěch u zkoušky Ano 30 15
Ne 10 25
VÝSLEDEK:
ZÁPIS:
1) H0 = Účast na přednáškách nemá vliv na výsledek zkoušky.
H1 = Účast na přednáškách má vliv na výsledek zkoušky.
2) Alfa = 0,05
3) Chí-kvadrátový test
4) X2 = 11,429
5) p = 0,001
6) p < alfa
7) Zamítáme nulovou hypotézu. Účast na přednáškách má vliv na výsledek
zkoušky.
2. U souboru pacientů bylo sledováno, zda použití určitého léku nevyvolává ve větší
míře otoky nohou. Na základě výsledků vyšetření 60 pacientů, ověřte vedlejší účinky
léku.
Pedagogická hodnost
Asistent Docent Profesor
Pohlaví Muž 32 15 8
Žena 34 8 3
VÝSLEDEK:
ZÁPIS:
Typ školy
Gymnázium Střední školy Ostatní
Výsledek zkoušky: Výborně 56 35 9
Složil 48 42 15
Nesložil 36 31 15
V SPSS máme data zadaná jiným způsobem, a to zapsaná do dvou sloupců. Takhle to
jde taky spočítat, ale je to časově náročnější a dá se tam udělat snadno chyba. My si
data tedy musíme zapsat sami. Dělá se to tak, že zapisujete jakoby souřadnice a tu
hodnotu v nich dáte jako váhy. První řádek je číslo 1, druhý řádek je 2, třetí 3, první
sloupec je číslo 1, druhý 2, třetí 3. Výsledný přepis tedy bude vypadat takhle:
POSTUP:
data – weight cases – (zadat váhy)
analyze – descriptive statistics – crosstabs
VÝSLEDEK:
Jak to zapsat už víte, hodnota p je 0,294. Nulovou hypotézu nezamítáme, takže škola
nemá vliv na úspěšnost u zkoušek.
Nulovou hypotézu přijímáme vždy, když je vše ok, ten daný jev, na který se ptají, se
tam nevyskytuje (otestujte kocovinu na svojí kočce – nulová hypotéza: vše je ok,
kočka nemá kocovinu, alternativní: kočka má kocovinu), nebo zda něco s něčím
souvisí (nulová: nesouvisí, vše je ok, alternativní: souvisí), a tak dále.
Jednoduchá lineární regrese a korelace – druhé cvičení
Soubor: Obleceni_lin.sav
1) Vytvořte graf – korelační pole pro zobrazení závislosti tržeb za prodej pánského
oblečení na počtu rozeslaných katalogů.
POSTUP:
2. simple scatter
3. Tržby se odvíjí od počtu rozeslaných katalogů, takže jsou závislé (Y) a katalogy
nezávislé (Y)
Dvakrát kliknout na ten graf – kliknout pravym na to, co vám vyjede – dát “ad fit
line at total”
3) Vypočítejte rovnici regresní přímky pro závislost tržeb za prodej pánského
oblečení na počtu rozeslaných katalogů.
POSTUP:
1.
VÝSLEDEK:
Regresní přímka v základní podobě: y = a + bx
Podle výsledků by byla: y = -20183,122 + 3,59x
Pomocí celé téhle rovnice jsme schopni spočítat tržby při daném počtu rozeslaných
katalogů. Constanta (-20183,122) je číslo, které je prostě pevné, můžou to být třeba
náklady na grafika, který dělal ty katalogy. I když nerozešlete žádný katalog, grafika
jste prostě zaplatit museli. Číslo 3,59x je regresní koeficient a udává, o kolik se změní
závislá y, když nezávislou x změníme o jednotku. Tzn. o kolik se zvýší tržby, když
odešleme o jeden katalog víc. X je počet odeslaných katalogů.
Jak jsem psal. Když odešleme o jeden katalog víc, zvýší se tržby o 3,59.
Tahle tabulka nám vyšla při výpočtu v předchozích bodech. Síla závislosti je v
políčku R. Je to tedy 0,848. Což je silná přímá závislost. Čím vyšší číslo, tím vyšší
závislost. Hodnoty mohou nabývat čísel v intervalu <-1,1>, pokud je číslo záporné,
jedná se o nepřímou závislost, pokud kladné, jedná se o přímou.
9) Z kolika procent jsou změny v tržbách za pánské oblečení vyvolány změnami
v počtu zaslaných katalogů.