Professional Documents
Culture Documents
Statistika Seminar
Statistika Seminar
1-3 levice
8-10 pravice
Statistická signifikance:
Testujte hypotézu/zjistěte zobecnitelnost = statistická signifikance
V sociálních vědách nelze jednoduše potvrdit hypotézu – nelze to, protože Karl Popper, proto
pracujeme s tzv. nulovými hypotézami (H0), které předpokládají neexistenci vztahu mezi
proměnnými.
Proto stanovujeme hypotézu jako: Mezi proměnnými neexistuje rozdíl na základě zvoleného faktoru
– cílem zkoumání/analýzy je tuto hypotézu vyvrátit.
Příklad:
Korelace:
- Cramerovo V – nominální
- Kendaulovo tau (B nebo C) – ordinální
- Pearsonovo R – intervalová
Faktorová analýza
Řekněte mi pro každý z výroků, zda je jednání ospravedlnitelné vždy, nikdy či něco mezi tím.
- Desetibodová stupnice
- 15 různých kategorií
Pro usnadnění práce si vytvořím nový součtový index všech proměnných, který bude poukazovat na
celkovou toleranci věcí – tím ale trochu sčítám hrušky s jabkama, proto musíme nejdříve použít:
nejmenší co to může být je 0,6 – 0,7 (aby šlo věci spolu sčítat)
Ještě jde udělat scan if item deleted (na stejným místě ve statistics) – ukáže nám, zda se index změní
a jak, pokud bychom určitou položku vynechali – to nám může pomoct, pokud bychom měli hodnotu
Cronbachovy alfy moc nízkou.
V Component Matrix se zobrazují korelace (můžeme je zobrazit i jen ty, co jsou nad nějakou hodnotu)
Abychom věc zjednodušili. Použijeme možnost rotation (direct oblimin či varimax) – díváme se na
tabulku patern matrix
Skupiny se tvoří podle toho, ve které skupině se zobrazuje hodnota (případně bereme nejvyšší
hodnotu, či řadíme do skupiny na základě logické souvislosti, můžeme zařadit jednu proměnnou i do
více skupin)
Naším cílem je vytvořit tři skupiny – tři indexy, které budeme následně analyzovat – každý index by
měl obsahovat stejný počet proměnných (pokud ne, musím následně součtový index udělat dělený
počtem kategorií)
Klastrová analýza
V analyze – clasify – hierarchical cluster
Hodní, podle jakých kritérií chci klastrovat (zjistit podobnost mezi např. kraji)
Lineární regrese
- Regression – linear
R square – čím vyšší procento, tím lepší model
Y = 7,5 – 0,019 x věk + 0,024 x pohlaví (výsledné Y označuje jak moc akceptují rozvody, čím vyšší, tím
větší akceptace)
Nutno dívat se na sig. níže například všechny proměnné kromě pohlaví mají 3 hvězdičky, protože jsou
signifikantní na nejvyšší úrovni, pohlaví není na žádné úrovni, tudíž nemá žádnou hvězdičku
Co ale nyní? Vyřadíme nesignifikantní?
Můžeme přidávat další, ale pokud přidáme moc, bude vše nesig. Kvůli malému počtu případů
v jednotlivých kategoriích.
Současně je nutné mít na paměti, jaké jsou škály, na kterých proměnné měříme
Úkol 2 –
Druhý úkol – je nutno vybrat data pouze pro ČR (prostřednictvím select cases)
Třetí úkol – lineární regrese (vysvětlující proměnná je index četnosti konfliktů, vysvětlovaná je index
genderových postojů…) podíváme se, zda se změnil koeficient
Důležitý je koeficient Exp(B), který říká, jak se zvýší pravděpodobnost, že analyzovaný jev nastane.
Analyzuje se jako -1 a poté krát 100, výsledek vychází v procentech.
Multinomická/mulitonomiální regrese
Pokud je více kategorií než dvě
Covariants – spojité
Factors – kategorizované
Když má moje matka maturitu místo vysoké školy, tak moje šance, že získám výuční list místo
základního vzdělání je o 488 % vyšší.
100-0 - lineární (vstupují do ní poté jen spojité a dichotomické proměnné), koeficienty B a beta –
vyjadřuje, jak se změní (o B) jedna proměnná, pokud se změní druhá proměnná o 1.
7.12.2023 – opáčko
Interval spolehlivost
Signifikance
Chí kvadrát – ověření statistické signifikance (v crosstabs)
Interpretace: podívám se na Sig. F testu, podle toho vyberu řádek a v tom je platná Sig. T testu
krombachovo alfa
faktorová analýza
(clustrová/seskupovací analýza)
Lineární regrese
Korelace vs regrese
Dami proměnné