Professional Documents
Culture Documents
SPSS Konspektai 2015
SPSS Konspektai 2015
© V.Čekanavičius, G.Murauskas 2
čia
1
Tuščio duomenų lauko gavimas Matome duomenis, jei
čia
čia
....ikonėlė 'atspausta'
duomenys
© V.Čekanavičius, G.Murauskas 11 © V.Čekanavičius, G.Murauskas 12
2
Kintamojo vardas (name) Kintamojo tipai (type)
1. Prasideda raide.
1. Simbolinis (string) -pavardėms ir pan. Turi
2. Neturi tarpų. tiktai ilgį;
3. K1; K1.1; Lmnsvs - gerai; 2. Skaitinis (numeric) – skaičiams, bei
4. Ali Baba, 1grupė – blogai. kodams. Standartas (pagal nutylėjimą) 8
5. Kintamojo vardas – stulpelio viršuje. pozicijos, iš jų 2 po kablelio.Pvz. 313,72.
3. Kiti tipai – naudojami retai.
3
Kintamųjų sąrašas Kintamųjų sąrašas
kintamojo
vardas
praleistos
reikšmės
kintamojo
aprašas tipas- skaitinis
(F-raidė)
kai kurių
reikšmių
paaiškinimas
19 © V.Čekanavičius, G.Murauskas 20
reikšmė
po to čia
© V.Čekanavičius, G.Murauskas 23 © V.Čekanavičius, G.Murauskas 24
4
Duomenų vedimas Duomenų vedimas
'data view' lange
Praktiniai patarimai:
1. Duomenys vedami klaviatūra.
2. Pelė naudojama saikingai.
naudojame 3. Vedant duomenis eilute - naudoti 'tab'
klaviatūrą klavišą.
4. Vedant duomenis stulpeliu – naudoti
'enter' klavišą.
čia
perkėlimui
spaudžiam
čia
© V.Čekanavičius, G.Murauskas 29
varna tupi © V.Čekanavičius, G.Murauskas 30
5
Dažnių lentelė su SPSS Dispersija
childs Number of Children
s dispersija
• Kintamasis agewed (amžius pirmą
kartą tuokiantis)
• Rasime šio kintamojo vidurkį bei
standartinį nuokrypį.
Pastaba: parodysime tik vieną iš kelių
galimų būdų.
© V.Čekanavičius, G.Murauskas 33 © V.Čekanavičius, G.Murauskas 34
perkeliame
čia
6
Vidurkis ir Std su SPSS Duomenų atranka
(select cases)
Descriptive Statistics
čia
nekišame
nagų
© V.Čekanavičius, G.Murauskas 39 © V.Čekanavičius, G.Murauskas 40
7
Duomenų atranka SPSS Duomenų atranka SPSS
'išbraukta'
8
select cases - pastabos select cases – simboliniai kint.
• BLOGAI • GERAI
• simbolinių kintamųjų reikšmės rašomos
• race = 1|3 • race =1| race =3
kabutėse:
• 30<age<40 • age>30 & age <40
• 30 < age • age >30
• gender='M'.
• age =15 / age =20 • age=15 | age=20 • simbolis turi būti TIKSLIAI nukopijuotas.
• [race=1] & [age =50] • (race=1) &(age=50) • gender='m' blogai.
• (race=1) (age =50) • (race=1) &(age=50) • gender=' M' blogai (tarpas po kabutės).
• (age >50) | (age <60) • tai visi respondentai-
beprasmė sąlyga.
Compute naujo
stulp.
Compute
vardas
kas jame bus
čia
9
Compute: naujas kintamasis Compute: 0 - 1 kintamasis
loginė
išraiška
dviejų kint.
vidurkis
paspaudžiam
ir užrašom
sąlygą
naujas kintamasis
ww=1, jei age>30 .
naujas kintamasis zzz=1, jei age>30 ir zzz=0, jei age =<30.
© V.Čekanavičius, G.Murauskas 57 © V.Čekanavičius, G.Murauskas 58
Automatic recode
10
Automatic recode Automatic recode simbolinis
kint.
čia
naujo
kint.
vardas
po to čia
© V.Čekanavičius, G.Murauskas 61 © V.Čekanavičius, G.Murauskas 62
Recode
11
Recode Recode
1. Kintamajame 'tikyba': musulmonai – 6,
budistai -2. Įsidėmime.
čia
Recode Recode
vardas atsirado
senas
kintamasis
naujojo kint.
vardas po to čia
po to čia
© V.Čekanavičius, G.Murauskas 69 © V.Čekanavičius, G.Murauskas 70
...bus 3
visos kitos
reikšmės...
senas
kodas budistus,
po to čia
į 2
© V.Čekanavičius, G.Murauskas 71 © V.Čekanavičius, G.Murauskas 72
12
Recode Recode: sudėtingesnis pvz.
Atsirado naujas stulpelis: Pvz. Sukursime naują kintamąjį amzkat,
kuriame pagal amžių respondentus
suskirstysime taip:
• 1 , jei amžius <30;
• 2 , jei amžius 31 – 50;
• 3, jei virš 50.
13
Recode: sudėtingesnis pvz. Recode: sudėtingesnis pvz.
nuo ...
iki
didžiausio
taip:
14
SPSS Duomenys
SPSS
Štai čia!
SPSS SPSS
kintamasis
imties vidurkis
One-Sample Statistics
Std. Error
N Mean Std. Deviation Mean
SAT 20 1162,5000 279,97885 62,60517
SPSS reikšmė
Išvados formulavimas
• Pritaikę Stjudento testą gavome, kad
One-Sample Test
imties vidurkis (1162,5) statistiškai
Test Value = 1250
95% Confidence
reikšmingai nesiskiria nuo 1250.
Interval of the
Mean Difference
t df Sig. (2-tailed) Difference Lower Upper • Skirtumas pakankamai didelis. Galbūt jis
SAT -1,398 19 ,178 -87,50000 -218,5341 43,5341
statistiškai nereikšmingas dėl mažo
stebėjimų skaičiaus (jų buvo tik 20).
kadangi p >=0.05,
p-reikšmė tai st.reikšm. nesiskiria
© V.Čekanavičius, G.Murauskas 89 © V.Čekanavičius, G.Murauskas 90
15
Kada taikomas
Pavyzdys SPSS
ar pirmadieniais ir penktadieniais vienodai Stjudento t kriterijus,
ilgai kalbama telefonu? taikomas priklausomoms imtims
abi dienas (p, pt) slapta stebėti tie patys
(pvz. apie telefono pokalbius
vienos firmos darbuotojai.
pirmadienį ir penktadienį)
duomenys: (20,32), (40,45), (15,11),
duomenys greta
(120,110), (34,39), (27,24), (33,35),
(40,36), (20,19), (10,15) min.
16
SPSS SPSS
Štai čia!
SPSS SPSS
imčių vidurkiai
p-reikšmė
ir std nuokrypiai vidurkiams
SPSS
Išvados formulavimas
Paired Samples Test • Pritaikę Stjudento testą gavome, kad nėra
statistiškai reikšmingo skirtumo tarp to,
Paired Differences
95% Confidence
kiek vidutiniškai laiko prakalbama
Interval of the
Difference
Sig. pirmadieniais ir penktadieniais.
Std. Error (2-taile
Mean Std. Deviation Mean Lower Upper t df d)
Pair 1 PIRMAD -
PENKTAD -.7000 6.32543 2.00028 -5.2249 3.8249 -.350 9 .734
17
Pastabos
Stjudento t kriterijus, • Lyginame dviejų nepriklausomų
grupių vidurkius,
taikomas nepriklausomoms
• pvz., dviejų grupių vidutinius pažymius.
imtims
• Duomenyse visada DU skirtingo tipo
stulpeliai:
(dviejų vidurkių lygybė) viename – intervalinis rezultatas
(pvz.pažymys),
kitame - grupės kodas (pvz., 1 arba 2)
© V.Čekanavičius, G.Murauskas 103 © V.Čekanavičius, G.Murauskas 104
SPSS
SPSS
Stjudento t kriterijus,
taikomas nepriklausomoms Štai čia!
imtims
(pvz. apie egzamino pažymio
viešinimą)
magistrai: užkoduoti 1
fukseliai: užkoduoti 2
duomenys
© V.Čekanavičius, G.Murauskas 107 © V.Čekanavičius, G.Murauskas 108
18
SPSS grupių
intervalinis
kodai SPSS
grupė
po to čia
Po to ‘Continue’ ir ‘OK’.
© V.Čekanavičius, G.Murauskas 109 © V.Čekanavičius, G.Murauskas 110
SPSS SPSS
Independent Samples Test
imčių vidurkiai
Levene's Test
for Equality of
Group Statistics Variances t-test for Equality of Means
95% Confidence
Std. Error Std.
Interval of the
Sig. Mean Error
GRUPE N Mean Std. Deviation Mean (2-taile Differe Differe Difference
BALAS 1.00 10 7.5000 1.58114 .50000 F Sig. t df d) nce nce Lower Upper
BALAS Equal variances
.058 .813 2.909 18 .009 2.1000 .72188 .58339 3.61661
2.00 10 5.4000 1.64655 .52068 assumed
Equal variances not
assumed 2.909 17.971 .009 2.1000 .72188 .58321 3.61679
SPSS
Išvados formulavimas
Independent Samples Test
Levene's Test
for Equality of • (kadangi p= 0.009<0.05, tai vidurkiai
p-reikšmė Variances t-test for Equality of Means
skiriasi statistiškai reikšmingai)
vidurkiams 95% Confidence
Std.
Sig. Mean Error Interval of the
Difference
F Sig. t df
(2-taile Differe Differe
d) nce nce Lower Upper • Pritaikę Stjudento testą gavome, kad
BALAS Equal variances
assumed
.058 .813 2.909 18 .009 2.1000 .72188 .58339 3.61661 magistrai pažymių viešinimą vertina
Equal variances not
2.909 17.971 .009 2.1000 .72188 .58321 3.61679 statistiškai reikšmingai palankiau
assumed
(vidutiniškai 7,5 balo) nei pirmakursiai
būtų čia, jei (vidutiniškai 5,4 balo), p=0,009.
dispersijos nelygios
© V.Čekanavičius, G.Murauskas 113 © V.Čekanavičius, G.Murauskas 114
19
Statistinė hipotezė
0,2 (-0,2) – silpna koreliacija; 0,8 (-0,8) stipri.
Koreliacijos koeficiento ženklas parodo kaip
H0 neatmetame (kintamieji stat. reikšm. koreliuoja:
nekoreliuoja), jei teigiamas- vienam kintamajam didėjant, kitas
p 0.05
irgi didėja.
neigiamas – vienam didėjant, kitas mažėja.
Čia - reikšmingumo lygmuo
Koreliacija dar nereiškia priežastingumo!
© V.Čekanavičius, G.Murauskas 117 © V.Čekanavičius, G.Murauskas 118
SPSS
SPSS
Koreliacija
Turime vadybininkų patirtį ir jų Štai čia!
pradinį atlyginimą.
Ar koreliuoja?
20
kintamieji SPSS SPSS
raštingiems
koreliacija
Correlations
Previous
Beginning Experience
Salary (months)
Beginning Salary Pearson Correlation 1 ,479**
Sig. (2-tailed) . ,000
N 84 84
Previous Experience Pearson Correlation ,479** 1
(months) Sig. (2-tailed) ,000 .
N 84 84
**. Correlation is significant at the 0.01 level (2-tailed).
varna
© V.Čekanavičius, G.Murauskas 121 © V.Čekanavičius, G.Murauskas 122
SPSS SPSS
Correlations Correlations
Previous Previous
Beginning Experience Beginning Experience
Salary (months) Salary (months)
Beginning Salary Pearson Correlation 1 ,479** Beginning Salary Pearson Correlation 1 ,479**
Sig. (2-tailed) . ,000 Sig. (2-tailed) . ,000
N 84 84 N 84 84
Previous Experience Pearson Correlation ,479** 1 Previous Experience Pearson Correlation ,479** 1
(months) Sig. (2-tailed) p-reikšmė ,000 . (months) Sig. (2-tailed) ,000 .
N 84 84 N 84 84
**. Correlation is significant at the 0.01 level (2-tailed). **. Correlation is significant at the 0.01 level (2-tailed).
žmonių
skaičius
raštingiems
© V.Čekanavičius, G.Murauskas 123 © V.Čekanavičius, G.Murauskas 124
SPSS
Correlations
Išvados formulavimas
Previous
Beginning Experience
• Darbuotojo patirtis (išdirbti mėnesiai)
Beginning Salary Pearson Correlation
Salary (months) statistiškai reikšmingai koreliuoja su
1 ,479**
Sig. (2-tailed) . ,000 pradiniu atlyginimu, r=0,479; p<0,01.
N 84 84 Labiau patyrę gauna didesnius pradinius
Previous Experience Pearson Correlation ,479** 1
(months) Sig. (2-tailed) ,000 . atlyginimus.
N 84 84
**. Correlation is significant at the 0.01 level (2-tailed).
21
Turinys
• Mann Whitney ......................1 p.
SPSS – ranginiai • Wilcoxon ……………………. 3 p.
kriterijai • Spearman …………………... 5 p.
• Kruskal – Wallis ……………. 7 p.
• Friedman ……………………. 9 p.
© V. Čekanavičius, G. Murauskas 2
Mann-Whitney kriterijus
1. Stjudento t kriterijaus
nepriklausomoms imtims analogas;
Mann - Whitney kriterijus 2. bet nelygina vidurkių;
3. lygina skirstinius;
4. kuris kintamasis ‘linkęs būti didesniu’
parodo didesnis vidutinis rangas.
22
Statistinė išvada
Kriterijaus idėja: su p - reikšme
• Visas lyginamų kintamųjų reikšmes
surašome į vieną variacinę eilutę. H0 atmetame (kintamųjų skirstiniai stat.
• Suranguojame tą eilutę. reikšmingai skiriasi), jei p<α
• Lyginame kiekvienos imties elementų
vidutinius rangus. H0 neatmetame (kintamųjų skirstiniai stat.
reikšm. nesiskiria), jei
• Didesnis rangas- 'kintamasis linkęs
būti didesniu'.
p≥α
Čia α - reikšmingumo lygmuo
© V. Čekanavičius, G. Murauskas 7 © V. Čekanavičius, G. Murauskas 8
rasė
varna
© V. Čekanavičius, G. Murauskas 11 © V. Čekanavičius, G. Murauskas 12
23
SPSS SPSS p-reikšmė
vidutiniai
rangai
Test Statisticsa
Ranks CLASSICL
Classical
RACE Racew N Mean Rank Sum of Ranks Music
CLASSICL 1of white
Respondent 674 371.97 250710.00 Mann-Whitney U 23235.000
2 black 75 402.20 30165.00 Wilcoxon W 250710.000
Total 749 Z -1.183
Asymp. Sig. (2-tailed) .237
a. Grouping Variable: RACE Racew of Respondent
baltieji rašė mažesnius balus (t.y. vertino
palankiau, nes tokia kodavimo sistema) skirtumas stat. nereikšmingas
© V. Čekanavičius, G. Murauskas 13 © V. Čekanavičius, G. Murauskas 14
Wilcoxon kriterijus
1. Stjudento t kriterijaus porinėms
(priklausomoms) imtims analogas;
Wilcoxon kriterijus 2. bet nelygina vidurkių;
3. lygina skirstinius;
4. kuris kintamasis ‘linkęs būti didesniu’
parodo didesnis vidutinis kintamųjų
skirtumo rangas.
24
Kriterijaus idėja: Kriterijaus idėja:
• Suskaičiuojame reikšmių • (12,13), (20,30), (5,3), (4,2), (15,17),
skirtumus kiekvienai porai. (25,30).
• Suranguojame skirtumų • Skirtumai: -1, -10, 2, 2, -2, -5.
modulius. • Moduliai:1(-), 2(-), 2(+),2(+),5(-),10(-).
• Rangai: 1(-), 3(-), 3(+), 3(+), 5(-), 6(-).
• Lyginame vidutinius teigiamų ir
neigiamų skirtumų rangus. • Vidutiniai rangai: (+): 3, (-): 3.75
Statistinė išvada
su p - reikšme Pavyzdys
• Ar vyresni, nei 50 m. respondentai
H0 atmetame (kintamųjų skirstiniai stat. vienodai palankiai vertina klasikinę
reikšmingai skiriasi), jei p<α muziką ir džiazą?
• ranginių kintamųjų reikšmės: 1-labai
H0 neatmetame (kintamųjų skirstiniai stat. palankiai, 2-palankiai,….,5-labai
reikšm. nesiskiria), jei nepalankiai.
p≥α • Tarkime, kad reikšmingumo lygmuo yra
0,05.
Čia a - reikšmingumo lygmuo
© V. Čekanavičius, G. Murauskas 21 © V. Čekanavičius, G. Murauskas 22
Štai čia!
varna
© V. Čekanavičius, G. Murauskas 23 © V. Čekanavičius, G. Murauskas 24
25
SPSS skirtumų SPSS p-reikšmė
rangai
Ranks Test Statisticsb
Spearman’o kriterijus
1. Pearson’o koreliacijos analogas.
2. Interpretuojamas visiškai
Spearman koreliacija analogiškai;
3. skaičiuoja Pearson’o koreliaciją tarp
imčių rangų;
4. tai leidžia naudoti ir specialiu atveju,
kai duomenys jau suranguoti.
26
Statistinė išvada
su p - reikšme Pavyzdys
• Ar vyresni, nei 50 m. respondentai,
H0 atmetame (kintamieji stat. reikšmingai palankiau vertinantys miuziklus,
koreliuoja), jei p<α palankiau vertina ir klasikinę muziką?
• ranginių kintamųjų reikšmės: 1-labai
H0 neatmetame (kintamieji stat. reikšm. palankiai, 2-palankiai,….,5-labai
nekoreliuoja), jei nepalankiai.
p≥α • Tarkime, kad reikšmingumo lygmuo yra
0,05.
Čia a - reikšmingumo lygmuo
© V. Čekanavičius, G. Murauskas 31 © V. Čekanavičius, G. Murauskas 32
Štai čia!
varna
SPSS
Correlations Spearman specialus atvejis
CLASSICL MUSICALS
Classical
Music
Broadway
Musicals
1. Kiekviena iš dviejų mokytojų surikiavo
Spearman's rho CLASSICL Correlation Coefficient 1.000 .399** mokinius pagal gabumus.
Sig. (2-tailed) . .000
N 504 489 2. Pirma: A, B, C, D, E, F, G, H, I,J, K, L.
MUSICAL Correlation Coefficient .399** 1.000
S Sig. (2-tailed) .000 . 3. Antra: B, C, A, D, H,E, F, G, K, I,J, L.
N 489 499
**. Correlation is significant at the .01 level (2-tailed).
4. Ar mokytojų nuomonės koreliuoja?
27
SPSS
Statistinė hipotezė: •Pirma: A,B,C,D,E,F,
G,H,I,J,K,L
H0 : nuomonės nekoreliuoja. •Antra: B, C, A,D,
H,E, F,G,K,I,J,L.
H1 : nuomonės koreliuoja.
šis stulpelis
nebūtinas
SPSS
Correlations
MOKYT1 MOKYT2
Spearman's rho MOKYT1 Correlation Coefficient 1.000 .916**
Sig. (2-tailed)
N 12
. .000
12 Kruskal - Wallis kriterijus
MOKYT2 Correlation Coefficient .916** 1.000
Sig. (2-tailed) .000 .
N 12 12
**. Correlation is significant at the .01 level (2-tailed).
28
Statistinė išvada
Statistinė hipotezė: su p - reikšme
H0 atmetame (kažkurie skirstiniai stat.
H0 : visi skirstiniai nesiskiria reikšmingai skiriasi), jei
H1 : kažkurie skirstiniai skiriasi.
p<α
H0 neatmetame (visi skirstiniai stat.
reikšm. nesiskiria), jei
p≥α
Čia a - reikšmingumo lygmuo
© V. Čekanavičius, G. Murauskas 43 © V. Čekanavičius, G. Murauskas 44
rasė
varna
© V. Čekanavičius, G. Murauskas 47 © V. Čekanavičius, G. Murauskas 48
29
SPSS SPSS p-reikšmė
a,b
Test Statistics
Ranks
RAP Rap
RACE Racew N Mean Rank Music
of Respondent Chi-Square 23.311
RAP Rap Music 1 white 617 372.20
df 2
2 black 65 254.05
Asymp. Sig. .000
3 other 34 309.59
a. Kruskal Wallis Test
Total 716
b. Grouping Variable: RACE Racew of Respondent
Friedman’o kriterijus
1. Wilcoxon kriterijaus apibendrinimas
keletui (2 ir daugiau) imčių.
Friedman kriterijus 2. jei imtys 2, Wilcoxono kriterijus
geriau.
3. interpretacija paprastesnė už
Wilcoxon
4. nepasako, kurie kintamieji skiriasi.
5. yra ‘Repeated measures’
neparametrinis analogas
© V. Čekanavičius, G. Murauskas 51 © V. Čekanavičius, G. Murauskas 52
30
Statistinė išvada
Statistinė hipotezė: su p - reikšme
H0 atmetame (kažkurie skirstiniai stat.
H0 : visų kintamųjų skirstiniai reikšmingai skiriasi), jei
nesiskiria. p<α
H1 : kažkurių kintamųjų skirstiniai H0 neatmetame (visi skirstiniai stat.
skiriasi. reikšm. nesiskiria), jei
p≥α
Čia a - reikšmingumo lygmuo
© V. Čekanavičius, G. Murauskas 55 © V. Čekanavičius, G. Murauskas 56
SPSS
Pavyzdys
• Ar prasimokę daugiau nei 15 m.
respondentai, vienodai palankiai
vertinana miuziklus, klasiką ir Štai čia!
bigbendus?
• ranginių kintamųjų reikšmės: 1-labai
palankiai, 2-palankiai,….,5-labai
nepalankiai.
• Tarkime, kad reikšmingumo lygmuo yra
0,05.
© V. Čekanavičius, G. Murauskas 57 © V. Čekanavičius, G. Murauskas 58
SPSS SPSS
kintamieji
Ranks
Mean Rank
CLASSICL Classical Music 1.87
MUSICALS Broadway
2.05
Musicals
BIGBAND Bigband Music 2.08
31
SPSS p-reikšmė
Friedman spec. atvejis
Test Statisticsa
• Penki ekspertai vertino alų A,B ir C.
N 343 • Pirmas: B, C, A (t.y. geriausias B,…)
Chi-Square 14.286 • Antras: B, C, A
df 2 • Trečias: A arba C, B
Asymp. Sig. .001 • Ketvirtas: A, B,C
a. Friedman Test • Penktas: B, A,C
• Ar visos alaus rūšys vienodai
populiarios?
ne visi stiliai vienodai populiarūs
© V. Čekanavičius, G. Murauskas 61 © V. Čekanavičius, G. Murauskas 62
SPSS rūšys
SPSS
Ranks
Mean Rank
A 2.10
B 1.60
C 2.30
SPSS
Test Statisticsa
N 5
Chi-Square 1.368
df 2
Asymp. Sig. .504
a. Friedman Test
© V. Čekanavičius, G. Murauskas 65
32
SPSS
Chi kvadrato suderinamumo
suderinamumo kriterijus,
kriterijus
Tikriname, ar klerkų nac. daugumos ir
nac. mažumos atstovų proporcija yra 7:2
• Spėjame proporciją.
• Jeigu nespėjame, tai čia ne tas chi
SPSS SPSS
duomenys
Štai čia!
prognozuojama
Spėjami procentai proporcija
ar santykiai
33
SPSS SPSS
skirtumas reikšmė
Test Statistics
Frequencies minority
Minority
Classification
minority Minority Classification Chi-Squarea ,639 p-reikšmė
df
Category Observed N Expected N Residual 1
Asymp. Sig. ,424
1 0 No 276 282,3 -6,3
a. 0 cells (,0%) have expected frequencies less than
2 1 Yes 87 80,7 6,3 5. The minimum expected cell frequency is 80,7.
Total 363
duomenys
nereti
duomenys stat. reikšm. neprieštarauja
Kiek yra Kiek spėjamam santykiui 7 nac. daug. : 2 nac. maž.
tikėjomės
© V.Čekanavičius, G.Murauskas 133 © V.Čekanavičius, G.Murauskas 134
duomenys
tik skaitiniai
© V.Čekanavičius, G.Murauskas 137 © V.Čekanavičius, G.Murauskas 138
34
SPSS SPSS
sveriam
apačioje
dešiniame
kampe atsiras
SPSS SPSS
RUSIS
SPSS
Išvados formulavimas
Test Statistics
• Pritaikę chi kvadrato kriterijų, gavome, kad
RUSIS
Chi-Squarea 15.050
duomenys statistiškai reikšmingai
df 3 prieštarauja spėjamam pakuočių santykiui,
Asymp. Sig. .002 p= 0,002. Žymiai daugiau, nei tikėtasi,
a. 0 cells (.0%) have expected frequencies less than
5. The minimum expected cell frequency is 36.2. nuperkama trečios rūšies pakuočių ir
mažiau ketvirtos rūšies pakuočių.
35
Porinių dažnių lentelės
36
Statistinė išvada, kai Pavyzdys
reikšmingumo lygmuo 0,05
• Ar vienodą procentą vadybininkų ir
H0 atmetame (populiacijos stat.
klerkų sudaro moterys?
reikšmingai skiriasi), jei
p 0,05 • Tarkime, kad reikšmingumo lygmuo yra
0,05.
SPSS SPSS
tinka ir
simboliniai
SPSS SPSS
po to čia
eilutė
stulpelis
varna
37
SPSS SPSS
ir čia
po to čia
ir čia
© V.Čekanavičius, G.Murauskas 157 © V.Čekanavičius, G.Murauskas 158
SPSS SPSS
JOBCAT Employment Category * GENDER Gender Crosstabulation
p-reikšmė
GENDER Gender
Chi-Square Tests
f Female m Male Total
JOBCAT Employment 1 Clerical Count 206 157 363
Category Asymp. Sig. Exact Sig. Exact Sig.
% within JOBCAT
Employment Category
56.7% 43.3% 100.0% Value df (2-sided) (2-sided) (1-sided)
Pearson Chi-Square b
% within GENDER 54.935 1 .000
Gender 95.4% 68.0% 81.2%
a
Continuity Correction
3 Manager Count
53.154 1 .000
10 74 84
% within JOBCAT Likelihood Ratio 61.256 1 .000
11.9% 88.1% 100.0%
Employment Category
Fisher's Exact Test .000 .000
% within GENDER
Gender 4.6% 32.0% 18.8% N of Valid Cases 447
Total Count 216 231 447 a. Computed only for a 2x2 table
% within JOBCAT
48.3% 51.7% 100.0%
Employment Category b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 40.59.
% within GENDER
Gender 100.0% 100.0% 100.0%
38
SPSS SPSS Pasveriame
pagal ‘kiek’
gali būti ir
simboliniai
skaitiniai
© V.Čekanavičius, G.Murauskas 163 © V.Čekanavičius, G.Murauskas 164
SPSS SPSS
ELGESYS * TV Crosstabulation
TV
nesmurt smurt Total
ELGESYS agres Count 30 63 93
% within ELGESYS 32.3% 67.7% 100.0%
% within TV 30.0% 63.0% 46.5%
neagr Count 70 37 107
% within ELGESYS 65.4% 34.6% 100.0%
% within TV 70.0% 37.0% 53.5%
Total Count 100 100 200
% within ELGESYS 50.0% 50.0% 100.0%
% within TV 100.0% 100.0% 100.0%
nagų Po to čia!
nebekišam!
smurtinę TV žiūrėję agresyvesni
Statistics ir Cells užpildome, kaip
© V.Čekanavičius, anksčiau.
G.Murauskas 165 © V.Čekanavičius, G.Murauskas 166
SPSS
Išvados formulavimas
Chi-Square Tests
• Pritaikę chi kvadrato kriterijų, gavome, kad
Asymp. Sig. Exact Sig. Exact Sig.
tarp žiūrėjusių smurtinę TV buvo
Pearson Chi-Square
Value
21.887b
df
1
(2-sided)
.000
(2-sided) (1-sided)
statistiškai reikšmingai daugiau agresyvių
Continuity Correctiona
Likelihood Ratio
20.581
22.314
1
1
.000
.000
vaikų (63%), nei tarp žiūrėjusių nesmurtinę
Fisher's Exact Test
N of Valid Cases
.000 .000 TV (30 %), p<0,01.
200
a. Computed only for a 2x2 table
b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 46.50.
stat. reikšmingai
© V.Čekanavičius, G.Murauskas 167 © V.Čekanavičius, G.Murauskas 168
39
Mc Nemar kriterijus
dažniausiai (bet ne visada):
• taikomas dvireikšmiams kintamiesiems
• gautiems apklausus tuos pačius
Mc Nemar kriterijus respondentus
• prieš poveikį respondentams (terapiją,
reklamą, įkalbinėjimą, filmą ir t.t.)
• ir po poveikio.
• domina, kaip paveikė respondentus
© V.Čekanavičius, G.Murauskas 169 © V.Čekanavičius, G.Murauskas 170
Duomenys
Statistinė hipotezė:
c d
© V.Čekanavičius, G.Murauskas 173 © V.Čekanavičius, G.Murauskas 174
40
Statistinė išvada
SPSS
su p - reikšme
• dukart apklausėme tuos pačius rinkėjus, prieš
H0 atmetame (poveikis buvo stat. TV laidą ir po TV laidos.
reikšmingas), jei
p 0.05 • prieš TV už, po TV už 200
• prieš TV už, po TV prieš 30
H0 neatmetame (poveikis stat. • prieš TV prieš, po TV už 60
nereikšmingas), jei
p 0.05 • prieš TV prieš, po TV prieš 100
• ar TV laida paveikė rinkėjus.
Čia 0.05 - reikšmingumo lygmuo
© V.Čekanavičius, G.Murauskas 175 © V.Čekanavičius, G.Murauskas 176
čia
Štai čia!
© V.Čekanavičius, G.Murauskas 179 © V.Čekanavičius, G.Murauskas 180
41
SPSS SPSS
pries * po Crosstabulation
Count
varna
po
Ne už Total
pries
Ne 100 60 160
už 30 200 230
SPSS p-reikšmė
ANOVA
Chi-Square Tests
Vienfaktorinė
Value Exact Sig. (2-sided)
McNemar Test
N of Valid Cases 390
.002a
dispersinė analizė
a. Binomial distribution used.
PAVYZDŽIAI
42
DUOMENYS
Statistinė hipotezė:
• VISADA DU stulpeliai
• Vienas – intervalinis. Jame yra H0: 1 = 2 =…= k
rezultatas, kurio vidurkius
lyginame. (Pvz., 32, 17, 22,…) H1: ne visi vidurkiai
• Kitas – kategorinis. Jame - lygūs
grupės kodas. (pvz., 1, 2, 3).
H0 atmetame (ne visi vidurkiai lygūs), jei Toliau : POST HOC testai. Pvz.
Bonferroni testas.
p 0.05
H0 neatmetame (visi vidurkiai stat. reikšm. Tikslas: Nustatyti kurių grupių
vidurkiai skiriasi statistiškai
nesiskiria), jei
p 0.05 reikšmingai.
Čia - reikšmingumo lygmuo
© V. Čekanavičius, G. Murauskas 189 © V. Čekanavičius, G. Murauskas 190
43
SPSS SPSS
Jazz
(intervalinis)
Rasė
(kategorinis)
Štai čia!
opcijos
SPSS SPSS
post hoc
aprašoma
grafikas
© V. Čekanavičius, G. Murauskas 195 © V. Čekanavičius, G. Murauskas 196
SPSS SPSS
Descriptives
Ma
Std. Std. Lower Upper Minimu xim
N Mean Deviation Error Bound Bound m um
1 white 304 2.98 1.118 .064 2.85 3.10 1 5
2 black 32 2.34 1.208 .214 1.91 2.78 1 4
3 other 8 3.38 .744 .263 2.75 4.00 2 4
post hoc Total 344 2.93 1.134 .061 2.81 3.05 1 5
44
SPSS SPSS
Multiple Comparisons
ANOVA
Dependent Variable:jazz Jazz Music
Mean Upper
Mean (I) race (J) race Difference (I-J) Std. Error Sig. Lower Bound Bound
Sum of Squares df Square F Sig. Tukey HSD 1 white 2 black .633* .208 .007 .14 1.12
Between 3 other -.398 .401 .582 -1.34 .55
Groups 13.251 2 6.625 5.279 .006 2 black 1 white -.633* .208 .007 -1.12 -.14
Within Groups 427.933 341 1.255 3 other -1.031 .443 .053 -2.07 .01
3 other 1 white .398 .401 .582 -.55 1.34
2 black 1.031 .443 .053 -.01 2.07
Total 441.183 343
Bonferroni 1 white 2 black .633* .208 .008 .13 1.13
3 other -.398 .401 .966 -1.36 .57
2 black 1 white -.633* .208 .008 -1.13 -.13
SPSS SPSS
Mean
Difference
(I) race (J) race (I-J) Std. Error Sig.
Tukey HSD 1 white 2 black .633* .208 .007
3 other -.398 .401 .582
45
PAVYZDŽIAI
Duomenys
• kraujospūdis matuojamas po
mėnesio, po pusmečio ir po metų. Keli intervaliniai kintamieji (stulpeliai).
Ieškoma skirtumų.
• stebime studento IQ kitimą Būtent jų vidurkius ir lyginame.
pereinant iš kurso į kursą.
Statistinė išvada
POST HOC testai su p - reikšme
Vidurkiai stat. reikšmingai skiriasi, jei
Taikomi ir interpretuojami, kaip ir
vienfaktorinėje ANOVA. p 0.05
Vidurkiai stat. reikšmingai, nesiskiria, jei
p 0.05
Čia - reikšmingumo lygmuo
© V.Čekanavičius, G.Murauskas 209 © V. Čekanavičius, G. Murauskas 210
46
SPSS
Pavyzdys
Duomenys
Tris gražuoles įvertino 15 ekspertų.
Arvisos gražuolės įvertintos vienodai
gerai?
SPSS pseudo-vardas:
pseudo-vardas
SPSS tai kas vienija
kintamuosius
(nesvarbus)
Štai čia!
Kintamųjų
(stulpelių)
skč.
SPSS SPSS
perkėlėm
post hoc
aprašoma
kintamieji aprašoma
varna
opcijos
© V.Čekanavičius, G.Murauskas 215 © V.Čekanavičius, G.Murauskas 216
47
SPSS SPSS
čia
grafikas
ir čia!
SPSS SPSS
kaip užkoduoti Within-Subjects Factors
post hoc
SPSS
Pairwise Comparisons
Išvada
Measure: MEASURE_1
Mean
95% Confidence Interval for
a
Difference
• Pritaikius blokuotųjų duomenų ANOVA
(I) FACTOR1 (J) FACTOR1 Difference (I-J)Std. Error
1 2 3.600* .542
Sig.
a
.000
Lower Bound Upper Bound
2.128 5.072
gavome, kad ne visos gražuolės
3 .467 .593 1.000 -1.144 2.077 vertinimas vienodai (p<0,05). Bonferoni
2 1 *
-3.600 .542 .000 -5.072 -2.128
3 *
-3.133 .723 .002 -5.098 -1.169 kriterijus parodė, kad antroji gražuolė
vertinama statistiškai reikšmingai
3 1 -.467 .593 1.000 -2.077 1.144
2 3.133* .723 .002 1.169 5.098
Based on estimated marginal means
*. The mean difference is significant at the .05 level.
blogiau nei pirmoji ir antroji.
a. Adjustment for multiple comparisons: Bonferroni.
prisimenam kodus
48
Koeficientas h2 :
ANOVA: faktorių
priklausomybės stiprumo
skirtumai tarp grupių
matavimas eta kvadratu h2
visi skirtumai
...
© V. Čekanavičius, G. Murauskas 2
Koeficiento h2 interpretacija:
Koeficientas h2 : • parodo, kurią dalį duomenų sklaidos lemia
populiacijų skirtumai.
© V. Čekanavičius, G. Murauskas 3
čia
SPSS SPSS
Štai čia!
49
SPSS SPSS čia
Measures of Association
varna
Eta Eta Squared
rezas * grupe ,887 ,786
VIDURKIŲ TRENDAI
Tiesinis Kvadratinis
50
Statistinė hipotezė:
Statistinė išvada su p - reikšme
Štai čia!
SPSS SPSS
Štai čia!
• Du • Du
menys menys
Kaip Anova
LINEAR
VARNA
Trendas tinka
51
SPSS SPSS (grupės nelygios)
Tiesinis ir kvadratinis
SPSS SPSS
menys
52
TRUMPAI
• ANCOVA –kelių grupių vidurkiai lyginami,
atsižvelgiant į papildomą informaciją.
ANCOVA
• ANCOVA – tai ANOVA su kovariantėmis.
KOVARIANČIŲ ANALIZĖ
PAVYZDŽIAI KO TIKIMĖS
• Norima nustatyti, kuris iš dviejų mokymo • Manome, kad grupių skirtumai išryškės, jei
metodų geresnis, kai, vertinant rezultatus, lyginsime to paties intelekto ir vienodos
atsižvelgiama į mokinių motyvaciją ir IQ. motyvacijos mokinių rezultatus. Nebus taip,
• Tiriama, ar besimokantieji vairuoti, kad mažai motyvuoti vienos grupės mokiniai
važiuodami dideliais automobiliais, padaro bus lyginami su stipriai motyvuotais kitos
daugiau klaidų nei važiuodami mažais. grupės mokiniais.
Papildomai atsižvelgiama į vairuotojo amžių. • Tikimės, kad skirtumai išryškės, kai lyginsime
maždaug to paties amžiaus vairuotojus.
53
KINTAMIEJI PAVYZDYS
• Priklausomas kintamasis Y (t.y. tas kintamasis, • Tiriame, ar statistiškai reikšmingai skiriasi trijų
kurio vidurkius lyginame) yra intervalinis, grupių testo rezultatai (REZ, intervalinis
normaliai pasiskirstęs. kintamasis). Atsižvelgsime į respondentų
• Kovariantė X (t.y. Kintamasis, į kurį reikia motyvaciją (MOT, intervalinis kintamasis). Grupę
atsižvelgti) yra intervalinė, normaliai nurodyto kintamasis Grupe (trireikšmis
pasiskirsčiusi. kategorinis kintamasis).
• Grupavimo (nepriklausomas, faktorius) • Duomenis galima rasti knygos V. Čekanavičius, G.
kintamasis – kategorinis. Jo dėka žinome, Murauskas, Statistika ir jos taikymai. III, pirmos
kuriai grupei koks respondentas priklauso. dalies šeštajame skyrelyje (1.1.9 pavyzdys).
Bonferroni
varnos
varna
ČIA
54
ANCOVA rezultatai ANCOVA rezultatai
p-reikšmė
55
ANCOVA rezultatų aprašymo pavyzdys
Tyrėme, ar statistiškai reikšmingai skiriasi trijų
grupių vidutiniai testo rezultatai. Atsižvelgėme
į respondentų motyvaciją. Taikėme PAPILDOMI TYRIMAI
kovariančių analizę (ANCOVA) ir Bonferonio
kriterijų. Gavome, kad pirmoji grupė
statistiškai reikšmingai skiriasi nuo likusiųjų, o
antroji ir trečioji grupės nesiskiria.
56
Reikšmių išsibarstymo grafikas Reikšmių išsibarstymo grafikas
• Norint nustatyti testo rezultatų ir motyvacijos
priklausomybę, verta nubraižyti abiejų
kintamųjų grafiką. Parodysime, kaip tai galima
padaryti naudojantis SPSS 17 programa.
Čia
57
Į ką grafike atkreipti dėmesį Kintamųjų sąveika
• Visose grupėse matyti ta pati tendencija – kuo
• Statistiškai reikšminga motyvacijos ir grupės
didesnė motyvacija, tuo geresni rezultatai.
sąveika parodo, kad skirtingose grupėse
• Matome, kad skirtingų grupių rezultatų
motyvacija skirtingai veikia rezultatus.
„debesėliai beveik lygiagretūs“. Vadinasi
grupės ir motyvacijos sąveikos (interakcijos) • Klasikinė ANCOVA daroma, kai nėra grupės ir
nėra. Visose grupėse motyvacijos poveikis kovariantės sąveikos (interakcijos).
maždaug vienodas. • Parodysime, kaip naudojant SPSS galima
• Kuo labiau debesėliai atsiskiria, tuo tikėtiniau, patikrinti, ar sąveikos nėra.
taikant ANCOVA, rasti statistiškai reikšmingų
vidurkių skirtumų. • Pradžia nesiskiria nuo įprastinės ANCOVA.
Čia
58
ANCOVA su kintamųjų sąveika Sąveikos nėra
Taškas
Sąveika
59
Tiesinė regresija - toks modelis,
Tiesinė regresija kai vieną (priklausomą)
kintamąjį įtakoja vienas arba
keletas (nepriklausomų)
kintamųjų.
PAVYZDŽIAI PAVYZDŽIAI
• ar poegzamininis dirglumas • išmatavome IQ pirmame kurse. Ar
priklauso nuo gauto pažymio, nuo galima prognozuoti koks bus
egzamino trukmės ir nuo ko labiau, studento diplomo pažymių vidurkis?
• kaip antikvarinės keramikos kaina • kiek padidės pelnas, padidinus
priklauso nuo jos senumo ir aukciono reklamos išlaidas 10 000 Lt?
dalyvių skaičiaus, • kokį vidutinį valstybinio egzamino
• ar diplomo pažymių vidurkis ir balą galima prognozuoti mokiniui per
komunikabilumas gali padėti baigiamąjį kontrolinį surinkusiam 87
prognozuoti būsimą atlyginimą. tšk.?
© V.Čekanavičius, G.Murauskas 225 © V.Čekanavičius, G.Murauskas 226
Duomenys MODELIS
60
Visi kintamieji intervaliniai*. Standartinis tyrimas:
• R2 , ANOVA, t-testai, VIF ir grafikai
• * išskyrus pseudokintamuosius . padės nustatyti reikalingus X-us.
• X-ai vienas kito neveikia, • R parodys, kaip Y priklauso nuo visų
X-ų iškart.
• X-ai veikia Y-ą.
• B-koeficientai padės sudaryti regresijos
• vieno X-o per kitus neišreikši. funkciją.
• Beta-koeficientai padės nustatyti,
kurie kintamieji svarbesni.
SPSS
Pavyzdys:
Štai čia!
61
Ką modeliuojame SPSS SPSS
po to čia
pagal ką
SPSS SPSS
išskirtims
po to čia
SPSS daugialypė
koreliacija
SPSS koreguotas
det. koef.
Descriptive Statistics
62
SPSS SPSS (koeficientai)
ANOVAb
Sum of Mean
Model Squares df Square F Sig.
1
Regression 1200.681 3 400.227 167.434 .000a
Residual 1226.256 513 2.390
SPSS (modelis)
Modelio lygtis
Regresijos modelio lygtis
satisfaction = - 0,039 + 0,374 trstprl +
0.228 happy + 0,322 trstprt
satisfaction =
- 0,039 • Kai trstprl padidėja vienetu, satisfaction
+ 0,374 trstprl padidėja 0,374 balo.
+ 0.228 happy • Prognozuojant, į lygtį tiesiog įstatomos
+ 0,322 trstprt konkrečios kintamųjų reikšmės.
© V.Čekanavičius, G.Murauskas 243
63
SPSS (koeficientai) SPSS (koeficientai)
Residuals Statisticsa
Std.
Minimum Maximum Mean Deviation N
Predicted Value .4182 8.5548 4.0397 1.52542 517
------------------------ ---------- ----------- ----------- --------------- ---------
----- ---
SPSS
PAVYZDŽIAI
Logistinė regresija - toks • pagal paciento svorį ir kraujo tyrimus
modelis, kai vieną nustatyti tikimybę susirgti diabetu,
(priklausomą) dvireikšmį • pagal testų rezultatus nustatyti reiks
kintamąjį įtakoja vienas arba kompiuteriui garantinio remonto,
keletas (nepriklausomų) • ar pagal agresyvumą bei plepumą
galima atskirti vyrą nuo moters.
kintamųjų.
• ar žinant rinkėjo pajamas ir amžių,
galima numatyti balsuos už kandidatą
ar nebalsuos.
© V.Čekanavičius, G.Murauskas 251 © V.Čekanavičius, G.Murauskas 252
64
Duomenys • priklausomas kintamasis Y
dvireikšmis (0 arba 1).
• (X1, X2, X3,…, Xk, Y) • X-ai intervaliniai.
• Vienas kintamasis (stulpelis) Y • prognozuojama tikimybė P(Y=1).
dvireikšmis – jo elgesį ir modeliuojame.
Dar vadinamas priklausomu kintamuoju • jei Y įgyja kitokias dvi reikšmes -
• Kiti (kitas) kintamieji intervaliniai jis perkoduojamas.
(dažniausiai) - nepriklausomi kintamieji. • Nei viena iš dviejų Y reikšmių
Jie, mūsų nuomone, daro įtaką Y’ui. neturi kartotis daugiau nei 80 %
duomenų.
© V.Čekanavičius, G.Murauskas 253 © V.Čekanavičius, G.Murauskas 254
Modelio schema:
Prognozuojame tikimybę P(Y=1).
Surandame:
Y=0 arba Y=1
e z(x)
X1 X2 X3 P̂ (Y m 1)
intervaliniai kintamieji 1 e z(x)
© V.Čekanavičius, G.Murauskas 255 © V.Čekanavičius, G.Murauskas 256
• jei z(x)>0 , tai Y=1 (ir pasižiūrime, ką tai Ar tinka logistinė regresija nustatome
reiškia). analizuodami
• jei z(x)<0 , tai Y=0 (ir pasižiūrime, ką tai
reiškia). • klasifikacinę lentelę,
• Jei z(x)=0, tai metame monetą. kriterijų,
• Voldo kriterijų,
• Determinacijos koeficientus.
© V.Čekanavičius, G.Murauskas 257 © V.Čekanavičius, G.Murauskas 258
65
kriterijus: Statistinės išvados
su p- reikšme:
• Tikrina hipotezę:
H0: visi bm = 0 H0 atmetame (logistinė regresija galbūt
tinka), jei
H1: ne visi bm = 0. p < 0.05
• Kitais žodžiais:
H0 neatmetame (logistinė regresija
H0: tikimybė nuo x-ų nepriklauso netinka), jei
H1: tikimybė nuo x-ų priklauso. p >=
• Tik nežinome nuo kurių x-ų. Čia - reikšmingumo lygmuo.
© V.Čekanavičius, G.Murauskas 259 © V.Čekanavičius, G.Murauskas 260
66
Pseudokintamieji Labai gerai duomenims
• Pseudokintamieji naudojami, kaip ir tinkančiame modelyje:
tiesinėje regresijoje. • Chi kvadrato p < 0,05.
• Pseudokintamieji koduojami, kaip ir • Visiems regresoriams Voldo kriterijaus
tiesinėje regresijoje (0 ir 1). p < 0,05.
• Jei kategorijų daugiau nei 2, reikia • Koeficientų ženklai neatrodo nelogiški.
net kelių pseudokintamųjų. • Teisingai klasifikuojama ne mažiau 50%
• SPSS perkoduoja automatiškai, jei atvejų, kai Y = 1 ir kai Y = 0.
paprašome. • Pasirinktasis determinacijos
koeficientas ≥ 0,20.
© V.Čekanavičius, G.Murauskas 265
Jei būtų
SPSS SPSS
kategorinių
priklausomas regresorių
nepriklausomi
Štai čia!
© V.Čekanavičius, G.Murauskas 269 © V.Čekanavičius, G.Murauskas 270
67
duomenų SPSS nauji
kodai
kodai
Klasifikacinė lentelė
Dependent Variable Encoding
SPSS SPSS
Omnibus Tests of Model Coefficients
Chi-square df Sig.
Step 1 Step 99.458 3 .000
a. Estimation terminated at iteration number 5 because parameter estimates changed happy .325 .090 13.019 1 .000 1.384
by less than .001.
freehms -.752 .145 27.018 1 .000 .471
didelis (>0,20).
Visi kintamieji statistiškai reikšmingi.
© V.Čekanavičius, G.Murauskas 275 © V.Čekanavičius, G.Murauskas 276
68
Modelio lygtis
Bendra išvada Z= lnP(Y=1)/P(Y=0)
Variables in the Equation
Prognozavimas Prognozavimas
Įstatę visas reikšmes gauname: Z NĖRA tikimybė. Z yra tikimybių
Z= lnP(PT)/P(EE) =1,322. santykis.
69
Diskriminantinė analizė - toks
Diskriminantinė modelis, kai vieną
analizė (priklausomą) kategorinį
kintamąjį įtakoja keletas
(nepriklausomų) intervalinių
kintamųjų.
Discriminant Analysis
Duomenys
70
Kanoninių funkcijų vertinimas: Kanoninių funkcijų % sudėtis:
• Žiūrime kiek % visomis kanoninėmis
• Kanoninėmis funkcijomis funkcijomis paaiškinamos dispersijos
paaiškinamos kintamųjų dispersijos tenka kiekvienai funkcijai.
procentinė sudėtis .
• Tai - santykinis rodiklis. Viena funkcija
• Vilkso lambda. gali būti svarbesnė už kitą, bet abi
• Vilkso statistikos p-reikšmė. netikusios.
• Jei yra tik viena kanoninė funkcija, tai
Apsiribosime proc. sudėtimi rodiklis beprasmis, nes =100%.
Standartinis tyrimas:
Pavyzdys:
• Klasifikacinė lentelė.
• Kanoninių funkcijų svarba. • Ar galima atskirti lietuvį nuo latvio ir esto
pagal testų
• Kintamųjų įtaka, kanoninėms
funkcijoms. • Jūra (test1),
• Grafikas. • Sportas (test2),
• Vilkso kriterijus ‘įtartiniems’ X-ams rasti. • Kaimynai (test3)
• (Prognozavimas). rezultatus?
71
Duomenys Analyze -> Classify -> Discriminant
kintamieji
varnos
Tada čia
72
SPSS SPSS
a a
Classification Results teisinga prognozė Classification Results
estai
Function 2
-2
latviai
f1 tenka 99.6 % paaiškinamos dispersijos, f2 0.4 %
-3 lietuviai
-8 -6 -4 -2 0 2 4 6 8
SPSS SPSS
Structure Matrix Vilkso p-reikšmės
Function
1 2 Tests of Equality of Group Means
TEST1 .854* .498
TEST2 -.136 .987 * Wilks'
TEST3 .254 .514 *
Lambda F df1 df2 Sig.
TEST1 .039 406.803 2 33 .000
Pooled within-groups correlations between discriminating
variables and standardized canonical discriminant functions TEST2 .572 12.364 2 33 .000
Variables ordered by absolute size of correlation within function. TEST3 .311 36.491 2 33 .000
*. Largest absolute correlation between each variable and
any discriminant function
73
SPSS (prognozavimas) SPSS (prognozavimas)
Kintamieji
Classification Function Coefficients Classification Function Coefficients
SALIS SALIS
1 lietuviai 2 latviai 3 estai 1 lietuviai 2 latviai 3 estai
TEST1 -1.234 .461 .163 TEST1 -1.234 .461 .163
TEST2 7.881 6.221 6.221 TEST2 7.881 6.221 6.221
TEST3 1.101 .685 .780 TEST3 1.101 .685 .780
(Constant) -351.724 -301.126 -278.343 (Constant) -351.724 -301.126 -278.343
Fisher's linear discriminant functions Fisher's linear discriminant functions
Cluster Analysis
Klasteris - panašių objektų
grupė.
74
PAVYZDŽIAI Krepšinio komandų klasterizavimo
rezultato pavyzdys
• pagal testų rezultatus grupuojame
tiriamuosius;
• I klasteris: Žalgiris, L.Rytas
• pagal sesijos rezultatus
• II klasteris: Šiauliai, Prienai
sugrupuojame II kurso psichologus;
• III klasteris: Sakalai, Neptūnas
• pagal socio-ekonominius parametrus
norime suskirstyti valstybes į grupes;
• pagal nuobodumo laipsnį
grupuojame pažįstamus.
respondentų
sąrašas
po to čia
klasterių
skaičius
© V.Čekanavičius, G.Murauskas 317 © V.Čekanavičius, G.Murauskas 318
75
SPSS SPSS informacija apie
pradiniai centrai pradinius klasterių
centrus
Cluster
1 2
klasterizavimo IQ 97.00 95.00
rezultatai
PAZYMYS 10.00 5.00
SPSS
76
Faktorinė analizė - toks modelis, kai Faktorinė analizė
vienas tiesiogiai nestebimas
kintamasis (latentinis faktorius) matematika
įtakoja keletą stebimų intervalinių
kintamųjų. stebimi
gabumai kintamieji
fizika
Dažniausiai būna keli faktoriai.
Nemaišyti su dispersine analize latentinis
faktorius chemija
ANOVA
© V. Čekanavičius, G. Murauskas 325 © V. Čekanavičius, G. Murauskas 326
PAVYZDŽIAI PASTABA
• tiriame, kas gali vienyti politikus (gal • faktorinė analizė geriau tinka vieno
pažiūrų kairumas, gal autoritetas) reiškinio skirtingų aspektų analizei; nei
• ką atpindi pažymiai (gabumus • kelių visiškai skirtingų reiškinių
apskritai, ar gabumus humanitariniams grupavimui;
bei tiksliesiems mokslams; • jei turime testą skirtą gabumams ir
• kas vienija respondentų požiūrį į fiziniam parametrams matuoti-
skirtingus muzikinius stilius; • geriau taikyti dvi faktorines analizes,
• kokios klausimų grupės išsiskiria kiekvienam pustesčiui.
klausimyne.
77
Faktorinės analizės prielaidos
Faktorinės analizės etapai
• visi X-ai normalūs;
• visi F-ai nekoreliuoti ir turi • Patikrinimas ar tinka duomenys.
vienetines dispersijas; • Faktorių išskyrimas.
• paklaidos ej nekoreliuotos; • Faktorių sukimas ir
• F-ai ir paklaidos nekoreliuoja. interpretavimas.
• Faktorių reikšmių skaičiavimas.
Faktorių nustatymas
Faktorių interpretavimas
• Faktorius paaiškina tuos kintamuosius,
kuriems jo svoris didelis. • sugalvoti faktoriui pavadinimą -
• Vertinimas ‘iš akies’: svoris didelis, jei tyrėjo reikalas.
absoliutiniu didumu >0.4. • tai priklauso nuo tyrėjo išsilavinimo.
• Gali tą patį kintamąjį paaiškinti keli • tą patį faktorių vienas įvardins, kaip
faktoriai. percepcinę organizaciją, o kitas, kaip
• Tada kintamąjį priskiriame tam, kuris objekto-visumos suvokimą.
geriau tinka pagal prasmę. • teisus tas, kuris sugeba įtikinti kitus.
78
Pastaba Faktorių sukimas
SPSS
Pavyzdys Štai čia!
79
SPSS
kintamieji SPSS po to čia
KMO
SPSS SPSS
po to čia
SPSS SPSS
Varimax
po to čia
80
SPSS SPSS
Keičiame
varna
į 0.4
po to čia
Adequacy. .851 4
5
.914
.763
7.033
5.867
62.752
68.619
6 .672 5.166 73.784
7 .605 4.657 78.442
Bartlett's Test of Approx. Chi-Square 4360.774 8 .563 4.328 82.770
9
Sphericity df 78 10
.517
.465
3.974
3.576
86.744
90.320
paaiškinama
11 .450 3.460 93.780 dispersija
Sig. .000 12 .438 3.366 97.146 tikrinės
13 .371 2.854 100.000 reikšmės
Extraction Method: Principal Component Analysis.
Duomenims FA labai gerai tinka.
© V. Čekanavičius, G. Murauskas 351 © V. Čekanavičius, G. Murauskas 352
81
KĄ DARO?
V.Čekanavičius, G.Murauskas 2
PAVYZDYS Idėja:
• Norime išsiaiškinti, kaip matematikos testo
mokykla 3 lygmuo
rezultatus veikia socialinė-ekonominė aplinka
ir klasė.
• Duomenys turi hierarchinę struktūrą, nes
klasės charakteristikos daro įtaką visiems tos 1 klasė 2 klasė 2 lygmuo
klasės mokiniams.
1 lygmuo
mokiniai
82
Besąlyginis HLM modelis Besąlyginis HLM modelis
• HLM iliustracijai pasirinktas duomenų poaibis –
kaimo ir Vilniaus miesto mokyklų 8 klasės moksleivių
• Besąlyginis (nulinis) modelis svarbus tuo, kad tyrimo rezultatai.
kiti hierarchiniai modeliai su juo lyginami.
• Besąlyginio modelio analizė padeda atsakyti į • Turime 559 mokinio iš 27 mokyklų matematikos
klausimą ar apskritai galima kalbėti apie testo rezultatus ir įvairius mokyklą bei mokinį
apibūdinančius duomenis.
hierarchinių modelių tinkamumą.
• Besąlyginį HLM modelį sudaro lygtys abiems –
mokinio ir mokyklos – lygmenims.
Mokinio
• Mokyklos rezultatas
rezultatas = mokyklos
= visų mokyklų vidurkis+
vidurkis+šios mokyklos
įtaka. individualūs skirtumai nuo vidurkio.
• Analogiškai aprašome mokyklos lygmenį:
83
Besąlyginis HLM modelis Besąlyginio modelio tyrimas su SPSS
• - fiksuoto poveikio parametras, • Duomenys turi tradicinę struktūrą – vienam
mokiniui skiriama viena eilutė.
čia
mokyklos
kodas
perkeliame
tada
čia
84
Besąlyginio modelio tyrimas su SPSS Besąlyginio modelio tyrimas su SPSS
keičiame į
Unstructured
Tada,
čia
pažymime
perkeliame
varnos
OK
85
Besąlyginio modelio tyrimas su SPSS Besąlyginio modelio tyrimas su SPSS
Pateikiamas parametro įvertis ˆ 499,47
• Primename, kad - - tai bendras visų mokyklų
• Gauti dispersijų įverčiai yra dideli: • Nagrinėjant besąlyginį modelį patartina suskaičiuoti
tarpklasinės koreliacijos koeficientą ICC (Intraclass
• ˆ 2356,11 ir ˆ 2
00 5117,19 . correlation coefficient), kuris parodo, kaip stipriai
skiriasi grupių (mokyklų) rezultatai, lyginant su
rezultatais grupėse.
Taigi, modelis duomenims tinka blogai.
ˆ00
ICC
ˆ00 ˆ
• Kuo ICC didesnis, tuo labiau įtikėtina, kad reikia
atsižvelgti į hierarchinę duomenų struktūrą.
86
Besąlyginio modelio tyrimas su SPSS Besąlyginio modelio tyrimas su SPSS
87
HLM modelis su antrojo lygmens HLM modelis su antrojo lygmens
intervaliniu kintamuoju intervaliniu kintamuoju
• Mokinio lygmens lygtis gana akivaizdi: • Antrojo lygmens kintamieji į modelį įtraukiami,
MAT CSES e.
tariant, kad atitinkami
atsitiktiniai.
koeficientai yra
• Laikomasi tokio principo:
• Čia e žymi atsitiktinę paklaidą, kuri yra normaliai • Kintamieji, kurie veikia visus mokinius vienodai,
pasiskirsčiusi su nuliniu vidurkiu ir nežinoma įtraukiami į lygtį, aprašančią laisvą narį 0 .
dispersija 2 . Ši dispersija atspindi skirtumus tarp • Kintamieji, kurie turi sąveiką su CSES, įtraukiami į
mokinių, atsiradusius ne dėl mokyklų įtakos. lygtį, aprašančią koeficientą .
1
88
HLM modelis su antrojo lygmens
Modelio tyrimas su SPSS
intervaliniu kintamuoju
• Kintamieji prie vadinami fiksuoto poveikio Atidaromas Mixed Models langas.
kintamaisiais, o kintamieji prie u – atsitiktinio
poveikio kintamaisiais.
• Fiksuoto poveikio kintamieji: CSES ir MSES.
• Atsitiktinio – kintamasis CSES. čia
mokyklos
kodas
visi kiti
intervaliniai
tada
čia
varna
89
Modelio tyrimas su SPSS Modelio tyrimas su SPSS
Keičiam į varna
Ustructured
po to
keliam atsitiktinio čia
poveikio kintamąjį
perkeliam
varnos
OK
90
Modelio tyrimas su SPSS Modelio tyrimas su SPSS
Visi pastovaus poveikio kintamieji statistiškai • Gauti atsitiktinių parametrų įverčiai :
reikšmingi. ˆ 175,94
ˆ00 559,48 ˆ01 0,371 ˆ11 9,19
ˆ1 16,56 ˆ1 8,04
ˆ 4290,92
91
Modelio tyrimas su SPSS Modelio tyrimas su SPSS
Jei norime daryti prognozes, tai tiesiog įstatome Įstatę konkrečias kintmųjų CSES ir MSES
fiksuotų parametrų įverčius į jungtinę lygtį: reikšmes, gautume testo rezultato prognozę
MAT ˆ ˆ01MSES ˆCSES. konkrečiam mokiniui.
Be to, ši regresinė lygtis leidžia įvertinti mokyklos
Nagrinėtiems duomenims gauname: įtaką. Iš tikro, kiekvienas papildomas MSES
balas padidina testo rezultatą 16,56 taško.
MAT 175,94 16,56MSES 8,04CSES. MAT 175,94 16,56MSES 8,04CSES.
92
Modelio tyrimas su SPSS Modelio tyrimas su SPSS
čia
tada
čia
visi kiti
intervaliniai varna
keliam atsitiktinio
poveikio kintamąjį
perkeliam
93
Modelio tyrimas su SPSS Modelio tyrimas su SPSS
varnos
po to
čia
94
Modelio tyrimas su SPSS Svarbi problema
• Matome, kad reikėtų pabandyti iš modelio • Jei I lygmenyje įtrauksime labai stipriai su rezultatu
pašalinti kintamųjų sąveiką VKxCSES . Galbūt koreliuojantį kintamąjį, tai paaiškės, kad joks HLM
modelis netinka.
ir atsisakyti konstantos .
• Pvz., jei įtrauksime fizikos testo rezultatą FIZ:
• Išsamesnė pavyzdžio analizė pateikta knygos
skyrelyje HLM modelių tyrimas SPSS MAT FIZ e.
programa.
• Paaiškės, kad geriau mokantys fiziką, geriau ir
matematiką išmano. Ir kas iš to? Norint pagerinti
matematikos žinias, reikia sustiprinti fizikos mokymą?
Kažin, kažin.
V.Čekanavičius, G.Murauskas 79 V.Čekanavičius, G.Murauskas 80
95