SPSS Konspektai 2015

Struktūra
SPSS sudaro trys blokai (langai):

1. Duomenų langas (data). Jame galima
SPSS - 1 matyti:
a) duomenis;
b) kintamųjų aprašymą.
Duomenų vedimas, aprašomoji 2. Rezultatų langas (output).
statistika, duomenų atranka,
3. Sintaksės langas (syntax).
perkodavimas
© V.Čekanavičius, G.Murauskas 2
Struktūra Duomenų langas

SPSS Rezultatų langas (output) gaunamas
atlikus skaičiavimus. Rezultatus galima
perkelti į Word arba Powerpoint failus.
SPSS Sintaksės langas (syntax)
naudojamas, kai rašoma programa.
Dažniausiai sintaksinės programos ikonėlės
neprireikia.
tipiškas vaizdas paleidus SPSS programą – tuščias duomenų langas.

© V.Čekanavičius, G.Murauskas 3 © V.Čekanavičius, G.Murauskas 4
Failo atidarymas Failo atidarymas

čia
čia
Failas atidaromas – iš bendrojo sąrašo...

Failas atidaromas –©iš neseniai naudotų failų sąrašo 6
V.Čekanavičius, G.Murauskas
1
Tuščio duomenų lauko gavimas Matome duomenis, jei
čia
čia
kairiajame kampe dega 'data view' ir....
Tuščio naujo failo atidarymas

Matome duomenis, jei Duomenų struktūra

SPSS ideologija:
1. Vienam respondentui viena eilutė
(case).
2. Kintamieji (klausimai) - stulpeliai
čia
(variables).
....ikonėlė 'atspausta'
Duomenų struktūra Kintamųjų charakteristikos

kintamųjų
vardai
1. Vardas (name).
2. Tipas (type).
3. Kintamojo 'etiketė' (variable label).
4. Praleistų reikšmių kodai (missing value).
5. Kintamojo reikšmių 'teiketės' (value label).
duomenys
2
Kintamojo vardas (name) Kintamojo tipai (type)
1. Prasideda raide.
1. Simbolinis (string) -pavardėms ir pan. Turi
2. Neturi tarpų. tiktai ilgį;
3. K1; K1.1; Lmnsvs - gerai; 2. Skaitinis (numeric) – skaičiams, bei
4. Ali Baba, 1grupė – blogai. kodams. Standartas (pagal nutylėjimą) 8
5. Kintamojo vardas – stulpelio viršuje. pozicijos, iš jų 2 po kablelio.Pvz. 313,72.
3. Kiti tipai – naudojami retai.
Kintamojo aprašas (etiketė) Kintamojo praleistos reikšmės

(variable label) (missing values)
1. Tai tekstinis komentaras, išsamiau 1. Tai neatsakytų klausimų kodai.
aprašantis kintamąjį. 2. Pvz. kai respondentas nežino atsakymo
2. Pvz. kintamojo vardas – K1, o aprašas vedame kodą 0.
(label) –'gimimo vieta'. 3. Jei 0 bus aprašytas, kaip 'missing value',
3. Statistinei analizei – nebūtinas. tai SPSS programa traktuos jį taip, kaip ir
4. Naudojamas tik, kad būtų patogiau dirbti. tuščią langelį.
Kintamojo reikšmių aprašai Visą informaciją apie kintamuosius

(etiketės) - value labels galime rasti kintamųjų sąraše:
1. Tai tekstiniai komentarai išsamiau

aprašantys kintamojo reikšmių kodus.
2. Pvz. kintamajame (stulpelyje) naudosime
tik kodus 1 arba 2, o 'value labels'
paaiškins, kad 1- vyr., o 2 – mot.
3. Statistinei analizei – nebūtinas. kintamųjų
4. Naudojamas tik tik, kad būtų patogiau sąrašas
dirbti. © V.Čekanavičius, G.Murauskas 17 © V.Čekanavičius, G.Murauskas 18
3
Kintamųjų sąrašas Kintamųjų sąrašas
kintamojo
vardas
praleistos
reikšmės
kintamojo
aprašas tipas- skaitinis
(F-raidė)
kai kurių
reikšmių
paaiškinimas
19 © V.Čekanavičius, G.Murauskas 20
Kintamųjų sąrašas Duomenų vedimas

1. Aprašome kintamuosius ('variable view'
lange).
2. Vedame duomenis ( 'data view' lange).
galimybė pažiūrėti
į duomenis
Kintamųjų aprašymas Kintamųjų aprašymas

'variable view' lange 'variable view' lange
reikšmė
vardas tipas variable čia 'value

label label'
'etiketė'
po to čia
4
Duomenų vedimas Duomenų vedimas
'data view' lange
Praktiniai patarimai:
1. Duomenys vedami klaviatūra.
2. Pelė naudojama saikingai.
naudojame 3. Vedant duomenis eilute - naudoti 'tab'
klaviatūrą klavišą.
4. Vedant duomenis stulpeliu – naudoti
'enter' klavišą.
Aprašomoji statistika Dažnių lentelė su SPSS

Susipažinsime su:
1. Dažnių lentele. • Suskaičiuosime, kiek procentų tirtų
amerikiečių turi tris vaikus.
2. Vidurkiu.
• naudosime failą 'GSS93subset' ir
3. Dispersija.
kintamąjį
4. Standartiniu nuokrypiu.
• 'childs'
Pastaba. Yra ir kitų charakteristikų.
Dažnių lentelė su SPSS Dažnių lentelė su SPSS
čia
perkėlimui
spaudžiam
čia
varna tupi © V.Čekanavičius, G.Murauskas 30
5
Dažnių lentelė su SPSS Dispersija
childs Number of Children
Frequency Percent Valid Percent

Cumulative
Percent
1) Atspindi reikšmių išsibarstymą apie vidurkį.
Valid 0
1
414 27,6 27,7 27,7 2) kuo didesnė – tuo didesni skirtumai tarp reikšmių.
242 16,1 16,2 43,9
2 398 26,5 26,6 70,5 3) pvz. iš dviejų mokymo programų, užtikrinančių
3
4
226
115
15,1
7,7
15,1
7,7
85,6
93,3
vienodus vidutinius pasiekimus, geresnė ta, kurios
5 58 3,9 3,9 97,2 mažesnė dispersija.
6 14 ,9 ,9 98,1
7 7 ,5 ,5 98,6
8 Eight or More 21 1,4 1,4 100,0
Total 1495 99,7 100,0
Missing 9 NA 5 ,3 (x 1  x ) 2  (x  x ) 2  ... (x  x)2
Total 1500 100,0 s2  2 n
n -1
'percent' – jei su praleistom reikšmėm, 'valid percent'- jei be
Standartinis nuokrypis Vidurkis ir Std su SPSS
• Failas: GSS93 subset
s dispersija
• Kintamasis agewed (amžius pirmą
kartą tuokiantis)
• Rasime šio kintamojo vidurkį bei
standartinį nuokrypį.
Pastaba: parodysime tik vieną iš kelių
galimų būdų.
Vidurkis ir Std su SPSS Vidurkis ir Std su SPSS
perkeliame
čia
6
Vidurkis ir Std su SPSS Duomenų atranka
(select cases)
Descriptive Statistics
N Minimum Maximum Mean Std. Deviation

• Paliekame tik dalį duomenų tolesnei
agewed Age When
First Married 1202 13 58 22,79 5,033 analizei;
Valid N (listwise) 1202
• Pvz. norime sužinoti vidutinį vyrų amžių
pirmą kartą tuokiantis.
vidutinis amžius 22,79 m • 'Select cases' statistinės analizės
neatlieka!
vidurkis std
Duomenų atranka SPSS Duomenų atranka SPSS

(select cases) perkeliame
tašką
po to čia
čia
nekišame
nagų
Duomenų atranka SPSS 'select cases' sintaksė

čia rašomos sąlygos
• kintamųjų vardai sujungiami aritmetinėmis
ir (arba) loginėmis operacijomis.
nelygu • Pvz., jei norime pasilikti tik vyrų duomenis,
(lytis užkoduota kintamuoju sex, vyrų
kodas 1), tai rašome
• sex=1
ir
arba
select cases if = atrinkti eilutes, jei ....

7
'išbraukta'
Tada ‘Continue’ ir ‘OK’

Eilutės nedingsta, tik pažymimos, kaip išbrauktos.
Tolesnėje analizėje jos nebenaudojamos.

• Norint 'atžymėti' visas eilutes, reikia
• Pvz. dabar suskaičiavę 'agewed' vidurkį,
gautume
N MinimumMaximum Mean Std. Deviation

agewed Age When
First Married 492 16 50 24,16 4,867
Valid N (listwise) 492 tašką prie
'all cases'
select cases - pastabos select cases - pastabos

• sąlyga taikoma kiekvienam respondentui.
• Tačiau
• pvz. norime atrinkti baltus (race=1) vyrus.
• jei norime, kad liktų baltieji bei negrai: tai
• rašome: (sex=1) & (race=1).
• rašome: (race=1) | (race=2).
• jaunesnis, nei 50 metų: age <50.
• jei parašysime (race=1)&(race=2),
• tarp 20 ir 50 m: (age>=20) & (age=<50). kompiuteris ieškos žmonių, kurie kartu ir
• baltieji vyrai, jaunesni nei 50 m, arba balti ir juodi (zebrų).
juodos moterys, vyresnės, nei 30m: • Beje, kintamųjų vardus geriau kopijuoti, o
• (sex=1& race=1 & age<50)|(sex=2 & ne rinkti patiems (mažiau klaidų).
race=2 & age>30).
8
select cases - pastabos select cases – simboliniai kint.
• BLOGAI • GERAI
• simbolinių kintamųjų reikšmės rašomos
• race = 1|3 • race =1| race =3
kabutėse:
• 30<age<40 • age>30 & age <40
• 30 < age • age >30
• gender='M'.
• age =15 / age =20 • age=15 | age=20 • simbolis turi būti TIKSLIAI nukopijuotas.
• [race=1] & [age =50] • (race=1) &(age=50) • gender='m' blogai.
• (race=1) (age =50) • (race=1) &(age=50) • gender=' M' blogai (tarpas po kabutės).
• (age >50) | (age <60) • tai visi respondentai-
beprasmė sąlyga.
Ką gali komanda Compute:
1. Sukurti kintamojo (stulpelio) kopiją.

2. Pakeisti kintamąjį (stulpelį).
COMPUTE 3. Sukurti naują kintamąjį (stulpelį).
4. Sukurti 0 – 1 stulpelį, atsižvelgiant į
sąlygas.
5. Sukurti sudėtingesnių kodų stulpelį,
atsižvelgiant į sąlygas.
Visada transformuoja stulpelius.
Compute naujo
stulp.
Compute
vardas
kas jame bus
čia
9
Compute: naujas kintamasis Compute: 0 - 1 kintamasis
loginė
išraiška
dviejų kint.
vidurkis
naujas kintamasis zzz=1, jei age>30 ir zzz=0, jei age =<30.
Compute: 0 - 1 kintamasis Compute: sudėtingesni kodai
paspaudžiam
ir užrašom
sąlygą
naujas kintamasis
ww=1, jei age>30 .
naujas kintamasis zzz=1, jei age>30 ir zzz=0, jei age =<30.
Automatic recode
1. Simbolinį (string) –kintamąjį

AUTOMATIC RECODE paverčia skaitiniu;
2. Senosios reikšmės virsta naujojo
kintamojo 'value labels'.
10
Automatic recode Automatic recode simbolinis
kint.
čia
naujo
kint.
vardas
po to čia
Automatic recode Automatic recode

atsirado
skaitinis
kintamasis
senos
reikšmės
virto
'etiketėmis'
Recode
1. Iš skaitinio kintamojo gauna naują skaitinį

su kitokiais kodais.
RECODE 2. Gali ir iš simbolinio padaryti skaitinį,
tačiau sudėtingiau, nei automatic recode.
3. Pvz. naujame kintamajame 'islam'
musulmoniškas valstybes pažymėsime
1, budistines 2, o likusias 3.
11
Recode Recode
1. Kintamajame 'tikyba': musulmonai – 6,
budistai -2. Įsidėmime.
čia
mes visada rinksimės ‘into Different Variables'
Recode Recode
vardas atsirado
senas
kintamasis
naujojo kint.
vardas po to čia
po to čia
Recode naujas Recode

kodas
...bus 3
visos kitos
reikšmės...
senas
kodas budistus,
po to čia
į 2
12
Recode Recode: sudėtingesnis pvz.
Atsirado naujas stulpelis: Pvz. Sukursime naują kintamąjį amzkat,
kuriame pagal amžių respondentus
suskirstysime taip:
• 1 , jei amžius <30;
• 2 , jei amžius 31 – 50;
• 3, jei virš 50.
Recode: sudėtingesnis pvz. Recode: sudėtingesnis pvz.

nuo
Missing
mažiausio
values
iki...
Tam, kad koduotos praleistos reikšmės ir

nepamirštam
naujo vardo
liktų praleistomis reikšmėmis.
nuo nuo ...

mažiausio ....iki
iki...
13
nuo ...
iki
didžiausio
taip:
Stjudento kriterijus vienai Statistinė hipotezė:

imčiai
H 0 : μ  a

H 1 : μ  a
Hipotezė apie vidurkio lygybę skaičiui
(duomenyse vienas intervalinis stulpelis,
skaičius a duotas sąlygoje.)
Statistinė išvada SPSS

su p - reikšme
T-testas vienai imčiai, kai
H0 atmetame (vidurkis stat. reikšmingai
skiriasi nuo a ), jei
p  0.05 Edukologas nori sužinoti ar 20
H0 neatmetame (vidurkis stat. reikšm. studentų SAT skiriasi nuo 1250.
nesiskiria nuo a), jei
p  0.05
Čia - reikšmingumo lygmuo
14
SPSS Duomenys
SPSS
Štai čia!
SPSS SPSS
kintamasis
imties vidurkis
One-Sample Statistics
Std. Error
N Mean Std. Deviation Mean
SAT 20 1162,5000 279,97885 62,60517
reikšmė ir std nuokrypis
SPSS reikšmė
Išvados formulavimas
• Pritaikę Stjudento testą gavome, kad
One-Sample Test
imties vidurkis (1162,5) statistiškai
Test Value = 1250
95% Confidence
reikšmingai nesiskiria nuo 1250.
Interval of the
Mean Difference
t df Sig. (2-tailed) Difference Lower Upper • Skirtumas pakankamai didelis. Galbūt jis
SAT -1,398 19 ,178 -87,50000 -218,5341 43,5341
statistiškai nereikšmingas dėl mažo
stebėjimų skaičiaus (jų buvo tik 20).
kadangi p >=0.05,
p-reikšmė tai st.reikšm. nesiskiria
15
Kada taikomas
Stjudento t kriterijus,  Dvi imtys, duomenys gaunami poromis

(tiriam vyrą-žmoną, motiną – dukterį,
taikomas priklausomoms ekspertai vertina dvi gražuoles).
imtims (porinis t testas)  Dažnai duomenys gaunami, dukart
išmatavus tą patį respondentą.
 Duomenyse du stulpeliai. Abiejuose
Dviejų vidurkių lygybė intervaliniai kintamieji. Jų vidurkiai ir
lyginami.
Statistinė hipotezė: Statistinės išvados

su p - reikšme
H0: x = y H0 atmetame (vidurkiai stat. reikšmingai

skiriasi) , jei
p<
H1: x = y
H0 neatmetame (vidurkiai stat. reikšm.
nesiskiria), jei
p >=
(hipotezė formuluojama populiacijoms) Čia - reikšmingumo lygmuo.
Pavyzdys SPSS
 ar pirmadieniais ir penktadieniais vienodai Stjudento t kriterijus,
ilgai kalbama telefonu? taikomas priklausomoms imtims
 abi dienas (p, pt) slapta stebėti tie patys
(pvz. apie telefono pokalbius
vienos firmos darbuotojai.
pirmadienį ir penktadienį)
 duomenys: (20,32), (40,45), (15,11),
 duomenys greta
(120,110), (34,39), (27,24), (33,35),
(40,36), (20,19), (10,15) min. 
16
SPSS SPSS
Štai čia!
duomenys © V.Čekanavičius, G.Murauskas 97 © V.Čekanavičius, G.Murauskas 98
SPSS SPSS
imčių vidurkiai
Paired Samples Statistics Paired Samples Test
Std. Error Paired Differences

Mean N Std. DeviationMean 95% Confidence
Interval of the
Pair 1 PIRMAD 35.9000 10 31.28880 9.89439 Std. Error Difference
Sig.
(2-taile
PENKTAD 36.6000 10 28.04441 8.86842 Pair 1 PIRMAD -
Mean Std. Deviation Mean Lower Upper t df d)
-.7000 6.32543 2.00028 -5.2249 3.8249 -.350 9 .734
PENKTAD
p-reikšmė
ir std nuokrypiai vidurkiams
SPSS
Paired Samples Test • Pritaikę Stjudento testą gavome, kad nėra
statistiškai reikšmingo skirtumo tarp to,
Paired Differences
95% Confidence
kiek vidutiniškai laiko prakalbama
Interval of the
Difference
Sig. pirmadieniais ir penktadieniais.
Std. Error (2-taile
Mean Std. Deviation Mean Lower Upper t df d)
Pair 1 PIRMAD -
PENKTAD -.7000 6.32543 2.00028 -5.2249 3.8249 -.350 9 .734
kadangi p>0.05, vidurkiai statistiškai reikšmingai nesiskiria
17
Pastabos
Stjudento t kriterijus, • Lyginame dviejų nepriklausomų
grupių vidurkius,
taikomas nepriklausomoms
• pvz., dviejų grupių vidutinius pažymius.
imtims
• Duomenyse visada DU skirtingo tipo
stulpeliai:
(dviejų vidurkių lygybė)  viename – intervalinis rezultatas
(pvz.pažymys),
 kitame - grupės kodas (pvz., 1 arba 2)
Statistinė hipotezė: Statistinės išvados,

kai reikšmingumo lygmuo 0,05
H0: x = y H0 atmetame (vidurkiai stat. reikšmingai

skiriasi) , jei
p< 5
H1: x = y
H0 neatmetame (vidurkiai stat. reikšm.
nesiskiria), jei
p >= 5
(hipotezė formuluojama populiacijoms)
SPSS
SPSS
Stjudento t kriterijus,
taikomas nepriklausomoms Štai čia!
imtims
(pvz. apie egzamino pažymio
viešinimą)
 magistrai: užkoduoti 1
 fukseliai: užkoduoti 2
 duomenys
18
SPSS grupių
intervalinis
kodai SPSS
grupė
po to čia
Po to ‘Continue’ ir ‘OK’.
SPSS SPSS
Independent Samples Test
imčių vidurkiai
Levene's Test
for Equality of
Group Statistics Variances t-test for Equality of Means
95% Confidence
Std. Error Std.
Interval of the
Sig. Mean Error
GRUPE N Mean Std. Deviation Mean (2-taile Differe Differe Difference
BALAS 1.00 10 7.5000 1.58114 .50000 F Sig. t df d) nce nce Lower Upper
BALAS Equal variances
.058 .813 2.909 18 .009 2.1000 .72188 .58339 3.61661
2.00 10 5.4000 1.64655 .52068 assumed
Equal variances not
assumed 2.909 17.971 .009 2.1000 .72188 .58321 3.61679
ir std nuokrypiai dispresijas jei p >=0.05, tai lygios

laikome lygiomis
SPSS
Independent Samples Test
Levene's Test
for Equality of • (kadangi p= 0.009<0.05, tai vidurkiai
p-reikšmė Variances t-test for Equality of Means
skiriasi statistiškai reikšmingai)
vidurkiams 95% Confidence
Std.
Sig. Mean Error Interval of the
Difference
F Sig. t df
(2-taile Differe Differe
d) nce nce Lower Upper • Pritaikę Stjudento testą gavome, kad
BALAS Equal variances
assumed
.058 .813 2.909 18 .009 2.1000 .72188 .58339 3.61661 magistrai pažymių viešinimą vertina
Equal variances not
2.909 17.971 .009 2.1000 .72188 .58321 3.61679 statistiškai reikšmingai palankiau
assumed
(vidutiniškai 7,5 balo) nei pirmakursiai
būtų čia, jei (vidutiniškai 5,4 balo), p=0,009.
dispersijos nelygios
19
Statistinė hipotezė
Hipotezė apie koreliacijos

koeficiento lygybę nuliui H 0 : nekoreliuoja

H1 : koreliuoja
Ar du intervaliniai kintamieji koreliuoja
KINTAMIEJI DU IR ABUDU INTERVALINIAI
Statistinė išvada Pastabos

su p - reikšme  kuo koreliacijos koeficientas toliau nuo nulio
(absoliutiniu didumu didesnis), tuo koreliacija
H0 atmetame (kintamieji stat. reikšmingai stipresnė.
koreliuoja, jei
p  0.05 

0,2 (-0,2) – silpna koreliacija; 0,8 (-0,8) stipri.
Koreliacijos koeficiento ženklas parodo kaip
H0 neatmetame (kintamieji stat. reikšm. koreliuoja:
nekoreliuoja), jei teigiamas- vienam kintamajam didėjant, kitas
p  0.05

irgi didėja.
 neigiamas – vienam didėjant, kitas mažėja.
 Koreliacija dar nereiškia priežastingumo!
SPSS
SPSS
 Koreliacija
 Turime vadybininkų patirtį ir jų Štai čia!
pradinį atlyginimą.
 Ar koreliuoja?

20
kintamieji SPSS SPSS
raštingiems
koreliacija
Correlations
Previous
Beginning Experience
Salary (months)
Beginning Salary Pearson Correlation 1 ,479**
Sig. (2-tailed) . ,000
N 84 84
Previous Experience Pearson Correlation ,479** 1
(months) Sig. (2-tailed) ,000 .
N 84 84
**. Correlation is significant at the 0.01 level (2-tailed).
varna
SPSS SPSS
Correlations Correlations
Previous Previous
Beginning Experience Beginning Experience
Salary (months) Salary (months)
Beginning Salary Pearson Correlation 1 ,479** Beginning Salary Pearson Correlation 1 ,479**
Sig. (2-tailed) . ,000 Sig. (2-tailed) . ,000
N 84 84 N 84 84
Previous Experience Pearson Correlation ,479** 1 Previous Experience Pearson Correlation ,479** 1
(months) Sig. (2-tailed) p-reikšmė ,000 . (months) Sig. (2-tailed) ,000 .
N 84 84 N 84 84
**. Correlation is significant at the 0.01 level (2-tailed). **. Correlation is significant at the 0.01 level (2-tailed).
žmonių
skaičius
raštingiems
SPSS
Correlations
Previous
Beginning Experience
• Darbuotojo patirtis (išdirbti mėnesiai)
Beginning Salary Pearson Correlation
Salary (months) statistiškai reikšmingai koreliuoja su
1 ,479**
Sig. (2-tailed) . ,000 pradiniu atlyginimu, r=0,479; p<0,01.
N 84 84 Labiau patyrę gauna didesnius pradinius
Previous Experience Pearson Correlation ,479** 1
(months) Sig. (2-tailed) ,000 . atlyginimus.
N 84 84
**. Correlation is significant at the 0.01 level (2-tailed).
Stat. reikšm. koreliuoja. Kuo labiau patyrę,

tuo pradinė alga didesnė.
21
Turinys
• Mann Whitney ......................1 p.
SPSS – ranginiai • Wilcoxon ……………………. 3 p.
kriterijai • Spearman …………………... 5 p.
• Kruskal – Wallis ……………. 7 p.
• Friedman ……………………. 9 p.
© V. Čekanavičius, G. Murauskas 2
Mann-Whitney kriterijus
1. Stjudento t kriterijaus
nepriklausomoms imtims analogas;
Mann - Whitney kriterijus 2. bet nelygina vidurkių;
3. lygina skirstinius;
4. kuris kintamasis ‘linkęs būti didesniu’
parodo didesnis vidutinis rangas.
© V. Čekanavičius, G. Murauskas 3 © V. Čekanavičius, G. Murauskas 4
Duomenys Statistinė hipotezė:

1. dvi nepriklausomos imtys, gautos
matuojant intervalinius arba H0 : kintamųjų skirstiniai nesiskiria
ranginius kintamuosius.
H1 : kintamųjų skirstiniai skiriasi.
2. imčių didumai gali skirtis.
3. skirtingų ranginio kintamojo reikšmių
turi būti bent 5.
22
Statistinė išvada
Kriterijaus idėja: su p - reikšme
• Visas lyginamų kintamųjų reikšmes
surašome į vieną variacinę eilutę. H0 atmetame (kintamųjų skirstiniai stat.
• Suranguojame tą eilutę. reikšmingai skiriasi), jei p<α
• Lyginame kiekvienos imties elementų
vidutinius rangus. H0 neatmetame (kintamųjų skirstiniai stat.
reikšm. nesiskiria), jei
• Didesnis rangas- 'kintamasis linkęs
būti didesniu'.
p≥α
Čia α - reikšmingumo lygmuo
SPSS Štai čia!

Pavyzdys
• Ar vyresni, nei 40 m. juodaodžiai ir
baltieji vienodai palankiai vertina
klasikinę muziką?
• ranginių kintamųjų reikšmės: 1-labai
palankiai, 2-palankiai,….,5-labai
nepalankiai.
• Tarkime, kad reikšmingumo lygmuo yra
0,05.
SPSS ką matuojam SPSS

rasių kodai
rasė
varna
23
SPSS SPSS p-reikšmė
vidutiniai
rangai
Test Statisticsa
Ranks CLASSICL
Classical
RACE Racew N Mean Rank Sum of Ranks Music
CLASSICL 1of white
Respondent 674 371.97 250710.00 Mann-Whitney U 23235.000
2 black 75 402.20 30165.00 Wilcoxon W 250710.000
Total 749 Z -1.183
Asymp. Sig. (2-tailed) .237
a. Grouping Variable: RACE Racew of Respondent
baltieji rašė mažesnius balus (t.y. vertino
palankiau, nes tokia kodavimo sistema) skirtumas stat. nereikšmingas
Wilcoxon kriterijus
1. Stjudento t kriterijaus porinėms
(priklausomoms) imtims analogas;
Wilcoxon kriterijus 2. bet nelygina vidurkių;
3. lygina skirstinius;
4. kuris kintamasis ‘linkęs būti didesniu’
parodo didesnis vidutinis kintamųjų
skirtumo rangas.

1. dvi priklausomos imtys, gautos
matuojant intervalinius arba ranginius H0 : kintamųjų skirstiniai nesiskiria
kintamuosius.
H1 : kintamųjų skirstiniai skiriasi.
2. imčių didumai vienodi
3. dažniausiai stebime tuos pat
respondentus dukart;
turi būti bent 5.
24
Kriterijaus idėja: Kriterijaus idėja:
• Suskaičiuojame reikšmių • (12,13), (20,30), (5,3), (4,2), (15,17),
skirtumus kiekvienai porai. (25,30).
• Suranguojame skirtumų • Skirtumai: -1, -10, 2, 2, -2, -5.
modulius. • Moduliai:1(-), 2(-), 2(+),2(+),5(-),10(-).
• Rangai: 1(-), 3(-), 3(+), 3(+), 5(-), 6(-).
• Lyginame vidutinius teigiamų ir
neigiamų skirtumų rangus. • Vidutiniai rangai: (+): 3, (-): 3.75
Statistinė išvada
su p - reikšme Pavyzdys
• Ar vyresni, nei 50 m. respondentai
H0 atmetame (kintamųjų skirstiniai stat. vienodai palankiai vertina klasikinę
reikšmingai skiriasi), jei p<α muziką ir džiazą?
H0 neatmetame (kintamųjų skirstiniai stat. palankiai, 2-palankiai,….,5-labai
reikšm. nesiskiria), jei nepalankiai.
p≥α • Tarkime, kad reikšmingumo lygmuo yra
0,05.
Čia a - reikšmingumo lygmuo
SPSS SPSS keliam ABUDU
Štai čia!
varna
25
SPSS skirtumų SPSS p-reikšmė
rangai
Ranks Test Statisticsb
N Mean Rank Sum of Ranks JAZZ Jazz

JAZZ - CLASSIC Negative Ranks 138a 157.43 21725.00 Music -
Positive Ranks 198b 176.22 34891.00 CLASSICL
Ties 161c Classical
Total 497 Music
a. JAZZ Jazz Music < CLASSICL Classical Music
Z -3.782a
Asymp. Sig. (2-tailed) .000
b. JAZZ Jazz Music > CLASSICL Classical Music
a. Based on negative ranks.
c. CLASSICL Classical Music = JAZZ Jazz Music
b. Wilcoxon Signed Ranks Test
didesni skirtumai buvo, kai palankiau

vertino klasiką (jai rašė mažesnius balus). skirstiniai skiriasi stat. reikšmingai
Spearman’o kriterijus
1. Pearson’o koreliacijos analogas.
2. Interpretuojamas visiškai
Spearman koreliacija analogiškai;
3. skaičiuoja Pearson’o koreliaciją tarp
imčių rangų;
4. tai leidžia naudoti ir specialiu atveju,
kai duomenys jau suranguoti.

1. porinė imtis, gauta matuojant
intervalinius arba ranginius H0 : kintamieji nekoreliuoja.
kintamuosius.
H1 : kintamieji koreliuoja.
2. galima naudoti ir imčių rangus.
turi būti bent 5.
26
Statistinė išvada
su p - reikšme Pavyzdys
• Ar vyresni, nei 50 m. respondentai,
H0 atmetame (kintamieji stat. reikšmingai palankiau vertinantys miuziklus,
koreliuoja), jei p<α palankiau vertina ir klasikinę muziką?
H0 neatmetame (kintamieji stat. reikšm. palankiai, 2-palankiai,….,5-labai
nekoreliuoja), jei nepalankiai.
p≥α • Tarkime, kad reikšmingumo lygmuo yra
0,05.
SPSS SPSS kintamieji
Štai čia!
varna
SPSS
Correlations Spearman specialus atvejis
CLASSICL MUSICALS
Classical
Music
Broadway
Musicals
1. Kiekviena iš dviejų mokytojų surikiavo
Spearman's rho CLASSICL Correlation Coefficient 1.000 .399** mokinius pagal gabumus.
Sig. (2-tailed) . .000
N 504 489 2. Pirma: A, B, C, D, E, F, G, H, I,J, K, L.
MUSICAL Correlation Coefficient .399** 1.000
S Sig. (2-tailed) .000 . 3. Antra: B, C, A, D, H,E, F, G, K, I,J, L.
N 489 499
**. Correlation is significant at the .01 level (2-tailed).
4. Ar mokytojų nuomonės koreliuoja?
Stat. reikšmingai koreliuoja. Palankiau vertinantys

miuziklus, palankiau vertins ir klasiką.
27
SPSS
Statistinė hipotezė: •Pirma: A,B,C,D,E,F,
G,H,I,J,K,L
H0 : nuomonės nekoreliuoja. •Antra: B, C, A,D,
H,E, F,G,K,I,J,L.
H1 : nuomonės koreliuoja.
šis stulpelis
nebūtinas
SPSS
Correlations
MOKYT1 MOKYT2
Spearman's rho MOKYT1 Correlation Coefficient 1.000 .916**
Sig. (2-tailed)
N 12
. .000
12 Kruskal - Wallis kriterijus
MOKYT2 Correlation Coefficient .916** 1.000
Sig. (2-tailed) .000 .
N 12 12
**. Correlation is significant at the .01 level (2-tailed).
nuomonės labai stipriai teigiamai koreliuoja
Kruskal-Wallis kriterijus Duomenys

1. Mann-Whitney kriterijaus apibendrinimas 1. keletas nepriklausomų intervalinių
keletui (2 ir daugiau) imčių. arba ranginių imčių.
2. Interpretuojamas visiškai analogiškai; 2. skirtingų ranginio kintamojo reikšmių
3. vidutinis rangas rodo didesnius imčių turi būti bent 5.
balus.
4. nepasako, kurie kintamieji skiriasi.
5. yra ANOVA neparametrinis analogas.
28
Statistinė išvada
Statistinė hipotezė: su p - reikšme
H0 atmetame (kažkurie skirstiniai stat.
H0 : visi skirstiniai nesiskiria reikšmingai skiriasi), jei
H1 : kažkurie skirstiniai skiriasi.
p<α
H0 neatmetame (visi skirstiniai stat.
reikšm. nesiskiria), jei
p≥α
SPSS Štai čia!

Pavyzdys
• Ar tarp prasimokiusių nemažiau 13m.
respondentų visų rasių atstovai
vienodai vertina rap’ą?
nepalankiai.
0,05.
SPSS SPSS kodai

rap
rasė
varna
29
SPSS SPSS p-reikšmė
a,b
Test Statistics
Ranks
RAP Rap
RACE Racew N Mean Rank Music
of Respondent Chi-Square 23.311
RAP Rap Music 1 white 617 372.20
df 2
2 black 65 254.05
Asymp. Sig. .000
3 other 34 309.59
a. Kruskal Wallis Test
Total 716
b. Grouping Variable: RACE Racew of Respondent
palankiausiai (kodavimas!) vertina juodieji. ne visos rasės vienodai vertina rap’ą
Friedman’o kriterijus
1. Wilcoxon kriterijaus apibendrinimas
keletui (2 ir daugiau) imčių.
Friedman kriterijus 2. jei imtys 2, Wilcoxono kriterijus
geriau.
3. interpretacija paprastesnė už
Wilcoxon
4. nepasako, kurie kintamieji skiriasi.
5. yra ‘Repeated measures’
neparametrinis analogas
Rangų interpretacija Duomenys

1. Tarkime respondentas parašė trims 1. keletas imčių, gautų matuojant
aktoriams pažymius: aktoriui A - 10, priklausomus intervalinius arba
aktoriui B - 6, aktoriui C - 8. ranginius kintamuosius.
2. Pažymiai ranguojami. Aktorių gauti 2. skirtingų ranginio kintamojo reikšmių
rangai: aktoriaus A - 3, aktoriaus B -1 turi būti bent 5.
, aktoriaus C - 2. 3. galima kiekvieno respondento
3. vidutiniai rangai atspindi tą patį. atsakymus suranguoti ir inaudoti
tuos rangus.
30
Statistinė išvada
Statistinė hipotezė: su p - reikšme
H0 atmetame (kažkurie skirstiniai stat.
H0 : visų kintamųjų skirstiniai reikšmingai skiriasi), jei
nesiskiria. p<α
H1 : kažkurių kintamųjų skirstiniai H0 neatmetame (visi skirstiniai stat.
skiriasi. reikšm. nesiskiria), jei
p≥α
SPSS
Pavyzdys
• Ar prasimokę daugiau nei 15 m.
respondentai, vienodai palankiai
vertinana miuziklus, klasiką ir Štai čia!
bigbendus?
nepalankiai.
0,05.
SPSS SPSS
kintamieji
Ranks
Mean Rank
CLASSICL Classical Music 1.87
MUSICALS Broadway
2.05
Musicals
BIGBAND Bigband Music 2.08
palankiausiai vertinta (kodavimas!) klasika

varna
31
SPSS p-reikšmė
Friedman spec. atvejis
Test Statisticsa
• Penki ekspertai vertino alų A,B ir C.
N 343 • Pirmas: B, C, A (t.y. geriausias B,…)
Chi-Square 14.286 • Antras: B, C, A
df 2 • Trečias: A arba C, B
Asymp. Sig. .001 • Ketvirtas: A, B,C
a. Friedman Test • Penktas: B, A,C
• Ar visos alaus rūšys vienodai
populiarios?
ne visi stiliai vienodai populiarūs
SPSS rūšys
SPSS
Ranks
Mean Rank
A 2.10
B 1.60
C 2.30
šis stulpelis rangai! populiariausias B alus

nebūtinas
SPSS
Test Statisticsa
N 5
Chi-Square 1.368
df 2
Asymp. Sig. .504
a. Friedman Test
vertinimų skirtumai stat. nereikšmingi
32
SPSS
Chi kvadrato suderinamumo
suderinamumo kriterijus,
kriterijus
 Tikriname, ar klerkų nac. daugumos ir
nac. mažumos atstovų proporcija yra 7:2
• Spėjame proporciją.
• Jeigu nespėjame, tai čia ne tas chi 
kvadratas, kurio norisi (yra dar vienas chi

kvadrato kriterijus)
SPSS SPSS
duomenys
Štai čia!
SPSS kintamasis SPSS
prognozuojama
Spėjami procentai proporcija
ar santykiai
Spėjame, pradėdami nuoG.Murauskas

© V.Čekanavičius, mažiausio minority kodo 131 © V.Čekanavičius, G.Murauskas 132
33
SPSS SPSS
skirtumas reikšmė
Test Statistics
Frequencies minority
Minority
Classification
minority Minority Classification Chi-Squarea ,639 p-reikšmė
df
Category Observed N Expected N Residual 1
Asymp. Sig. ,424
1 0 No 276 282,3 -6,3
a. 0 cells (,0%) have expected frequencies less than
2 1 Yes 87 80,7 6,3 5. The minimum expected cell frequency is 80,7.
Total 363
duomenys
nereti
duomenys stat. reikšm. neprieštarauja
Kiek yra Kiek spėjamam santykiui 7 nac. daug. : 2 nac. maž.
tikėjomės
Išvados formulavimas SPSS

Specialus atvejis
• Pritaikę chi kvadrato kriterijų, gavome, kad
Saldainiai pardavinėjami 4 skirtingose dėžutėse.
duomenys statistiškai reikšmingai
25% dėžučių didelės, 25% vidutinės, 30%
neprieštarauja spėjamam nac. daugumos mažos ir 20% suvenyrinės.
ir nac. mažumos dabuotojų santykiui. Pirkėjai nupirko 50 didelių, 40 vidutinių, 72
mažas ir 19 suvenyrinių dėžučių.
Ar kažkurių dėžučių reikia gaminti daugiau?
SPSS SPSS tada čia
duomenys
tik skaitiniai
34
SPSS SPSS
sveriam
apačioje
dešiniame
kampe atsiras
SPSS SPSS
RUSIS
Observed N Expected N Residual

Spėjami 1.00 50 45.3 4.8
procentai 2.00 40 45.3 -5.3
3.00 72 54.3 17.7
4.00 19 36.2 -17.2
prie svorio Total 181
nagų
nebekišam
SPSS
Test Statistics
RUSIS
Chi-Squarea 15.050
duomenys statistiškai reikšmingai
df 3 prieštarauja spėjamam pakuočių santykiui,
Asymp. Sig. .002 p= 0,002. Žymiai daugiau, nei tikėtasi,
a. 0 cells (.0%) have expected frequencies less than
5. The minimum expected cell frequency is 36.2. nuperkama trečios rūšies pakuočių ir
mažiau ketvirtos rūšies pakuočių.
Išvada: reikia keisti gamybą
35
Porinių dažnių lentelės
• Visi imties respondentai suskirstomi į

grupes pagal du požymius.
Chi kvadrato • Pvz. pagal lytį ir požiūrį į gyvenimą.
homogeniškumo kriterijus • Gyvenimas: žavus (exciting),
• rutina (routine)
• pilkas (dull)
Porinių dažnių lentelės
Pavyzdžiai kriterijus. Požymių

• Ar nusikalstamumo lygis priklauso nuo homogeniškumo tikrinimas
bedarbystės lygio? • vienas požymis stebimas
• Ar tikyba susijusi su požiūriu į abortus keliose populiacijose;
(pritariu-nepritariu)?
• Ar perkamo automobilio spalva
• tikriname, ar visose
priklauso nuo perkančiojo lyties? populiacijose požymis vienodai
• Ar studentės dažniau renkasi magistro pasiskirstęs;
studijas, nei studentai?

 Vienas kategorinis kintamasis
matuotas keliose nepriklausomose H0 : pagal tiriamą požymį
populiacijose.
populiacijos nesiskiria.
 Žinome kiekvienos populiacijos sudėtį
pagal kategorinį kintamąjį. H1 : populiacijos skiriasi.
 Kategorijų gali būti keletas.
36
Statistinė išvada, kai Pavyzdys
reikšmingumo lygmuo 0,05
• Ar vienodą procentą vadybininkų ir
H0 atmetame (populiacijos stat.
klerkų sudaro moterys?
reikšmingai skiriasi), jei
p  0,05 • Tarkime, kad reikšmingumo lygmuo yra
0,05.
H0 neatmetame (populiacijos stat. reikšm.

nesiskiria), jei
p  0,05
SPSS SPSS
tinka ir
simboliniai
duomenys Štai čia!
SPSS SPSS
po to čia
eilutė
stulpelis
varna
37
SPSS SPSS
ir čia
po to čia
ir čia
SPSS SPSS
JOBCAT Employment Category * GENDER Gender Crosstabulation
p-reikšmė
GENDER Gender
Chi-Square Tests
f Female m Male Total
JOBCAT Employment 1 Clerical Count 206 157 363
Category Asymp. Sig. Exact Sig. Exact Sig.
% within JOBCAT
Employment Category
56.7% 43.3% 100.0% Value df (2-sided) (2-sided) (1-sided)
Pearson Chi-Square b
% within GENDER 54.935 1 .000
Gender 95.4% 68.0% 81.2%
a
Continuity Correction
3 Manager Count
53.154 1 .000
10 74 84
% within JOBCAT Likelihood Ratio 61.256 1 .000
11.9% 88.1% 100.0%
Employment Category
Fisher's Exact Test .000 .000
% within GENDER
Gender 4.6% 32.0% 18.8% N of Valid Cases 447
Total Count 216 231 447 a. Computed only for a 2x2 table
% within JOBCAT
48.3% 51.7% 100.0%
Employment Category b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 40.59.
% within GENDER
Gender 100.0% 100.0% 100.0%
p < 0.05, todėl proporcijos sat. reikšmingai skiriasi
Išvados formulavimas SPSS

Specialus atvejis
• grupė vaikų žiūrėjo smurtines TV laidas,
tarp klerkų moterų yra statistiškai
grupė - nesmurtines. Po to buvo stebėtas jų
reikšmingai daugiau (56,7%), nei tarp elgesio agreyvumas.
vadybininkų (11,9 %), p<0,01. • 63 žiūrėjo smurtines ir agresyvūs, 37 smurt. ir
neagr.; 30 nesmurt. ir agresyvūs ir 70
nesmurt. ir neagresyvūs.
• ar TV ir elgesys susiję?
38
SPSS SPSS Pasveriame
pagal ‘kiek’
gali būti ir
simboliniai
skaitiniai
SPSS SPSS
ELGESYS * TV Crosstabulation
TV
nesmurt smurt Total
ELGESYS agres Count 30 63 93
% within ELGESYS 32.3% 67.7% 100.0%
% within TV 30.0% 63.0% 46.5%
neagr Count 70 37 107
% within ELGESYS 65.4% 34.6% 100.0%
% within TV 70.0% 37.0% 53.5%
Total Count 100 100 200
% within ELGESYS 50.0% 50.0% 100.0%
% within TV 100.0% 100.0% 100.0%
nagų Po to čia!
nebekišam!
smurtinę TV žiūrėję agresyvesni
Statistics ir Cells užpildome, kaip
© V.Čekanavičius, anksčiau.
G.Murauskas 165 © V.Čekanavičius, G.Murauskas 166
SPSS
Chi-Square Tests
Asymp. Sig. Exact Sig. Exact Sig.
tarp žiūrėjusių smurtinę TV buvo
Pearson Chi-Square
Value
21.887b
df
1
(2-sided)
.000
(2-sided) (1-sided)
statistiškai reikšmingai daugiau agresyvių
Continuity Correctiona
Likelihood Ratio
20.581
22.314
1
1
.000
.000
vaikų (63%), nei tarp žiūrėjusių nesmurtinę
Fisher's Exact Test
N of Valid Cases
.000 .000 TV (30 %), p<0,01.
200
a. Computed only for a 2x2 table
b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 46.50.
stat. reikšmingai
39
Mc Nemar kriterijus
dažniausiai (bet ne visada):
• taikomas dvireikšmiams kintamiesiems
• gautiems apklausus tuos pačius
Mc Nemar kriterijus respondentus
• prieš poveikį respondentams (terapiją,
reklamą, įkalbinėjimą, filmą ir t.t.)
• ir po poveikio.
• domina, kaip paveikė respondentus
Mc Nemar kriterijus Duomenys

Kitas tipinis variantas: ar vienodos  Vienas dvireikšmis (už-prieš, taip-ne)
proporcijos priklausomiems kategorinis kintamasis matuotas
kategoriniams kintamiesiems. dviejose priklausomose populiacijose
• Duomenys gauti, apklausus tuos pačius  arba vienoje populiacijoje dukart.
respondentus.
• Pvz., ar toks pat procentas respondentų
rūko, kaip ir vartoja alkoholį.
Duomenys
Statistinė hipotezė:
Prieš H0 : poveikio nebuvo (iš ‘už’ į

‘prieš’ nuomonę pakeitė tiek pat,
  kiek iš ‘prieš’ į ‘už’)
Po  a b H1 : poveikis buvo
 c d
40
Statistinė išvada
SPSS
su p - reikšme
• dukart apklausėme tuos pačius rinkėjus, prieš
H0 atmetame (poveikis buvo stat. TV laidą ir po TV laidos.
reikšmingas), jei
p  0.05 • prieš TV už, po TV už 200
• prieš TV už, po TV prieš 30
H0 neatmetame (poveikis stat. • prieš TV prieš, po TV už 60
nereikšmingas), jei
p  0.05 • prieš TV prieš, po TV prieš 100
• ar TV laida paveikė rinkėjus.
Čia 0.05 - reikšmingumo lygmuo
SPSS SPSS pasveriame

kaip ir
atveju
SPSS SPSS kintamieji
čia
Štai čia!
41
SPSS SPSS
pries * po Crosstabulation
Count
varna
po
Ne už Total
pries
Ne 100 60 160
už 30 200 230
Total 130 260 390
SPSS p-reikšmė
ANOVA
Chi-Square Tests
Vienfaktorinė
Value Exact Sig. (2-sided)
McNemar Test
N of Valid Cases 390
.002a
dispersinė analizė
a. Binomial distribution used.
stat. reikšmingai padidėjo rėmėjų ANalysis Of VAriance
© V.Čekanavičius, G.Murauskas 183 © V. Čekanavičius, G. Murauskas 184
PAVYZDŽIAI
ANOVA yra t kriterijaus • ar lietuviai, latviai ir karelai tiek pat

laiko naršo internete,
apibendrinimas keletui
• ar priklauso klaidų skaičius nuo
nepriklausomų imčių. išgerto vyno rūšies,
• ar visų kursų studentai vienodai
Jei dispersijos lygios, dviems imtims intelektualūs,
ANOVA ir t kriterijus duoda tą patį • ar vidutiniškai vienodai garsiai rėkia
atsakymą. L. Ryto ir K. Žalgirio sirgaliai.
42
DUOMENYS
• VISADA DU stulpeliai
• Vienas – intervalinis. Jame yra H0: 1 = 2 =…= k
rezultatas, kurio vidurkius
lyginame. (Pvz., 32, 17, 22,…) H1: ne visi vidurkiai
• Kitas – kategorinis. Jame - lygūs
grupės kodas. (pvz., 1, 2, 3).
Statistinė išvada ANOVA skirtumus rado,

su p - reikšme kas toliau ?????
H0 atmetame (ne visi vidurkiai lygūs), jei Toliau : POST HOC testai. Pvz.
Bonferroni testas.
p  0.05
H0 neatmetame (visi vidurkiai stat. reikšm. Tikslas: Nustatyti kurių grupių
vidurkiai skiriasi statistiškai
nesiskiria), jei
p  0.05 reikšmingai.
Statistinė išvada Pavyzdys

su p - reikšme
Ar visų rasių respondentai vienodai palankiai
Vidurkiai stat. reikšmingai skiriasi, jei vertina džiazą?
p  0.05 Tiriame vyresnius nei 60 m respondentus(es)

Vidurkiai stat. reikšmingai, nesiskiria, jei
p  0.05
43
SPSS SPSS
Jazz
(intervalinis)
Rasė
(kategorinis)
Štai čia!
opcijos
SPSS SPSS
post hoc
aprašoma
grafikas
SPSS SPSS
Descriptives
jazz Jazz Music
vidurkiai95% Confidence Interval

for Mean
Ma
Std. Std. Lower Upper Minimu xim
N Mean Deviation Error Bound Bound m um
1 white 304 2.98 1.118 .064 2.85 3.10 1 5
2 black 32 2.34 1.208 .214 1.91 2.78 1 4
3 other 8 3.38 .744 .263 2.75 4.00 2 4
post hoc Total 344 2.93 1.134 .061 2.81 3.05 1 5
44
SPSS SPSS
Multiple Comparisons
ANOVA
Dependent Variable:jazz Jazz Music
95% Confidence Interval

jazz Jazz Music
Mean Upper
Mean (I) race (J) race Difference (I-J) Std. Error Sig. Lower Bound Bound
Sum of Squares df Square F Sig. Tukey HSD 1 white 2 black .633* .208 .007 .14 1.12
Between 3 other -.398 .401 .582 -1.34 .55
Groups 13.251 2 6.625 5.279 .006 2 black 1 white -.633* .208 .007 -1.12 -.14
Within Groups 427.933 341 1.255 3 other -1.031 .443 .053 -2.07 .01
3 other 1 white .398 .401 .582 -.55 1.34
2 black 1.031 .443 .053 -.01 2.07
Total 441.183 343
Bonferroni 1 white 2 black .633* .208 .008 .13 1.13
3 other -.398 .401 .966 -1.36 .57
2 black 1 white -.633* .208 .008 -1.13 -.13
Požiūris į džiazą statistiškai reikšmingai priklauso nuo 3 other

3 other
1 white
-1.031
.398
.443
.401
.061
.966
-2.10
-.57
.03
1.36
respondento rasės (p < 0.05). 2 black 1.031 .443 .061 -.03 2.10
*. The mean difference is significant at the 0.05 level.
SPSS SPSS
Mean
Difference
(I) race (J) race (I-J) Std. Error Sig.
Tukey HSD 1 white 2 black .633* .208 .007
3 other -.398 .401 .582
2 black 1 white -.633* .208 .007

3 other -1.031 .443 .053
3 other 1 white .398 .401 .582

2 black 1.031 .443 .053
Statistiškai reikšmingai skiriasi juodieji nuo baltųjų. Kiti

skirtumai statistiškai nereikšmingi.
Blokuotų duomenų Blokuotų duom. ANOVA

dispersinė analizė yra porinio t kriterijaus
apibendrinimas keletui
priklausomų imčių.
Repeated measures ANOVA
Neparametrinis analogas - Friedman
testas.
45
PAVYZDŽIAI
Duomenys
• kraujospūdis matuojamas po
mėnesio, po pusmečio ir po metų. Keli intervaliniai kintamieji (stulpeliai).
Ieškoma skirtumų.
• stebime studento IQ kitimą Būtent jų vidurkius ir lyginame.
pereinant iš kurso į kursą.
• ta pati žiuri vertina kelias gražuoles.
Statistinė hipotezė: Statistinė išvada

su p - reikšme
H0 atmetame (ne visi vidurkiai lygūs), jei
H0: visi vidurkiai lygūs
p  0.05
H1: ne visi vidurkiai lygūs H0 neatmetame (visi vidurkiai stat. reikšm.
nesiskiria), jei
p  0.05
Statistinė išvada
POST HOC testai su p - reikšme
Vidurkiai stat. reikšmingai skiriasi, jei
Taikomi ir interpretuojami, kaip ir
vienfaktorinėje ANOVA. p  0.05
Vidurkiai stat. reikšmingai, nesiskiria, jei
p  0.05
46
SPSS
Pavyzdys
Duomenys
Tris gražuoles įvertino 15 ekspertų.
Arvisos gražuolės įvertintos vienodai
gerai?
H0: vidutiniai gražuolių įvertinimai stat.

reikšmingai nesiskiria
H1: skiriasi
SPSS pseudo-vardas:
pseudo-vardas
SPSS tai kas vienija
kintamuosius
(nesvarbus)
Štai čia!
Kintamųjų
(stulpelių)
skč.
Add Tada Define

SPSS SPSS
perkėlėm
post hoc
aprašoma
kintamieji aprašoma
varna
opcijos
47
SPSS SPSS
čia
grafikas
ir čia!
SPSS SPSS
kaip užkoduoti Within-Subjects Factors
Measure: MEASURE_1 Tests of Within-Subjects Effects

Dependent
FACTOR1 Variable Measure: MEASURE_1 p-reikšmė
1 GRAZ1
Type III Sum Partial Eta
2 GRAZ2 Source of Squares df Mean Square F Sig. Squared
3 GRAZ3 FACTOR1 Sphericity Assumed 114.978 2 57.489 19.705 .000 .585
Greenhouse-Geisser 114.978 1.777 64.687 19.705 .000 .585
Descriptive Statistics Huynh-Feldt 114.978 2.000 57.489 19.705 .000 .585
Lower-bound 114.978 1.000 114.978 19.705 .001 .585
Mean Std. Deviation N
GRAZ1
aprašoma Error(FACTOR1)
Sphericity Assumed 81.689 28 2.917
15.8667 3.96172 15
Greenhouse-Geisser 81.689 24.884 3.283
GRAZ2 12.2667 3.99046 15
Huynh-Feldt 81.689 28.000 2.917
GRAZ3 15.4000 4.08482 15
Lower-bound 81.689 14.000 5.835
post hoc
SPSS
Pairwise Comparisons
Išvada
Measure: MEASURE_1
Mean
95% Confidence Interval for
a
Difference
• Pritaikius blokuotųjų duomenų ANOVA
(I) FACTOR1 (J) FACTOR1 Difference (I-J)Std. Error
1 2 3.600* .542
Sig.
a
.000
Lower Bound Upper Bound
2.128 5.072
gavome, kad ne visos gražuolės
3 .467 .593 1.000 -1.144 2.077 vertinimas vienodai (p<0,05). Bonferoni
2 1 *
-3.600 .542 .000 -5.072 -2.128
3 *
-3.133 .723 .002 -5.098 -1.169 kriterijus parodė, kad antroji gražuolė
vertinama statistiškai reikšmingai
3 1 -.467 .593 1.000 -2.077 1.144
2 3.133* .723 .002 1.169 5.098
Based on estimated marginal means
*. The mean difference is significant at the .05 level.
blogiau nei pirmoji ir antroji.
a. Adjustment for multiple comparisons: Bonferroni.
prisimenam kodus
48
Koeficientas h2 :
ANOVA: faktorių
priklausomybės stiprumo
skirtumai tarp grupių
matavimas eta kvadratu h2 
visi skirtumai
...
Koeficiento h2 interpretacija:
Koeficientas h2 : • parodo, kurią dalį duomenų sklaidos lemia
populiacijų skirtumai.
SSB SSB • ~ kiek rezultatą įtakoja grupė.

h2  
SST SSB  SSW
čia
SPSS SPSS
Štai čia!
49
SPSS SPSS čia
Measures of Association
varna
Eta Eta Squared
rezas * grupe ,887 ,786
VIDURKIŲ TRENDAI
Tiesinis Kvadratinis
Vidurkių trendas - tai vidurkių

kitimo tendencija (ką primena
vidurkių grafikas).
Tiesinis Kvadratinis
Kada taikoma trendų analizė? Statistinė hipotezė:
• Kai nepriklausomas grupavimo

kintamasis yra gautas iš intervalinio. H0: vidurkiai nesudaro tiesinio
trendo,
• Grupės NR atspindi vis didesnį (mažesnį)
kažkokios savybės kiekį. H1: vidurkiai sudaro tiesinį
trendą.
Fux, oberfux, senior,student (patirtis).
1bokalas, 2bok., 3bok. (alkoholis).
50
Statistinė išvada su p - reikšme
H0: vidurkiai nesudaro H0 atmetame (trendas TINKA), jei

kvadratinio trendo,
H1: vidurkiai sudaro kvadratinį p  0.05
trendą. H0 neatmetame (trendas netinka), jei
ir t.t. Kiekvienam trendui sava
hipotezė.
p  0.05
Čia 0.05 - reikšmingumo lygmuo
Štai čia!
SPSS SPSS
Štai čia!
• Du • Du
menys menys
Kaip Anova
SPSS SPSS (grupės lygios)

ANOVA p-reikšmė
LINEAR
VARNA
Trendas tinka
51
SPSS SPSS (grupės nelygios)
Arba visi respondentai lygiaverčiai (unwighted), arba visos grupės (weighted).

Renkamės tą atsakymą, kuris mums atrodo logiškesnis.
Tiesinis ir kvadratinis
SPSS SPSS
menys
52
TRUMPAI
• ANCOVA –kelių grupių vidurkiai lyginami,
atsižvelgiant į papildomą informaciją.
ANCOVA
• ANCOVA – tai ANOVA su kovariantėmis.
KOVARIANČIŲ ANALIZĖ
PAVYZDŽIAI KO TIKIMĖS
• Norima nustatyti, kuris iš dviejų mokymo • Manome, kad grupių skirtumai išryškės, jei
metodų geresnis, kai, vertinant rezultatus, lyginsime to paties intelekto ir vienodos
atsižvelgiama į mokinių motyvaciją ir IQ. motyvacijos mokinių rezultatus. Nebus taip,
• Tiriama, ar besimokantieji vairuoti, kad mažai motyvuoti vienos grupės mokiniai
važiuodami dideliais automobiliais, padaro bus lyginami su stipriai motyvuotais kitos
daugiau klaidų nei važiuodami mažais. grupės mokiniais.
Papildomai atsižvelgiama į vairuotojo amžių. • Tikimės, kad skirtumai išryškės, kai lyginsime
maždaug to paties amžiaus vairuotojus.
PALYGINIMAS SU ANOVA PASTABA

• ANOVA nulinė hipotezė: • Visai įmanoma situacija, kai taikant ANOVA
statistiškai reikšmingi skirtumai randami, o
taikant ANCOVA – ne. Pavyzdžiui, gali būti,
• ANCOVA nulinė hipotezė:
kad pritaikius ANOVA, vidutinis vaikų skaičius
katalikiškose ir protestantiškose šeimose
skirsis. Kita vertus, atsižvelgus į šeimos galvos
socialinį ir ekonominį statusą, šie skirtumai
• čia 1a, 2a, 3a yra grupių vidurkiai,
„pataisyti“, atsižvelgus į kovariantes. dings.
53
KINTAMIEJI PAVYZDYS
• Priklausomas kintamasis Y (t.y. tas kintamasis, • Tiriame, ar statistiškai reikšmingai skiriasi trijų
kurio vidurkius lyginame) yra intervalinis, grupių testo rezultatai (REZ, intervalinis
normaliai pasiskirstęs. kintamasis). Atsižvelgsime į respondentų
• Kovariantė X (t.y. Kintamasis, į kurį reikia motyvaciją (MOT, intervalinis kintamasis). Grupę
atsižvelgti) yra intervalinė, normaliai nurodyto kintamasis Grupe (trireikšmis
pasiskirsčiusi. kategorinis kintamasis).
• Grupavimo (nepriklausomas, faktorius) • Duomenis galima rasti knygos V. Čekanavičius, G.
kintamasis – kategorinis. Jo dėka žinome, Murauskas, Statistika ir jos taikymai. III, pirmos
kuriai grupei koks respondentas priklauso. dalies šeštajame skyrelyje (1.1.9 pavyzdys).
SPSS duomenys ANCOVA SU SPSS

• Reikia 3 stulpelių. Juose nurodoma kiekvieno
respondento grupė (Grupe), testo rezultatas
(REZ) ir motyvacija (MOT).
ANCOVA SU SPSS ANCOVA SU SPSS
Bonferroni
varnos
varna
ČIA
54
ANCOVA rezultatai ANCOVA rezultatai
p-reikšmė
ANCOVA rezultatai ANCOVA rezultatai

• Tarkime, kad pasirinkome reikšmingumo Naudojantis Bonferonio kriterijumi, lyginami
lygmenį = 0,05. Matome, kad p < 0.05 „pataisyti“ rezultatų vidurkiai, kai
• Darome išvadą, kad tarp tarp trijų grupių atsižvelgiama į motyvaciją.
vidutinių testo rezultatų yra statistiškai
reikšmingai besiskiriančių.
• Liko atsakyti į klausimą, kurių grupių vidutiniai
rezultatai skiriasi, t.y. pritaikyti post hoc testą.
Post hoc vidurkių lyginimai ANCOVA rezultatai

Ką lyginame
• Statistiškai reikšmingai skiriasi tų grupių
vidurkiai, kuriuos lyginant p<0,05. Tokių
vidurkių skirtumus SPSS automatiškai pažymi
žvaigždute.
• Gauta, kad pirmoji grupė statistiškai
reikšmingai skiriasi nuo likusiųjų, o antroji ir
trečioji grupės nesiskiria.
55
ANCOVA rezultatų aprašymo pavyzdys
Tyrėme, ar statistiškai reikšmingai skiriasi trijų
grupių vidutiniai testo rezultatai. Atsižvelgėme
į respondentų motyvaciją. Taikėme PAPILDOMI TYRIMAI
kovariančių analizę (ANCOVA) ir Bonferonio
kriterijų. Gavome, kad pirmoji grupė
statistiškai reikšmingai skiriasi nuo likusiųjų, o
antroji ir trečioji grupės nesiskiria.
Palyginimas su ANOVA Palyginimas su ANOVA

• Taikant ANCOVA patartina vidurkius palyginti
ir be kovariantės. Tam naudojama vienfaktorė
dispersinė analizė (ANOVA).
• SPSS programa ANOVA galima atlikti ne vienu
būdu. Naudosime pačią paprasčiausią parinktį.
Palyginimas su ANOVA Palyginimas su ANOVA

Vidurkių skirtumai statistiškai nereikšmingi.
Primename, kad, atsižvelgus į motyvaciją,
statistiškai reikšmingų skirtumų atsirado.
56
Reikšmių išsibarstymo grafikas Reikšmių išsibarstymo grafikas
• Norint nustatyti testo rezultatų ir motyvacijos
priklausomybę, verta nubraižyti abiejų
kintamųjų grafiką. Parodysime, kaip tai galima
padaryti naudojantis SPSS 17 programa.
Reikšmių išsibarstymo grafikas Reikšmių išsibarstymo grafikas
Čia
Reikšmių išsibarstymo grafikas Suredaguotas grafikas

• Grafikas – ne itin vaizdus, tačiau jį galima
redaguoti.
57
Į ką grafike atkreipti dėmesį Kintamųjų sąveika
• Visose grupėse matyti ta pati tendencija – kuo
• Statistiškai reikšminga motyvacijos ir grupės
didesnė motyvacija, tuo geresni rezultatai.
sąveika parodo, kad skirtingose grupėse
• Matome, kad skirtingų grupių rezultatų
motyvacija skirtingai veikia rezultatus.
„debesėliai beveik lygiagretūs“. Vadinasi
grupės ir motyvacijos sąveikos (interakcijos) • Klasikinė ANCOVA daroma, kai nėra grupės ir
nėra. Visose grupėse motyvacijos poveikis kovariantės sąveikos (interakcijos).
maždaug vienodas. • Parodysime, kaip naudojant SPSS galima
• Kuo labiau debesėliai atsiskiria, tuo tikėtiniau, patikrinti, ar sąveikos nėra.
taikant ANCOVA, rasti statistiškai reikšmingų
vidurkių skirtumų. • Pradžia nesiskiria nuo įprastinės ANCOVA.
ANCOVA su kintamųjų sąveika ANCOVA su kintamųjų sąveika
Čia
ANCOVA su kintamųjų sąveika ANCOVA su kintamųjų sąveika Čia
58
ANCOVA su kintamųjų sąveika Sąveikos nėra
Taškas
Sąveika
Ką daryti, jeigu sąveika yra Baigiamosios pastabos

Tuo atveju, interpretuojant rezultatus, reikia Tyrėme vienfaktorę ANCOVA, t.y. modelį su
kalbėti ne apie ANCOVA, bet apie tiesinį Gauso viena kovariante. Kovariančių gali būti ir
modelį (LNM). Reikėtų užrašyti modelį daugiau. Modelio analizė nuo to nesikeičia. Vis
dėlto, kuo mažiau kovariančių, tuo modelį
lengviau interpretuoti.
ir jį komentuoti (priklauso nuo motyvacijos,
grupės ir motyvacijos sąveikos su grupe ir
pan.).
59
Tiesinė regresija - toks modelis,
Tiesinė regresija kai vieną (priklausomą)
kintamąjį įtakoja vienas arba
keletas (nepriklausomų)
kintamųjų.
PAVYZDŽIAI PAVYZDŽIAI
• ar poegzamininis dirglumas • išmatavome IQ pirmame kurse. Ar
priklauso nuo gauto pažymio, nuo galima prognozuoti koks bus
egzamino trukmės ir nuo ko labiau, studento diplomo pažymių vidurkis?
• kaip antikvarinės keramikos kaina • kiek padidės pelnas, padidinus
priklauso nuo jos senumo ir aukciono reklamos išlaidas 10 000 Lt?
dalyvių skaičiaus, • kokį vidutinį valstybinio egzamino
• ar diplomo pažymių vidurkis ir balą galima prognozuoti mokiniui per
komunikabilumas gali padėti baigiamąjį kontrolinį surinkusiam 87
prognozuoti būsimą atlyginimą. tšk.?
Duomenys MODELIS
• (X1,, X2,, X3,,…, Xk,, Y) Y   0  1X 1  ...   k X k  e

• tai, ką prognozuosime -
priklausomas kintamasis ( Y , kaina)
Y priklauso nuo stebimų X-ų ir nuo
• pagal ką - nepriklausomi kintamieji
(regresoriai) ( X-ai , metai, dalyvių
dar kažkokių nestebimų dalykų e.
skaičius). e – atsitiktinis dydis (normalus) su 0
• Keli (dažniausiai intervaliniai) vidurkiu ir nežinoma dispersija.
kintamieji (stulpeliai).
60
Visi kintamieji intervaliniai*. Standartinis tyrimas:
• R2 , ANOVA, t-testai, VIF ir grafikai
• * išskyrus pseudokintamuosius . padės nustatyti reikalingus X-us.
• X-ai vienas kito neveikia, • R parodys, kaip Y priklauso nuo visų
X-ų iškart.
• X-ai veikia Y-ą.
• B-koeficientai padės sudaryti regresijos
• vieno X-o per kitus neišreikši. funkciją.
• Beta-koeficientai padės nustatyti,
kurie kintamieji svarbesni.
Geram regresijos modeliui:

• R2 ≥ 0,20.
Pavyzdys:
• ANOVA p < 0,05. • Tirsime, kaip 20-40 m estų politinės
• Visų t testų p < 0,05. padėties šalyje vertinimas (satisfaction)
• Visi VIF ≤ 4 (nėra multikolinearumo priklauso nuo požiūrio į parlamentą,
problemos). partijas ir laimingumo ( trstprl, trstprt,
• Visos Kuko mato reikšmės ≤ 1. happy). Visi kintamieji matuojami 10 balų
• Koeficientų ženklai atitinka koreliacijas. skalėje (1 – labai nepasitiki).
• Sprendžiant pagal histogramą,
liekamosios paklaidos normalios.
SPSS
Pavyzdys:
Štai čia!
61
Ką modeliuojame SPSS SPSS
po to čia
pagal ką
SPSS SPSS
išskirtims
po to čia
SPSS daugialypė
koreliacija
SPSS koreguotas
det. koef.
Mean Std. Deviation N Model Summaryb

satisfaction 4.0397 2.16872 517
Adjusted R Std. Error of the
trstprl 3.80 2.287 517 Model R R Square Square Estimate
1 .703a .495 .492 1.54608
happy 7.07 1.837 517
trstprt 3.24 1.941 517
determinacijos R2 = 0.495 , pakankamas

koeficientas
Respondentai gana laimingi ir nelabai
(>> 0.20)
patenkinti institucijomis.
62
SPSS SPSS (koeficientai)
ANOVAb
Sum of Mean
Model Squares df Square F Sig.
1
Regression 1200.681 3 400.227 167.434 .000a
Residual 1226.256 513 2.390
Total 2426.937 516
Yra statistiškai reikšmingų

kintamųjų
gerai, nes p<0.05
SPSS (modelis)
Modelio lygtis
Regresijos modelio lygtis
satisfaction = - 0,039 + 0,374 trstprl +
0.228 happy + 0,322 trstprt
satisfaction =
- 0,039 • Kai trstprl padidėja vienetu, satisfaction
+ 0,374 trstprl padidėja 0,374 balo.
+ 0.228 happy • Prognozuojant, į lygtį tiesiog įstatomos
+ 0,322 trstprt konkrečios kintamųjų reikšmės.
SPSS (koeficientai) SPSS (koeficientai)

t testai
Beta koeficientai
Matome, kad modelyje mažiausiai

svarbus kintamasis happy Visi kintamieji statistiškai reikšmingi
© V.Čekanavičius, G.Murauskas 245 ( visi p <0.05).
63
SPSS (koeficientai) SPSS (koeficientai)
Residuals Statisticsa
Std.
Minimum Maximum Mean Deviation N
Predicted Value .4182 8.5548 4.0397 1.52542 517
------------------------ ---------- ----------- ----------- --------------- ---------
----- ---
Mahal. Distance .077 25.501 2.994 2.663 517

Cook's Distance .000 .138 .002 .008 517
Centered .000 .049 .006 .005 517
Leverage Value
Visos Kuko mato reikšmės < 1.

Sprendžiant pagal Kuko matą, išskirčių
nėra.
Multikolinearumo nėra (visi VIF < 4).247
© V.Čekanavičius, G.Murauskas © V.Čekanavičius, G.Murauskas 248
SPSS
Galutinė modelio tyrimo išvada: Logistinė regresija

regresijos modelis tinka
duomenims.
Logistic Regression
PAVYZDŽIAI
Logistinė regresija - toks • pagal paciento svorį ir kraujo tyrimus
modelis, kai vieną nustatyti tikimybę susirgti diabetu,
(priklausomą) dvireikšmį • pagal testų rezultatus nustatyti reiks
kintamąjį įtakoja vienas arba kompiuteriui garantinio remonto,
keletas (nepriklausomų) • ar pagal agresyvumą bei plepumą
galima atskirti vyrą nuo moters.
kintamųjų.
• ar žinant rinkėjo pajamas ir amžių,
galima numatyti balsuos už kandidatą
ar nebalsuos.
64
Duomenys • priklausomas kintamasis Y
dvireikšmis (0 arba 1).
• (X1, X2, X3,…, Xk, Y) • X-ai intervaliniai.
• Vienas kintamasis (stulpelis) Y • prognozuojama tikimybė P(Y=1).
dvireikšmis – jo elgesį ir modeliuojame.
Dar vadinamas priklausomu kintamuoju • jei Y įgyja kitokias dvi reikšmes -
• Kiti (kitas) kintamieji intervaliniai jis perkoduojamas.
(dažniausiai) - nepriklausomi kintamieji. • Nei viena iš dviejų Y reikšmių
Jie, mūsų nuomone, daro įtaką Y’ui. neturi kartotis daugiau nei 80 %
duomenų.
Modelio schema:
Prognozuojame tikimybę P(Y=1).
Surandame:
Y=0 arba Y=1
z(x) = a + b1x1 + ... + bkxk
e z(x)
X1 X2 X3 P̂ (Y m  1) 
intervaliniai kintamieji 1  e z(x)
Kategoriją prognozuoti galima pagal Modelio suderinamumas su

z(x) duomenimis
• jei z(x)>0 , tai Y=1 (ir pasižiūrime, ką tai Ar tinka logistinė regresija nustatome
reiškia). analizuodami
• jei z(x)<0 , tai Y=0 (ir pasižiūrime, ką tai
reiškia). • klasifikacinę lentelę,
• Jei z(x)=0, tai metame monetą.  kriterijų,
• Voldo kriterijų,
• Determinacijos koeficientus.
65
kriterijus: Statistinės išvados
su p- reikšme:
• Tikrina hipotezę:
H0: visi bm = 0 H0 atmetame (logistinė regresija galbūt
tinka), jei
H1: ne visi bm = 0. p < 0.05
• Kitais žodžiais:
H0 neatmetame (logistinė regresija
H0: tikimybė nuo x-ų nepriklauso netinka), jei
H1: tikimybė nuo x-ų priklauso. p >=
• Tik nežinome nuo kurių x-ų. Čia - reikšmingumo lygmuo.
Statistinės išvados apie

Voldo testai koeficientams bm
kintamuosius (Wald kriterijus)
• Ieškome nesvarbių x-ų. su p- reikšme:
• Tikrina hipotezę: H0 atmetame (kintamasis modeliui tinka),
jei
H0: bm = 0 p<
H1: bm = 0 H0 neatmetame (kintamasis ‘įtartinas’), jei
• Jei nulinės hipotezės neatmetame-tai
kintamasis ‘įtartinas’ (modelyje p >=
galbūt nereikalingas).
Čia - reikšmingumo lygmuo.
Ką daryti su ‘įtartinais’ Determinacijos koeficientai:

kintamaisiais?
• Jų yra net keli - ir visi pseudo.
• pakartojame regresijos modelį be • Dažniausiai taikomi Kokso-Snelo arba
‘įtartino’ kintamojo. Nagelkerkės koeficientai.
• tiriame klasifikacinę lentelę. • Kuo R2 didesnis, tuo modelis geresnis.
• jei klasifikavimo tikslumas praktiškai • Pavyzdyje apie įskaitą Nagelkerkės
nepakito - kintamąjį šaliname. koeficientas yra 0,565.
66
Pseudokintamieji Labai gerai duomenims
• Pseudokintamieji naudojami, kaip ir tinkančiame modelyje:
tiesinėje regresijoje. • Chi kvadrato p < 0,05.
• Pseudokintamieji koduojami, kaip ir • Visiems regresoriams Voldo kriterijaus
tiesinėje regresijoje (0 ir 1). p < 0,05.
• Jei kategorijų daugiau nei 2, reikia • Koeficientų ženklai neatrodo nelogiški.
net kelių pseudokintamųjų. • Teisingai klasifikuojama ne mažiau 50%
• SPSS perkoduoja automatiškai, jei atvejų, kai Y = 1 ir kai Y = 0.
paprašome. • Pasirinktasis determinacijos
koeficientas ≥ 0,20.
Pavyzdys: Modelio schema:

• Ar padeda atskirti Estijos ir Portugalijos
20 – 30 metų vyrus tokie klausimai:
stfedu – požiūris į šalies švietimo
sistemą, happy – laimingumas, freehms
– gėjai ir lesbietės gali gyventi, kaip
nori.
Jei būtų
SPSS SPSS
kategorinių
priklausomas regresorių
nepriklausomi
Štai čia!
67
duomenų SPSS nauji
kodai
kodai
Klasifikacinė lentelė
Dependent Variable Encoding
Internal SPSS pateikia dvi klasifikacines lenteles:

Original Value Value
EE Estonia 0 Pirmoji skirta atsitiktinio spėjimo
PT Portugal 1 efektyvumui įvertinti.
Antroji rodo modelio gerumą (būtent ji ir
yra svarbiausia).
Modelyje Y= 1 atitiks Portugaliją,
Aptarsime antrąją klasifikacinę lentelę.
o Y = 0 – Estiją.
SPSS SPSS
Omnibus Tests of Model Coefficients
Chi-square df Sig.
Step 1 Step 99.458 3 .000
Block 99.458 3 .000
Model 99.458 3 .000
Visos trys eilutės lentelėje yra identiškos.

Teisingai klasifikuota 72,1 % estų ir 75,6% Gerai, kai p < 0,05. Kadangi p = 0,000..,
portugalų. tai modelis gerai tinka.
determinacijos SPSS SPSS

koeficientai
Model Summary
Variables in the Equation
B S.E. Wald df Sig. Exp(B)

Step -2 Log likelihood Cox & Snell R Square Nagelkerke R Square Step 1a stfedu -.537 .081 43.471 1 .000 .585
1 266.388a .314 .419
a. Estimation terminated at iteration number 5 because parameter estimates changed happy .325 .090 13.019 1 .000 1.384
by less than .001.
freehms -.752 .145 27.018 1 .000 .471
Constant 2.498 .831 9.038 1 .003 12.157

Nagelkerkės determinacijos
pseudokoeficientas 0,419 pakankamai a. Variable(s) entered on step 1: stfedu, happy, freehms.
didelis (>0,20).
Visi kintamieji statistiškai reikšmingi.
68
Modelio lygtis
Bendra išvada Z= lnP(Y=1)/P(Y=0)
Variables in the Equation
Logistinės regresijos modelis gerai tinka = lnP(PT)/P(EE) =

B
duomenims. Step 1a stfedu -.537 – 0,537 stfedu
happy .325
+ 0,325 happy
freehms -.752 - 0,752 freehms
Constant 2.498 + 2,498
a. Variable(s) entered on step 1: stfedu, happy,
freehms.
Modelio lygtis Prognozavimas

Z= lnP(PT)/P(EE) = – 0,537 stfedu Tarkime, kad domina iš kokios valstybės
+ 0,325 happy - 0,752 freehms + 2,498 yra respondentas, kuriam
stfedu =2, happy = 2, freehms = 1
• Didėjant stfedu, didėja tikimybė, kad iš EE.
• Didėjant happy, didėja tikimybė, kad iš PT. Įstatome šias reikšmes į
• Didėjant freehms, didėja tikimybė, kad iš EE. Z= lnP(PT)/P(EE) = – 0,537 stfedu
+ 0,325 happy - 0,752 freehms + 2,498 =
O ką tas didėjimas reiškia, paaiškės iš – 0,537 *2 + 0,325 *2 - 0,752*1 + 2,498 =
kintamųjų kodavimo. 1.322.
Prognozavimas Prognozavimas
Įstatę visas reikšmes gauname: Z NĖRA tikimybė. Z yra tikimybių
Z= lnP(PT)/P(EE) =1,322. santykis.
Kadangi z >0, tai prognozuojame Y=1 Tikimybė, kad respondentas iš

(cntry=PT), t.y., kad respondentas yra Portugalijos randama taip:
iš Portugalijos.
P(Y=1) =2,71^1,322/(1+2,71**1,322)= 0,79
69
Diskriminantinė analizė - toks
Diskriminantinė modelis, kai vieną
analizė (priklausomą) kategorinį
kintamąjį įtakoja keletas
(nepriklausomų) intervalinių
kintamųjų.
Discriminant Analysis
Duomenys
• (X11, X21, X31,…, Xk1, Y1) , .…, Y kategorinis

(X1n, X2n, X3n,…, Xkn, Yn) .
• tai, ką prognozuosime -
priklausomas kintamasis ( Y,
mokslinis laipsnis)
• pagal ką - nepriklausomi kintamieji X1
(regresoriai) ( X-ai , arogantiškumas,
X2 X3
įkyrumas). intervaliniai kintamieji
Kintamųjų diskriminacinės Kanoninės funkcijos

savybes parodo:
• Diskriminavimui naudojama ne
• Vilkso lambda - kuo mažesnė, tuo atskiri X-ai, o jų tiesiniai dariniai:
geriau diskriminuoja. f1(x)=a1+b11 X1 + b21X2 +… +bk1Xk ,
• Vilkso kriterijaus p-reikšmė (jei p < , f2(x)=a2+b12 X1 + b22X2 +… +bk2Xk,..
tai gerai).
• Reikia abiejų, nes p-reikšmė gali būti • Šios funkcijos sudaromos specialiu
maža ir dėl duomenų gausos. būdu ir vadinamos kanoninėmis
• Atskirų kintamųjų tyrimas - pagalbinė funkcijomis.
analizė (ne pati svarbiausia). • Jų analizė - svarbiau, nei atskirų X-ų.
70
Kanoninių funkcijų vertinimas: Kanoninių funkcijų % sudėtis:
• Žiūrime kiek % visomis kanoninėmis
• Kanoninėmis funkcijomis funkcijomis paaiškinamos dispersijos
paaiškinamos kintamųjų dispersijos tenka kiekvienai funkcijai.
procentinė sudėtis .
• Tai - santykinis rodiklis. Viena funkcija
• Vilkso lambda. gali būti svarbesnė už kitą, bet abi
• Vilkso statistikos p-reikšmė. netikusios.
• Jei yra tik viena kanoninė funkcija, tai
Apsiribosime proc. sudėtimi rodiklis beprasmis, nes =100%.
Kintamųjų įtaka kanoninėms

funkcijoms Klasifikacinė lentelė
• Standartizuotųjų (t.y. z-reikšmių) • tai pagrindinis diskriminantinės analizės

kanoninių funkcijų koeficientai (kuo tikimo indikatorius.
moduliu didesni, tuo X-as svarbesnis). • joje nusprendžiame kurios Y
Tai analogai. kategorijos priskirtinos esamos imties
• Atskirų X-ų ir kanoninių funkcijų duomenims.
koreliacijos. • kadangi tikrąsias Y reikšmes žinome,
• Padeda nustatyti ‘įtartinus’ X-us. galime nustatyti, kiek kartų suklydome.
Standartinis tyrimas:
Pavyzdys:
• Klasifikacinė lentelė.
• Kanoninių funkcijų svarba. • Ar galima atskirti lietuvį nuo latvio ir esto
pagal testų
• Kintamųjų įtaka, kanoninėms
funkcijoms. • Jūra (test1),
• Grafikas. • Sportas (test2),
• Vilkso kriterijus ‘įtartiniems’ X-ams rasti. • Kaimynai (test3)
• (Prognozavimas). rezultatus?
71
Duomenys Analyze -> Classify -> Discriminant
Analyze -> Classify -> Discriminant Statistics

Nurodome su čia
Define Range varnos
kintamieji
Classify -> Discriminant Classify
varnos
Tada čia
72
SPSS SPSS
a a
Classification Results teisinga prognozė Classification Results
Predicted Group Membership Predicted Group Membership

SALIS 1 lietuviai 2 latviai 3 estai Total SALIS 1 lietuviai 2 latviai 3 estai Total
Original Count 1 lietuviai 16 0 0 16 Original Count 1 lietuviai 16 0 0 16
2 latviai 0 11 2 13 2 latviai 0 11 2 13
3 estai 0 2 5 7 3 estai 0 2 5 7
% 1 lietuviai 100.0 .0 .0 100.0 % 1 lietuviai 100.0 .0 .0 100.0
2 latviai .0 84.6 15.4 100.0 2 latviai .0 84.6 15.4 100.0
3 estai .0 28.6 71.4 100.0 3 estai .0 28.6 71.4 100.0
a. 88.9% of original grouped cases correctly classified. a. 88.9% of original grouped cases correctly classified.
teisingų
prognozių %
SPSS f1 gerai diskriminuoja SPSS

2 f blogai diskriminuoja Summary of Canonical Discriminant Functions
Canonical Discriminant Functions
3
Eigenvalues
2
Canonical
1
Function Eigenvalue % of Variance Cumulative % Correlation
1 a
latviai 33.751 99.6 99.6 .986
lietuviai
2 a
0
.129 .4 100.0 .338
estai
SALIS a. First 2 canonical discriminant functions were used in the analysis.
-1
Group Centroids
estai
Function 2
-2
latviai
f1 tenka 99.6 % paaiškinamos dispersijos, f2 0.4 %
-3 lietuviai
-8 -6 -4 -2 0 2 4 6 8

Function 1
SPSS SPSS
Structure Matrix Vilkso p-reikšmės
Function
1 2 Tests of Equality of Group Means
TEST1 .854* .498
TEST2 -.136 .987 * Wilks'
TEST3 .254 .514 *
Lambda F df1 df2 Sig.
TEST1 .039 406.803 2 33 .000
Pooled within-groups correlations between discriminating
variables and standardized canonical discriminant functions TEST2 .572 12.364 2 33 .000
Variables ordered by absolute size of correlation within function. TEST3 .311 36.491 2 33 .000
*. Largest absolute correlation between each variable and
any discriminant function
Visų kintamųjų p-reikšmės mažos,

Labiausiai f1 koreliuoja su TEST1 (Jūra) rezultatais. tačiau Vilkso maža tik TEST1 (Jūra).
73
SPSS (prognozavimas) SPSS (prognozavimas)
Kintamieji
Classification Function Coefficients Classification Function Coefficients
SALIS SALIS
1 lietuviai 2 latviai 3 estai 1 lietuviai 2 latviai 3 estai
TEST1 -1.234 .461 .163 TEST1 -1.234 .461 .163
TEST2 7.881 6.221 6.221 TEST2 7.881 6.221 6.221
TEST3 1.101 .685 .780 TEST3 1.101 .685 .780
(Constant) -351.724 -301.126 -278.343 (Constant) -351.724 -301.126 -278.343
Fisher's linear discriminant functions Fisher's linear discriminant functions
lietuviui Fišerio funkcija = latviui Fišerio funkcija =

-1.23*TEST1 + 7.88*TEST2+1.10*TEST3 - 351.72 0.46*TEST1 + 6.22*TEST2+0.68*TEST3 - 301.12
SPSS (prognozavimas) Prognozavimas:

Classification Function Coefficients
• Tarkime TEST1=30, TEST2= 80,
SALIS
1 lietuviai 2 latviai 3 estai
TEST3=70.
TEST1 -1.234 .461 .163 • Fišerio funkcijos:
TEST2 7.881 6.221 6.221
• Lietuviui= 318.78.
TEST3 1.101 .685 .780
(Constant) -351.724 -301.126 -278.343 • Latviui= 257.91.
Fisher's linear discriminant functions • Estui= 269.75.
• Prognozuojame, kad respondentas
estui Fišerio funkcija =
0.16*TEST1 + 6.22*TEST2+0.78*TEST3 - 278.34 lietuvis.
Klasterinė analizė - objektus

Klasterinė analizė pagal panašumą suskirstome į
grupes - klasterius.
Cluster Analysis
Klasteris - panašių objektų
grupė.
74
PAVYZDŽIAI Krepšinio komandų klasterizavimo
rezultato pavyzdys
• pagal testų rezultatus grupuojame
tiriamuosius;
• I klasteris: Žalgiris, L.Rytas
• pagal sesijos rezultatus
• II klasteris: Šiauliai, Prienai
sugrupuojame II kurso psichologus;
• III klasteris: Sakalai, Neptūnas
• pagal socio-ekonominius parametrus
norime suskirstyti valstybes į grupes;
• pagal nuobodumo laipsnį
grupuojame pažįstamus.
Klasterinės analizės metodai

Duomenys
• Hierarchiniai (jungimo arba
• (X11, X21, X31,…, Xk1) , .…, skaidymo).
(X1n, X2n, X3n,…, Xkn) . • Nehierarchiniai (K-vidurkių ir kt.)
• yra tik kintamųjų X-ų reikšmės!
• kintamieji X- intervaliniai, Mes mokysimės tik k-vidurkių
ranginiai, kategoriniai. klasterizaciją.
SPSS pagal ką SPSS

Štai čia!
respondentų
sąrašas
po to čia
klasterių
skaičius
75
SPSS SPSS informacija apie
pradiniai centrai pradinius klasterių
centrus
Initial Cluster Centers
Cluster
1 2
klasterizavimo IQ 97.00 95.00
rezultatai
PAZYMYS 10.00 5.00
SPSS kokiam klasteriui SPSS informacija apie

priklauso galutinius klasterių
centrus
Cluster Membership
Final Cluster Centers
Case Number VARDAS Cluster Distance
1 A 1 1.000 Cluster
2 B 2 1.944
1 2
3 C 1 1.000
IQ 97.00 95.00
4 D 2 1.054
5 E 2 1.333 PAZYMYS 9.00 6.33
atstumas iki
klasterio centro
SPSS
Number of Cases in each Cluster
Cluster 1 2.000 Faktorinė analizė

2 3.000
Valid 5.000
Missing .000 FACTOR ANALYSIS
76
Faktorinė analizė - toks modelis, kai Faktorinė analizė
vienas tiesiogiai nestebimas
kintamasis (latentinis faktorius) matematika
įtakoja keletą stebimų intervalinių
kintamųjų. stebimi
gabumai kintamieji
fizika
Dažniausiai būna keli faktoriai.
Nemaišyti su dispersine analize latentinis
faktorius chemija
ANOVA
• Tikslas - išskirti kuo geriau • Latentinio faktoriaus pavadinimą

kintamųjų elgesį aprašančius sugalvoja tyrėjas.
faktorius. • Faktorių skaičių parenka tyrėjas.
• Naudojant faktorių reikšmes • Faktorinė analizė tinka ne visada.
sumažėja tiriamų kintamųjų. • Skirtingos faktorinės analizės
• Taip pat sumažėja ir turimos išskiria skirtingus faktorius.
informacijos. • Ne visada lengva interpretuoti
faktorius.
PAVYZDŽIAI PASTABA
• tiriame, kas gali vienyti politikus (gal • faktorinė analizė geriau tinka vieno
pažiūrų kairumas, gal autoritetas) reiškinio skirtingų aspektų analizei; nei
• ką atpindi pažymiai (gabumus • kelių visiškai skirtingų reiškinių
apskritai, ar gabumus humanitariniams grupavimui;
bei tiksliesiems mokslams; • jei turime testą skirtą gabumams ir
• kas vienija respondentų požiūrį į fiziniam parametrams matuoti-
skirtingus muzikinius stilius; • geriau taikyti dvi faktorines analizes,
• kokios klausimų grupės išsiskiria kiekvienam pustesčiui.
klausimyne.
77
Faktorinės analizės prielaidos
Faktorinės analizės etapai
• visi X-ai normalūs;
• visi F-ai nekoreliuoti ir turi • Patikrinimas ar tinka duomenys.
vienetines dispersijas; • Faktorių išskyrimas.
• paklaidos ej nekoreliuotos; • Faktorių sukimas ir
• F-ai ir paklaidos nekoreliuoja. interpretavimas.
• Faktorių reikšmių skaičiavimas.
Duomenų tikimas Kiek faktorių imti?
• Kintamieji X-ai turi koreliuoti. • Dažniausiai žiūrima, kiek kintamųjų

Koreliuotumą vertina: elgesio dispersijos paaiškina faktoriai.
• Nėra griežtos taisyklės, kiek kintamųjų
• Bartleto kriterijus (gerai, kai p <
dispersijos turi paaiškinti faktoriai.
).
• Interpretacija-daugiau dispersijos
• Kaizerio-Mejerio-Olkino matas. paaiškina, daugiau ir informacijos apie
Blogai, kai KMO<0.50 (mažiau už kintamųjų elgesį išlaikome, pereidami
vieną antrąją). prie faktorių.
Faktorių nustatymas
Faktorių interpretavimas
• Faktorius paaiškina tuos kintamuosius,
kuriems jo svoris didelis. • sugalvoti faktoriui pavadinimą -
• Vertinimas ‘iš akies’: svoris didelis, jei tyrėjo reikalas.
absoliutiniu didumu >0.4. • tai priklauso nuo tyrėjo išsilavinimo.
• Gali tą patį kintamąjį paaiškinti keli • tą patį faktorių vienas įvardins, kaip
faktoriai. percepcinę organizaciją, o kitas, kaip
• Tada kintamąjį priskiriame tam, kuris objekto-visumos suvokimą.
geriau tinka pagal prasmę. • teisus tas, kuris sugeba įtikinti kitus.
78
Pastaba Faktorių sukimas
• pagrindinių komponenčių analizė • tačiau dominuojantis pirmasis

reiškia, kad pirmas faktorius faktorius labai apsunkina faktorių
svarbiausias, po to antras ir t.t. interpretaciją.
• dominuojantis pirmasis faktorius • sunku interpretuoti ir kai tas pats X
liudija, kad matuojame vieno pakliūna į keletą faktorių.
reiškinio skirtingus aspektus (tai • išeitis faktorių sukimas.
gerai). • nauji faktoriai - senųjų tiesinės
daugdaros.
Faktorių sukimas Faktorių reikšmės
• po sukimo faktorių interpretacija • nėra vieningos skaičiavimo

gali keistis. metodikos.
• yra visokių sukimų. • naudojant SPSS siūlomas
technikas rezultatai normuoti;
• populiariausias VARIMAX
• dažnai faktoriaus reikšme
• gali netikti nė vienas sukimas.
laikomas atitinkamų kintamųjų
reikšmių vidurkis.
SPSS
Pavyzdys Štai čia!
• failas B1994, politikų vertinimai.

• kokios politikų grupės išsiskiria.
• kas keičiasi po sukimo.
79
SPSS
kintamieji SPSS po to čia
KMO
SPSS SPSS
po to čia
Jei norime, tai

galime patys
nurodyti norimą
faktorių skaičių.
faktorių skč.
SPSS SPSS
Varimax
po to čia
80
SPSS SPSS
Keičiame
varna
į 0.4
po to čia
SPSS SPSS trys faktoriai

Total Variance Explained
Initial Eigenvalues Extraction Sums of Squared Loadings

Rotation Sums of Squared Loadings
KMO and Bartlett's Test ComponentTotal % of Variance Cumulative %Total % of VarianceCumulative %Total % of Variance
Cumulative %
1 4.366 33.585 33.585 4.366 33.585 33.585 2.941 22.626 22.626
2
Kaiser-Meyer-Olkin Measure of Sampling 3
1.664
1.214
12.800
9.335
46.384
55.719
1.664
1.214
12.800
9.335
46.384
55.719
2.327
1.976
17.897
15.196
40.523
55.719
Adequacy. .851 4
5
.914
.763
7.033
5.867
62.752
68.619
6 .672 5.166 73.784
7 .605 4.657 78.442
Bartlett's Test of Approx. Chi-Square 4360.774 8 .563 4.328 82.770
9
Sphericity df 78 10
.517
.465
3.974
3.576
86.744
90.320
paaiškinama
11 .450 3.460 93.780 dispersija
Sig. .000 12 .438 3.366 97.146 tikrinės
13 .371 2.854 100.000 reikšmės
Extraction Method: Principal Component Analysis.
Duomenims FA labai gerai tinka.
SPSS faktorių svorių matrica

prieš sukimą
F2-kairieji, F3-dešinieji, SPSS faktorių svorių matrica
po sukimo
81
KĄ DARO?
• Regresijos išplėtojimas, kai nurodome koks

intervalinis nuo kokių kitų intervalinių
HLM kintamųjų priklauso.
• Regresijos lygties daugikliai yra naujų
Tiesiniai hierarchiniai kintamųjų priklausomi kintamieji.
modeliai
V.Čekanavičius, G.Murauskas 2
PAVYZDYS Idėja:
• Norime išsiaiškinti, kaip matematikos testo
mokykla 3 lygmuo
rezultatus veikia socialinė-ekonominė aplinka
ir klasė.
• Duomenys turi hierarchinę struktūrą, nes
klasės charakteristikos daro įtaką visiems tos 1 klasė 2 klasė 2 lygmuo
klasės mokiniams.
1 lygmuo
mokiniai
V.Čekanavičius, G.Murauskas 3 V.Čekanavičius, G.Murauskas 4
PASTABOS: Tipinė HLM tyrimo eiga

• Ir pirmojo ir antrojo lygmens stebėjimų turi • Pradžioje visada sudaromas besąlyginis
būti nemažai – negalima hierarchinio modelio (nulinis) modelis.
taikyti tik porai mokyklų. • Sudaromas sudėtingesnis modelis.
• Matuojami kintamieji – normalūs arba • Modeliai lyginami, aiškinamasi kuris geresnis.
kategoriniai. • Visi modelių lyginimai prasmingi tik tada, kai
• Kategorinių kintamųjų neturėtų būti labai jie sudaryti tiems patiems duomenims.
daug.
82
Besąlyginis HLM modelis Besąlyginis HLM modelis
• HLM iliustracijai pasirinktas duomenų poaibis –
kaimo ir Vilniaus miesto mokyklų 8 klasės moksleivių
• Besąlyginis (nulinis) modelis svarbus tuo, kad tyrimo rezultatai.
kiti hierarchiniai modeliai su juo lyginami.
• Besąlyginio modelio analizė padeda atsakyti į • Turime 559 mokinio iš 27 mokyklų matematikos
klausimą ar apskritai galima kalbėti apie testo rezultatus ir įvairius mokyklą bei mokinį
apibūdinančius duomenis.
hierarchinių modelių tinkamumą.
• Besąlyginį HLM modelį sudaro lygtys abiems –
mokinio ir mokyklos – lygmenims.
Besąlyginis HLM modelis MODELIO IDĖJA

• Vadovausimės tokia logika:
• mokinio rezultatų skirtumas nuo visos mokyklos vidurkio
atspindi tai, kad būdinga tik tam mokiniui – jo gabumus, namų
aplinką, repetitoriaus patirtį ir pan.
Mokinio
• Mokyklos rezultatas
rezultatas = mokyklos
= visų mokyklų vidurkis+
vidurkis+šios mokyklos
įtaka. individualūs skirtumai nuo vidurkio.
• Analogiškai aprašome mokyklos lygmenį:
• Mokyklos rezultatas = visų mokyklų vidurkis+šios mokyklos

Mokyklos rezultatas = visų mokyklų vidurkis+šios mokyklos įtaka.
įtaka.
Besąlyginis HLM modelis Besąlyginis HLM modelis

• Mokinio lygmuo:
MAT     u 0  e
MAT  0  e • Parametras   nusako visų mokyklų matematikos
testo rezultatų vidurkį.
• Mokyklos lygmuo: • Mokyklų skirtumus rodo kintamojo u0
 0     u 0 dispersija  00 .
• Mokinių individualius skirtumus – kintamojo
• Jungtinis modelis:
e dispersija  2 .
MAT     u 0  e • Kuo dispersijos didesnės, tuo didesni ir atitinkami
skirtumai.
83
Besąlyginis HLM modelis Besąlyginio modelio tyrimas su SPSS

•  - fiksuoto poveikio parametras, • Duomenys turi tradicinę struktūrą – vienam
mokiniui skiriama viena eilutė.
 00 ir - 2 - atsitiktinio poveikio parametrai. • Be to, yra kintamasis IDMOK,

kuriame nurodytas mokyklos kodas.
Besąlyginio modelio tyrimas su SPSS Besąlyginio modelio tyrimas su SPSS

duomenys
Atidaromas Mixed Models langas.
čia

po to -
čia
mokyklos
kodas
perkeliame
tada
čia
84
keičiame į
Unstructured
Tada,
čia
pažymime
perkeliame
varnos
OK
• SPSS programa pateikia informacinių • Informacinių kriterijų reikšmės. Reikės vėliau –

• AIC (Akaikės), lyginant du modelius.
• AICC (Hurvičiaus ir Tsai),
• CAIS (Bozdogano), • mažesnė reikšmė –
• BIC (Švarco – Bajeso) kriterijų reikšmes.
geriau.
• Į šias reikšmes atsižvelgiama, kai lyginami du
modeliai.
• Modelis, turintis mažesnes informacinių kriterijų
reikšmes, geriau suderintas su duomenimis.
85
Pateikiamas parametro  įvertis ˆ  499,47
• Primename, kad   - - tai bendras visų mokyklų

Be to patikrinama hipotezė H 0 :    0 matematikos testo MAT vidurkis.


Kadangi p<0,05 , tai H1 :    0
stat.reikšmingai    0 . • Statistinės hipotezės išvada, kad jis nelygus nuliui
nėra itin vertinga (niekas ir nesitikėjo, kad visi bus
beraščiai).
• Įvertis ˆ  499,47 -- daug svarbesnis.

Tikrinamos dvi hipotezės apie I ir II lygmenų paklaidų • Abi nulinės hipotezės atmetamos, darome
dispersijas:
išvadą, kad
 00  0
, ir 2
 0
H 0 :    0 H 0 :  2  0
  • Gavome patvirtinimą, kad modelis nepilnai
H1 :    0 H1 :  2  0 paaiškina rezultatų skirtumus.
Taip pat pateikiami šių atsitiktinių parametrų įverčiai.
• Gauti dispersijų įverčiai yra dideli: • Nagrinėjant besąlyginį modelį patartina suskaičiuoti
tarpklasinės koreliacijos koeficientą ICC (Intraclass
• ˆ  2356,11 ir ˆ 2
00   5117,19 . correlation coefficient), kuris parodo, kaip stipriai
skiriasi grupių (mokyklų) rezultatai, lyginant su
rezultatais grupėse.
Taigi, modelis duomenims tinka blogai.
ˆ00
ICC 
ˆ00  ˆ 
• Kuo ICC didesnis, tuo labiau įtikėtina, kad reikia
atsižvelgti į hierarchinę duomenų struktūrą.
86
• Pavyzdyje • Ir ICC ir atsitiktinių parametrų įverčiai rodo, kad reikia

sudaryti sudėtingesnį modelį.
2356,11 • Įtraukdami naujus I ir II lygmenų kintamuosius,
ICC   0,315... siekiame sumažinti įverčių
2356,11  5117,19
ˆ00  2356,11 ˆ 2  5117,19
• Tai nėra itin didelė reikšmė. Ji interpretuojama taip:
apie 31,5 procento mokinio rezultatų priklauso nuo didumus (jie parodo tuos mokinių ir mokyklų
mokyklos. skirtumus, kurių nepaaiškina modelis).
HLM modelis su antrojo lygmens HLM modelis su antrojo lygmens

intervaliniu kintamuoju intervaliniu kintamuoju
Manome, kad : • Grafiškai modelis atrodo taip:
• mokinio matematikos testo rezultatas
priklauso nuo jo socialinio ir ekonominio
statuso (CSES);
• mokykos įtaka visiems mokiniams vienoda;
• mokyklos įtakos stiprumą lemia jos mokinių
socialinio ir ekonominio statuso vidurkis
(MSES).

Reikalavimai kintamiesiems: • Pasižiūrime, kurio lygmens kintamųjų turime:
• Priklausomas kintamasis (MAT) būtinai
intervalinis.
• pirmojo (mokinio) lygmens kintamieji: CSES.
• Kiti kintamieji intervaliniai arba kategoriniai
(pseudokintamieji). • antrojo (mokyklos) lygmens kintamieji: MSES.
• Šiame pvz. visi kiti kintamieji CSES, MSES yra
intervaliniai.
• Paklaidos (liekanos) – normaliai
pasiskirsčiusios ir nepriklausomos.
87
• Mokinio lygmens lygtis gana akivaizdi: • Antrojo lygmens kintamieji į modelį įtraukiami,
MAT    CSES  e.
tariant, kad atitinkami
atsitiktiniai.
 koeficientai yra
• Laikomasi tokio principo:
• Čia e žymi atsitiktinę paklaidą, kuri yra normaliai • Kintamieji, kurie veikia visus mokinius vienodai,
pasiskirsčiusi su nuliniu vidurkiu ir nežinoma įtraukiami į lygtį, aprašančią laisvą narį  0 .
dispersija  2 . Ši dispersija atspindi skirtumus tarp • Kintamieji, kurie turi sąveiką su CSES, įtraukiami į
mokinių, atsiradusius ne dėl mokyklų įtakos. lygtį, aprašančią koeficientą  .
1

• Taigi, antrojo lygmens lygtys yra tokios: • Primename, kad dispersijos
 00 , 11
      01MSES  u 0 ,
• atspindi rezultatų skirtumus, atsirandančius dėl
1   1  u1. mokyklų įtakos.
• Tačiau tik tuos skirtumus, kurių nepaaiškina
• Čia  ij nežinomos konstantos. pasirinktasis modelis.
• Kuo šios dispersijos mažesnės, tuo modelis geriau
• Paklaidos u 0 , u1 turi dispersijas  00 , 11 ir gali suderintas su duomenimis.
koreliuoti (kovariacija  ).
01

• Galima sudaryti jungtinę lygtį: • Fiksuoto (pastovaus) poveikio parametrai
MAT      01MSES   CSES    ,  01,  .

 e  u 0  u1CSES . • atsitiktinio poveikio parametrai (liekanų e, u 0 , u
dispersijos ir kovariacijos):
• Matome, kad modelyje išsiskiria fiksuotų poveikių
komponentas ir  00 , , ,   .
• atsitiktinių poveikių komponentas.
88
HLM modelis su antrojo lygmens
Modelio tyrimas su SPSS
intervaliniu kintamuoju
• Kintamieji prie  vadinami fiksuoto poveikio Atidaromas Mixed Models langas.
kintamaisiais, o kintamieji prie u – atsitiktinio
poveikio kintamaisiais.
• Fiksuoto poveikio kintamieji: CSES ir MSES.
• Atsitiktinio – kintamasis CSES. čia
MAT      01MSES   CSES 

 e  u 0  u1CSES .
Modelio tyrimas su SPSS Modelio tyrimas su SPSS

priklauso po to,
mas čia
mokyklos
kodas
visi kiti
intervaliniai
tada
čia

po to
čia
Perkeliam
visus
fiksuoto
poveikio
kintamuosius
varna
89
Keičiam į varna
Ustructured
po to
keliam atsitiktinio čia
poveikio kintamąjį
perkeliam
varnos
OK

Planas: • Akaikės ir kitų indeksų sumažėjimas bent per 10
• Lyginsime AIC ir kitus informacinius indeksus su vienetų jau laikomas svarbiu.
besąlyginiu modeliu.
• Tikrinsime,kurie fiksuoti parametrai statistiškai
nereikšmingi.
• Tikrinsime, kurie atsitiktiniai parametrai statistiškai
nereikšmingi.
• Tikrinsime, kiek sumažėjo atsitiktinių parametrų
dispersijų įverčiai.
Nujasis modelis Besąlyginis
90
Visi pastovaus poveikio kintamieji statistiškai • Gauti atsitiktinių parametrų įverčiai :
reikšmingi. ˆ  175,94
 ˆ00  559,48 ˆ01  0,371 ˆ11  9,19
ˆ1  16,56 ˆ1  8,04
ˆ   4290,92

• Matome, kad  0 ir 1 statistiškai Įsitikiname, kad respondentų skirtumus
reikšmingai nekoreliuoja, nes atitinkama p atspindinti dispersija nėra itin maža:
reikšmė lygi 0,99; o ir pats kovariacijos įvertis ˆ 2  4290,92
mažas:ˆ01  0,371 . Vis dėlto, lyginant su besąlyginio modelio
• Taip pat matome, kad parinktoji antrojo analogiška dispersija (s2 = 5117,19), aišku,
lygmens lygtis parametrą 1 aprašo kad dispersija ženkliai sumažėjo.
pakankamai išsamiai (atitinkama p reikšmė Galima ištirti, kuri dalis dispersijos dingo.
0,408). To negalima pasakyti apie  0 .

Formulė: Reziumuodami, galime pasakyti, kad
ˆ sena
2
 ˆ nauja
2
nagrinėjamas modelis daug geriau tinka

ˆ sena
2
duomenims nei besąlyginis modelis.
Gauname: 5117,19  4290,92 Testo rezultatai matuojami šimtais balų. Todėl
 0,161...
5117,19 rezultatų paklaidos standartinis nuokrypis
Interpretuojame taip: lyginant su besąlyginiu modeliu, nėra labai didelis ˆ  65,49...
16% sumažėjo modeliu nepaaiškintų mokinių
Tai įgalina modelį laikyti pakankamai geru.
rezultatų skirtumų. Gana nemenkas išlošimas.
Žinoma, tai nereiškia, kad nėra geriau
duomenims tinkančių modelių.
91
Jei norime daryti prognozes, tai tiesiog įstatome Įstatę konkrečias kintmųjų CSES ir MSES
fiksuotų parametrų įverčius į jungtinę lygtį: reikšmes, gautume testo rezultato prognozę
MAT  ˆ  ˆ01MSES  ˆCSES. konkrečiam mokiniui.
Be to, ši regresinė lygtis leidžia įvertinti mokyklos
Nagrinėtiems duomenims gauname: įtaką. Iš tikro, kiekvienas papildomas MSES
balas padidina testo rezultatą 16,56 taško.
MAT  175,94  16,56MSES  8,04CSES. MAT  175,94  16,56MSES  8,04CSES.
Kategorinis kintamasis Kategorinis kintamasis

• Ištirsime modelį su antrojo lygmens kategoriniu • Mokinio matematikos testo rezultatas priklauso nuo
kintamuoju VK, nurodančiu mokyklos priklausomybę jo socialinio ir ekonominio statuso:
Vilniaus miestui.
MAT    CSES  e.
• Kategorinis (nebūtinai dvireikšmis) kintamasis,
patalpinamas į laukelį Factor(s). • Mokyklos įtaka priklauso nuo mokyklos socialinio ir
• Tirsime ankstesnį modelį, papildytą šiuo antrojo ekonominio statuso vidurkio ir mokyklos lokalizacijos:
lygmens kintamuoju.
• Suformuluosime sąlygas tiksliau.       MSES   1 VK  u 0 .
Kategorinis kintamasis Kategorinis kintamasis

• Vilniaus mokyklose socialinio ir ekonominio statuso • Jungtinė lygtis:
reikšmė kitokia nei kitose mokyklose: M AT   00   01M SES   10CSES
   10   11VK  u1.   02VK   12VK  CSES
• Čia e turi dispersiją  2 .  [u1CSES  u 0  e].
• Fiksuotieji kintamieji: CSES, MSES, VK, VKxCSES .
• Paklaidos u 0 , u1 turi dispersijas  00 , 11 ir gali
• Atsitiktiniai kintamieji: CSES ir postūmis.
koreliuoti (kovariacija  0 1 ).
92
Atidaromas Mixed Models langas.

mokyklos
kodas
čia
tada
čia

priklauso po to,
mas čia
Perkeliam
visus
kategorinis
fiksuoto
poveikio
kintamuosius
visi kiti
intervaliniai varna

Keičiam į varna
po to Ustructured
čia
keliam atsitiktinio
poveikio kintamąjį
perkeliam
93
varnos
po to
čia

Planas:
• Lyginsime AIC ir kitus informacinius indeksus su
ankstesniu modeliu.
• Tikrinsime,kurie fiksuoti parametrai statistiškai
nereikšmingi.
OK
• Tikrinsime, kurie atsitiktiniai parametrai statistiškai
nereikšmingi.
• Tikrinsime, kiek sumažėjo atsitiktinių parametrų
dispersijų įverčiai.

• Akaikės ir kitų indeksų sumažėjimas bent per 10 Ne visi fiksuoto poveikio kintamieji statistiškai
vienetų jau laikomas svarbiu. reikšmingi.
Nujasis modelis Ankstesnis modelis

94
Modelio tyrimas su SPSS Svarbi problema
• Matome, kad reikėtų pabandyti iš modelio • Jei I lygmenyje įtrauksime labai stipriai su rezultatu
pašalinti kintamųjų sąveiką VKxCSES . Galbūt koreliuojantį kintamąjį, tai paaiškės, kad joks HLM
modelis netinka.
ir atsisakyti konstantos .
• Pvz., jei įtrauksime fizikos testo rezultatą FIZ:
• Išsamesnė pavyzdžio analizė pateikta knygos
skyrelyje HLM modelių tyrimas SPSS MAT    FIZ  e.
programa.
• Paaiškės, kad geriau mokantys fiziką, geriau ir
matematiką išmano. Ir kas iš to? Norint pagerinti
matematikos žinias, reikia sustiprinti fizikos mokymą?
Kažin, kažin.
Svarbi problema METODINIAI PATARIMAI

• Modelį reikia sudaryti sąmoningai mąstant apie • Pradedame nuo besąlyginio modelio.
• Kurie kintamieji yra pastovaus poveikio, o kurie – kintamojo
tyrimo tikslus, o ne pagal stipriausias koreliacijas. padės nustatyti padės toks algoritmas:
• Norime sužinoti, kas daro įtaką matematikos 1) Nustatomi pirmojo ir antrojo lygmens kintamieji.
žinioms. 2) Apibrėžiamos spėjamos priklausomybės.
3) Lygtimis užrašoma, kas nuo ko priklauso. Reikia nepamiršti
• Pavyzdžiui, koks yra mokyklos vaidmuo (II lygmuo). antrojo lygmens lygtyse pridėti atsitiktinę paklaidą u. Pirmojo
lygmens lygčiai pridedama e.
• Arba koks socioekonominio statuso vaidmuo
4) Antrojo lygmens lygtis įstatoma į pirmojo lygmens lygtį.
(I lygmuo). 5) Jungtinėje lygtyje surenkami nariai prie u ir e.
6) Kintamieji be u - pastovaus poveikio; kintamieji su u -
atsitiktinio poveikio. Beje, tas pats kintamasis gali įeiti į abu
sąrašus.
95

SPSS Konspektai 2015

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

SPSS Konspektai 2015

Uploaded by

Copyright:

Available Formats

Struktūra

SPSS sudaro trys blokai (langai):

Struktūra Duomenų langas

tipiškas vaizdas paleidus SPSS programą – tuščias duomenų langas.

Failo atidarymas Failo atidarymas

Failas atidaromas – iš bendrojo sąrašo...

kairiajame kampe dega 'data view' ir....

Tuščio naujo failo atidarymas

Matome duomenis, jei Duomenų struktūra

© V.Čekanavičius, G.Murauskas 9 © V.Čekanavičius, G.Murauskas 10

Duomenų struktūra Kintamųjų charakteristikos

© V.Čekanavičius, G.Murauskas 13 © V.Čekanavičius, G.Murauskas 14

Kintamojo aprašas (etiketė) Kintamojo praleistos reikšmės

© V.Čekanavičius, G.Murauskas 15 © V.Čekanavičius, G.Murauskas 16

Kintamojo reikšmių aprašai Visą informaciją apie kintamuosius

1. Tai tekstiniai komentarai išsamiau

Kintamųjų sąrašas Duomenų vedimas

© V.Čekanavičius, G.Murauskas 21 © V.Čekanavičius, G.Murauskas 22

Kintamųjų aprašymas Kintamųjų aprašymas

vardas tipas variable čia 'value

© V.Čekanavičius, G.Murauskas 25 © V.Čekanavičius, G.Murauskas 26

Aprašomoji statistika Dažnių lentelė su SPSS

© V.Čekanavičius, G.Murauskas 27 © V.Čekanavičius, G.Murauskas 28

Dažnių lentelė su SPSS Dažnių lentelė su SPSS

Frequency Percent Valid Percent

Standartinis nuokrypis Vidurkis ir Std su SPSS

• Failas: GSS93 subset

Vidurkis ir Std su SPSS Vidurkis ir Std su SPSS

© V.Čekanavičius, G.Murauskas 35 © V.Čekanavičius, G.Murauskas 36

N Minimum Maximum Mean Std. Deviation

© V.Čekanavičius, G.Murauskas 37 © V.Čekanavičius, G.Murauskas 38

Duomenų atranka SPSS Duomenų atranka SPSS

Duomenų atranka SPSS 'select cases' sintaksė

select cases if = atrinkti eilutes, jei ....

Tada ‘Continue’ ir ‘OK’

© V.Čekanavičius, G.Murauskas 43 © V.Čekanavičius, G.Murauskas 44

Duomenų atranka SPSS Duomenų atranka SPSS

N MinimumMaximum Mean Std. Deviation

© V.Čekanavičius, G.Murauskas 45 © V.Čekanavičius, G.Murauskas 46

select cases - pastabos select cases - pastabos

© V.Čekanavičius, G.Murauskas 49 © V.Čekanavičius, G.Murauskas 50

Ką gali komanda Compute:

1. Sukurti kintamojo (stulpelio) kopiją.

© V.Čekanavičius, G.Murauskas 53 © V.Čekanavičius, G.Murauskas 54

naujas kintamasis zzz=1, jei age>30 ir zzz=0, jei age =<30.

© V.Čekanavičius, G.Murauskas 55 © V.Čekanavičius, G.Murauskas 56

Compute: 0 - 1 kintamasis Compute: sudėtingesni kodai

1. Simbolinį (string) –kintamąjį

© V.Čekanavičius, G.Murauskas 59 © V.Čekanavičius, G.Murauskas 60

Automatic recode Automatic recode

© V.Čekanavičius, G.Murauskas 63 © V.Čekanavičius, G.Murauskas 64

1. Iš skaitinio kintamojo gauna naują skaitinį

© V.Čekanavičius, G.Murauskas 65 © V.Čekanavičius, G.Murauskas 66

mes visada rinksimės ‘into Different Variables'

© V.Čekanavičius, G.Murauskas 67 © V.Čekanavičius, G.Murauskas 68

Recode naujas Recode

© V.Čekanavičius, G.Murauskas 73 © V.Čekanavičius, G.Murauskas 74

Recode: sudėtingesnis pvz. Recode: sudėtingesnis pvz.

Tam, kad koduotos praleistos reikšmės ir

© V.Čekanavičius, G.Murauskas 75 © V.Čekanavičius, G.Murauskas 76

Recode: sudėtingesnis pvz. Recode: sudėtingesnis pvz.

nuo nuo ...

© V.Čekanavičius, G.Murauskas 79 © V.Čekanavičius, G.Murauskas 80