You are on page 1of 95

Struktūra

SPSS sudaro trys blokai (langai):


1. Duomenų langas (data). Jame galima
SPSS - 1 matyti:
a) duomenis;
b) kintamųjų aprašymą.
Duomenų vedimas, aprašomoji 2. Rezultatų langas (output).
statistika, duomenų atranka,
3. Sintaksės langas (syntax).
perkodavimas

© V.Čekanavičius, G.Murauskas 2

Struktūra Duomenų langas


SPSS Rezultatų langas (output) gaunamas
atlikus skaičiavimus. Rezultatus galima
perkelti į Word arba Powerpoint failus.
SPSS Sintaksės langas (syntax)
naudojamas, kai rašoma programa.
Dažniausiai sintaksinės programos ikonėlės
neprireikia.

tipiškas vaizdas paleidus SPSS programą – tuščias duomenų langas.


© V.Čekanavičius, G.Murauskas 3 © V.Čekanavičius, G.Murauskas 4

Failo atidarymas Failo atidarymas


čia

čia

Failas atidaromas – iš bendrojo sąrašo...


© V.Čekanavičius, G.Murauskas 5
Failas atidaromas –©iš neseniai naudotų failų sąrašo 6
V.Čekanavičius, G.Murauskas

1
Tuščio duomenų lauko gavimas Matome duomenis, jei

čia

čia

kairiajame kampe dega 'data view' ir....

Tuščio naujo failo atidarymas


© V.Čekanavičius, G.Murauskas 7 © V.Čekanavičius, G.Murauskas 8

Matome duomenis, jei Duomenų struktūra


SPSS ideologija:
1. Vienam respondentui viena eilutė
(case).
2. Kintamieji (klausimai) - stulpeliai
čia
(variables).

....ikonėlė 'atspausta'

© V.Čekanavičius, G.Murauskas 9 © V.Čekanavičius, G.Murauskas 10

Duomenų struktūra Kintamųjų charakteristikos


kintamųjų
vardai
1. Vardas (name).
2. Tipas (type).
3. Kintamojo 'etiketė' (variable label).
4. Praleistų reikšmių kodai (missing value).
5. Kintamojo reikšmių 'teiketės' (value label).

duomenys
© V.Čekanavičius, G.Murauskas 11 © V.Čekanavičius, G.Murauskas 12

2
Kintamojo vardas (name) Kintamojo tipai (type)

1. Prasideda raide.
1. Simbolinis (string) -pavardėms ir pan. Turi
2. Neturi tarpų. tiktai ilgį;
3. K1; K1.1; Lmnsvs - gerai; 2. Skaitinis (numeric) – skaičiams, bei
4. Ali Baba, 1grupė – blogai. kodams. Standartas (pagal nutylėjimą) 8
5. Kintamojo vardas – stulpelio viršuje. pozicijos, iš jų 2 po kablelio.Pvz. 313,72.
3. Kiti tipai – naudojami retai.

© V.Čekanavičius, G.Murauskas 13 © V.Čekanavičius, G.Murauskas 14

Kintamojo aprašas (etiketė) Kintamojo praleistos reikšmės


(variable label) (missing values)
1. Tai tekstinis komentaras, išsamiau 1. Tai neatsakytų klausimų kodai.
aprašantis kintamąjį. 2. Pvz. kai respondentas nežino atsakymo
2. Pvz. kintamojo vardas – K1, o aprašas vedame kodą 0.
(label) –'gimimo vieta'. 3. Jei 0 bus aprašytas, kaip 'missing value',
3. Statistinei analizei – nebūtinas. tai SPSS programa traktuos jį taip, kaip ir
4. Naudojamas tik, kad būtų patogiau dirbti. tuščią langelį.

© V.Čekanavičius, G.Murauskas 15 © V.Čekanavičius, G.Murauskas 16

Kintamojo reikšmių aprašai Visą informaciją apie kintamuosius


(etiketės) - value labels galime rasti kintamųjų sąraše:

1. Tai tekstiniai komentarai išsamiau


aprašantys kintamojo reikšmių kodus.
2. Pvz. kintamajame (stulpelyje) naudosime
tik kodus 1 arba 2, o 'value labels'
paaiškins, kad 1- vyr., o 2 – mot.
3. Statistinei analizei – nebūtinas. kintamųjų
4. Naudojamas tik tik, kad būtų patogiau sąrašas
dirbti. © V.Čekanavičius, G.Murauskas 17 © V.Čekanavičius, G.Murauskas 18

3
Kintamųjų sąrašas Kintamųjų sąrašas
kintamojo
vardas
praleistos
reikšmės

kintamojo
aprašas tipas- skaitinis
(F-raidė)
kai kurių
reikšmių
paaiškinimas

19 © V.Čekanavičius, G.Murauskas 20

Kintamųjų sąrašas Duomenų vedimas


1. Aprašome kintamuosius ('variable view'
lange).
2. Vedame duomenis ( 'data view' lange).
galimybė pažiūrėti
į duomenis

© V.Čekanavičius, G.Murauskas 21 © V.Čekanavičius, G.Murauskas 22

Kintamųjų aprašymas Kintamųjų aprašymas


'variable view' lange 'variable view' lange

reikšmė

vardas tipas variable čia 'value


label label'
'etiketė'

po to čia
© V.Čekanavičius, G.Murauskas 23 © V.Čekanavičius, G.Murauskas 24

4
Duomenų vedimas Duomenų vedimas
'data view' lange
Praktiniai patarimai:
1. Duomenys vedami klaviatūra.
2. Pelė naudojama saikingai.
naudojame 3. Vedant duomenis eilute - naudoti 'tab'
klaviatūrą klavišą.
4. Vedant duomenis stulpeliu – naudoti
'enter' klavišą.

© V.Čekanavičius, G.Murauskas 25 © V.Čekanavičius, G.Murauskas 26

Aprašomoji statistika Dažnių lentelė su SPSS


Susipažinsime su:
1. Dažnių lentele. • Suskaičiuosime, kiek procentų tirtų
amerikiečių turi tris vaikus.
2. Vidurkiu.
• naudosime failą 'GSS93subset' ir
3. Dispersija.
kintamąjį
4. Standartiniu nuokrypiu.
• 'childs'
Pastaba. Yra ir kitų charakteristikų.

© V.Čekanavičius, G.Murauskas 27 © V.Čekanavičius, G.Murauskas 28

Dažnių lentelė su SPSS Dažnių lentelė su SPSS

čia
perkėlimui
spaudžiam
čia

© V.Čekanavičius, G.Murauskas 29
varna tupi © V.Čekanavičius, G.Murauskas 30

5
Dažnių lentelė su SPSS Dispersija
childs Number of Children

Frequency Percent Valid Percent


Cumulative
Percent
1) Atspindi reikšmių išsibarstymą apie vidurkį.
Valid 0
1
414 27,6 27,7 27,7 2) kuo didesnė – tuo didesni skirtumai tarp reikšmių.
242 16,1 16,2 43,9
2 398 26,5 26,6 70,5 3) pvz. iš dviejų mokymo programų, užtikrinančių
3
4
226
115
15,1
7,7
15,1
7,7
85,6
93,3
vienodus vidutinius pasiekimus, geresnė ta, kurios
5 58 3,9 3,9 97,2 mažesnė dispersija.
6 14 ,9 ,9 98,1
7 7 ,5 ,5 98,6
8 Eight or More 21 1,4 1,4 100,0
Total 1495 99,7 100,0
Missing 9 NA 5 ,3 (x 1  x ) 2  (x  x ) 2  ... (x  x)2
Total 1500 100,0 s2  2 n
n -1
'percent' – jei su praleistom reikšmėm, 'valid percent'- jei be
© V.Čekanavičius, G.Murauskas 31 © V.Čekanavičius, G.Murauskas 32

Standartinis nuokrypis Vidurkis ir Std su SPSS

• Failas: GSS93 subset

s dispersija
• Kintamasis agewed (amžius pirmą
kartą tuokiantis)
• Rasime šio kintamojo vidurkį bei
standartinį nuokrypį.
Pastaba: parodysime tik vieną iš kelių
galimų būdų.
© V.Čekanavičius, G.Murauskas 33 © V.Čekanavičius, G.Murauskas 34

Vidurkis ir Std su SPSS Vidurkis ir Std su SPSS

perkeliame
čia

© V.Čekanavičius, G.Murauskas 35 © V.Čekanavičius, G.Murauskas 36

6
Vidurkis ir Std su SPSS Duomenų atranka
(select cases)
Descriptive Statistics

N Minimum Maximum Mean Std. Deviation


• Paliekame tik dalį duomenų tolesnei
agewed Age When
First Married 1202 13 58 22,79 5,033 analizei;
Valid N (listwise) 1202
• Pvz. norime sužinoti vidutinį vyrų amžių
pirmą kartą tuokiantis.
vidutinis amžius 22,79 m • 'Select cases' statistinės analizės
neatlieka!
vidurkis std

© V.Čekanavičius, G.Murauskas 37 © V.Čekanavičius, G.Murauskas 38

Duomenų atranka SPSS Duomenų atranka SPSS


(select cases) perkeliame
tašką
po to čia

čia
nekišame
nagų
© V.Čekanavičius, G.Murauskas 39 © V.Čekanavičius, G.Murauskas 40

Duomenų atranka SPSS 'select cases' sintaksė


čia rašomos sąlygos
• kintamųjų vardai sujungiami aritmetinėmis
ir (arba) loginėmis operacijomis.
nelygu • Pvz., jei norime pasilikti tik vyrų duomenis,
(lytis užkoduota kintamuoju sex, vyrų
kodas 1), tai rašome
• sex=1
ir
arba

select cases if = atrinkti eilutes, jei ....


© V.Čekanavičius, G.Murauskas 41 © V.Čekanavičius, G.Murauskas 42

7
Duomenų atranka SPSS Duomenų atranka SPSS

'išbraukta'

Tada ‘Continue’ ir ‘OK’


Eilutės nedingsta, tik pažymimos, kaip išbrauktos.
Tolesnėje analizėje jos nebenaudojamos.

© V.Čekanavičius, G.Murauskas 43 © V.Čekanavičius, G.Murauskas 44

Duomenų atranka SPSS Duomenų atranka SPSS


• Norint 'atžymėti' visas eilutes, reikia
• Pvz. dabar suskaičiavę 'agewed' vidurkį,
gautume
Descriptive Statistics

N MinimumMaximum Mean Std. Deviation


agewed Age When
First Married 492 16 50 24,16 4,867
Valid N (listwise) 492 tašką prie
'all cases'

© V.Čekanavičius, G.Murauskas 45 © V.Čekanavičius, G.Murauskas 46

select cases - pastabos select cases - pastabos


• sąlyga taikoma kiekvienam respondentui.
• Tačiau
• pvz. norime atrinkti baltus (race=1) vyrus.
• jei norime, kad liktų baltieji bei negrai: tai
• rašome: (sex=1) & (race=1).
• rašome: (race=1) | (race=2).
• jaunesnis, nei 50 metų: age <50.
• jei parašysime (race=1)&(race=2),
• tarp 20 ir 50 m: (age>=20) & (age=<50). kompiuteris ieškos žmonių, kurie kartu ir
• baltieji vyrai, jaunesni nei 50 m, arba balti ir juodi (zebrų).
juodos moterys, vyresnės, nei 30m: • Beje, kintamųjų vardus geriau kopijuoti, o
• (sex=1& race=1 & age<50)|(sex=2 & ne rinkti patiems (mažiau klaidų).
race=2 & age>30).
© V.Čekanavičius, G.Murauskas 47 © V.Čekanavičius, G.Murauskas 48

8
select cases - pastabos select cases – simboliniai kint.
• BLOGAI • GERAI
• simbolinių kintamųjų reikšmės rašomos
• race = 1|3 • race =1| race =3
kabutėse:
• 30<age<40 • age>30 & age <40
• 30 < age • age >30
• gender='M'.
• age =15 / age =20 • age=15 | age=20 • simbolis turi būti TIKSLIAI nukopijuotas.
• [race=1] & [age =50] • (race=1) &(age=50) • gender='m' blogai.
• (race=1) (age =50) • (race=1) &(age=50) • gender=' M' blogai (tarpas po kabutės).
• (age >50) | (age <60) • tai visi respondentai-
beprasmė sąlyga.

© V.Čekanavičius, G.Murauskas 49 © V.Čekanavičius, G.Murauskas 50

Ką gali komanda Compute:

1. Sukurti kintamojo (stulpelio) kopiją.


2. Pakeisti kintamąjį (stulpelį).
COMPUTE 3. Sukurti naują kintamąjį (stulpelį).
4. Sukurti 0 – 1 stulpelį, atsižvelgiant į
sąlygas.
5. Sukurti sudėtingesnių kodų stulpelį,
atsižvelgiant į sąlygas.
Visada transformuoja stulpelius.
© V.Čekanavičius, G.Murauskas 52

Compute naujo
stulp.
Compute
vardas
kas jame bus

čia

© V.Čekanavičius, G.Murauskas 53 © V.Čekanavičius, G.Murauskas 54

9
Compute: naujas kintamasis Compute: 0 - 1 kintamasis

loginė
išraiška
dviejų kint.
vidurkis

naujas kintamasis zzz=1, jei age>30 ir zzz=0, jei age =<30.

© V.Čekanavičius, G.Murauskas 55 © V.Čekanavičius, G.Murauskas 56

Compute: 0 - 1 kintamasis Compute: sudėtingesni kodai

paspaudžiam
ir užrašom
sąlygą

naujas kintamasis
ww=1, jei age>30 .
naujas kintamasis zzz=1, jei age>30 ir zzz=0, jei age =<30.
© V.Čekanavičius, G.Murauskas 57 © V.Čekanavičius, G.Murauskas 58

Automatic recode

1. Simbolinį (string) –kintamąjį


AUTOMATIC RECODE paverčia skaitiniu;
2. Senosios reikšmės virsta naujojo
kintamojo 'value labels'.

© V.Čekanavičius, G.Murauskas 59 © V.Čekanavičius, G.Murauskas 60

10
Automatic recode Automatic recode simbolinis
kint.

čia

naujo
kint.
vardas

po to čia
© V.Čekanavičius, G.Murauskas 61 © V.Čekanavičius, G.Murauskas 62

Automatic recode Automatic recode


atsirado
skaitinis
kintamasis
senos
reikšmės
virto
'etiketėmis'

© V.Čekanavičius, G.Murauskas 63 © V.Čekanavičius, G.Murauskas 64

Recode

1. Iš skaitinio kintamojo gauna naują skaitinį


su kitokiais kodais.
RECODE 2. Gali ir iš simbolinio padaryti skaitinį,
tačiau sudėtingiau, nei automatic recode.
3. Pvz. naujame kintamajame 'islam'
musulmoniškas valstybes pažymėsime
1, budistines 2, o likusias 3.

© V.Čekanavičius, G.Murauskas 65 © V.Čekanavičius, G.Murauskas 66

11
Recode Recode
1. Kintamajame 'tikyba': musulmonai – 6,
budistai -2. Įsidėmime.

čia

mes visada rinksimės ‘into Different Variables'

© V.Čekanavičius, G.Murauskas 67 © V.Čekanavičius, G.Murauskas 68

Recode Recode

vardas atsirado
senas
kintamasis
naujojo kint.
vardas po to čia

po to čia
© V.Čekanavičius, G.Murauskas 69 © V.Čekanavičius, G.Murauskas 70

Recode naujas Recode


kodas

...bus 3

visos kitos
reikšmės...
senas
kodas budistus,
po to čia
į 2
© V.Čekanavičius, G.Murauskas 71 © V.Čekanavičius, G.Murauskas 72

12
Recode Recode: sudėtingesnis pvz.
Atsirado naujas stulpelis: Pvz. Sukursime naują kintamąjį amzkat,
kuriame pagal amžių respondentus
suskirstysime taip:
• 1 , jei amžius <30;
• 2 , jei amžius 31 – 50;
• 3, jei virš 50.

© V.Čekanavičius, G.Murauskas 73 © V.Čekanavičius, G.Murauskas 74

Recode: sudėtingesnis pvz. Recode: sudėtingesnis pvz.


nuo
Missing
mažiausio
values
iki...

Tam, kad koduotos praleistos reikšmės ir


nepamirštam
naujo vardo
liktų praleistomis reikšmėmis.

© V.Čekanavičius, G.Murauskas 75 © V.Čekanavičius, G.Murauskas 76

Recode: sudėtingesnis pvz. Recode: sudėtingesnis pvz.

nuo nuo ...


mažiausio ....iki
iki...
© V.Čekanavičius, G.Murauskas 77 © V.Čekanavičius, G.Murauskas 78

13
Recode: sudėtingesnis pvz. Recode: sudėtingesnis pvz.

nuo ...
iki
didžiausio

taip:

© V.Čekanavičius, G.Murauskas 79 © V.Čekanavičius, G.Murauskas 80

Stjudento kriterijus vienai Statistinė hipotezė:


imčiai
H 0 : μ  a

H 1 : μ  a
Hipotezė apie vidurkio lygybę skaičiui
(duomenyse vienas intervalinis stulpelis,
skaičius a duotas sąlygoje.)
© V.Čekanavičius, G.Murauskas 81 © V.Čekanavičius, G.Murauskas 82

Statistinė išvada SPSS


su p - reikšme
T-testas vienai imčiai, kai
H0 atmetame (vidurkis stat. reikšmingai
skiriasi nuo a ), jei
p  0.05 Edukologas nori sužinoti ar 20
H0 neatmetame (vidurkis stat. reikšm. studentų SAT skiriasi nuo 1250.
nesiskiria nuo a), jei
p  0.05
Čia - reikšmingumo lygmuo
© V.Čekanavičius, G.Murauskas 83 © V.Čekanavičius, G.Murauskas 84

14
SPSS Duomenys
SPSS
Štai čia!

© V.Čekanavičius, G.Murauskas 85 © V.Čekanavičius, G.Murauskas 86

SPSS SPSS
kintamasis
imties vidurkis

One-Sample Statistics

Std. Error
N Mean Std. Deviation Mean
SAT 20 1162,5000 279,97885 62,60517

reikšmė ir std nuokrypis

© V.Čekanavičius, G.Murauskas 87 © V.Čekanavičius, G.Murauskas 88

SPSS reikšmė
Išvados formulavimas
• Pritaikę Stjudento testą gavome, kad
One-Sample Test
imties vidurkis (1162,5) statistiškai
Test Value = 1250
95% Confidence
reikšmingai nesiskiria nuo 1250.
Interval of the
Mean Difference
t df Sig. (2-tailed) Difference Lower Upper • Skirtumas pakankamai didelis. Galbūt jis
SAT -1,398 19 ,178 -87,50000 -218,5341 43,5341
statistiškai nereikšmingas dėl mažo
stebėjimų skaičiaus (jų buvo tik 20).
kadangi p >=0.05,
p-reikšmė tai st.reikšm. nesiskiria
© V.Čekanavičius, G.Murauskas 89 © V.Čekanavičius, G.Murauskas 90

15
Kada taikomas

Stjudento t kriterijus,  Dvi imtys, duomenys gaunami poromis


(tiriam vyrą-žmoną, motiną – dukterį,
taikomas priklausomoms ekspertai vertina dvi gražuoles).
imtims (porinis t testas)  Dažnai duomenys gaunami, dukart
išmatavus tą patį respondentą.
 Duomenyse du stulpeliai. Abiejuose
Dviejų vidurkių lygybė intervaliniai kintamieji. Jų vidurkiai ir
lyginami.

© V.Čekanavičius, G.Murauskas 91 © V.Čekanavičius, G.Murauskas 92

Statistinė hipotezė: Statistinės išvados


su p - reikšme

H0: x = y H0 atmetame (vidurkiai stat. reikšmingai


skiriasi) , jei
p<
H1: x = y
H0 neatmetame (vidurkiai stat. reikšm.
nesiskiria), jei
p >=
(hipotezė formuluojama populiacijoms) Čia - reikšmingumo lygmuo.
© V.Čekanavičius, G.Murauskas 93 © V.Čekanavičius, G.Murauskas 94

Pavyzdys SPSS
 ar pirmadieniais ir penktadieniais vienodai Stjudento t kriterijus,
ilgai kalbama telefonu? taikomas priklausomoms imtims
 abi dienas (p, pt) slapta stebėti tie patys
(pvz. apie telefono pokalbius
vienos firmos darbuotojai.
pirmadienį ir penktadienį)
 duomenys: (20,32), (40,45), (15,11),
 duomenys greta
(120,110), (34,39), (27,24), (33,35),
(40,36), (20,19), (10,15) min. 

© V.Čekanavičius, G.Murauskas 95 © V.Čekanavičius, G.Murauskas 96

16
SPSS SPSS

Štai čia!

duomenys © V.Čekanavičius, G.Murauskas 97 © V.Čekanavičius, G.Murauskas 98

SPSS SPSS
imčių vidurkiai

Paired Samples Statistics Paired Samples Test

Std. Error Paired Differences


Mean N Std. DeviationMean 95% Confidence
Interval of the
Pair 1 PIRMAD 35.9000 10 31.28880 9.89439 Std. Error Difference
Sig.
(2-taile
PENKTAD 36.6000 10 28.04441 8.86842 Pair 1 PIRMAD -
Mean Std. Deviation Mean Lower Upper t df d)
-.7000 6.32543 2.00028 -5.2249 3.8249 -.350 9 .734
PENKTAD

p-reikšmė
ir std nuokrypiai vidurkiams

© V.Čekanavičius, G.Murauskas 99 © V.Čekanavičius, G.Murauskas 100

SPSS
Išvados formulavimas
Paired Samples Test • Pritaikę Stjudento testą gavome, kad nėra
statistiškai reikšmingo skirtumo tarp to,
Paired Differences
95% Confidence
kiek vidutiniškai laiko prakalbama
Interval of the
Difference
Sig. pirmadieniais ir penktadieniais.
Std. Error (2-taile
Mean Std. Deviation Mean Lower Upper t df d)
Pair 1 PIRMAD -
PENKTAD -.7000 6.32543 2.00028 -5.2249 3.8249 -.350 9 .734

kadangi p>0.05, vidurkiai statistiškai reikšmingai nesiskiria

© V.Čekanavičius, G.Murauskas 101 © V.Čekanavičius, G.Murauskas 102

17
Pastabos
Stjudento t kriterijus, • Lyginame dviejų nepriklausomų
grupių vidurkius,
taikomas nepriklausomoms
• pvz., dviejų grupių vidutinius pažymius.
imtims
• Duomenyse visada DU skirtingo tipo
stulpeliai:
(dviejų vidurkių lygybė)  viename – intervalinis rezultatas
(pvz.pažymys),
 kitame - grupės kodas (pvz., 1 arba 2)
© V.Čekanavičius, G.Murauskas 103 © V.Čekanavičius, G.Murauskas 104

Statistinė hipotezė: Statistinės išvados,


kai reikšmingumo lygmuo 0,05

H0: x = y H0 atmetame (vidurkiai stat. reikšmingai


skiriasi) , jei
p< 5
H1: x = y
H0 neatmetame (vidurkiai stat. reikšm.
nesiskiria), jei
p >= 5
(hipotezė formuluojama populiacijoms)

© V.Čekanavičius, G.Murauskas 105 © V.Čekanavičius, G.Murauskas 106

SPSS
SPSS
Stjudento t kriterijus,
taikomas nepriklausomoms Štai čia!

imtims
(pvz. apie egzamino pažymio
viešinimą)
 magistrai: užkoduoti 1
 fukseliai: užkoduoti 2
 duomenys
© V.Čekanavičius, G.Murauskas 107 © V.Čekanavičius, G.Murauskas 108

18
SPSS grupių
intervalinis
kodai SPSS

grupė

po to čia
Po to ‘Continue’ ir ‘OK’.
© V.Čekanavičius, G.Murauskas 109 © V.Čekanavičius, G.Murauskas 110

SPSS SPSS
Independent Samples Test
imčių vidurkiai
Levene's Test
for Equality of
Group Statistics Variances t-test for Equality of Means

95% Confidence
Std. Error Std.
Interval of the
Sig. Mean Error
GRUPE N Mean Std. Deviation Mean (2-taile Differe Differe Difference
BALAS 1.00 10 7.5000 1.58114 .50000 F Sig. t df d) nce nce Lower Upper
BALAS Equal variances
.058 .813 2.909 18 .009 2.1000 .72188 .58339 3.61661
2.00 10 5.4000 1.64655 .52068 assumed
Equal variances not
assumed 2.909 17.971 .009 2.1000 .72188 .58321 3.61679

ir std nuokrypiai dispresijas jei p >=0.05, tai lygios


laikome lygiomis
© V.Čekanavičius, G.Murauskas 111 © V.Čekanavičius, G.Murauskas 112

SPSS
Išvados formulavimas
Independent Samples Test

Levene's Test
for Equality of • (kadangi p= 0.009<0.05, tai vidurkiai
p-reikšmė Variances t-test for Equality of Means
skiriasi statistiškai reikšmingai)
vidurkiams 95% Confidence
Std.
Sig. Mean Error Interval of the
Difference
F Sig. t df
(2-taile Differe Differe
d) nce nce Lower Upper • Pritaikę Stjudento testą gavome, kad
BALAS Equal variances
assumed
.058 .813 2.909 18 .009 2.1000 .72188 .58339 3.61661 magistrai pažymių viešinimą vertina
Equal variances not
2.909 17.971 .009 2.1000 .72188 .58321 3.61679 statistiškai reikšmingai palankiau
assumed
(vidutiniškai 7,5 balo) nei pirmakursiai
būtų čia, jei (vidutiniškai 5,4 balo), p=0,009.
dispersijos nelygios
© V.Čekanavičius, G.Murauskas 113 © V.Čekanavičius, G.Murauskas 114

19
Statistinė hipotezė

Hipotezė apie koreliacijos


koeficiento lygybę nuliui H 0 : nekoreliuoja

H1 : koreliuoja
Ar du intervaliniai kintamieji koreliuoja

KINTAMIEJI DU IR ABUDU INTERVALINIAI

© V.Čekanavičius, G.Murauskas 115 © V.Čekanavičius, G.Murauskas 116

Statistinė išvada Pastabos


su p - reikšme  kuo koreliacijos koeficientas toliau nuo nulio
(absoliutiniu didumu didesnis), tuo koreliacija
H0 atmetame (kintamieji stat. reikšmingai stipresnė.
koreliuoja, jei
p  0.05 


0,2 (-0,2) – silpna koreliacija; 0,8 (-0,8) stipri.
Koreliacijos koeficiento ženklas parodo kaip
H0 neatmetame (kintamieji stat. reikšm. koreliuoja:
nekoreliuoja), jei teigiamas- vienam kintamajam didėjant, kitas
p  0.05

irgi didėja.
 neigiamas – vienam didėjant, kitas mažėja.
Čia - reikšmingumo lygmuo
 Koreliacija dar nereiškia priežastingumo!
© V.Čekanavičius, G.Murauskas 117 © V.Čekanavičius, G.Murauskas 118

SPSS
SPSS
 Koreliacija
 Turime vadybininkų patirtį ir jų Štai čia!
pradinį atlyginimą.
 Ar koreliuoja?

© V.Čekanavičius, G.Murauskas 119 © V.Čekanavičius, G.Murauskas 120

20
kintamieji SPSS SPSS
raštingiems
koreliacija
Correlations

Previous
Beginning Experience
Salary (months)
Beginning Salary Pearson Correlation 1 ,479**
Sig. (2-tailed) . ,000
N 84 84
Previous Experience Pearson Correlation ,479** 1
(months) Sig. (2-tailed) ,000 .
N 84 84
**. Correlation is significant at the 0.01 level (2-tailed).

varna
© V.Čekanavičius, G.Murauskas 121 © V.Čekanavičius, G.Murauskas 122

SPSS SPSS

Correlations Correlations

Previous Previous
Beginning Experience Beginning Experience
Salary (months) Salary (months)
Beginning Salary Pearson Correlation 1 ,479** Beginning Salary Pearson Correlation 1 ,479**
Sig. (2-tailed) . ,000 Sig. (2-tailed) . ,000
N 84 84 N 84 84
Previous Experience Pearson Correlation ,479** 1 Previous Experience Pearson Correlation ,479** 1
(months) Sig. (2-tailed) p-reikšmė ,000 . (months) Sig. (2-tailed) ,000 .
N 84 84 N 84 84
**. Correlation is significant at the 0.01 level (2-tailed). **. Correlation is significant at the 0.01 level (2-tailed).
žmonių
skaičius
raštingiems
© V.Čekanavičius, G.Murauskas 123 © V.Čekanavičius, G.Murauskas 124

SPSS
Correlations
Išvados formulavimas
Previous
Beginning Experience
• Darbuotojo patirtis (išdirbti mėnesiai)
Beginning Salary Pearson Correlation
Salary (months) statistiškai reikšmingai koreliuoja su
1 ,479**
Sig. (2-tailed) . ,000 pradiniu atlyginimu, r=0,479; p<0,01.
N 84 84 Labiau patyrę gauna didesnius pradinius
Previous Experience Pearson Correlation ,479** 1
(months) Sig. (2-tailed) ,000 . atlyginimus.
N 84 84
**. Correlation is significant at the 0.01 level (2-tailed).

Stat. reikšm. koreliuoja. Kuo labiau patyrę,


tuo pradinė alga didesnė.
© V.Čekanavičius, G.Murauskas 125 © V.Čekanavičius, G.Murauskas 126

21
Turinys
• Mann Whitney ......................1 p.
SPSS – ranginiai • Wilcoxon ……………………. 3 p.
kriterijai • Spearman …………………... 5 p.
• Kruskal – Wallis ……………. 7 p.
• Friedman ……………………. 9 p.

© V. Čekanavičius, G. Murauskas 2

Mann-Whitney kriterijus
1. Stjudento t kriterijaus
nepriklausomoms imtims analogas;
Mann - Whitney kriterijus 2. bet nelygina vidurkių;
3. lygina skirstinius;
4. kuris kintamasis ‘linkęs būti didesniu’
parodo didesnis vidutinis rangas.

© V. Čekanavičius, G. Murauskas 3 © V. Čekanavičius, G. Murauskas 4

Duomenys Statistinė hipotezė:


1. dvi nepriklausomos imtys, gautos
matuojant intervalinius arba H0 : kintamųjų skirstiniai nesiskiria
ranginius kintamuosius.
H1 : kintamųjų skirstiniai skiriasi.
2. imčių didumai gali skirtis.
3. skirtingų ranginio kintamojo reikšmių
turi būti bent 5.

© V. Čekanavičius, G. Murauskas 5 © V. Čekanavičius, G. Murauskas 6

22
Statistinė išvada
Kriterijaus idėja: su p - reikšme
• Visas lyginamų kintamųjų reikšmes
surašome į vieną variacinę eilutę. H0 atmetame (kintamųjų skirstiniai stat.
• Suranguojame tą eilutę. reikšmingai skiriasi), jei p<α
• Lyginame kiekvienos imties elementų
vidutinius rangus. H0 neatmetame (kintamųjų skirstiniai stat.
reikšm. nesiskiria), jei
• Didesnis rangas- 'kintamasis linkęs
būti didesniu'.
p≥α
Čia α - reikšmingumo lygmuo
© V. Čekanavičius, G. Murauskas 7 © V. Čekanavičius, G. Murauskas 8

SPSS Štai čia!


Pavyzdys
• Ar vyresni, nei 40 m. juodaodžiai ir
baltieji vienodai palankiai vertina
klasikinę muziką?
• ranginių kintamųjų reikšmės: 1-labai
palankiai, 2-palankiai,….,5-labai
nepalankiai.
• Tarkime, kad reikšmingumo lygmuo yra
0,05.

© V. Čekanavičius, G. Murauskas 9 © V. Čekanavičius, G. Murauskas 10

SPSS ką matuojam SPSS


rasių kodai

rasė

varna
© V. Čekanavičius, G. Murauskas 11 © V. Čekanavičius, G. Murauskas 12

23
SPSS SPSS p-reikšmė
vidutiniai
rangai
Test Statisticsa

Ranks CLASSICL
Classical
RACE Racew N Mean Rank Sum of Ranks Music
CLASSICL 1of white
Respondent 674 371.97 250710.00 Mann-Whitney U 23235.000
2 black 75 402.20 30165.00 Wilcoxon W 250710.000
Total 749 Z -1.183
Asymp. Sig. (2-tailed) .237
a. Grouping Variable: RACE Racew of Respondent
baltieji rašė mažesnius balus (t.y. vertino
palankiau, nes tokia kodavimo sistema) skirtumas stat. nereikšmingas
© V. Čekanavičius, G. Murauskas 13 © V. Čekanavičius, G. Murauskas 14

Wilcoxon kriterijus
1. Stjudento t kriterijaus porinėms
(priklausomoms) imtims analogas;
Wilcoxon kriterijus 2. bet nelygina vidurkių;
3. lygina skirstinius;
4. kuris kintamasis ‘linkęs būti didesniu’
parodo didesnis vidutinis kintamųjų
skirtumo rangas.

© V. Čekanavičius, G. Murauskas 15 © V. Čekanavičius, G. Murauskas 16

Duomenys Statistinė hipotezė:


1. dvi priklausomos imtys, gautos
matuojant intervalinius arba ranginius H0 : kintamųjų skirstiniai nesiskiria
kintamuosius.
H1 : kintamųjų skirstiniai skiriasi.
2. imčių didumai vienodi
3. dažniausiai stebime tuos pat
respondentus dukart;
4. skirtingų ranginio kintamojo reikšmių
turi būti bent 5.
© V. Čekanavičius, G. Murauskas 17 © V. Čekanavičius, G. Murauskas 18

24
Kriterijaus idėja: Kriterijaus idėja:
• Suskaičiuojame reikšmių • (12,13), (20,30), (5,3), (4,2), (15,17),
skirtumus kiekvienai porai. (25,30).
• Suranguojame skirtumų • Skirtumai: -1, -10, 2, 2, -2, -5.
modulius. • Moduliai:1(-), 2(-), 2(+),2(+),5(-),10(-).
• Rangai: 1(-), 3(-), 3(+), 3(+), 5(-), 6(-).
• Lyginame vidutinius teigiamų ir
neigiamų skirtumų rangus. • Vidutiniai rangai: (+): 3, (-): 3.75

© V. Čekanavičius, G. Murauskas 19 © V. Čekanavičius, G. Murauskas 20

Statistinė išvada
su p - reikšme Pavyzdys
• Ar vyresni, nei 50 m. respondentai
H0 atmetame (kintamųjų skirstiniai stat. vienodai palankiai vertina klasikinę
reikšmingai skiriasi), jei p<α muziką ir džiazą?
• ranginių kintamųjų reikšmės: 1-labai
H0 neatmetame (kintamųjų skirstiniai stat. palankiai, 2-palankiai,….,5-labai
reikšm. nesiskiria), jei nepalankiai.
p≥α • Tarkime, kad reikšmingumo lygmuo yra
0,05.
Čia a - reikšmingumo lygmuo
© V. Čekanavičius, G. Murauskas 21 © V. Čekanavičius, G. Murauskas 22

SPSS SPSS keliam ABUDU

Štai čia!

varna
© V. Čekanavičius, G. Murauskas 23 © V. Čekanavičius, G. Murauskas 24

25
SPSS skirtumų SPSS p-reikšmė
rangai
Ranks Test Statisticsb

N Mean Rank Sum of Ranks JAZZ Jazz


JAZZ - CLASSIC Negative Ranks 138a 157.43 21725.00 Music -
Positive Ranks 198b 176.22 34891.00 CLASSICL
Ties 161c Classical
Total 497 Music
a. JAZZ Jazz Music < CLASSICL Classical Music
Z -3.782a
Asymp. Sig. (2-tailed) .000
b. JAZZ Jazz Music > CLASSICL Classical Music
a. Based on negative ranks.
c. CLASSICL Classical Music = JAZZ Jazz Music
b. Wilcoxon Signed Ranks Test

didesni skirtumai buvo, kai palankiau


vertino klasiką (jai rašė mažesnius balus). skirstiniai skiriasi stat. reikšmingai
© V. Čekanavičius, G. Murauskas 25 © V. Čekanavičius, G. Murauskas 26

Spearman’o kriterijus
1. Pearson’o koreliacijos analogas.
2. Interpretuojamas visiškai
Spearman koreliacija analogiškai;
3. skaičiuoja Pearson’o koreliaciją tarp
imčių rangų;
4. tai leidžia naudoti ir specialiu atveju,
kai duomenys jau suranguoti.

© V. Čekanavičius, G. Murauskas 27 © V. Čekanavičius, G. Murauskas 28

Duomenys Statistinė hipotezė:


1. porinė imtis, gauta matuojant
intervalinius arba ranginius H0 : kintamieji nekoreliuoja.
kintamuosius.
H1 : kintamieji koreliuoja.
2. galima naudoti ir imčių rangus.
3. skirtingų ranginio kintamojo reikšmių
turi būti bent 5.

© V. Čekanavičius, G. Murauskas 29 © V. Čekanavičius, G. Murauskas 30

26
Statistinė išvada
su p - reikšme Pavyzdys
• Ar vyresni, nei 50 m. respondentai,
H0 atmetame (kintamieji stat. reikšmingai palankiau vertinantys miuziklus,
koreliuoja), jei p<α palankiau vertina ir klasikinę muziką?
• ranginių kintamųjų reikšmės: 1-labai
H0 neatmetame (kintamieji stat. reikšm. palankiai, 2-palankiai,….,5-labai
nekoreliuoja), jei nepalankiai.
p≥α • Tarkime, kad reikšmingumo lygmuo yra
0,05.
Čia a - reikšmingumo lygmuo
© V. Čekanavičius, G. Murauskas 31 © V. Čekanavičius, G. Murauskas 32

SPSS SPSS kintamieji

Štai čia!

varna

© V. Čekanavičius, G. Murauskas 33 © V. Čekanavičius, G. Murauskas 34

SPSS
Correlations Spearman specialus atvejis
CLASSICL MUSICALS
Classical
Music
Broadway
Musicals
1. Kiekviena iš dviejų mokytojų surikiavo
Spearman's rho CLASSICL Correlation Coefficient 1.000 .399** mokinius pagal gabumus.
Sig. (2-tailed) . .000
N 504 489 2. Pirma: A, B, C, D, E, F, G, H, I,J, K, L.
MUSICAL Correlation Coefficient .399** 1.000
S Sig. (2-tailed) .000 . 3. Antra: B, C, A, D, H,E, F, G, K, I,J, L.
N 489 499
**. Correlation is significant at the .01 level (2-tailed).
4. Ar mokytojų nuomonės koreliuoja?

Stat. reikšmingai koreliuoja. Palankiau vertinantys


miuziklus, palankiau vertins ir klasiką.
© V. Čekanavičius, G. Murauskas 35 © V. Čekanavičius, G. Murauskas 36

27
SPSS
Statistinė hipotezė: •Pirma: A,B,C,D,E,F,
G,H,I,J,K,L
H0 : nuomonės nekoreliuoja. •Antra: B, C, A,D,
H,E, F,G,K,I,J,L.
H1 : nuomonės koreliuoja.

šis stulpelis
nebūtinas

© V. Čekanavičius, G. Murauskas 37 © V. Čekanavičius, G. Murauskas 38

SPSS
Correlations

MOKYT1 MOKYT2
Spearman's rho MOKYT1 Correlation Coefficient 1.000 .916**
Sig. (2-tailed)
N 12
. .000
12 Kruskal - Wallis kriterijus
MOKYT2 Correlation Coefficient .916** 1.000
Sig. (2-tailed) .000 .
N 12 12
**. Correlation is significant at the .01 level (2-tailed).

nuomonės labai stipriai teigiamai koreliuoja

© V. Čekanavičius, G. Murauskas 39 © V. Čekanavičius, G. Murauskas 40

Kruskal-Wallis kriterijus Duomenys


1. Mann-Whitney kriterijaus apibendrinimas 1. keletas nepriklausomų intervalinių
keletui (2 ir daugiau) imčių. arba ranginių imčių.
2. Interpretuojamas visiškai analogiškai; 2. skirtingų ranginio kintamojo reikšmių
3. vidutinis rangas rodo didesnius imčių turi būti bent 5.
balus.
4. nepasako, kurie kintamieji skiriasi.
5. yra ANOVA neparametrinis analogas.

© V. Čekanavičius, G. Murauskas 41 © V. Čekanavičius, G. Murauskas 42

28
Statistinė išvada
Statistinė hipotezė: su p - reikšme
H0 atmetame (kažkurie skirstiniai stat.
H0 : visi skirstiniai nesiskiria reikšmingai skiriasi), jei
H1 : kažkurie skirstiniai skiriasi.
p<α
H0 neatmetame (visi skirstiniai stat.
reikšm. nesiskiria), jei
p≥α
Čia a - reikšmingumo lygmuo
© V. Čekanavičius, G. Murauskas 43 © V. Čekanavičius, G. Murauskas 44

SPSS Štai čia!


Pavyzdys
• Ar tarp prasimokiusių nemažiau 13m.
respondentų visų rasių atstovai
vienodai vertina rap’ą?
• ranginių kintamųjų reikšmės: 1-labai
palankiai, 2-palankiai,….,5-labai
nepalankiai.
• Tarkime, kad reikšmingumo lygmuo yra
0,05.

© V. Čekanavičius, G. Murauskas 45 © V. Čekanavičius, G. Murauskas 46

SPSS SPSS kodai


rap

rasė

varna
© V. Čekanavičius, G. Murauskas 47 © V. Čekanavičius, G. Murauskas 48

29
SPSS SPSS p-reikšmė
a,b
Test Statistics
Ranks
RAP Rap
RACE Racew N Mean Rank Music
of Respondent Chi-Square 23.311
RAP Rap Music 1 white 617 372.20
df 2
2 black 65 254.05
Asymp. Sig. .000
3 other 34 309.59
a. Kruskal Wallis Test
Total 716
b. Grouping Variable: RACE Racew of Respondent

palankiausiai (kodavimas!) vertina juodieji. ne visos rasės vienodai vertina rap’ą

© V. Čekanavičius, G. Murauskas 49 © V. Čekanavičius, G. Murauskas 50

Friedman’o kriterijus
1. Wilcoxon kriterijaus apibendrinimas
keletui (2 ir daugiau) imčių.
Friedman kriterijus 2. jei imtys 2, Wilcoxono kriterijus
geriau.
3. interpretacija paprastesnė už
Wilcoxon
4. nepasako, kurie kintamieji skiriasi.
5. yra ‘Repeated measures’
neparametrinis analogas
© V. Čekanavičius, G. Murauskas 51 © V. Čekanavičius, G. Murauskas 52

Rangų interpretacija Duomenys


1. Tarkime respondentas parašė trims 1. keletas imčių, gautų matuojant
aktoriams pažymius: aktoriui A - 10, priklausomus intervalinius arba
aktoriui B - 6, aktoriui C - 8. ranginius kintamuosius.
2. Pažymiai ranguojami. Aktorių gauti 2. skirtingų ranginio kintamojo reikšmių
rangai: aktoriaus A - 3, aktoriaus B -1 turi būti bent 5.
, aktoriaus C - 2. 3. galima kiekvieno respondento
3. vidutiniai rangai atspindi tą patį. atsakymus suranguoti ir inaudoti
tuos rangus.
© V. Čekanavičius, G. Murauskas 53 © V. Čekanavičius, G. Murauskas 54

30
Statistinė išvada
Statistinė hipotezė: su p - reikšme
H0 atmetame (kažkurie skirstiniai stat.
H0 : visų kintamųjų skirstiniai reikšmingai skiriasi), jei
nesiskiria. p<α
H1 : kažkurių kintamųjų skirstiniai H0 neatmetame (visi skirstiniai stat.
skiriasi. reikšm. nesiskiria), jei
p≥α
Čia a - reikšmingumo lygmuo
© V. Čekanavičius, G. Murauskas 55 © V. Čekanavičius, G. Murauskas 56

SPSS
Pavyzdys
• Ar prasimokę daugiau nei 15 m.
respondentai, vienodai palankiai
vertinana miuziklus, klasiką ir Štai čia!
bigbendus?
• ranginių kintamųjų reikšmės: 1-labai
palankiai, 2-palankiai,….,5-labai
nepalankiai.
• Tarkime, kad reikšmingumo lygmuo yra
0,05.
© V. Čekanavičius, G. Murauskas 57 © V. Čekanavičius, G. Murauskas 58

SPSS SPSS
kintamieji

Ranks

Mean Rank
CLASSICL Classical Music 1.87
MUSICALS Broadway
2.05
Musicals
BIGBAND Bigband Music 2.08

palankiausiai vertinta (kodavimas!) klasika


varna

© V. Čekanavičius, G. Murauskas 59 © V. Čekanavičius, G. Murauskas 60

31
SPSS p-reikšmė
Friedman spec. atvejis
Test Statisticsa
• Penki ekspertai vertino alų A,B ir C.
N 343 • Pirmas: B, C, A (t.y. geriausias B,…)
Chi-Square 14.286 • Antras: B, C, A
df 2 • Trečias: A arba C, B
Asymp. Sig. .001 • Ketvirtas: A, B,C
a. Friedman Test • Penktas: B, A,C
• Ar visos alaus rūšys vienodai
populiarios?
ne visi stiliai vienodai populiarūs
© V. Čekanavičius, G. Murauskas 61 © V. Čekanavičius, G. Murauskas 62

SPSS rūšys
SPSS
Ranks

Mean Rank
A 2.10
B 1.60
C 2.30

šis stulpelis rangai! populiariausias B alus


nebūtinas

© V. Čekanavičius, G. Murauskas 63 © V. Čekanavičius, G. Murauskas 64

SPSS
Test Statisticsa

N 5
Chi-Square 1.368
df 2
Asymp. Sig. .504
a. Friedman Test

vertinimų skirtumai stat. nereikšmingi

© V. Čekanavičius, G. Murauskas 65

32
SPSS
Chi kvadrato suderinamumo
suderinamumo kriterijus,
kriterijus
 Tikriname, ar klerkų nac. daugumos ir
nac. mažumos atstovų proporcija yra 7:2
• Spėjame proporciją.
• Jeigu nespėjame, tai čia ne tas chi 

kvadratas, kurio norisi (yra dar vienas chi


kvadrato kriterijus)

© V.Čekanavičius, G.Murauskas 127 © V.Čekanavičius, G.Murauskas 128

SPSS SPSS
duomenys

Štai čia!

© V.Čekanavičius, G.Murauskas 129 © V.Čekanavičius, G.Murauskas 130

SPSS kintamasis SPSS

prognozuojama
Spėjami procentai proporcija
ar santykiai

Spėjame, pradėdami nuoG.Murauskas


© V.Čekanavičius, mažiausio minority kodo 131 © V.Čekanavičius, G.Murauskas 132

33
SPSS SPSS
skirtumas reikšmė
Test Statistics

Frequencies minority
Minority
Classification
minority Minority Classification Chi-Squarea ,639 p-reikšmė
df
Category Observed N Expected N Residual 1
Asymp. Sig. ,424
1 0 No 276 282,3 -6,3
a. 0 cells (,0%) have expected frequencies less than
2 1 Yes 87 80,7 6,3 5. The minimum expected cell frequency is 80,7.
Total 363
duomenys
nereti
duomenys stat. reikšm. neprieštarauja
Kiek yra Kiek spėjamam santykiui 7 nac. daug. : 2 nac. maž.
tikėjomės
© V.Čekanavičius, G.Murauskas 133 © V.Čekanavičius, G.Murauskas 134

Išvados formulavimas SPSS


Specialus atvejis
• Pritaikę chi kvadrato kriterijų, gavome, kad
Saldainiai pardavinėjami 4 skirtingose dėžutėse.
duomenys statistiškai reikšmingai
25% dėžučių didelės, 25% vidutinės, 30%
neprieštarauja spėjamam nac. daugumos mažos ir 20% suvenyrinės.
ir nac. mažumos dabuotojų santykiui. Pirkėjai nupirko 50 didelių, 40 vidutinių, 72
mažas ir 19 suvenyrinių dėžučių.
Ar kažkurių dėžučių reikia gaminti daugiau?

© V.Čekanavičius, G.Murauskas 135 © V.Čekanavičius, G.Murauskas 136

SPSS SPSS tada čia

duomenys
tik skaitiniai
© V.Čekanavičius, G.Murauskas 137 © V.Čekanavičius, G.Murauskas 138

34
SPSS SPSS
sveriam

apačioje
dešiniame
kampe atsiras

© V.Čekanavičius, G.Murauskas 139 © V.Čekanavičius, G.Murauskas 140

SPSS SPSS

RUSIS

Observed N Expected N Residual


Spėjami 1.00 50 45.3 4.8
procentai 2.00 40 45.3 -5.3
3.00 72 54.3 17.7
4.00 19 36.2 -17.2
prie svorio Total 181
nagų
nebekišam

© V.Čekanavičius, G.Murauskas 141 © V.Čekanavičius, G.Murauskas 142

SPSS
Išvados formulavimas
Test Statistics
• Pritaikę chi kvadrato kriterijų, gavome, kad
RUSIS
Chi-Squarea 15.050
duomenys statistiškai reikšmingai
df 3 prieštarauja spėjamam pakuočių santykiui,
Asymp. Sig. .002 p= 0,002. Žymiai daugiau, nei tikėtasi,
a. 0 cells (.0%) have expected frequencies less than
5. The minimum expected cell frequency is 36.2. nuperkama trečios rūšies pakuočių ir
mažiau ketvirtos rūšies pakuočių.

Išvada: reikia keisti gamybą

© V.Čekanavičius, G.Murauskas 143 © V.Čekanavičius, G.Murauskas 144

35
Porinių dažnių lentelės

• Visi imties respondentai suskirstomi į


grupes pagal du požymius.
Chi kvadrato • Pvz. pagal lytį ir požiūrį į gyvenimą.
homogeniškumo kriterijus • Gyvenimas: žavus (exciting),
• rutina (routine)
• pilkas (dull)
Porinių dažnių lentelės

© V.Čekanavičius, G.Murauskas 145 © V.Čekanavičius, G.Murauskas 146

Pavyzdžiai kriterijus. Požymių


• Ar nusikalstamumo lygis priklauso nuo homogeniškumo tikrinimas
bedarbystės lygio? • vienas požymis stebimas
• Ar tikyba susijusi su požiūriu į abortus keliose populiacijose;
(pritariu-nepritariu)?
• Ar perkamo automobilio spalva
• tikriname, ar visose
priklauso nuo perkančiojo lyties? populiacijose požymis vienodai
• Ar studentės dažniau renkasi magistro pasiskirstęs;
studijas, nei studentai?

© V.Čekanavičius, G.Murauskas 147 © V.Čekanavičius, G.Murauskas 148

Duomenys Statistinė hipotezė:


 Vienas kategorinis kintamasis
matuotas keliose nepriklausomose H0 : pagal tiriamą požymį
populiacijose.
populiacijos nesiskiria.
 Žinome kiekvienos populiacijos sudėtį
pagal kategorinį kintamąjį. H1 : populiacijos skiriasi.
 Kategorijų gali būti keletas.

© V.Čekanavičius, G.Murauskas 149 © V.Čekanavičius, G.Murauskas 150

36
Statistinė išvada, kai Pavyzdys
reikšmingumo lygmuo 0,05
• Ar vienodą procentą vadybininkų ir
H0 atmetame (populiacijos stat.
klerkų sudaro moterys?
reikšmingai skiriasi), jei
p  0,05 • Tarkime, kad reikšmingumo lygmuo yra
0,05.

H0 neatmetame (populiacijos stat. reikšm.


nesiskiria), jei
p  0,05
© V.Čekanavičius, G.Murauskas 151 © V.Čekanavičius, G.Murauskas 152

SPSS SPSS
tinka ir
simboliniai

duomenys Štai čia!

© V.Čekanavičius, G.Murauskas 153 © V.Čekanavičius, G.Murauskas 154

SPSS SPSS
po to čia
eilutė

stulpelis

varna

© V.Čekanavičius, G.Murauskas 155 © V.Čekanavičius, G.Murauskas 156

37
SPSS SPSS

ir čia

po to čia

ir čia
© V.Čekanavičius, G.Murauskas 157 © V.Čekanavičius, G.Murauskas 158

SPSS SPSS
JOBCAT Employment Category * GENDER Gender Crosstabulation
p-reikšmė
GENDER Gender
Chi-Square Tests
f Female m Male Total
JOBCAT Employment 1 Clerical Count 206 157 363
Category Asymp. Sig. Exact Sig. Exact Sig.
% within JOBCAT
Employment Category
56.7% 43.3% 100.0% Value df (2-sided) (2-sided) (1-sided)
Pearson Chi-Square b
% within GENDER 54.935 1 .000
Gender 95.4% 68.0% 81.2%
a
Continuity Correction
3 Manager Count
53.154 1 .000
10 74 84
% within JOBCAT Likelihood Ratio 61.256 1 .000
11.9% 88.1% 100.0%
Employment Category
Fisher's Exact Test .000 .000
% within GENDER
Gender 4.6% 32.0% 18.8% N of Valid Cases 447
Total Count 216 231 447 a. Computed only for a 2x2 table
% within JOBCAT
48.3% 51.7% 100.0%
Employment Category b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 40.59.
% within GENDER
Gender 100.0% 100.0% 100.0%

p < 0.05, todėl proporcijos sat. reikšmingai skiriasi

© V.Čekanavičius, G.Murauskas 159 © V.Čekanavičius, G.Murauskas 160

Išvados formulavimas SPSS


Specialus atvejis
• Pritaikę chi kvadrato kriterijų, gavome, kad
• grupė vaikų žiūrėjo smurtines TV laidas,
tarp klerkų moterų yra statistiškai
grupė - nesmurtines. Po to buvo stebėtas jų
reikšmingai daugiau (56,7%), nei tarp elgesio agreyvumas.
vadybininkų (11,9 %), p<0,01. • 63 žiūrėjo smurtines ir agresyvūs, 37 smurt. ir
neagr.; 30 nesmurt. ir agresyvūs ir 70
nesmurt. ir neagresyvūs.
• ar TV ir elgesys susiję?

© V.Čekanavičius, G.Murauskas 161 © V.Čekanavičius, G.Murauskas 162

38
SPSS SPSS Pasveriame
pagal ‘kiek’

gali būti ir
simboliniai
skaitiniai
© V.Čekanavičius, G.Murauskas 163 © V.Čekanavičius, G.Murauskas 164

SPSS SPSS
ELGESYS * TV Crosstabulation

TV
nesmurt smurt Total
ELGESYS agres Count 30 63 93
% within ELGESYS 32.3% 67.7% 100.0%
% within TV 30.0% 63.0% 46.5%
neagr Count 70 37 107
% within ELGESYS 65.4% 34.6% 100.0%
% within TV 70.0% 37.0% 53.5%
Total Count 100 100 200
% within ELGESYS 50.0% 50.0% 100.0%
% within TV 100.0% 100.0% 100.0%
nagų Po to čia!
nebekišam!
smurtinę TV žiūrėję agresyvesni
Statistics ir Cells užpildome, kaip
© V.Čekanavičius, anksčiau.
G.Murauskas 165 © V.Čekanavičius, G.Murauskas 166

SPSS
Išvados formulavimas

Chi-Square Tests
• Pritaikę chi kvadrato kriterijų, gavome, kad
Asymp. Sig. Exact Sig. Exact Sig.
tarp žiūrėjusių smurtinę TV buvo
Pearson Chi-Square
Value
21.887b
df
1
(2-sided)
.000
(2-sided) (1-sided)
statistiškai reikšmingai daugiau agresyvių
Continuity Correctiona
Likelihood Ratio
20.581
22.314
1
1
.000
.000
vaikų (63%), nei tarp žiūrėjusių nesmurtinę
Fisher's Exact Test
N of Valid Cases
.000 .000 TV (30 %), p<0,01.
200
a. Computed only for a 2x2 table
b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 46.50.

stat. reikšmingai
© V.Čekanavičius, G.Murauskas 167 © V.Čekanavičius, G.Murauskas 168

39
Mc Nemar kriterijus
dažniausiai (bet ne visada):
• taikomas dvireikšmiams kintamiesiems
• gautiems apklausus tuos pačius
Mc Nemar kriterijus respondentus
• prieš poveikį respondentams (terapiją,
reklamą, įkalbinėjimą, filmą ir t.t.)
• ir po poveikio.
• domina, kaip paveikė respondentus
© V.Čekanavičius, G.Murauskas 169 © V.Čekanavičius, G.Murauskas 170

Mc Nemar kriterijus Duomenys


Kitas tipinis variantas: ar vienodos  Vienas dvireikšmis (už-prieš, taip-ne)
proporcijos priklausomiems kategorinis kintamasis matuotas
kategoriniams kintamiesiems. dviejose priklausomose populiacijose
• Duomenys gauti, apklausus tuos pačius  arba vienoje populiacijoje dukart.
respondentus.
• Pvz., ar toks pat procentas respondentų
rūko, kaip ir vartoja alkoholį.

© V.Čekanavičius, G.Murauskas 171 © V.Čekanavičius, G.Murauskas 172

Duomenys
Statistinė hipotezė:

Prieš H0 : poveikio nebuvo (iš ‘už’ į


‘prieš’ nuomonę pakeitė tiek pat,
  kiek iš ‘prieš’ į ‘už’)
Po  a b H1 : poveikis buvo

 c d
© V.Čekanavičius, G.Murauskas 173 © V.Čekanavičius, G.Murauskas 174

40
Statistinė išvada
SPSS
su p - reikšme
• dukart apklausėme tuos pačius rinkėjus, prieš
H0 atmetame (poveikis buvo stat. TV laidą ir po TV laidos.
reikšmingas), jei
p  0.05 • prieš TV už, po TV už 200
• prieš TV už, po TV prieš 30
H0 neatmetame (poveikis stat. • prieš TV prieš, po TV už 60
nereikšmingas), jei
p  0.05 • prieš TV prieš, po TV prieš 100
• ar TV laida paveikė rinkėjus.
Čia 0.05 - reikšmingumo lygmuo
© V.Čekanavičius, G.Murauskas 175 © V.Čekanavičius, G.Murauskas 176

SPSS SPSS pasveriame


kaip ir
atveju

© V.Čekanavičius, G.Murauskas 177 © V.Čekanavičius, G.Murauskas 178

SPSS SPSS kintamieji

čia

Štai čia!
© V.Čekanavičius, G.Murauskas 179 © V.Čekanavičius, G.Murauskas 180

41
SPSS SPSS

pries * po Crosstabulation

Count
varna
po

Ne už Total
pries
Ne 100 60 160
už 30 200 230

Total 130 260 390

© V.Čekanavičius, G.Murauskas 181 © V.Čekanavičius, G.Murauskas 182

SPSS p-reikšmė
ANOVA
Chi-Square Tests

Vienfaktorinė
Value Exact Sig. (2-sided)

McNemar Test
N of Valid Cases 390
.002a
dispersinė analizė
a. Binomial distribution used.

stat. reikšmingai padidėjo rėmėjų ANalysis Of VAriance

© V.Čekanavičius, G.Murauskas 183 © V. Čekanavičius, G. Murauskas 184

PAVYZDŽIAI

ANOVA yra t kriterijaus • ar lietuviai, latviai ir karelai tiek pat


laiko naršo internete,
apibendrinimas keletui
• ar priklauso klaidų skaičius nuo
nepriklausomų imčių. išgerto vyno rūšies,
• ar visų kursų studentai vienodai
Jei dispersijos lygios, dviems imtims intelektualūs,
ANOVA ir t kriterijus duoda tą patį • ar vidutiniškai vienodai garsiai rėkia
atsakymą. L. Ryto ir K. Žalgirio sirgaliai.

© V. Čekanavičius, G. Murauskas 185 © V. Čekanavičius, G. Murauskas 186

42
DUOMENYS
Statistinė hipotezė:
• VISADA DU stulpeliai
• Vienas – intervalinis. Jame yra H0: 1 = 2 =…= k
rezultatas, kurio vidurkius
lyginame. (Pvz., 32, 17, 22,…) H1: ne visi vidurkiai
• Kitas – kategorinis. Jame - lygūs
grupės kodas. (pvz., 1, 2, 3).

© V. Čekanavičius, G. Murauskas 187 © V. Čekanavičius, G. Murauskas 188

Statistinė išvada ANOVA skirtumus rado,


su p - reikšme kas toliau ?????

H0 atmetame (ne visi vidurkiai lygūs), jei Toliau : POST HOC testai. Pvz.
Bonferroni testas.
p  0.05
H0 neatmetame (visi vidurkiai stat. reikšm. Tikslas: Nustatyti kurių grupių
vidurkiai skiriasi statistiškai
nesiskiria), jei
p  0.05 reikšmingai.
Čia - reikšmingumo lygmuo
© V. Čekanavičius, G. Murauskas 189 © V. Čekanavičius, G. Murauskas 190

Statistinė išvada Pavyzdys


su p - reikšme
Ar visų rasių respondentai vienodai palankiai
Vidurkiai stat. reikšmingai skiriasi, jei vertina džiazą?

p  0.05 Tiriame vyresnius nei 60 m respondentus(es)


Vidurkiai stat. reikšmingai, nesiskiria, jei
p  0.05
Čia - reikšmingumo lygmuo
© V. Čekanavičius, G. Murauskas 191 © V. Čekanavičius, G. Murauskas 192

43
SPSS SPSS
Jazz
(intervalinis)

Rasė
(kategorinis)

Štai čia!

opcijos

© V. Čekanavičius, G. Murauskas 193 © V. Čekanavičius, G. Murauskas 194

SPSS SPSS
post hoc
aprašoma

grafikas
© V. Čekanavičius, G. Murauskas 195 © V. Čekanavičius, G. Murauskas 196

SPSS SPSS
Descriptives

jazz Jazz Music

vidurkiai95% Confidence Interval


for Mean

Ma
Std. Std. Lower Upper Minimu xim
N Mean Deviation Error Bound Bound m um
1 white 304 2.98 1.118 .064 2.85 3.10 1 5
2 black 32 2.34 1.208 .214 1.91 2.78 1 4
3 other 8 3.38 .744 .263 2.75 4.00 2 4
post hoc Total 344 2.93 1.134 .061 2.81 3.05 1 5

© V. Čekanavičius, G. Murauskas 197 © V. Čekanavičius, G. Murauskas 198

44
SPSS SPSS
Multiple Comparisons
ANOVA
Dependent Variable:jazz Jazz Music

95% Confidence Interval


jazz Jazz Music

Mean Upper
Mean (I) race (J) race Difference (I-J) Std. Error Sig. Lower Bound Bound
Sum of Squares df Square F Sig. Tukey HSD 1 white 2 black .633* .208 .007 .14 1.12
Between 3 other -.398 .401 .582 -1.34 .55
Groups 13.251 2 6.625 5.279 .006 2 black 1 white -.633* .208 .007 -1.12 -.14
Within Groups 427.933 341 1.255 3 other -1.031 .443 .053 -2.07 .01
3 other 1 white .398 .401 .582 -.55 1.34
2 black 1.031 .443 .053 -.01 2.07
Total 441.183 343
Bonferroni 1 white 2 black .633* .208 .008 .13 1.13
3 other -.398 .401 .966 -1.36 .57
2 black 1 white -.633* .208 .008 -1.13 -.13

Požiūris į džiazą statistiškai reikšmingai priklauso nuo 3 other


3 other
1 white
-1.031
.398
.443
.401
.061
.966
-2.10
-.57
.03
1.36
respondento rasės (p < 0.05). 2 black 1.031 .443 .061 -.03 2.10
*. The mean difference is significant at the 0.05 level.

© V. Čekanavičius, G. Murauskas 199 © V. Čekanavičius, G. Murauskas 200

SPSS SPSS
Mean
Difference
(I) race (J) race (I-J) Std. Error Sig.
Tukey HSD 1 white 2 black .633* .208 .007
3 other -.398 .401 .582

2 black 1 white -.633* .208 .007


3 other -1.031 .443 .053

3 other 1 white .398 .401 .582


2 black 1.031 .443 .053

Statistiškai reikšmingai skiriasi juodieji nuo baltųjų. Kiti


skirtumai statistiškai nereikšmingi.

© V. Čekanavičius, G. Murauskas 201 © V. Čekanavičius, G. Murauskas 202

Blokuotų duomenų Blokuotų duom. ANOVA


dispersinė analizė yra porinio t kriterijaus
apibendrinimas keletui
priklausomų imčių.
Repeated measures ANOVA
Neparametrinis analogas - Friedman
testas.

© V.Čekanavičius, G.Murauskas 203 © V.Čekanavičius, G.Murauskas 204

45
PAVYZDŽIAI
Duomenys
• kraujospūdis matuojamas po
mėnesio, po pusmečio ir po metų. Keli intervaliniai kintamieji (stulpeliai).
Ieškoma skirtumų.
• stebime studento IQ kitimą Būtent jų vidurkius ir lyginame.
pereinant iš kurso į kursą.

• ta pati žiuri vertina kelias gražuoles.

© V.Čekanavičius, G.Murauskas 205 © V.Čekanavičius, G.Murauskas 206

Statistinė hipotezė: Statistinė išvada


su p - reikšme
H0 atmetame (ne visi vidurkiai lygūs), jei
H0: visi vidurkiai lygūs
p  0.05
H1: ne visi vidurkiai lygūs H0 neatmetame (visi vidurkiai stat. reikšm.
nesiskiria), jei
p  0.05
Čia - reikšmingumo lygmuo
© V.Čekanavičius, G.Murauskas 207 © V. Čekanavičius, G. Murauskas 208

Statistinė išvada
POST HOC testai su p - reikšme
Vidurkiai stat. reikšmingai skiriasi, jei
Taikomi ir interpretuojami, kaip ir
vienfaktorinėje ANOVA. p  0.05
Vidurkiai stat. reikšmingai, nesiskiria, jei
p  0.05
Čia - reikšmingumo lygmuo
© V.Čekanavičius, G.Murauskas 209 © V. Čekanavičius, G. Murauskas 210

46
SPSS
Pavyzdys
Duomenys
Tris gražuoles įvertino 15 ekspertų.
Arvisos gražuolės įvertintos vienodai
gerai?

H0: vidutiniai gražuolių įvertinimai stat.


reikšmingai nesiskiria
H1: skiriasi
© V.Čekanavičius, G.Murauskas 212

SPSS pseudo-vardas:

pseudo-vardas
SPSS tai kas vienija
kintamuosius
(nesvarbus)

Štai čia!

Kintamųjų
(stulpelių)
skč.

Add Tada Define


© V.Čekanavičius, G.Murauskas 213 © V.Čekanavičius, G.Murauskas 214

SPSS SPSS
perkėlėm
post hoc

aprašoma
kintamieji aprašoma
varna

opcijos
© V.Čekanavičius, G.Murauskas 215 © V.Čekanavičius, G.Murauskas 216

47
SPSS SPSS

čia

grafikas
ir čia!

© V.Čekanavičius, G.Murauskas 217 © V.Čekanavičius, G.Murauskas 218

SPSS SPSS
kaip užkoduoti Within-Subjects Factors

Measure: MEASURE_1 Tests of Within-Subjects Effects


Dependent
FACTOR1 Variable Measure: MEASURE_1 p-reikšmė
1 GRAZ1
Type III Sum Partial Eta
2 GRAZ2 Source of Squares df Mean Square F Sig. Squared
3 GRAZ3 FACTOR1 Sphericity Assumed 114.978 2 57.489 19.705 .000 .585
Greenhouse-Geisser 114.978 1.777 64.687 19.705 .000 .585
Descriptive Statistics Huynh-Feldt 114.978 2.000 57.489 19.705 .000 .585
Lower-bound 114.978 1.000 114.978 19.705 .001 .585
Mean Std. Deviation N
GRAZ1
aprašoma Error(FACTOR1)
Sphericity Assumed 81.689 28 2.917
15.8667 3.96172 15
Greenhouse-Geisser 81.689 24.884 3.283
GRAZ2 12.2667 3.99046 15
Huynh-Feldt 81.689 28.000 2.917
GRAZ3 15.4000 4.08482 15
Lower-bound 81.689 14.000 5.835

© V.Čekanavičius, G.Murauskas 219 © V.Čekanavičius, G.Murauskas 220

post hoc
SPSS
Pairwise Comparisons
Išvada
Measure: MEASURE_1

Mean
95% Confidence Interval for
a
Difference
• Pritaikius blokuotųjų duomenų ANOVA
(I) FACTOR1 (J) FACTOR1 Difference (I-J)Std. Error
1 2 3.600* .542
Sig.
a

.000
Lower Bound Upper Bound
2.128 5.072
gavome, kad ne visos gražuolės
3 .467 .593 1.000 -1.144 2.077 vertinimas vienodai (p<0,05). Bonferoni
2 1 *
-3.600 .542 .000 -5.072 -2.128
3 *
-3.133 .723 .002 -5.098 -1.169 kriterijus parodė, kad antroji gražuolė
vertinama statistiškai reikšmingai
3 1 -.467 .593 1.000 -2.077 1.144
2 3.133* .723 .002 1.169 5.098
Based on estimated marginal means
*. The mean difference is significant at the .05 level.
blogiau nei pirmoji ir antroji.
a. Adjustment for multiple comparisons: Bonferroni.
prisimenam kodus

© V.Čekanavičius, G.Murauskas 221

48
Koeficientas h2 :
ANOVA: faktorių
priklausomybės stiprumo
skirtumai tarp grupių
matavimas eta kvadratu h2 
visi skirtumai

...
© V. Čekanavičius, G. Murauskas 2

Koeficiento h2 interpretacija:
Koeficientas h2 : • parodo, kurią dalį duomenų sklaidos lemia
populiacijų skirtumai.

SSB SSB • ~ kiek rezultatą įtakoja grupė.


h2  
SST SSB  SSW

© V. Čekanavičius, G. Murauskas 3

čia
SPSS SPSS

Štai čia!

© V. Čekanavičius, G. Murauskas 5 © V. Čekanavičius, G. Murauskas 6

49
SPSS SPSS čia

Measures of Association
varna
Eta Eta Squared
rezas * grupe ,887 ,786

© V. Čekanavičius, G. Murauskas 7 © V. Čekanavičius, G. Murauskas 8

VIDURKIŲ TRENDAI
Tiesinis Kvadratinis

Vidurkių trendas - tai vidurkių


kitimo tendencija (ką primena
vidurkių grafikas).
Tiesinis Kvadratinis

© V.Čekanavičius, G.Murauskas 9 © V.Čekanavičius, G.Murauskas 10

Kada taikoma trendų analizė? Statistinė hipotezė:

• Kai nepriklausomas grupavimo


kintamasis yra gautas iš intervalinio. H0: vidurkiai nesudaro tiesinio
trendo,
• Grupės NR atspindi vis didesnį (mažesnį)
kažkokios savybės kiekį. H1: vidurkiai sudaro tiesinį
trendą.
Fux, oberfux, senior,student (patirtis).
1bokalas, 2bok., 3bok. (alkoholis).

© V.Čekanavičius, G.Murauskas 11 © V.Čekanavičius, G.Murauskas 12

50
Statistinė hipotezė:
Statistinė išvada su p - reikšme

H0: vidurkiai nesudaro H0 atmetame (trendas TINKA), jei


kvadratinio trendo,
H1: vidurkiai sudaro kvadratinį p  0.05
trendą. H0 neatmetame (trendas netinka), jei
ir t.t. Kiekvienam trendui sava
hipotezė.
p  0.05
Čia 0.05 - reikšmingumo lygmuo

© V.Čekanavičius, G.Murauskas 13 © V.Čekanavičius, G.Murauskas 14

Štai čia!

SPSS SPSS
Štai čia!
• Du • Du

menys menys

Kaip Anova

© V.Čekanavičius, G.Murauskas 15 © V.Čekanavičius, G.Murauskas 16

SPSS SPSS (grupės lygios)


ANOVA p-reikšmė

LINEAR
VARNA

Trendas tinka

© V.Čekanavičius, G.Murauskas 17 © V.Čekanavičius, G.Murauskas 18

51
SPSS SPSS (grupės nelygios)

Arba visi respondentai lygiaverčiai (unwighted), arba visos grupės (weighted).


Renkamės tą atsakymą, kuris mums atrodo logiškesnis.

© V.Čekanavičius, G.Murauskas 19 © V.Čekanavičius, G.Murauskas 20

Tiesinis ir kvadratinis

SPSS SPSS

menys

© V.Čekanavičius, G.Murauskas 21 © V.Čekanavičius, G.Murauskas 22

52
TRUMPAI
• ANCOVA –kelių grupių vidurkiai lyginami,
atsižvelgiant į papildomą informaciją.
ANCOVA
• ANCOVA – tai ANOVA su kovariantėmis.
KOVARIANČIŲ ANALIZĖ

PAVYZDŽIAI KO TIKIMĖS
• Norima nustatyti, kuris iš dviejų mokymo • Manome, kad grupių skirtumai išryškės, jei
metodų geresnis, kai, vertinant rezultatus, lyginsime to paties intelekto ir vienodos
atsižvelgiama į mokinių motyvaciją ir IQ. motyvacijos mokinių rezultatus. Nebus taip,
• Tiriama, ar besimokantieji vairuoti, kad mažai motyvuoti vienos grupės mokiniai
važiuodami dideliais automobiliais, padaro bus lyginami su stipriai motyvuotais kitos
daugiau klaidų nei važiuodami mažais. grupės mokiniais.
Papildomai atsižvelgiama į vairuotojo amžių. • Tikimės, kad skirtumai išryškės, kai lyginsime
maždaug to paties amžiaus vairuotojus.

PALYGINIMAS SU ANOVA PASTABA


• ANOVA nulinė hipotezė: • Visai įmanoma situacija, kai taikant ANOVA
statistiškai reikšmingi skirtumai randami, o
taikant ANCOVA – ne. Pavyzdžiui, gali būti,
• ANCOVA nulinė hipotezė:
kad pritaikius ANOVA, vidutinis vaikų skaičius
katalikiškose ir protestantiškose šeimose
skirsis. Kita vertus, atsižvelgus į šeimos galvos
socialinį ir ekonominį statusą, šie skirtumai
• čia 1a, 2a, 3a yra grupių vidurkiai,
„pataisyti“, atsižvelgus į kovariantes. dings.

53
KINTAMIEJI PAVYZDYS
• Priklausomas kintamasis Y (t.y. tas kintamasis, • Tiriame, ar statistiškai reikšmingai skiriasi trijų
kurio vidurkius lyginame) yra intervalinis, grupių testo rezultatai (REZ, intervalinis
normaliai pasiskirstęs. kintamasis). Atsižvelgsime į respondentų
• Kovariantė X (t.y. Kintamasis, į kurį reikia motyvaciją (MOT, intervalinis kintamasis). Grupę
atsižvelgti) yra intervalinė, normaliai nurodyto kintamasis Grupe (trireikšmis
pasiskirsčiusi. kategorinis kintamasis).
• Grupavimo (nepriklausomas, faktorius) • Duomenis galima rasti knygos V. Čekanavičius, G.
kintamasis – kategorinis. Jo dėka žinome, Murauskas, Statistika ir jos taikymai. III, pirmos
kuriai grupei koks respondentas priklauso. dalies šeštajame skyrelyje (1.1.9 pavyzdys).

SPSS duomenys ANCOVA SU SPSS


• Reikia 3 stulpelių. Juose nurodoma kiekvieno
respondento grupė (Grupe), testo rezultatas
(REZ) ir motyvacija (MOT).

ANCOVA SU SPSS ANCOVA SU SPSS

Bonferroni

varnos
varna
ČIA

54
ANCOVA rezultatai ANCOVA rezultatai

p-reikšmė

ANCOVA rezultatai ANCOVA rezultatai


• Tarkime, kad pasirinkome reikšmingumo Naudojantis Bonferonio kriterijumi, lyginami
lygmenį = 0,05. Matome, kad p < 0.05 „pataisyti“ rezultatų vidurkiai, kai
• Darome išvadą, kad tarp tarp trijų grupių atsižvelgiama į motyvaciją.
vidutinių testo rezultatų yra statistiškai
reikšmingai besiskiriančių.
• Liko atsakyti į klausimą, kurių grupių vidutiniai
rezultatai skiriasi, t.y. pritaikyti post hoc testą.

Post hoc vidurkių lyginimai ANCOVA rezultatai


Ką lyginame
• Statistiškai reikšmingai skiriasi tų grupių
vidurkiai, kuriuos lyginant p<0,05. Tokių
vidurkių skirtumus SPSS automatiškai pažymi
žvaigždute.
• Gauta, kad pirmoji grupė statistiškai
reikšmingai skiriasi nuo likusiųjų, o antroji ir
trečioji grupės nesiskiria.

55
ANCOVA rezultatų aprašymo pavyzdys
Tyrėme, ar statistiškai reikšmingai skiriasi trijų
grupių vidutiniai testo rezultatai. Atsižvelgėme
į respondentų motyvaciją. Taikėme PAPILDOMI TYRIMAI
kovariančių analizę (ANCOVA) ir Bonferonio
kriterijų. Gavome, kad pirmoji grupė
statistiškai reikšmingai skiriasi nuo likusiųjų, o
antroji ir trečioji grupės nesiskiria.

Palyginimas su ANOVA Palyginimas su ANOVA


• Taikant ANCOVA patartina vidurkius palyginti
ir be kovariantės. Tam naudojama vienfaktorė
dispersinė analizė (ANOVA).
• SPSS programa ANOVA galima atlikti ne vienu
būdu. Naudosime pačią paprasčiausią parinktį.

Palyginimas su ANOVA Palyginimas su ANOVA


Vidurkių skirtumai statistiškai nereikšmingi.
Primename, kad, atsižvelgus į motyvaciją,
statistiškai reikšmingų skirtumų atsirado.

56
Reikšmių išsibarstymo grafikas Reikšmių išsibarstymo grafikas
• Norint nustatyti testo rezultatų ir motyvacijos
priklausomybę, verta nubraižyti abiejų
kintamųjų grafiką. Parodysime, kaip tai galima
padaryti naudojantis SPSS 17 programa.

Reikšmių išsibarstymo grafikas Reikšmių išsibarstymo grafikas

Čia

Reikšmių išsibarstymo grafikas Suredaguotas grafikas


• Grafikas – ne itin vaizdus, tačiau jį galima
redaguoti.

57
Į ką grafike atkreipti dėmesį Kintamųjų sąveika
• Visose grupėse matyti ta pati tendencija – kuo
• Statistiškai reikšminga motyvacijos ir grupės
didesnė motyvacija, tuo geresni rezultatai.
sąveika parodo, kad skirtingose grupėse
• Matome, kad skirtingų grupių rezultatų
motyvacija skirtingai veikia rezultatus.
„debesėliai beveik lygiagretūs“. Vadinasi
grupės ir motyvacijos sąveikos (interakcijos) • Klasikinė ANCOVA daroma, kai nėra grupės ir
nėra. Visose grupėse motyvacijos poveikis kovariantės sąveikos (interakcijos).
maždaug vienodas. • Parodysime, kaip naudojant SPSS galima
• Kuo labiau debesėliai atsiskiria, tuo tikėtiniau, patikrinti, ar sąveikos nėra.
taikant ANCOVA, rasti statistiškai reikšmingų
vidurkių skirtumų. • Pradžia nesiskiria nuo įprastinės ANCOVA.

ANCOVA su kintamųjų sąveika ANCOVA su kintamųjų sąveika

Čia

ANCOVA su kintamųjų sąveika ANCOVA su kintamųjų sąveika Čia

58
ANCOVA su kintamųjų sąveika Sąveikos nėra

Taškas

Sąveika

Ką daryti, jeigu sąveika yra Baigiamosios pastabos


Tuo atveju, interpretuojant rezultatus, reikia Tyrėme vienfaktorę ANCOVA, t.y. modelį su
kalbėti ne apie ANCOVA, bet apie tiesinį Gauso viena kovariante. Kovariančių gali būti ir
modelį (LNM). Reikėtų užrašyti modelį daugiau. Modelio analizė nuo to nesikeičia. Vis
dėlto, kuo mažiau kovariančių, tuo modelį
lengviau interpretuoti.
ir jį komentuoti (priklauso nuo motyvacijos,
grupės ir motyvacijos sąveikos su grupe ir
pan.).

59
Tiesinė regresija - toks modelis,
Tiesinė regresija kai vieną (priklausomą)
kintamąjį įtakoja vienas arba
keletas (nepriklausomų)
kintamųjų.

© V.Čekanavičius, G.Murauskas 223 © V.Čekanavičius, G.Murauskas 224

PAVYZDŽIAI PAVYZDŽIAI
• ar poegzamininis dirglumas • išmatavome IQ pirmame kurse. Ar
priklauso nuo gauto pažymio, nuo galima prognozuoti koks bus
egzamino trukmės ir nuo ko labiau, studento diplomo pažymių vidurkis?
• kaip antikvarinės keramikos kaina • kiek padidės pelnas, padidinus
priklauso nuo jos senumo ir aukciono reklamos išlaidas 10 000 Lt?
dalyvių skaičiaus, • kokį vidutinį valstybinio egzamino
• ar diplomo pažymių vidurkis ir balą galima prognozuoti mokiniui per
komunikabilumas gali padėti baigiamąjį kontrolinį surinkusiam 87
prognozuoti būsimą atlyginimą. tšk.?
© V.Čekanavičius, G.Murauskas 225 © V.Čekanavičius, G.Murauskas 226

Duomenys MODELIS

• (X1,, X2,, X3,,…, Xk,, Y) Y   0  1X 1  ...   k X k  e


• tai, ką prognozuosime -
priklausomas kintamasis ( Y , kaina)
Y priklauso nuo stebimų X-ų ir nuo
• pagal ką - nepriklausomi kintamieji
(regresoriai) ( X-ai , metai, dalyvių
dar kažkokių nestebimų dalykų e.
skaičius). e – atsitiktinis dydis (normalus) su 0
• Keli (dažniausiai intervaliniai) vidurkiu ir nežinoma dispersija.
kintamieji (stulpeliai).
© V.Čekanavičius, G.Murauskas 227 © V.Čekanavičius, G.Murauskas 228

60
Visi kintamieji intervaliniai*. Standartinis tyrimas:
• R2 , ANOVA, t-testai, VIF ir grafikai
• * išskyrus pseudokintamuosius . padės nustatyti reikalingus X-us.
• X-ai vienas kito neveikia, • R parodys, kaip Y priklauso nuo visų
X-ų iškart.
• X-ai veikia Y-ą.
• B-koeficientai padės sudaryti regresijos
• vieno X-o per kitus neišreikši. funkciją.
• Beta-koeficientai padės nustatyti,
kurie kintamieji svarbesni.

© V.Čekanavičius, G.Murauskas 229 © V.Čekanavičius, G.Murauskas 230

Geram regresijos modeliui:


• R2 ≥ 0,20.
Pavyzdys:
• ANOVA p < 0,05. • Tirsime, kaip 20-40 m estų politinės
• Visų t testų p < 0,05. padėties šalyje vertinimas (satisfaction)
• Visi VIF ≤ 4 (nėra multikolinearumo priklauso nuo požiūrio į parlamentą,
problemos). partijas ir laimingumo ( trstprl, trstprt,
• Visos Kuko mato reikšmės ≤ 1. happy). Visi kintamieji matuojami 10 balų
• Koeficientų ženklai atitinka koreliacijas. skalėje (1 – labai nepasitiki).
• Sprendžiant pagal histogramą,
liekamosios paklaidos normalios.
© V.Čekanavičius, G.Murauskas 232

SPSS
Pavyzdys:

Štai čia!

© V.Čekanavičius, G.Murauskas 233 © V.Čekanavičius, G.Murauskas 234

61
Ką modeliuojame SPSS SPSS
po to čia

pagal ką

© V.Čekanavičius, G.Murauskas 235 © V.Čekanavičius, G.Murauskas 236

SPSS SPSS
išskirtims

po to čia

© V.Čekanavičius, G.Murauskas 237 © V.Čekanavičius, G.Murauskas 238

SPSS daugialypė
koreliacija
SPSS koreguotas
det. koef.
Descriptive Statistics

Mean Std. Deviation N Model Summaryb


satisfaction 4.0397 2.16872 517
Adjusted R Std. Error of the
trstprl 3.80 2.287 517 Model R R Square Square Estimate
1 .703a .495 .492 1.54608
happy 7.07 1.837 517
trstprt 3.24 1.941 517

determinacijos R2 = 0.495 , pakankamas


koeficientas
Respondentai gana laimingi ir nelabai
(>> 0.20)
patenkinti institucijomis.
© V.Čekanavičius, G.Murauskas 239 © V.Čekanavičius, G.Murauskas 240

62
SPSS SPSS (koeficientai)
ANOVAb

Sum of Mean
Model Squares df Square F Sig.
1
Regression 1200.681 3 400.227 167.434 .000a
Residual 1226.256 513 2.390

Total 2426.937 516

Yra statistiškai reikšmingų


kintamųjų
gerai, nes p<0.05
© V.Čekanavičius, G.Murauskas 241 © V.Čekanavičius, G.Murauskas 242

SPSS (modelis)
Modelio lygtis
Regresijos modelio lygtis
satisfaction = - 0,039 + 0,374 trstprl +
0.228 happy + 0,322 trstprt
satisfaction =
- 0,039 • Kai trstprl padidėja vienetu, satisfaction
+ 0,374 trstprl padidėja 0,374 balo.
+ 0.228 happy • Prognozuojant, į lygtį tiesiog įstatomos
+ 0,322 trstprt konkrečios kintamųjų reikšmės.
© V.Čekanavičius, G.Murauskas 243

SPSS (koeficientai) SPSS (koeficientai)


t testai
Beta koeficientai

Matome, kad modelyje mažiausiai


svarbus kintamasis happy Visi kintamieji statistiškai reikšmingi
© V.Čekanavičius, G.Murauskas 245 ( visi p <0.05).
© V.Čekanavičius, G.Murauskas 246

63
SPSS (koeficientai) SPSS (koeficientai)
Residuals Statisticsa
Std.
Minimum Maximum Mean Deviation N
Predicted Value .4182 8.5548 4.0397 1.52542 517
------------------------ ---------- ----------- ----------- --------------- ---------
----- ---

Mahal. Distance .077 25.501 2.994 2.663 517


Cook's Distance .000 .138 .002 .008 517
Centered .000 .049 .006 .005 517
Leverage Value

Visos Kuko mato reikšmės < 1.


Sprendžiant pagal Kuko matą, išskirčių
nėra.
Multikolinearumo nėra (visi VIF < 4).247
© V.Čekanavičius, G.Murauskas © V.Čekanavičius, G.Murauskas 248

SPSS

Galutinė modelio tyrimo išvada: Logistinė regresija


regresijos modelis tinka
duomenims.
Logistic Regression

© V.Čekanavičius, G.Murauskas 249 © V.Čekanavičius, G.Murauskas 250

PAVYZDŽIAI
Logistinė regresija - toks • pagal paciento svorį ir kraujo tyrimus
modelis, kai vieną nustatyti tikimybę susirgti diabetu,
(priklausomą) dvireikšmį • pagal testų rezultatus nustatyti reiks
kintamąjį įtakoja vienas arba kompiuteriui garantinio remonto,
keletas (nepriklausomų) • ar pagal agresyvumą bei plepumą
galima atskirti vyrą nuo moters.
kintamųjų.
• ar žinant rinkėjo pajamas ir amžių,
galima numatyti balsuos už kandidatą
ar nebalsuos.
© V.Čekanavičius, G.Murauskas 251 © V.Čekanavičius, G.Murauskas 252

64
Duomenys • priklausomas kintamasis Y
dvireikšmis (0 arba 1).
• (X1, X2, X3,…, Xk, Y) • X-ai intervaliniai.
• Vienas kintamasis (stulpelis) Y • prognozuojama tikimybė P(Y=1).
dvireikšmis – jo elgesį ir modeliuojame.
Dar vadinamas priklausomu kintamuoju • jei Y įgyja kitokias dvi reikšmes -
• Kiti (kitas) kintamieji intervaliniai jis perkoduojamas.
(dažniausiai) - nepriklausomi kintamieji. • Nei viena iš dviejų Y reikšmių
Jie, mūsų nuomone, daro įtaką Y’ui. neturi kartotis daugiau nei 80 %
duomenų.
© V.Čekanavičius, G.Murauskas 253 © V.Čekanavičius, G.Murauskas 254

Modelio schema:
Prognozuojame tikimybę P(Y=1).
Surandame:
Y=0 arba Y=1

z(x) = a + b1x1 + ... + bkxk

e z(x)
X1 X2 X3 P̂ (Y m  1) 
intervaliniai kintamieji 1  e z(x)
© V.Čekanavičius, G.Murauskas 255 © V.Čekanavičius, G.Murauskas 256

Kategoriją prognozuoti galima pagal Modelio suderinamumas su


z(x) duomenimis

• jei z(x)>0 , tai Y=1 (ir pasižiūrime, ką tai Ar tinka logistinė regresija nustatome
reiškia). analizuodami
• jei z(x)<0 , tai Y=0 (ir pasižiūrime, ką tai
reiškia). • klasifikacinę lentelę,
• Jei z(x)=0, tai metame monetą.  kriterijų,
• Voldo kriterijų,
• Determinacijos koeficientus.
© V.Čekanavičius, G.Murauskas 257 © V.Čekanavičius, G.Murauskas 258

65
kriterijus: Statistinės išvados
su p- reikšme:
• Tikrina hipotezę:
H0: visi bm = 0 H0 atmetame (logistinė regresija galbūt
tinka), jei
H1: ne visi bm = 0. p < 0.05
• Kitais žodžiais:
H0 neatmetame (logistinė regresija
H0: tikimybė nuo x-ų nepriklauso netinka), jei
H1: tikimybė nuo x-ų priklauso. p >=
• Tik nežinome nuo kurių x-ų. Čia - reikšmingumo lygmuo.
© V.Čekanavičius, G.Murauskas 259 © V.Čekanavičius, G.Murauskas 260

Statistinės išvados apie


Voldo testai koeficientams bm
kintamuosius (Wald kriterijus)
• Ieškome nesvarbių x-ų. su p- reikšme:
• Tikrina hipotezę: H0 atmetame (kintamasis modeliui tinka),
jei
H0: bm = 0 p<
H1: bm = 0 H0 neatmetame (kintamasis ‘įtartinas’), jei
• Jei nulinės hipotezės neatmetame-tai
kintamasis ‘įtartinas’ (modelyje p >=
galbūt nereikalingas).
Čia - reikšmingumo lygmuo.
© V.Čekanavičius, G.Murauskas 261 © V.Čekanavičius, G.Murauskas 262

Ką daryti su ‘įtartinais’ Determinacijos koeficientai:


kintamaisiais?
• Jų yra net keli - ir visi pseudo.
• pakartojame regresijos modelį be • Dažniausiai taikomi Kokso-Snelo arba
‘įtartino’ kintamojo. Nagelkerkės koeficientai.
• tiriame klasifikacinę lentelę. • Kuo R2 didesnis, tuo modelis geresnis.
• jei klasifikavimo tikslumas praktiškai • Pavyzdyje apie įskaitą Nagelkerkės
nepakito - kintamąjį šaliname. koeficientas yra 0,565.

© V.Čekanavičius, G.Murauskas 263 © V.Čekanavičius, G.Murauskas 264

66
Pseudokintamieji Labai gerai duomenims
• Pseudokintamieji naudojami, kaip ir tinkančiame modelyje:
tiesinėje regresijoje. • Chi kvadrato p < 0,05.
• Pseudokintamieji koduojami, kaip ir • Visiems regresoriams Voldo kriterijaus
tiesinėje regresijoje (0 ir 1). p < 0,05.
• Jei kategorijų daugiau nei 2, reikia • Koeficientų ženklai neatrodo nelogiški.
net kelių pseudokintamųjų. • Teisingai klasifikuojama ne mažiau 50%
• SPSS perkoduoja automatiškai, jei atvejų, kai Y = 1 ir kai Y = 0.
paprašome. • Pasirinktasis determinacijos
koeficientas ≥ 0,20.
© V.Čekanavičius, G.Murauskas 265

Pavyzdys: Modelio schema:


• Ar padeda atskirti Estijos ir Portugalijos
20 – 30 metų vyrus tokie klausimai:
stfedu – požiūris į šalies švietimo
sistemą, happy – laimingumas, freehms
– gėjai ir lesbietės gali gyventi, kaip
nori.

© V.Čekanavičius, G.Murauskas 267 © V.Čekanavičius, G.Murauskas 268

Jei būtų
SPSS SPSS
kategorinių
priklausomas regresorių

nepriklausomi

Štai čia!
© V.Čekanavičius, G.Murauskas 269 © V.Čekanavičius, G.Murauskas 270

67
duomenų SPSS nauji
kodai
kodai
Klasifikacinė lentelė
Dependent Variable Encoding

Internal SPSS pateikia dvi klasifikacines lenteles:


Original Value Value
EE Estonia 0 Pirmoji skirta atsitiktinio spėjimo
PT Portugal 1 efektyvumui įvertinti.
Antroji rodo modelio gerumą (būtent ji ir
yra svarbiausia).
Modelyje Y= 1 atitiks Portugaliją,
Aptarsime antrąją klasifikacinę lentelę.
o Y = 0 – Estiją.
© V.Čekanavičius, G.Murauskas 271

SPSS SPSS
Omnibus Tests of Model Coefficients

Chi-square df Sig.
Step 1 Step 99.458 3 .000

Block 99.458 3 .000

Model 99.458 3 .000

Visos trys eilutės lentelėje yra identiškos.


Teisingai klasifikuota 72,1 % estų ir 75,6% Gerai, kai p < 0,05. Kadangi p = 0,000..,
portugalų. tai modelis gerai tinka.
© V.Čekanavičius, G.Murauskas 273 © V.Čekanavičius, G.Murauskas 274

determinacijos SPSS SPSS


koeficientai
Model Summary
Variables in the Equation

B S.E. Wald df Sig. Exp(B)


Step -2 Log likelihood Cox & Snell R Square Nagelkerke R Square Step 1a stfedu -.537 .081 43.471 1 .000 .585
1 266.388a .314 .419

a. Estimation terminated at iteration number 5 because parameter estimates changed happy .325 .090 13.019 1 .000 1.384
by less than .001.
freehms -.752 .145 27.018 1 .000 .471

Constant 2.498 .831 9.038 1 .003 12.157


Nagelkerkės determinacijos
pseudokoeficientas 0,419 pakankamai a. Variable(s) entered on step 1: stfedu, happy, freehms.

didelis (>0,20).
Visi kintamieji statistiškai reikšmingi.
© V.Čekanavičius, G.Murauskas 275 © V.Čekanavičius, G.Murauskas 276

68
Modelio lygtis
Bendra išvada Z= lnP(Y=1)/P(Y=0)
Variables in the Equation

Logistinės regresijos modelis gerai tinka = lnP(PT)/P(EE) =


B
duomenims. Step 1a stfedu -.537 – 0,537 stfedu
happy .325
+ 0,325 happy
freehms -.752 - 0,752 freehms
Constant 2.498 + 2,498
a. Variable(s) entered on step 1: stfedu, happy,
freehms.

© V.Čekanavičius, G.Murauskas 278

Modelio lygtis Prognozavimas


Z= lnP(PT)/P(EE) = – 0,537 stfedu Tarkime, kad domina iš kokios valstybės
+ 0,325 happy - 0,752 freehms + 2,498 yra respondentas, kuriam
stfedu =2, happy = 2, freehms = 1
• Didėjant stfedu, didėja tikimybė, kad iš EE.
• Didėjant happy, didėja tikimybė, kad iš PT. Įstatome šias reikšmes į
• Didėjant freehms, didėja tikimybė, kad iš EE. Z= lnP(PT)/P(EE) = – 0,537 stfedu
+ 0,325 happy - 0,752 freehms + 2,498 =
O ką tas didėjimas reiškia, paaiškės iš – 0,537 *2 + 0,325 *2 - 0,752*1 + 2,498 =
kintamųjų kodavimo. 1.322.
© V.Čekanavičius, G.Murauskas 279 © V.Čekanavičius, G.Murauskas 280

Prognozavimas Prognozavimas
Įstatę visas reikšmes gauname: Z NĖRA tikimybė. Z yra tikimybių
Z= lnP(PT)/P(EE) =1,322. santykis.

Kadangi z >0, tai prognozuojame Y=1 Tikimybė, kad respondentas iš


(cntry=PT), t.y., kad respondentas yra Portugalijos randama taip:
iš Portugalijos.
P(Y=1) =2,71^1,322/(1+2,71**1,322)= 0,79

© V.Čekanavičius, G.Murauskas 281 © V.Čekanavičius, G.Murauskas 282

69
Diskriminantinė analizė - toks
Diskriminantinė modelis, kai vieną
analizė (priklausomą) kategorinį
kintamąjį įtakoja keletas
(nepriklausomų) intervalinių
kintamųjų.
Discriminant Analysis

© V.Čekanavičius, G.Murauskas 283 © V.Čekanavičius, G.Murauskas 284

Duomenys

• (X11, X21, X31,…, Xk1, Y1) , .…, Y kategorinis


(X1n, X2n, X3n,…, Xkn, Yn) .
• tai, ką prognozuosime -
priklausomas kintamasis ( Y,
mokslinis laipsnis)
• pagal ką - nepriklausomi kintamieji X1
(regresoriai) ( X-ai , arogantiškumas,
X2 X3
įkyrumas). intervaliniai kintamieji
© V.Čekanavičius, G.Murauskas 285 © V.Čekanavičius, G.Murauskas 286

Kintamųjų diskriminacinės Kanoninės funkcijos


savybes parodo:
• Diskriminavimui naudojama ne
• Vilkso lambda - kuo mažesnė, tuo atskiri X-ai, o jų tiesiniai dariniai:
geriau diskriminuoja. f1(x)=a1+b11 X1 + b21X2 +… +bk1Xk ,
• Vilkso kriterijaus p-reikšmė (jei p < , f2(x)=a2+b12 X1 + b22X2 +… +bk2Xk,..
tai gerai).
• Reikia abiejų, nes p-reikšmė gali būti • Šios funkcijos sudaromos specialiu
maža ir dėl duomenų gausos. būdu ir vadinamos kanoninėmis
• Atskirų kintamųjų tyrimas - pagalbinė funkcijomis.
analizė (ne pati svarbiausia). • Jų analizė - svarbiau, nei atskirų X-ų.
© V.Čekanavičius, G.Murauskas 287 © V.Čekanavičius, G.Murauskas 288

70
Kanoninių funkcijų vertinimas: Kanoninių funkcijų % sudėtis:
• Žiūrime kiek % visomis kanoninėmis
• Kanoninėmis funkcijomis funkcijomis paaiškinamos dispersijos
paaiškinamos kintamųjų dispersijos tenka kiekvienai funkcijai.
procentinė sudėtis .
• Tai - santykinis rodiklis. Viena funkcija
• Vilkso lambda. gali būti svarbesnė už kitą, bet abi
• Vilkso statistikos p-reikšmė. netikusios.
• Jei yra tik viena kanoninė funkcija, tai
Apsiribosime proc. sudėtimi rodiklis beprasmis, nes =100%.

© V.Čekanavičius, G.Murauskas 289 © V.Čekanavičius, G.Murauskas 290

Kintamųjų įtaka kanoninėms


funkcijoms Klasifikacinė lentelė

• Standartizuotųjų (t.y. z-reikšmių) • tai pagrindinis diskriminantinės analizės


kanoninių funkcijų koeficientai (kuo tikimo indikatorius.
moduliu didesni, tuo X-as svarbesnis). • joje nusprendžiame kurios Y
Tai analogai. kategorijos priskirtinos esamos imties
• Atskirų X-ų ir kanoninių funkcijų duomenims.
koreliacijos. • kadangi tikrąsias Y reikšmes žinome,
• Padeda nustatyti ‘įtartinus’ X-us. galime nustatyti, kiek kartų suklydome.

© V.Čekanavičius, G.Murauskas 291 © V.Čekanavičius, G.Murauskas 292

Standartinis tyrimas:
Pavyzdys:
• Klasifikacinė lentelė.
• Kanoninių funkcijų svarba. • Ar galima atskirti lietuvį nuo latvio ir esto
pagal testų
• Kintamųjų įtaka, kanoninėms
funkcijoms. • Jūra (test1),
• Grafikas. • Sportas (test2),
• Vilkso kriterijus ‘įtartiniems’ X-ams rasti. • Kaimynai (test3)
• (Prognozavimas). rezultatus?

© V.Čekanavičius, G.Murauskas 293 © V.Čekanavičius, G.Murauskas 294

71
Duomenys Analyze -> Classify -> Discriminant

© V.Čekanavičius, G.Murauskas 295 © V.Čekanavičius, G.Murauskas 296

Analyze -> Classify -> Discriminant Statistics


Nurodome su čia
Define Range varnos

kintamieji

© V.Čekanavičius, G.Murauskas 297 © V.Čekanavičius, G.Murauskas 298

Classify -> Discriminant Classify

varnos

Tada čia

© V.Čekanavičius, G.Murauskas 299 © V.Čekanavičius, G.Murauskas 300

72
SPSS SPSS
a a
Classification Results teisinga prognozė Classification Results

Predicted Group Membership Predicted Group Membership


SALIS 1 lietuviai 2 latviai 3 estai Total SALIS 1 lietuviai 2 latviai 3 estai Total
Original Count 1 lietuviai 16 0 0 16 Original Count 1 lietuviai 16 0 0 16
2 latviai 0 11 2 13 2 latviai 0 11 2 13
3 estai 0 2 5 7 3 estai 0 2 5 7
% 1 lietuviai 100.0 .0 .0 100.0 % 1 lietuviai 100.0 .0 .0 100.0
2 latviai .0 84.6 15.4 100.0 2 latviai .0 84.6 15.4 100.0
3 estai .0 28.6 71.4 100.0 3 estai .0 28.6 71.4 100.0
a. 88.9% of original grouped cases correctly classified. a. 88.9% of original grouped cases correctly classified.
teisingų
prognozių %
© V.Čekanavičius, G.Murauskas 301 © V.Čekanavičius, G.Murauskas 302

SPSS f1 gerai diskriminuoja SPSS


2 f blogai diskriminuoja Summary of Canonical Discriminant Functions
Canonical Discriminant Functions
3
Eigenvalues
2
Canonical
1
Function Eigenvalue % of Variance Cumulative % Correlation
1 a
latviai 33.751 99.6 99.6 .986
lietuviai
2 a
0
.129 .4 100.0 .338
estai
SALIS a. First 2 canonical discriminant functions were used in the analysis.
-1
Group Centroids

estai
Function 2

-2
latviai
f1 tenka 99.6 % paaiškinamos dispersijos, f2 0.4 %
-3 lietuviai
-8 -6 -4 -2 0 2 4 6 8

© V.Čekanavičius, G.Murauskas 303 © V.Čekanavičius, G.Murauskas 304


Function 1

SPSS SPSS
Structure Matrix Vilkso p-reikšmės
Function
1 2 Tests of Equality of Group Means
TEST1 .854* .498
TEST2 -.136 .987 * Wilks'
TEST3 .254 .514 *
Lambda F df1 df2 Sig.
TEST1 .039 406.803 2 33 .000
Pooled within-groups correlations between discriminating
variables and standardized canonical discriminant functions TEST2 .572 12.364 2 33 .000
Variables ordered by absolute size of correlation within function. TEST3 .311 36.491 2 33 .000
*. Largest absolute correlation between each variable and
any discriminant function

Visų kintamųjų p-reikšmės mažos,


Labiausiai f1 koreliuoja su TEST1 (Jūra) rezultatais. tačiau Vilkso maža tik TEST1 (Jūra).

© V.Čekanavičius, G.Murauskas 305 © V.Čekanavičius, G.Murauskas 306

73
SPSS (prognozavimas) SPSS (prognozavimas)
Kintamieji
Classification Function Coefficients Classification Function Coefficients

SALIS SALIS
1 lietuviai 2 latviai 3 estai 1 lietuviai 2 latviai 3 estai
TEST1 -1.234 .461 .163 TEST1 -1.234 .461 .163
TEST2 7.881 6.221 6.221 TEST2 7.881 6.221 6.221
TEST3 1.101 .685 .780 TEST3 1.101 .685 .780
(Constant) -351.724 -301.126 -278.343 (Constant) -351.724 -301.126 -278.343
Fisher's linear discriminant functions Fisher's linear discriminant functions

lietuviui Fišerio funkcija = latviui Fišerio funkcija =


-1.23*TEST1 + 7.88*TEST2+1.10*TEST3 - 351.72 0.46*TEST1 + 6.22*TEST2+0.68*TEST3 - 301.12
© V.Čekanavičius, G.Murauskas 307 © V.Čekanavičius, G.Murauskas 308

SPSS (prognozavimas) Prognozavimas:


Classification Function Coefficients
• Tarkime TEST1=30, TEST2= 80,
SALIS
1 lietuviai 2 latviai 3 estai
TEST3=70.
TEST1 -1.234 .461 .163 • Fišerio funkcijos:
TEST2 7.881 6.221 6.221
• Lietuviui= 318.78.
TEST3 1.101 .685 .780
(Constant) -351.724 -301.126 -278.343 • Latviui= 257.91.
Fisher's linear discriminant functions • Estui= 269.75.
• Prognozuojame, kad respondentas
estui Fišerio funkcija =
0.16*TEST1 + 6.22*TEST2+0.78*TEST3 - 278.34 lietuvis.
© V.Čekanavičius, G.Murauskas 309 © V.Čekanavičius, G.Murauskas 310

Klasterinė analizė - objektus


Klasterinė analizė pagal panašumą suskirstome į
grupes - klasterius.

Cluster Analysis
Klasteris - panašių objektų
grupė.

© V.Čekanavičius, G.Murauskas 311 © V.Čekanavičius, G.Murauskas 312

74
PAVYZDŽIAI Krepšinio komandų klasterizavimo
rezultato pavyzdys
• pagal testų rezultatus grupuojame
tiriamuosius;
• I klasteris: Žalgiris, L.Rytas
• pagal sesijos rezultatus
• II klasteris: Šiauliai, Prienai
sugrupuojame II kurso psichologus;
• III klasteris: Sakalai, Neptūnas
• pagal socio-ekonominius parametrus
norime suskirstyti valstybes į grupes;
• pagal nuobodumo laipsnį
grupuojame pažįstamus.

© V.Čekanavičius, G.Murauskas 313 © V.Čekanavičius, G.Murauskas 314

Klasterinės analizės metodai


Duomenys
• Hierarchiniai (jungimo arba
• (X11, X21, X31,…, Xk1) , .…, skaidymo).
(X1n, X2n, X3n,…, Xkn) . • Nehierarchiniai (K-vidurkių ir kt.)
• yra tik kintamųjų X-ų reikšmės!
• kintamieji X- intervaliniai, Mes mokysimės tik k-vidurkių
ranginiai, kategoriniai. klasterizaciją.

© V.Čekanavičius, G.Murauskas 315 © V.Čekanavičius, G.Murauskas 316

SPSS pagal ką SPSS


Štai čia!

respondentų
sąrašas

po to čia

klasterių
skaičius
© V.Čekanavičius, G.Murauskas 317 © V.Čekanavičius, G.Murauskas 318

75
SPSS SPSS informacija apie
pradiniai centrai pradinius klasterių
centrus

Initial Cluster Centers

Cluster
1 2
klasterizavimo IQ 97.00 95.00
rezultatai
PAZYMYS 10.00 5.00

© V.Čekanavičius, G.Murauskas 319 © V.Čekanavičius, G.Murauskas 320

SPSS kokiam klasteriui SPSS informacija apie


priklauso galutinius klasterių
centrus
Cluster Membership
Final Cluster Centers
Case Number VARDAS Cluster Distance
1 A 1 1.000 Cluster
2 B 2 1.944
1 2
3 C 1 1.000
IQ 97.00 95.00
4 D 2 1.054
5 E 2 1.333 PAZYMYS 9.00 6.33
atstumas iki
klasterio centro
© V.Čekanavičius, G.Murauskas 321 © V.Čekanavičius, G.Murauskas 322

SPSS

Number of Cases in each Cluster

Cluster 1 2.000 Faktorinė analizė


2 3.000
Valid 5.000
Missing .000 FACTOR ANALYSIS

© V.Čekanavičius, G.Murauskas 323 © V. Čekanavičius, G. Murauskas 324

76
Faktorinė analizė - toks modelis, kai Faktorinė analizė
vienas tiesiogiai nestebimas
kintamasis (latentinis faktorius) matematika
įtakoja keletą stebimų intervalinių
kintamųjų. stebimi
gabumai kintamieji
fizika
Dažniausiai būna keli faktoriai.
Nemaišyti su dispersine analize latentinis
faktorius chemija
ANOVA
© V. Čekanavičius, G. Murauskas 325 © V. Čekanavičius, G. Murauskas 326

• Tikslas - išskirti kuo geriau • Latentinio faktoriaus pavadinimą


kintamųjų elgesį aprašančius sugalvoja tyrėjas.
faktorius. • Faktorių skaičių parenka tyrėjas.
• Naudojant faktorių reikšmes • Faktorinė analizė tinka ne visada.
sumažėja tiriamų kintamųjų. • Skirtingos faktorinės analizės
• Taip pat sumažėja ir turimos išskiria skirtingus faktorius.
informacijos. • Ne visada lengva interpretuoti
faktorius.

© V. Čekanavičius, G. Murauskas 327 © V. Čekanavičius, G. Murauskas 328

PAVYZDŽIAI PASTABA
• tiriame, kas gali vienyti politikus (gal • faktorinė analizė geriau tinka vieno
pažiūrų kairumas, gal autoritetas) reiškinio skirtingų aspektų analizei; nei
• ką atpindi pažymiai (gabumus • kelių visiškai skirtingų reiškinių
apskritai, ar gabumus humanitariniams grupavimui;
bei tiksliesiems mokslams; • jei turime testą skirtą gabumams ir
• kas vienija respondentų požiūrį į fiziniam parametrams matuoti-
skirtingus muzikinius stilius; • geriau taikyti dvi faktorines analizes,
• kokios klausimų grupės išsiskiria kiekvienam pustesčiui.
klausimyne.

© V. Čekanavičius, G. Murauskas 329 © V. Čekanavičius, G. Murauskas 330

77
Faktorinės analizės prielaidos
Faktorinės analizės etapai
• visi X-ai normalūs;
• visi F-ai nekoreliuoti ir turi • Patikrinimas ar tinka duomenys.
vienetines dispersijas; • Faktorių išskyrimas.
• paklaidos ej nekoreliuotos; • Faktorių sukimas ir
• F-ai ir paklaidos nekoreliuoja. interpretavimas.
• Faktorių reikšmių skaičiavimas.

© V. Čekanavičius, G. Murauskas 331 © V. Čekanavičius, G. Murauskas 332

Duomenų tikimas Kiek faktorių imti?

• Kintamieji X-ai turi koreliuoti. • Dažniausiai žiūrima, kiek kintamųjų


Koreliuotumą vertina: elgesio dispersijos paaiškina faktoriai.
• Nėra griežtos taisyklės, kiek kintamųjų
• Bartleto kriterijus (gerai, kai p <
dispersijos turi paaiškinti faktoriai.
).
• Interpretacija-daugiau dispersijos
• Kaizerio-Mejerio-Olkino matas. paaiškina, daugiau ir informacijos apie
Blogai, kai KMO<0.50 (mažiau už kintamųjų elgesį išlaikome, pereidami
vieną antrąją). prie faktorių.

© V. Čekanavičius, G. Murauskas 333 © V. Čekanavičius, G. Murauskas 334

Faktorių nustatymas
Faktorių interpretavimas
• Faktorius paaiškina tuos kintamuosius,
kuriems jo svoris didelis. • sugalvoti faktoriui pavadinimą -
• Vertinimas ‘iš akies’: svoris didelis, jei tyrėjo reikalas.
absoliutiniu didumu >0.4. • tai priklauso nuo tyrėjo išsilavinimo.
• Gali tą patį kintamąjį paaiškinti keli • tą patį faktorių vienas įvardins, kaip
faktoriai. percepcinę organizaciją, o kitas, kaip
• Tada kintamąjį priskiriame tam, kuris objekto-visumos suvokimą.
geriau tinka pagal prasmę. • teisus tas, kuris sugeba įtikinti kitus.

© V. Čekanavičius, G. Murauskas 335 © V. Čekanavičius, G. Murauskas 336

78
Pastaba Faktorių sukimas

• pagrindinių komponenčių analizė • tačiau dominuojantis pirmasis


reiškia, kad pirmas faktorius faktorius labai apsunkina faktorių
svarbiausias, po to antras ir t.t. interpretaciją.
• dominuojantis pirmasis faktorius • sunku interpretuoti ir kai tas pats X
liudija, kad matuojame vieno pakliūna į keletą faktorių.
reiškinio skirtingus aspektus (tai • išeitis faktorių sukimas.
gerai). • nauji faktoriai - senųjų tiesinės
daugdaros.
© V. Čekanavičius, G. Murauskas 337 © V. Čekanavičius, G. Murauskas 338

Faktorių sukimas Faktorių reikšmės

• po sukimo faktorių interpretacija • nėra vieningos skaičiavimo


gali keistis. metodikos.
• yra visokių sukimų. • naudojant SPSS siūlomas
technikas rezultatai normuoti;
• populiariausias VARIMAX
• dažnai faktoriaus reikšme
• gali netikti nė vienas sukimas.
laikomas atitinkamų kintamųjų
reikšmių vidurkis.
© V. Čekanavičius, G. Murauskas 339 © V. Čekanavičius, G. Murauskas 340

SPSS
Pavyzdys Štai čia!

• failas B1994, politikų vertinimai.


• kokios politikų grupės išsiskiria.
• kas keičiasi po sukimo.

© V. Čekanavičius, G. Murauskas 341 © V. Čekanavičius, G. Murauskas 342

79
SPSS
kintamieji SPSS po to čia

KMO

© V. Čekanavičius, G. Murauskas 343 © V. Čekanavičius, G. Murauskas 344

SPSS SPSS
po to čia

Jei norime, tai


galime patys
nurodyti norimą
faktorių skaičių.
faktorių skč.

© V. Čekanavičius, G. Murauskas 345 © V. Čekanavičius, G. Murauskas 346

SPSS SPSS

Varimax

po to čia

© V. Čekanavičius, G. Murauskas 347 © V. Čekanavičius, G. Murauskas 348

80
SPSS SPSS

Keičiame
varna
į 0.4

po to čia

© V. Čekanavičius, G. Murauskas 349 © V. Čekanavičius, G. Murauskas 350

SPSS SPSS trys faktoriai


Total Variance Explained

Initial Eigenvalues Extraction Sums of Squared Loadings


Rotation Sums of Squared Loadings
KMO and Bartlett's Test ComponentTotal % of Variance Cumulative %Total % of VarianceCumulative %Total % of Variance
Cumulative %
1 4.366 33.585 33.585 4.366 33.585 33.585 2.941 22.626 22.626
2
Kaiser-Meyer-Olkin Measure of Sampling 3
1.664
1.214
12.800
9.335
46.384
55.719
1.664
1.214
12.800
9.335
46.384
55.719
2.327
1.976
17.897
15.196
40.523
55.719

Adequacy. .851 4
5
.914
.763
7.033
5.867
62.752
68.619
6 .672 5.166 73.784
7 .605 4.657 78.442
Bartlett's Test of Approx. Chi-Square 4360.774 8 .563 4.328 82.770
9
Sphericity df 78 10
.517
.465
3.974
3.576
86.744
90.320
paaiškinama
11 .450 3.460 93.780 dispersija
Sig. .000 12 .438 3.366 97.146 tikrinės
13 .371 2.854 100.000 reikšmės
Extraction Method: Principal Component Analysis.
Duomenims FA labai gerai tinka.
© V. Čekanavičius, G. Murauskas 351 © V. Čekanavičius, G. Murauskas 352

SPSS faktorių svorių matrica


prieš sukimą
F2-kairieji, F3-dešinieji, SPSS faktorių svorių matrica
po sukimo

© V. Čekanavičius, G. Murauskas 353 © V. Čekanavičius, G. Murauskas 354

81
KĄ DARO?

• Regresijos išplėtojimas, kai nurodome koks


intervalinis nuo kokių kitų intervalinių
HLM kintamųjų priklauso.
• Regresijos lygties daugikliai yra naujų
Tiesiniai hierarchiniai kintamųjų priklausomi kintamieji.
modeliai

V.Čekanavičius, G.Murauskas 2

PAVYZDYS Idėja:
• Norime išsiaiškinti, kaip matematikos testo
mokykla 3 lygmuo
rezultatus veikia socialinė-ekonominė aplinka
ir klasė.
• Duomenys turi hierarchinę struktūrą, nes
klasės charakteristikos daro įtaką visiems tos 1 klasė 2 klasė 2 lygmuo

klasės mokiniams.
1 lygmuo

mokiniai

V.Čekanavičius, G.Murauskas 3 V.Čekanavičius, G.Murauskas 4

PASTABOS: Tipinė HLM tyrimo eiga


• Ir pirmojo ir antrojo lygmens stebėjimų turi • Pradžioje visada sudaromas besąlyginis
būti nemažai – negalima hierarchinio modelio (nulinis) modelis.
taikyti tik porai mokyklų. • Sudaromas sudėtingesnis modelis.
• Matuojami kintamieji – normalūs arba • Modeliai lyginami, aiškinamasi kuris geresnis.
kategoriniai. • Visi modelių lyginimai prasmingi tik tada, kai
• Kategorinių kintamųjų neturėtų būti labai jie sudaryti tiems patiems duomenims.
daug.

V.Čekanavičius, G.Murauskas 5 V.Čekanavičius, G.Murauskas 6

82
Besąlyginis HLM modelis Besąlyginis HLM modelis
• HLM iliustracijai pasirinktas duomenų poaibis –
kaimo ir Vilniaus miesto mokyklų 8 klasės moksleivių
• Besąlyginis (nulinis) modelis svarbus tuo, kad tyrimo rezultatai.
kiti hierarchiniai modeliai su juo lyginami.
• Besąlyginio modelio analizė padeda atsakyti į • Turime 559 mokinio iš 27 mokyklų matematikos
klausimą ar apskritai galima kalbėti apie testo rezultatus ir įvairius mokyklą bei mokinį
apibūdinančius duomenis.
hierarchinių modelių tinkamumą.
• Besąlyginį HLM modelį sudaro lygtys abiems –
mokinio ir mokyklos – lygmenims.

V.Čekanavičius, G.Murauskas 7 V.Čekanavičius, G.Murauskas 8

Besąlyginis HLM modelis MODELIO IDĖJA


• Vadovausimės tokia logika:
• mokinio rezultatų skirtumas nuo visos mokyklos vidurkio
atspindi tai, kad būdinga tik tam mokiniui – jo gabumus, namų
aplinką, repetitoriaus patirtį ir pan.

Mokinio
• Mokyklos rezultatas
rezultatas = mokyklos
= visų mokyklų vidurkis+
vidurkis+šios mokyklos
įtaka. individualūs skirtumai nuo vidurkio.
• Analogiškai aprašome mokyklos lygmenį:

• Mokyklos rezultatas = visų mokyklų vidurkis+šios mokyklos


Mokyklos rezultatas = visų mokyklų vidurkis+šios mokyklos įtaka.
įtaka.

V.Čekanavičius, G.Murauskas 9 V.Čekanavičius, G.Murauskas 10

Besąlyginis HLM modelis Besąlyginis HLM modelis


• Mokinio lygmuo:
MAT     u 0  e
MAT  0  e • Parametras   nusako visų mokyklų matematikos
testo rezultatų vidurkį.
• Mokyklos lygmuo: • Mokyklų skirtumus rodo kintamojo u0
 0     u 0 dispersija  00 .
• Mokinių individualius skirtumus – kintamojo
• Jungtinis modelis:
e dispersija  2 .
MAT     u 0  e • Kuo dispersijos didesnės, tuo didesni ir atitinkami
skirtumai.
V.Čekanavičius, G.Murauskas 11 V.Čekanavičius, G.Murauskas 12

83
Besąlyginis HLM modelis Besąlyginio modelio tyrimas su SPSS


•  - fiksuoto poveikio parametras, • Duomenys turi tradicinę struktūrą – vienam
mokiniui skiriama viena eilutė.

 00 ir - 2 - atsitiktinio poveikio parametrai. • Be to, yra kintamasis IDMOK,


kuriame nurodytas mokyklos kodas.

V.Čekanavičius, G.Murauskas 13 V.Čekanavičius, G.Murauskas 14

Besąlyginio modelio tyrimas su SPSS Besąlyginio modelio tyrimas su SPSS


duomenys

Atidaromas Mixed Models langas.

čia

V.Čekanavičius, G.Murauskas 15 V.Čekanavičius, G.Murauskas 16

Besąlyginio modelio tyrimas su SPSS Besąlyginio modelio tyrimas su SPSS


po to -
čia

mokyklos
kodas

perkeliame

tada
čia

V.Čekanavičius, G.Murauskas 17 V.Čekanavičius, G.Murauskas 18

84
Besąlyginio modelio tyrimas su SPSS Besąlyginio modelio tyrimas su SPSS
keičiame į
Unstructured
Tada,
čia

pažymime

perkeliame

V.Čekanavičius, G.Murauskas 19 V.Čekanavičius, G.Murauskas 20

Besąlyginio modelio tyrimas su SPSS Besąlyginio modelio tyrimas su SPSS

varnos

OK

V.Čekanavičius, G.Murauskas 21 V.Čekanavičius, G.Murauskas 22

Besąlyginio modelio tyrimas su SPSS Besąlyginio modelio tyrimas su SPSS

• SPSS programa pateikia informacinių • Informacinių kriterijų reikšmės. Reikės vėliau –


• AIC (Akaikės), lyginant du modelius.
• AICC (Hurvičiaus ir Tsai),
• CAIS (Bozdogano), • mažesnė reikšmė –
• BIC (Švarco – Bajeso) kriterijų reikšmes.
geriau.
• Į šias reikšmes atsižvelgiama, kai lyginami du
modeliai.
• Modelis, turintis mažesnes informacinių kriterijų
reikšmes, geriau suderintas su duomenimis.
V.Čekanavičius, G.Murauskas 23 V.Čekanavičius, G.Murauskas 24

85
Besąlyginio modelio tyrimas su SPSS Besąlyginio modelio tyrimas su SPSS
Pateikiamas parametro  įvertis ˆ  499,47
• Primename, kad   - - tai bendras visų mokyklų


Be to patikrinama hipotezė H 0 :    0 matematikos testo MAT vidurkis.



Kadangi p<0,05 , tai H1 :    0
stat.reikšmingai    0 . • Statistinės hipotezės išvada, kad jis nelygus nuliui
nėra itin vertinga (niekas ir nesitikėjo, kad visi bus
beraščiai).
• Įvertis ˆ  499,47 -- daug svarbesnis.

V.Čekanavičius, G.Murauskas 25 V.Čekanavičius, G.Murauskas 26

Besąlyginio modelio tyrimas su SPSS Besąlyginio modelio tyrimas su SPSS


Tikrinamos dvi hipotezės apie I ir II lygmenų paklaidų • Abi nulinės hipotezės atmetamos, darome
dispersijas:
išvadą, kad
 00  0
, ir 2
 0
H 0 :    0 H 0 :  2  0
  • Gavome patvirtinimą, kad modelis nepilnai
H1 :    0 H1 :  2  0 paaiškina rezultatų skirtumus.

Taip pat pateikiami šių atsitiktinių parametrų įverčiai.

V.Čekanavičius, G.Murauskas 27 V.Čekanavičius, G.Murauskas 28

Besąlyginio modelio tyrimas su SPSS Besąlyginio modelio tyrimas su SPSS

• Gauti dispersijų įverčiai yra dideli: • Nagrinėjant besąlyginį modelį patartina suskaičiuoti
tarpklasinės koreliacijos koeficientą ICC (Intraclass
• ˆ  2356,11 ir ˆ 2
00   5117,19 . correlation coefficient), kuris parodo, kaip stipriai
skiriasi grupių (mokyklų) rezultatai, lyginant su
rezultatais grupėse.
Taigi, modelis duomenims tinka blogai.
ˆ00
ICC 
ˆ00  ˆ 
• Kuo ICC didesnis, tuo labiau įtikėtina, kad reikia
atsižvelgti į hierarchinę duomenų struktūrą.

V.Čekanavičius, G.Murauskas 29 V.Čekanavičius, G.Murauskas 30

86
Besąlyginio modelio tyrimas su SPSS Besąlyginio modelio tyrimas su SPSS

• Pavyzdyje • Ir ICC ir atsitiktinių parametrų įverčiai rodo, kad reikia


sudaryti sudėtingesnį modelį.
2356,11 • Įtraukdami naujus I ir II lygmenų kintamuosius,
ICC   0,315... siekiame sumažinti įverčių
2356,11  5117,19
ˆ00  2356,11 ˆ 2  5117,19
• Tai nėra itin didelė reikšmė. Ji interpretuojama taip:
apie 31,5 procento mokinio rezultatų priklauso nuo didumus (jie parodo tuos mokinių ir mokyklų
mokyklos. skirtumus, kurių nepaaiškina modelis).

V.Čekanavičius, G.Murauskas 31 V.Čekanavičius, G.Murauskas 32

HLM modelis su antrojo lygmens HLM modelis su antrojo lygmens


intervaliniu kintamuoju intervaliniu kintamuoju
Manome, kad : • Grafiškai modelis atrodo taip:
• mokinio matematikos testo rezultatas
priklauso nuo jo socialinio ir ekonominio
statuso (CSES);
• mokykos įtaka visiems mokiniams vienoda;
• mokyklos įtakos stiprumą lemia jos mokinių
socialinio ir ekonominio statuso vidurkis
(MSES).

V.Čekanavičius, G.Murauskas 33 V.Čekanavičius, G.Murauskas 34

HLM modelis su antrojo lygmens HLM modelis su antrojo lygmens


intervaliniu kintamuoju intervaliniu kintamuoju
Reikalavimai kintamiesiems: • Pasižiūrime, kurio lygmens kintamųjų turime:
• Priklausomas kintamasis (MAT) būtinai
intervalinis.
• pirmojo (mokinio) lygmens kintamieji: CSES.
• Kiti kintamieji intervaliniai arba kategoriniai
(pseudokintamieji). • antrojo (mokyklos) lygmens kintamieji: MSES.
• Šiame pvz. visi kiti kintamieji CSES, MSES yra
intervaliniai.
• Paklaidos (liekanos) – normaliai
pasiskirsčiusios ir nepriklausomos.
V.Čekanavičius, G.Murauskas 35 V.Čekanavičius, G.Murauskas 36

87
HLM modelis su antrojo lygmens HLM modelis su antrojo lygmens
intervaliniu kintamuoju intervaliniu kintamuoju
• Mokinio lygmens lygtis gana akivaizdi: • Antrojo lygmens kintamieji į modelį įtraukiami,

MAT    CSES  e.
tariant, kad atitinkami
atsitiktiniai.
 koeficientai yra
• Laikomasi tokio principo:
• Čia e žymi atsitiktinę paklaidą, kuri yra normaliai • Kintamieji, kurie veikia visus mokinius vienodai,
pasiskirsčiusi su nuliniu vidurkiu ir nežinoma įtraukiami į lygtį, aprašančią laisvą narį  0 .
dispersija  2 . Ši dispersija atspindi skirtumus tarp • Kintamieji, kurie turi sąveiką su CSES, įtraukiami į
mokinių, atsiradusius ne dėl mokyklų įtakos. lygtį, aprašančią koeficientą  .
1

V.Čekanavičius, G.Murauskas 37 V.Čekanavičius, G.Murauskas 38

HLM modelis su antrojo lygmens HLM modelis su antrojo lygmens


intervaliniu kintamuoju intervaliniu kintamuoju
• Taigi, antrojo lygmens lygtys yra tokios: • Primename, kad dispersijos
 00 , 11
      01MSES  u 0 ,
• atspindi rezultatų skirtumus, atsirandančius dėl
1   1  u1. mokyklų įtakos.
• Tačiau tik tuos skirtumus, kurių nepaaiškina
• Čia  ij nežinomos konstantos. pasirinktasis modelis.
• Kuo šios dispersijos mažesnės, tuo modelis geriau
• Paklaidos u 0 , u1 turi dispersijas  00 , 11 ir gali suderintas su duomenimis.
koreliuoti (kovariacija  ).
01

V.Čekanavičius, G.Murauskas 39 V.Čekanavičius, G.Murauskas 40

HLM modelis su antrojo lygmens HLM modelis su antrojo lygmens


intervaliniu kintamuoju intervaliniu kintamuoju
• Galima sudaryti jungtinę lygtį: • Fiksuoto (pastovaus) poveikio parametrai

MAT      01MSES   CSES    ,  01,  .


 e  u 0  u1CSES . • atsitiktinio poveikio parametrai (liekanų e, u 0 , u
dispersijos ir kovariacijos):
• Matome, kad modelyje išsiskiria fiksuotų poveikių
komponentas ir  00 , , ,   .
• atsitiktinių poveikių komponentas.

V.Čekanavičius, G.Murauskas 41 V.Čekanavičius, G.Murauskas 42

88
HLM modelis su antrojo lygmens
Modelio tyrimas su SPSS
intervaliniu kintamuoju
• Kintamieji prie  vadinami fiksuoto poveikio Atidaromas Mixed Models langas.
kintamaisiais, o kintamieji prie u – atsitiktinio
poveikio kintamaisiais.
• Fiksuoto poveikio kintamieji: CSES ir MSES.
• Atsitiktinio – kintamasis CSES. čia

MAT      01MSES   CSES 


 e  u 0  u1CSES .

V.Čekanavičius, G.Murauskas 43 V.Čekanavičius, G.Murauskas 44

Modelio tyrimas su SPSS Modelio tyrimas su SPSS


priklauso po to,
mas čia

mokyklos
kodas
visi kiti
intervaliniai

tada
čia

V.Čekanavičius, G.Murauskas 45 V.Čekanavičius, G.Murauskas 46

Modelio tyrimas su SPSS Modelio tyrimas su SPSS


po to
čia
Perkeliam
visus
fiksuoto
poveikio
kintamuosius

varna

V.Čekanavičius, G.Murauskas 47 V.Čekanavičius, G.Murauskas 48

89
Modelio tyrimas su SPSS Modelio tyrimas su SPSS
Keičiam į varna
Ustructured

po to
keliam atsitiktinio čia
poveikio kintamąjį

perkeliam

V.Čekanavičius, G.Murauskas 49 V.Čekanavičius, G.Murauskas 50

Modelio tyrimas su SPSS Modelio tyrimas su SPSS

varnos

OK

V.Čekanavičius, G.Murauskas 51 V.Čekanavičius, G.Murauskas 52

Modelio tyrimas su SPSS Modelio tyrimas su SPSS


Planas: • Akaikės ir kitų indeksų sumažėjimas bent per 10
• Lyginsime AIC ir kitus informacinius indeksus su vienetų jau laikomas svarbiu.
besąlyginiu modeliu.
• Tikrinsime,kurie fiksuoti parametrai statistiškai
nereikšmingi.
• Tikrinsime, kurie atsitiktiniai parametrai statistiškai
nereikšmingi.
• Tikrinsime, kiek sumažėjo atsitiktinių parametrų
dispersijų įverčiai.
Nujasis modelis Besąlyginis
V.Čekanavičius, G.Murauskas 53 V.Čekanavičius, G.Murauskas 54

90
Modelio tyrimas su SPSS Modelio tyrimas su SPSS
Visi pastovaus poveikio kintamieji statistiškai • Gauti atsitiktinių parametrų įverčiai :
reikšmingi. ˆ  175,94
 ˆ00  559,48 ˆ01  0,371 ˆ11  9,19
ˆ1  16,56 ˆ1  8,04
ˆ   4290,92

V.Čekanavičius, G.Murauskas 55 V.Čekanavičius, G.Murauskas 56

Modelio tyrimas su SPSS Modelio tyrimas su SPSS


• Matome, kad  0 ir 1 statistiškai Įsitikiname, kad respondentų skirtumus
reikšmingai nekoreliuoja, nes atitinkama p atspindinti dispersija nėra itin maža:
reikšmė lygi 0,99; o ir pats kovariacijos įvertis ˆ 2  4290,92
mažas:ˆ01  0,371 . Vis dėlto, lyginant su besąlyginio modelio
• Taip pat matome, kad parinktoji antrojo analogiška dispersija (s2 = 5117,19), aišku,
lygmens lygtis parametrą 1 aprašo kad dispersija ženkliai sumažėjo.
pakankamai išsamiai (atitinkama p reikšmė Galima ištirti, kuri dalis dispersijos dingo.
0,408). To negalima pasakyti apie  0 .

V.Čekanavičius, G.Murauskas 57 V.Čekanavičius, G.Murauskas 58

Modelio tyrimas su SPSS Modelio tyrimas su SPSS


Formulė: Reziumuodami, galime pasakyti, kad
ˆ sena
2
 ˆ nauja
2

nagrinėjamas modelis daug geriau tinka


ˆ sena
2
duomenims nei besąlyginis modelis.
Gauname: 5117,19  4290,92 Testo rezultatai matuojami šimtais balų. Todėl
 0,161...
5117,19 rezultatų paklaidos standartinis nuokrypis
Interpretuojame taip: lyginant su besąlyginiu modeliu, nėra labai didelis ˆ  65,49...
16% sumažėjo modeliu nepaaiškintų mokinių
Tai įgalina modelį laikyti pakankamai geru.
rezultatų skirtumų. Gana nemenkas išlošimas.
Žinoma, tai nereiškia, kad nėra geriau
duomenims tinkančių modelių.
V.Čekanavičius, G.Murauskas 59 V.Čekanavičius, G.Murauskas 60

91
Modelio tyrimas su SPSS Modelio tyrimas su SPSS
Jei norime daryti prognozes, tai tiesiog įstatome Įstatę konkrečias kintmųjų CSES ir MSES
fiksuotų parametrų įverčius į jungtinę lygtį: reikšmes, gautume testo rezultato prognozę
MAT  ˆ  ˆ01MSES  ˆCSES. konkrečiam mokiniui.
Be to, ši regresinė lygtis leidžia įvertinti mokyklos
Nagrinėtiems duomenims gauname: įtaką. Iš tikro, kiekvienas papildomas MSES
balas padidina testo rezultatą 16,56 taško.
MAT  175,94  16,56MSES  8,04CSES. MAT  175,94  16,56MSES  8,04CSES.

V.Čekanavičius, G.Murauskas 61 V.Čekanavičius, G.Murauskas 62

Kategorinis kintamasis Kategorinis kintamasis


• Ištirsime modelį su antrojo lygmens kategoriniu • Mokinio matematikos testo rezultatas priklauso nuo
kintamuoju VK, nurodančiu mokyklos priklausomybę jo socialinio ir ekonominio statuso:
Vilniaus miestui.
MAT    CSES  e.
• Kategorinis (nebūtinai dvireikšmis) kintamasis,
patalpinamas į laukelį Factor(s). • Mokyklos įtaka priklauso nuo mokyklos socialinio ir
• Tirsime ankstesnį modelį, papildytą šiuo antrojo ekonominio statuso vidurkio ir mokyklos lokalizacijos:
lygmens kintamuoju.
• Suformuluosime sąlygas tiksliau.       MSES   1 VK  u 0 .

V.Čekanavičius, G.Murauskas 63 V.Čekanavičius, G.Murauskas 64

Kategorinis kintamasis Kategorinis kintamasis


• Vilniaus mokyklose socialinio ir ekonominio statuso • Jungtinė lygtis:
reikšmė kitokia nei kitose mokyklose: M AT   00   01M SES   10CSES
   10   11VK  u1.   02VK   12VK  CSES
• Čia e turi dispersiją  2 .  [u1CSES  u 0  e].
• Fiksuotieji kintamieji: CSES, MSES, VK, VKxCSES .
• Paklaidos u 0 , u1 turi dispersijas  00 , 11 ir gali
• Atsitiktiniai kintamieji: CSES ir postūmis.
koreliuoti (kovariacija  0 1 ).

V.Čekanavičius, G.Murauskas 65 V.Čekanavičius, G.Murauskas 66

92
Modelio tyrimas su SPSS Modelio tyrimas su SPSS

Atidaromas Mixed Models langas.


mokyklos
kodas

čia

tada
čia

V.Čekanavičius, G.Murauskas 67 V.Čekanavičius, G.Murauskas 68

Modelio tyrimas su SPSS Modelio tyrimas su SPSS


priklauso po to,
mas čia
Perkeliam
visus
kategorinis
fiksuoto
poveikio
kintamuosius

visi kiti
intervaliniai varna

V.Čekanavičius, G.Murauskas 69 V.Čekanavičius, G.Murauskas 70

Modelio tyrimas su SPSS Modelio tyrimas su SPSS


Keičiam į varna
po to Ustructured
čia

keliam atsitiktinio
poveikio kintamąjį

perkeliam

V.Čekanavičius, G.Murauskas 71 V.Čekanavičius, G.Murauskas 72

93
Modelio tyrimas su SPSS Modelio tyrimas su SPSS

varnos
po to
čia

V.Čekanavičius, G.Murauskas 73 V.Čekanavičius, G.Murauskas 74

Modelio tyrimas su SPSS Modelio tyrimas su SPSS


Planas:
• Lyginsime AIC ir kitus informacinius indeksus su
ankstesniu modeliu.
• Tikrinsime,kurie fiksuoti parametrai statistiškai
nereikšmingi.
OK
• Tikrinsime, kurie atsitiktiniai parametrai statistiškai
nereikšmingi.
• Tikrinsime, kiek sumažėjo atsitiktinių parametrų
dispersijų įverčiai.

V.Čekanavičius, G.Murauskas 75 V.Čekanavičius, G.Murauskas 76

Modelio tyrimas su SPSS Modelio tyrimas su SPSS


• Akaikės ir kitų indeksų sumažėjimas bent per 10 Ne visi fiksuoto poveikio kintamieji statistiškai
vienetų jau laikomas svarbiu. reikšmingi.

Nujasis modelis Ankstesnis modelis


V.Čekanavičius, G.Murauskas 77 V.Čekanavičius, G.Murauskas 78

94
Modelio tyrimas su SPSS Svarbi problema
• Matome, kad reikėtų pabandyti iš modelio • Jei I lygmenyje įtrauksime labai stipriai su rezultatu
pašalinti kintamųjų sąveiką VKxCSES . Galbūt koreliuojantį kintamąjį, tai paaiškės, kad joks HLM
modelis netinka.
ir atsisakyti konstantos .
• Pvz., jei įtrauksime fizikos testo rezultatą FIZ:
• Išsamesnė pavyzdžio analizė pateikta knygos
skyrelyje HLM modelių tyrimas SPSS MAT    FIZ  e.
programa.
• Paaiškės, kad geriau mokantys fiziką, geriau ir
matematiką išmano. Ir kas iš to? Norint pagerinti
matematikos žinias, reikia sustiprinti fizikos mokymą?
Kažin, kažin.
V.Čekanavičius, G.Murauskas 79 V.Čekanavičius, G.Murauskas 80

Svarbi problema METODINIAI PATARIMAI


• Modelį reikia sudaryti sąmoningai mąstant apie • Pradedame nuo besąlyginio modelio.
• Kurie kintamieji yra pastovaus poveikio, o kurie – kintamojo
tyrimo tikslus, o ne pagal stipriausias koreliacijas. padės nustatyti padės toks algoritmas:
• Norime sužinoti, kas daro įtaką matematikos 1) Nustatomi pirmojo ir antrojo lygmens kintamieji.
žinioms. 2) Apibrėžiamos spėjamos priklausomybės.
3) Lygtimis užrašoma, kas nuo ko priklauso. Reikia nepamiršti
• Pavyzdžiui, koks yra mokyklos vaidmuo (II lygmuo). antrojo lygmens lygtyse pridėti atsitiktinę paklaidą u. Pirmojo
lygmens lygčiai pridedama e.
• Arba koks socioekonominio statuso vaidmuo
4) Antrojo lygmens lygtis įstatoma į pirmojo lygmens lygtį.
(I lygmuo). 5) Jungtinėje lygtyje surenkami nariai prie u ir e.
6) Kintamieji be u - pastovaus poveikio; kintamieji su u -
atsitiktinio poveikio. Beje, tas pats kintamasis gali įeiti į abu
sąrašus.

V.Čekanavičius, G.Murauskas 81 V.Čekanavičius, G.Murauskas 82

95

You might also like