You are on page 1of 503

SPSS

"Statistical Package for the Social Sciences"


SPSS
• Sustav za statističku obradu podataka u društvenim
znanostima
• Koristi se za:
– izradu tabelarnih izvještaja
– izradu grafikona
– deskriptivnu statistiku
– složene statističke analize
• Više zasebnih modula (dijelova programa)
– Osnovni je IBM SPSS Statistics Base model
• Koristimo ga u računalnoj učionici 201/202
• Dodatni moduli se posebno kupuju (ovisno o potrebnim statističkim
procedurama)

2
Struktura SPSS datoteke

3
Nakon pokretanja programa
- Data View -

4
Nakon pokretanja programa
- Variable View -

5
Pogled na podatke
- Data View -

6
Pogled na varijable
- Variable View -

7
Data View i Variable View
• U Data View:
– Redci:
• Objekti
– U psihologiji najčešće ispitanici
– Stupci:
• Varijable
– U psihologiji npr. pitanja koja su postavljena

• U Variable View:
– Redci:
• Varijable
– Stupci:
• Osobine (atributi) varijabli

8
SPSS datoteke s primjerima
• Mnogo datoteka s primjerima
• Fiktivni ali poučni podaci
• Služe za vježbu

9
Otvaranje datoteka s primjerima
File – Open – Data...

10
Otvaranje datoteka s primjerima

11
Otvaranje datoteka s primjerima
Inače, SPSS datoteke koje sadrže podatke imaju ekstenziju .sav

12
Otvaranje datoteka s primjerima
Datoteka demo.sav

13
Svaka operacija koju izvršimo u SPSS-u se
bilježi u prozoru koji se zove Output Viewer

14
Navigation Meni
- za lakše snalaženje u glavnom prozoru -

15
Zatvaranje programa SPSS i
Output viewer

16
Kreiranje nove SPSS datoteke

17
Definiranje varijabli
- naziv -

18
Definiranje varijabli
- predodređene vrijednosti atributa -

19
Definiranje varijabli
- tip -

20
Definiranje varijabli
- tip -

21
Tipovi varijabli u SPSS-u
• Numeric
– Varijabla čije vrijednosti su brojevi
– Vrijednosti se prikazuju u standardnom numeričkom formatu
• Comma - Numerička varijabla sa slijedećim prikazom: 45,678.78
• Dot - Numerička varijabla sa slijedećim prikazom: 45.678,78
• Scientific notation - Numerička varijabla u znanstvenoj notaciji: 4,57E+004
• Date - Razni datumski formati, npr: 03/12/2016
• Dollar - Numerička varijabla sa vodećim znakom dolara: $57,24
• Custom currency - Prikazi s raznim valutama koje je moguće podešavati
• String - Varijabla čije vrijednosti su nizovi znakova
• Restricted Numeric
– Ne-negativni cijeli brojevi
– Prikazuju se vodeće nule postavljene na maksimalnu širinu varijable: 00000025

• Savjet: Za unos cijelih brojeva – upotrijebiti tip Numeric i jednostavno sakriti decimalna mjesta
(staviti broj decimala na 0)

22
Definiranje varijabli
- tip String -

23
Definiranje varijabli
- tip String -

24
Deskriptivni opisi varijabli (Label)
• Dulje, opisne oznake varijabli
• Bolje opisuju varijablu od njihovog naziva
• Možemo upisati i cijele rečenice

25
Deskriptivni opisi varijabli (Label)
• Bit će ispisani u tabelama i grafikonima

26
Zadavanje posebnih oznaka mogućim
vrijednostima varijabli (Value Labels)
• Opisuju pojedinačne vrijednosti koje može
poprimiti neka varijabla

27
Zadavanje posebnih oznaka mogućim
vrijednostima varijabli (Value Labels)
- Primjer: varijabla marital (bračno stanje) -

28
Zadavanje posebnih oznaka mogućim
vrijednostima varijabli (Value Labels)
- Primjer: varijabla marital (bračno stanje) -

• Postoje dvije moguće vrijednosti varijable Bračno stanje


• Izaberemo dvije vrijednosti za koje odredimo koja od njih
što znači, na primjer:

– 0 znači da osoba nije oženjena/udana


– 1 znači da osoba jeste oženjena/udana

• Tim vrijednostima možemo dodijeliti opise koji znače


upravo to što trebaju značiti

29
Zadavanje posebnih oznaka mogućim
vrijednostima varijabli (Value Labels)
- Primjer: varijabla marital (bračno stanje) -

30
Zadavanje posebnih oznaka mogućim
vrijednostima varijabli (Value Labels)
- Primjer: varijabla marital (bračno stanje) -

31
Zadane oznake varijabli će se ispisivati
u tabelama i na grafikonima

32
Zadane oznake varijabli mogu se prikazati i u Data
View ako uključimo opciju View → Value Labels

33
Zadane oznake varijabli mogu se
prikazati i u Data View

34
… pa se mogu upotrijebiti za unos podataka
klikom na miša

35
Rad s nedostajućim podacima
(Missing Data)
• Postoje različiti razlozi nedostajućih podataka:
– Ispitanik odbija odgovoriti na pitanje
– Ispitanik ne zna odgovor
– Ispitanik odgovara na neočekivani način
– ...
• Važno je NE IGNORIRATI nedostajuće podatke
– Mogu biti važni za interpretaciju podataka:
• Možda je udio nedostajućih podataka velik
• Možda želimo razlikovati razloge neodgovaranja

• Zato ih je potrebno:
– Definirati
– Po želji uključiti ili isključiti iz analize
36
U SPSS-u postoje dvije vrste
nedostajućih podataka
• System-missing:
– podaci koji nedostaju bez određenog razloga
– samo za varijable numeričkog tipa
– prikazani su točkicom u tabeli
– varijabla tipa string
• ne postoji System-missing
• nedostajući podatak se interpretira kao prazan string
• User-missing:
– postoje među podacima ali ih je potrebno isključiti iz
kalkulacija i obrade

37
System-missing

38
Definiranje vrijednosti za
nedostajuće podatke

39
Definiranje vrijednosti za
nedostajuće podatke
• Dva načina:

– Do tri konkretne vrijednosti


– Raspon vrijednosti i još jedna konkretna
vrijednost
40
Definiranje vrijednosti za
nedostajuće podatke

41
Definiranje vrijednosti za
nedostajuće podatke

42
Definiranje značenja nedostajućih
podataka

43
Definiranje značenja nedostajućih
podataka

44
Definiranje značenja nedostajućih
podataka

45
Za nedostajuće podatke zatim
unosimo podatke koje smo odredili

46
A mogu se prikazati i njihove
opisne vrijednosti

47
I za string varijablu možemo
definirati missing kao i za numeric

48
I za string varijablu možemo
definirati missing kao i za numeric

49
Skala mjerenja - Measure

50
Skale mjerenja (measurements) podataka
Categorical Scale
(kvalitativni podaci) (kvantitativni, kontinuirani podaci)
Podaci koji mogu Postoji informacija o veličini svojstva koje mjerimo,
poprimiti ograničeni broj postoji uređaj među vrijednostima
različitih vrijednosti i razlika između tih vrijednosti se
može izračunati
Primanja u kunama:
Petar: 4.524,30
Sanja: 6.836,58
Nominal Ordinal
Ne postoji Postoji uređaj među podacima,
uređaj među podaci se mogu rangirati po nekom
podacima, kriteriju ali ne postoji informacija o
a brojčane vrijednosti količini mjerenog svojstva u pojedinim
su samo zamjena slučajevima niti mjerljiva razlika među
za neki naziv podacima
Zadovoljstvo poslom:
Omjerna skala
Spol: Visoko Kontinuirana skala uz dodatak apsolutne nule
Muški (0)
Ženski (1)
Srednje (nula označava nepostojanje svojstva)
Nisko
Primanja u kunama:
Studira na: Ivan: 0,00
Odsjek za psihologiju (1)
Odsjek za povijest (2)
... (3)
51
Kombinacije tipova i skala mjerenja

• Različite ikone koje se pojavljuju prilikom


odabira varijabli u postupcima

52
Variable View - Role

53
Variable View - Role
• Uloga koju će varijabla igrati u vašoj analizi (npr. Nezavisna
varijabla, zavisna variable…)
• Neke složenije analize u SPSS-u omogućuju da se varijable
unaprijed selektiraju na temelju definirane uloge odn. role
– samo varijable sa odgovarajućom ulogom će biti dostupne u nekoj proceduri
• Za većinu analiza uloga varijable neće značiti ništa
• Postoje slijedeće uloge:
– Input: Varijabla će biti upotrijebljena kao nezavisna (ovo je "default" uloga)
– Target: Varijabla će biti upotrijebljena kao zavisna
– Both: Varijabla će biti upotrijebljena i kao nezavisna i kao zavisna
– None: Varijabla nema određenu ulogu
– Partition: Varijabla će podijeliti podatke na zasebne grupe
– Split: Koristi se u modulu IBM SPSS Modeler (nema veze sa naredbom split)

54
Define Variable Properties

• Efikasan način za definiranje mnogo (kategoričkih) varijabli odjednom ili za


definiranje mnogo varijabli koje imaju ista svojstva
• Pretpostavimo da u tabeli imamo samo podatke bez svojstava varijabli

• Izbornik Data » Define Variable Properties… radi sljedeće:


– Pretražuje podatke i izlistava sve vrijednosti za svaku odabranu varijablu
– Identificira vrijednosti bez opisnih vrijednosti i automatski ih kreira
– Omogućava kopiranje opisnih vrijednosti između varijabli

55
Data » Define Variable Properties…

56
Odaberemo (kategoričke) varijable koje
želimo i prebacimo ih u desni prozor

57
Nakon što kliknemo na Continue

58
Kliknemo na neku varijablu

59
Ako želimo promijeniti skalu mjerenja
možemo kliknuti na Suggest

60
Ako želimo promijeniti skalu mjerenja
možemo kliknuti na Suggest

61
U Label za broj 9 upišemo Bez odgovora

62
U Missing za broj 9 stavimo kvačicu (tako
definiramo User Missing)

63
Možemo definirati i druge opisne oznake
(Labels)

64
Preko naredbe To Other Variables možemo
ista svojstva primijeniti na druge varijable

65
Završavamo sa OK

66
Kopiranje atributa varijabli
Nakon što definiramo atribute za određenu varijablu možemo te atribute
kopirati i primijeniti ih na druge varijable

67
Kopiranje atributa varijabli

68
Kopiranje atributa varijabli

69
Možemo kopirati i sve atribute
jedne varijable u druge varijable

70
Možemo kopirati i sve atribute
jedne varijable u druge varijable

71
Možemo kopirati i sve atribute
jedne varijable u druge varijable

72
Možemo kopirati i sve atribute
jedne varijable u druge varijable

73
Osnovne transformacije
varijabli

74
Izračunavanje novih varijabli

75
Izračunavanje novih varijabli
• Na temelju već postojećih varijabli želimo izračunati novu
• Iz visine i težine želimo izračunati indeks tjelesne mase
• Nova varijabla će se zvati ITM sa opisom (Label): Indeks
tjelesne mase
• Indeks tjelesne mase računa se prema formuli:

Težina
Indeks tjelesne mase 
Visina 2

76
Transform → Compute Variable…

77
Target Variable i Numeric Expression

78
Type & Label...

79
Kreirana je nova varijabla s izračunatim vrijednostima za
svakog ispitanika

80
Izračunavanje novih varijabli
- uporaba već definiranih funkcija -

• Za izračunavanje novih varijabli možemo koristiti veliki skup već definiranih


funkcija
• Funkcije su (zbog lakšeg snalaženja) podijeljene u skupine prema nekim
kriterijima
– Arithmetic - aritmetičke funkcije, npr:
• Abs - apsolutna vrijednost broja
• Sqrt - kvadratni korijen iz broja
• Lg10 - dekadski logaritam log10 po bazi 10
• Ln - prirodni logaritam po bazi e ≈ 2,71
– Conversion - konverzije brojeva u stringove i obratno
– Current Date/Time - daju trenutni datum i vrijeme u više formata
– Date … - funkcije nad datumima
– Miscellaneous - nekoliko pomočnih funkcija, npr:
• $Casenum - redni broj ispitanika
• …

81
Izračunavanje novih varijabli
- uporaba već definiranih funkcija -

– Missing Values - funkcije nad nedostajućim vrijednostima


– Random numbers - slučajni brojevi
– Search
• Any(Var1,1,3,5) - daje logičku vrijednost 1 (true) ako je vrijednost varijable 1, 3 ili 5, a
logičku vrijednost 0 (false) u suprotnom
• Any(1,Var1,Var2,Var3) - daje logičku vrijednost 1 (true) ako barem jedna od varijabli
Var1, Var2, Var3 ima vrijednost 1, a logičku vrijednost 0 (false) u suprotnom
• Funkcije koje daju vrijednosti položaja znakova u stringovima; daju maksimalnu ili
minimalnu vrijednost argumenata funkcije; daju vrijednost ovisno o tome je li vrijednost
unutar zadanog ranga; omogućavaju zamjene nekih znakova u stringovima; …
– Statistical - statističke funkcije (koeficijent varijacije, maksimum, minimum,
aritmetička sredina, medijan, standardna devijacija, suma, varijanca)
– String - funkcije nad stringovima
– Time Duration Creation - funkcije nad vremenskim intervalima
– Time Duration Extraction - funkcije nad vremenskim intervalima
• Osim navedenih imamo još razne vjerojatnosne funkcije, funkcije
distribucije, itd
82
Izračunavanje novih varijabli
- uporaba već definiranih funkcija -

83
Izračunavanje novih varijabli
- uporaba već definiranih funkcija, npr: kvadratni korijen -

84
Izračunavanje novih varijabli
- uporaba već definiranih funkcija, npr: kvadratni korijen -

85
Izračunavanje novih varijabli
- uporaba već definiranih funkcija, npr: kvadratni korijen -

86
Izračunavanje novih varijabli
- uporaba već definiranih funkcija, npr: dekadski logaritam -

87
Izračunavanje novih varijabli
- uporaba već definiranih funkcija, npr: prirodni logaritam -

88
Izračunavanje novih varijabli
- funkcije sa više argumenata -

89
Izračunavanje novih varijabli
- funkcije sa više argumenata -

Broj upitnika znači najmanji


broj potrebnih argumenata

90
Izračunavanje novih varijabli
- funkcije sa više argumenata -

91
Izračunavanje novih varijabli
- funkcije sa više argumenata -

92
Izračunavanje novih varijabli
- kombiniranje više funkcija -

93
Rad s vrijednostima koje
zadovoljavaju određene uvjete
• Kako ćemo određeni postupak provesti
samo nad ispitanicima koji zadovoljavaju
neki uvjet (npr. da su u mirovini)?

94
Rad s vrijednostima koje zadovoljavaju određene uvjete

95
Rad s vrijednostima koje zadovoljavaju određene uvjete

96
Rad s vrijednostima koje zadovoljavaju određene uvjete

• Vrijednost varijable koja je jednaka


prihodu po članu domaćinstva želimo
izračunati samo za domaćinstva u kojima
je ispitanik u mirovini:

income
incsvret 
reside

97
Rad s vrijednostima koje zadovoljavaju određene uvjete

Nakon što postavimo formulu kliknemo na if…

98
Rad s vrijednostima koje zadovoljavaju određene uvjete

99
Rad s vrijednostima koje zadovoljavaju određene uvjete
Include if case satisfies condition:

100
Rad s vrijednostima koje zadovoljavaju određene uvjete

101
Rad s vrijednostima koje zadovoljavaju određene uvjete

• Izraz kojim određujemo neki uvjet koji moraju


zadovoljavati vrijednosti varijabli nekog ispitanika može
poprimiti logičke vrijednosti:
– true (ako izraz zadovoljava uvjet)
– false (ako izraz ne zadovoljava uvjet)
• (pri nekim operacijama se javljaju logičke vrijednosti true
i false)
• U slučaju true će se operacija izvršiti za tog ispitanika, a
u slučaju false neće

102
Kombiniranje više uvjeta

103
Kombiniranje više uvjeta
• Primjer:

– Želimo izračunati slijedeću novu varijablu:

age_empl = age – employ

– Ta varijabla će sadržavati podatak o tome s


koliko godina se je zaposlenik zaposlio kod
sadašnjeg poslodavca
104
Kombiniranje više uvjeta
• Međutim, mi želimo navedenu novu
varijablu izračunati samo za zaposlenike
koji:

– su završili srednju školu ili manje


i
– zarađuju manje od 50.000 dolara godišnje

105
Logički veznici
ne negacija u SPSS-u se piše ~
i konjunkcija u SPSS-u se piše &
ili disjunkcija u SPSS-u se piše |

~p - negacija izraza p
p & q - konjunkcija izraza p i q
p | q - disjunkcija izraza p i q

106
Logički veznici
~p - istinit izraz kada je p lažan izraz, a
lažan izraz kad je p istinit izraz

p & q - istinit izraz samo kada su i p i q


istiniti izrazi

p | q - istinit izraz kada je barem jedan od


izraza p i q istinit
107
Logički veznici
• Kada upotrebljavamo funkcije i aritmetičke
operacije (+,-,*,/,**) u logičkim izrazima tada se
najprije izračunavaju funkcije i aritmetičke
operacije, zatim poredbeni operatori i na kraju
logički operatori
• Kada u izrazima upotrebljavamo više logičkih
operatora tada se najprije izračunava negacija ~,
zatim konjunkcija & i na kraju disjunkcija |
• Ako želimo izmijeniti redoslijed izračunavanja
operacija trebamo upotrijebiti zagrade ( i )
108
Kombiniranje više uvjeta
Transform → Compute Variable...

109
Kombiniranje više uvjeta
If...

110
Kombiniranje više uvjeta

111
Kombiniranje više uvjeta

112
Kombiniranje više uvjeta

113
Kombiniranje više uvjeta
• Želimo izračunati novu varijablu porez u
kojoj će biti izračunato 25% od prihoda ali
samo za zaposlenike koji:
– zarađuju manje od 30.000 ili više od 70.000
dolara godišnje i imaju između 30 i 50 godina
(uključujući i one koji imaju 30 i 50 godina)

114
Kombiniranje više uvjeta

115
Kombiniranje više uvjeta

116
Kombiniranje više uvjeta

117
Rekodiranje podataka
• U datoteci demo.sav imamo varijablu age:

118
Rekodiranje podataka
• Želimo da nam SPSS automatski izračuna u
koju starosnu skupinu spada svaki od ispitanika i
to na slijedeći način:
Ispod 12 = 1
12-17 = 2
18-24 = 3
25-34 = 4
35-44 = 5
45-54 = 6
55-64 = 7
65-74 = 8
Iznad 75 = 9
119
Rekodiranje podataka
Transform → Recode into Different Variables…

120
Rekodiranje
• Odaberemo varijablu koju želimo rekodirati i strelicom je premjestimo u
srednji prozor

121
Rekodiranje
• Odaberemo ime nove varijable i kliknemo na Change

122
Rekodiranje
• Zatim kliknemo na Old and New Values...

123
Rekodiranje
• Pod Old Value odaberemo uvjet kojeg mora zadovoljavati stara vrijednost
• Pod New Value odaberemo novu vrijednost koju mora poprimiti ta varijabla

124
Rekodiranje
• Kliknemo na Add

125
Rekodiranje
• Jedan za drugim odredimo sve uvjete

126
Mogućnosti rekodiranja
• Možemo rekodirati:
– Točno jednu određenu vrijednost u:
• Točno jednu određenu vrijednost, System-missing ili u jednaku vrijednost
kakva je bila
– System-missing u:
• Točno jednu određenu vrijednost ili System-missing
– System- or user-missing u:
• Točno jednu određenu vrijednost, System-missing ili u jednaku vrijednost
kakva je bila
– Rang vrijednosti “od ... do ...” u:
• Točno jednu određenu vrijednost, System-missing ili u jednaku vrijednost
kakva je bila
– Sve druge vrijednosti (za koje nismo odredili pravilo) u:
• Točno jednu određenu vrijednost, System-missing ili u jednaku vrijednost
kakva je bila

127
Nakon Continue i OK dobijemo varijablu
agegroup s rekodiranim vrijednostima

128
Zadatak
• Školske ocjene su u Hrvatskoj 1-5, a u
Njemačkoj 5-1 (najbolja je 1, a najmanja 5)
• U SPSS tabeli imamo varijablu ocjene iz
Hrvatske koje treba rekodirati da bismo ih
poslali u Njemačku
• Shema rekodiranja dana je na slijedećem
slajdu -->

129
Zadatak

130
Recode into Same Variables...

• Opasno!
• Nakon toga ne radi naredba Undo!
131
Automatsko rekodiranje
• Transform → Automatic Recode
• Kreira novu varijablu i automatski rekodira
sadržaj neke string ili brojčane varijable u
sekvencijalne vrijednosti
– Sekvencijalne vrijednosti pokazuju nekakav redosljed
string ili brojčanih vrijednosti
• String varijable se rekodiraju prema abecednom redoslijedu
• Brojčane vrijednosti se rekodiraju prema njihovoj stvarnoj
vrijednosti
• Možemo birati da li će kodiranje početi od najmanje ili od
najveće vrijednosti

132
Automatsko rekodiranje

Omogućava da na jednak
način rekodiramo više
varijabli

Moguće je pohraniti
Prazan string se inače ne shemu rekodiranja za
interpretira kao missing buduću uporabu
ali uz ovu opciju hoće
(user-missing vrijednosti će
automatskim rekodiranjem
biti rekodirane iza non-missing
vrijednosti) 133
Automatsko rekodiranje
- primjeri -

134
Spajanje datoteka

135
Spajanje SPSS datoteka po
ispitanicima (Cases)
• Imamo dvije datoteke: grupa1.sav i grupa2.sav

136
Spajanje SPSS datoteka po
ispitanicima (Cases)
• Obje datoteke imaju identičnu strukturu s
obzirom na varijable
• Želimo spojiti ispitanike iz prve i druge
datoteke i dobiti jednu zajedničku datoteku
• Da bismo to postigli možemo postupiti na
način kako slijedi →...

137
Otvorimo prvu datoteku grupa1.sav

138
Data → Merge Files → Add Cases...

139
Browse...

140
Open → Continue

141
Što ako datoteke ipak nemaju
identičnu strukturu?

142
Unpaired Variables
• Varijable koje će biti isključene iz konačne spojene
datoteke
• Varijable iz aktivne datoteke su označene zvjezdicom (*)
• Varijable iz druge datoteke su označene znakom plus (+)
• Lista nesparenih varijabli sadrži:

– Varijable koje se razlikuju po nazivu od svih varijabli iz druge


datoteke
– Varijable koje su u jednoj datoteci jednog, a u drugoj datoteci
drugog tipa
– String varijable različite definirane duljine

143
Spajanje više SPSS datoteka po
ispitanicima (Cases)
• Pretpostavimo da imamo (barem) tri SPSS
datoteke: grupa1.sav, grupa2.sav i grupa3.sav
• … i da sve gornje datoteke imaju identičnu
strukturu s obzirom na varijable
• Možemo spojiti ispitanike iz svih gornjih datoteka
i dobiti jednu zajedničku datoteku:
– Uzastopnom uporabom naredbe Merge
ili
– Uporabom sintakse → Vidi kasnije u nastavi → …

144
Spajanje SPSS datoteka po
varijablama
• Imamo dvije datoteke: Varijable1.sav i Varijable2.sav

145
Spajanje SPSS datoteka po
varijablama
• Obje datoteke se odnose na iste ispitanike
• Sadrže različite varijable
• Sadrže jednu zajedničku varijablu (ključ - key
variable)
• Obje datoteke moraju prije spajanja biti sortirane
po ključu
• Datoteke moraju biti sortirane rastuće
(Ascending)

146
Otvorimo prvu datoteku

147
Data → Merge Files → Add
Variables...

148
An external SPSS Statistics data file

149
Browse... i odaberemo datoteku
koju želimo spojiti s otvorenom

150
Nakon Open i Continue

151
Match Cases on key variables in
sorted files

152
Odabrati ključ za spojenu datoteku

153
Prebaciti odabrani ključ strelicom u prozor
Key Variables

154
Nakon OK

155
Spojena datoteka

156
U slučaju da obje datoteke nisu
sortirane po ključu rastuće
• SPSS Output samo daje obavijest da
spajanje ne može biti izvršeno
• Spajanje datoteka se ne obavlja
• Datoteke ostaju kakve su bile

157
Deskriptivna statistika u SPSS-u

158
Deskriptivna statistika
• Deskriptivna statistika:
– Zadaća: opisati podatke (na način da ih sredi i sažme da bi bili
što pregledniji)
– Česta potreba: prvo izračunati elemente deskriptivne statistike
pa donijeti odluku koju složeniju analizu će se raditi
– Mjere deskriptivne statistike:
• Frekvencije
• Postotci
• Centralne tendencije
• Mjere varijabilnosti (disperzije, raspršenja, odstupanja) podataka
– Za razliku od statistike zaključivanja kojom se izvode zaključci,
testiraju postavljene hipoteze, …

159
Mjere centralne tendencije
• Ukazuju na tendencije grupiranja oko neke
centralne vrijednosti u distribuciji rezultata
• Najčešće mjere centralne tendencije:
– Aritmetička sredina (srednja vrijednost, Mean) -
prosječan rezultat u dobivenoj distribuciji
– Medijan (centralna vrijednost) - vrijednost koja ima
jednak broj slučajeva "lijevo" i "desno"
– Mod (dominantna vrijednost) - govori koji se rezultat u
nekoj distribuciji najčešće pojavljuje

160
Mjere varijabilnosti
• Raspon:
– Razlika između najvećeg i najmanjeg izmjerenog rezultata
• Standardna devijacija:
– Odgovara aritmetičkoj sredini kao mjeri centralne tendencije
– Pokazuje koliko su vrijednosti udaljene od aritmetičke sredine
– Formula:

gdje je:
X - pojedinačni rezultat ispitanika
M - aritmetička sredina
N - ukupni broj slučajeva

• Varijanca:
– jednaka kvadratu standardne devijacije: ν = σ2

161
Deskriptivna statistika u SPSS-u

162
Deskriptivna statistika u SPSS-u
• Tri različita načina:
– Analyze → Descriptive Statistics →
• Frequencies…
• Descriptives…
• Explore…
• Između gornje tri naredbe postoje određena
preklapanja
• Svaka ima i svoje specifičnosti

163
Naredba Frequencies
(Frekvencije)

164
Frekvencije
• Služe da:
• istražimo distribuciju na određenim varijablama
• prebrojimo vrijednosti određene varijable

165
Frequencies prozor

• Varijable koje želimo analizirati


prebacujemo u prozor Variable(s)
166
Frequencies prozor

• Varijable koje želimo analizirati


prebacujemo u prozor Variable(s)
167
Frequencies prozor

Ispis tablice s frekvencijom svake pojedine vrijednosti varijable


-provjera ima li među podacima vrijednosti koje su izvan očekivanih vrijednosti
-daje dobar uvid u distribuciju i bez grafičkog prikaza

168
Statistics…

Želimo li u
Output uključiti
percentile

169
Statistics…

Kvartili
(25-ti, 50-ti i
75-ti percentil)
(kvartili dijele
podatke u četiri
jednakobrojne
skupine)

170
Statistics…

Točke koje
ravnomjerno
dijele distribuciju
na određeni broj
grupa

171
Statistics…

Sami određujemo
koje percentile
želimo vidjeti

172
Statistics…

Mjere centralne
tendencije
distribucije

173
Statistics…

Srednja
vrijednost

174
Statistics…

Medijan
(zapravo 50-ti
percentil)

175
Statistics…

Mode
(najčešća
vrijednost)

176
Statistics…

Suma svih
vrijednosti
odabrane
varijable

177
Statistics…

Mjere disperzije
(raspršenja)

178
Statistics…

Standardna
devijacija

179
Statistics…

Varijanca

180
Statistics…

Raspon

181
Statistics…

Minimum

182
Statistics…

Maksimum

183
Statistics…

Standardna
pogreška
aritmetičke sredine
184
Statistics…

Ako odaberemo ovu opciju, tada će Percentile Values i Median biti izračunati s pretpostavkom
da su podaci grupirani na način da vrijednosti u tabeli predstavljaju sredine originalnih grupa 185
(npr. da za varijablu starost, vrijednost 25 predstavlja sve one koji imaju između 20 i 29 godina)
Statistics…
U slučaju kada
Values are group midpoints
nije označeno:

U slučaju kada je
Values are group midpoints
označeno:

186
Primjer podataka za opciju Values are group midpoints
Statistics…

Mjere asimetrije
(skewness)
i spljoštenosti
(kurtosis)
187
Charts…

Stupčasti grafikon kojem


su na horizontalnoj osi
vrijednosti varijable, a na
vertikalnoj frekvencije
pojavljivanja tih vrijednosti
u distribuciji - Za svaku vrijednost
prikazuje poseban stupac
- Omogućuje laku vizualnu
usporedbu vrijednosti

188
Charts…

Okrugli grafikon
(u obliku torte) koji za
svaku vrijednost prikazuje
koji je njen doprinos
kao dijela cjeline

189
Charts…

Histogram (s krivuljom koja


prikazuje normalnu
distribuciju)

190
Razlike histograma i stupčastog
grafikona

Bar Chart

1. Skoro svaki djelatnik


ima malo
drugačiji prihod
(ovako nemamo
uvid u raspodjelu
prihoda)
2. X os nije prikazana
u linearnom omjeru
(prvi interval je širok 4.650,
a posljednji 62.500)

191
Razlike histograma i stupčastog
grafikona

Histogram

1. Sve vrijednosti su podijeljene


u jednake intervale
- po 5 intervala unutar
intervala od 25.000 (X os je
prikazana u linearnom omjeru)
2. S po jednim stupcem je prikazan
broj zaposlenika koji spadaju u
jedan takav interval
(pa makar u interval
spadalo nula ispitanika)

192
Charts…

Na grafikonu će biti prikazane numeričke


vrijednosti (frekvencije) vrijednosti

193
Charts…

Na grafikonu će biti prikazani postotci koje


numeričke vrijednosti zauzimaju u distribuciji
(postotci govore o odnosu broja slučajeva
jedne kategorije sa ukupnim brojem slučajeva)
194
Format…

Način sortiranja vrijednosti s obzirom na vrijednost varijabli


(odn. kako smo definirali Values prilikom kreiranja varijabli)
ili s obzirom na broj pojavljivanja vrijednosti u distribuciji

195
Format…

196
Format…

U slučaju kada analiziramo više varijabli istovremeno tada


ova opcija omogućava lakše uspoređivanje varijabli
(rezultate za različite varijable prikazuje jedne do drugih)

197
Format…

Rezultate prikazuje za svaku varijablu posebno

198
Format…

Onemogućava prikaz tablica koje imaju više različitih


vrijednosti od broja koji zadamo

199
Primjer
varijabla Age - starost ispitanika

200
Primjer
Statistics…

201
Primjer
Charts…

202
Primjer
Formats…

203
Rezultati
- Tabela i grafikon -

204
Rezultat
- Tablica frekvencija -

• Ima previše mogućih vrijednosti


• Nije dobar primjer

AGE

Cumulative
Frequency Percent Valid Percent Percent
Valid 18 12 ,2 ,2 ,2
19 33 ,5 ,5 ,7
20 42 ,7 ,7 1,4
21 73 1,1 1,1 2,5
22 69 1,1 1,1 3,6
23 98 1,5 1,5 5,1
24 109 1,7 1,7 6,8
25 121 1,9 1,9 8,7
26 120 1,9 1,9 10,6
27 127 2,0 2,0 12,6
28 139 2,2 2,2 14,7
29 154 2,4 2,4 17,1
30 167 2,6 2,6 19,8
31 181 2,8 2,8 22,6
32 177 2,8 2,8 25,3
33 174 2,7 2,7 28,1
205
34 171 2,7 2,7 30,7
35 180 2,8 2,8 33,5
Rezultat
- Tablica frekvencija -

• Za varijablu ed koja ima 5 mogućih vrijednosti:

Statistics

Level of education
N Valid 6400
Missing 0

Level of education

Cumulative
Frequency Percent Valid Percent Percent
Valid Did not complete high
1390 21,7 21,7 21,7
school
High school degree 1936 30,3 30,3 52,0
Some college 1360 21,3 21,3 73,2
College degree 1355 21,2 21,2 94,4
Post-undergraduate
359 5,6 5,6 100,0
degree
Total 6400 100,0 100,0

206
Frekvencije
• Frekvencije predstavljaju broj ispitanika koji
imaju određenu vrijednost neke varijable
Statistics

Level of education
N Valid 6400
Missing 0

Level of education

Cumulative
Frequency Percent Valid Percent Percent
Valid Did not complete high
1390 21,7 21,7 21,7
school
High school degree 1936 30,3 30,3 52,0
Some college 1360 21,3 21,3 73,2
College degree 1355 21,2 21,2 94,4
Post-undergraduate
359 5,6 5,6 100,0
degree
Total 6400 100,0 100,0

207
Postotci
• Postotci govore o odnosu broja slučajeva u
jednoj kategoriji sa ukupnim brojem slučajeva
Statistics

Level of education
N Valid 6400
Missing 0

Level of education

Cumulative
Frequency Percent Valid Percent Percent
Valid Did not complete high
1390 21,7 21,7 21,7
school
High school degree 1936 30,3 30,3 52,0
Some college 1360 21,3 21,3 73,2
College degree 1355 21,2 21,2 94,4
Post-undergraduate
359 5,6 5,6 100,0
degree
Total 6400 100,0 100,0

208
Valid percent
• Valid Percent - postotna zastupljenost pojedinih kategorija u odnosu
na valjani broj ispitanika
– U donjem slučaju nema nedostajućih podataka pa su svi valjani

Statistics

Level of education
N Valid 6400
Missing 0

Level of education

Cumulative
Frequency Percent Valid Percent Percent
Valid Did not complete high
1390 21,7 21,7 21,7
school
High school degree 1936 30,3 30,3 52,0
Some college 1360 21,3 21,3 73,2
College degree 1355 21,2 21,2 94,4
Post-undergraduate
359 5,6 5,6 100,0
degree
Total 6400 100,0 100,0

209
Cumulative percent
• Cumulative Percent - kumulativni postotci odnosno zbroj postotka
jednog razreda sa postotcima prethodnih razreda

Statistics

Level of education
N Valid 6400
Missing 0

Level of education

Cumulative
Frequency Percent Valid Percent Percent
Valid Did not complete high
1390 21,7 21,7 21,7
school
High school degree 1936 30,3 30,3 52,0
Some college 1360 21,3 21,3 73,2
College degree 1355 21,2 21,2 94,4
Post-undergraduate
359 5,6 5,6 100,0
degree
Total 6400 100,0 100,0

210
Tablica frekvencija
• U slučaju nedostajućih podataka:

Statistics

Level of education
N Valid 6134
Missing 266

Level of education

Cumulative
Frequency Percent Valid Percent Percent
Valid Did not complete high
1338 20,9 21,8 21,8
school
High school degree 1855 29,0 30,2 52,1
Some college 1296 20,3 21,1 73,2
College degree 1302 20,3 21,2 94,4
Post-undergraduate
343 5,4 5,6 100,0
degree
Total 6134 95,8 100,0
Missing System 266 4,2
Total 6400 100,0
211
Naredba Explore

212
Naredba Explore
• Također moguće izračunati osnovne podatke
deskriptivne statistike
• Razlike s obzirom na naredbu Frequencies:
– Mogu se dobiti traženi deskriptivni rezultati zasebno
za pojedinu skupinu ispitanika (a bez uporabe neke
naredbe selekcije, grupiranja i sl.)
– Moguće je dobiti grafički prikaz rezultata pomoću
Stem and Leaf postupka (vidi slijedeći slajd →)
– Može se dobiti i Boxplots prikaz rezultata (vidi
nekoliko slajdova dalje)

213
Stem and Leaf prikaz distribucije
dobi

Age in years Stem-and-Leaf Plot

Frequency Stem & Leaf

55,00 1 . 89999
356,00 2 . 00000111111222222333333344444444444
691,00 2 . 555555555555666666666666667777777777788888888888888889999999999999999
848,00 3 . 0000000000000000011111111111111111222222222222222233333333333333334444444444444444444
971,00 3 . 5555555555555555556666666666666666666777777777777777777778888888888888888888999999999999999999999
874,00 4 . 000000000000000000111111111111111112222222222222222222333333333333333334444444444444444
815,00 4 . 555555555555555555666666666666667777777777777777778888888888888888999999999999999
681,00 5 . 00000000000000111111111111111222222222222233333333333344444444444444
489,00 5 . 5555555555566666666666777777777788888888999999999
331,00 6 . 00000011111111122222233333344444
193,00 6 . 555556666667778899
88,00 7 . 00011234
8,00 7 . &

Stem width: 10
Each leaf: 10 case(s)

& denotes fractional leaves.

214
Korištenje naredbe Explore
- prozor Explore -

Varijabla za koju želimo deskriptivnu statistiku

Varijabla prema kojoj će se deskriptivni podaci


izračunati posebno za neke kategorije
ispitanika (npr. zasebno za žene i zasebno za
muškarce)

Za objašnjenje ovog polja vidi Boxplots prikaz -> …

I brojčani i grafički Samo brojčani Samo grafički

Prikaz rezultata 215


Korištenje naredbe Explore
- prozor Explore -

Odabrali smo da želimo statistiku varijable


age za kategorije varijable gender

216
Explore → Statistics…

Za odabir koje elemente deskriptivne


statistike treba izračunati potrebno je
odabrati ovu opciju

217
Explore → Plots…
- mogućnosti grafičkih prikaza -

Ako želimo Stem-and-leaf


grafički prikaz
Ako želimo Boxplots

Ako želimo histogram

218
Explore - Rezultati primjera
- tabela Case Processing Summary -

Koliko je ispitanika imalo Koliko ispitanika nije imalo Ukupno


valjane vrijednosti valjane vrijednosti

219
Explore - Rezultati primjera
- tabela Descriptives -

220
Explore - Rezultati primjera
- Steam-and-Leaf organiziran po spolu -

Age in years Stem-and-Leaf Plot for


gender= Female

Frequency Stem & Leaf

24,00 1 . 8999
165,00 2 . 000001111222223333344444444
341,00 2 . 55555555556666666666677777777788888888888899999999999999
448,00 3 . 000000000000000111111111111112222222222222233333333333333344444444444444444
507,00 3 . 55555555555555566666666666666666777777777777777777888888888888888999999999999999999
441,00 4 . 00000000000000011111111111111122222222222222223333333333333334444444444444
415,00 4 . 55555555555555555666666666666777777777777778888888888888999999999999
328,00 5 . 000000000000111111111111222222222233333333334444444444
231,00 5 . 55555555556666666677777778888889999999
148,00 6 . 000001111111122233333444
94,00 6 . 5555666667778899
34,00 7 . 0011234
2,00 7 . &
1,00 Extremes (>=76)

Stem width: 10
Each leaf: 6 case(s)

& denotes fractional leaves.

Age in years Stem-and-Leaf Plot for


gender= Male

Frequency Stem & Leaf

31,00 1 . 899999
191,00 2 . 000001111111222222233333333444444444444
350,00 2 . 5555555555556666666666666677777777777788888888888888888999999999999999
400,00 3 . 00000000000000001111111111111111122222222222222233333333333333344444444444444444
464,00 3 . 555555555555555555666666666666666667777777777777777778888888888888888888999999999999999999999
433,00 4 . 000000000000000000111111111111111112222222222222222222233333333333333334444444444444444
400,00 4 . 5555555555555555666666666666667777777777777777778888888888888889999999999999999
353,00 5 . 00000000000000111111111111111122222222222222333333333333444444444444444
258,00 5 . 5555555555666666666666777777777777888888888999999999
183,00 6 . 000000011111111222222223333333444444
99,00 6 . 5555556666667778999
54,00 7 . 0001122334
5,00 7 . &

Stem width: 10
Each leaf: 5 case(s)

221
& denotes fractional leaves.
Explore - Rezultati primjera
- Boxplots -

222
Explore - Rezultati primjera
- Boxplots -

Redni broj u tabeli


ekstremnog slučaja
(da smo u Label Cases by
stavili neku varijablu
onda bi ovdje bila
njena vrijednost umjesto
Ovog rednog broja)
Centralna
vrijednost

Raspon (inner fences)


Interkvartilni raspon rezultata koji je
(50% rezultata oko referentni okvir za
centralne vrijednosti, vrednovanje je li neki
između prvog i od rezultata možda
trećeg kvartila) ekstreman

223
Naredba Descriptives

224
Naredba Descriptives

• Daje gotovo iste deskriptivne statistike kao i


naredbe Frequencies i Explore
• Ima dodatnu mogućnost izračuna z-vrijednosti
• Descriptives ne prikazuje tablice frekvencija kao
Frequencies
• Na popisu varijabli se ne nalaze String varijable
(u naredbi Frequencies se nalaze)

225
Prozor Descriptives

Određujemo koje elemente


deskriptivne statistike želimo

226
Deskripcija
- Descriptives… → Options… -

Deskriptivna
statistika

U slučaju istovremene
analize više varijabli:
redoslijed kojim će se
prikazati u tabeli

227
Rezultati

Descriptive Statistics

N Range Minimum Maximum Sum Mean Std. Variance Skew ness Kurtosis
Statistic Statistic Statistic Statistic Statistic Statistic Std. Error Deviation
Statistic Statistic Statistic Std. Error Statistic Std. Error
Age in years 6400 59 18 77 269175 42,06 ,154 12,290 151,032 ,299 ,031 -,602 ,061
Price of primary vehicle 6400 95,70 4,20 99,90 192821,60 30,1284 ,27409 21,92692 480,790 1,216 ,031 ,524 ,061
Number of people in
6400 8 1 9 15038 2,35 ,018 1,468 2,156 ,995 ,031 ,253 ,061
household
Valid N (listw ise) 6400

228
Izračunavanje Z-vrijednosti
• Opcija pod Descriptives:
– Save standardized values as variables

229
Izračunavanje Z-vrijednosti
• Nova varijabla - Znaziv_varijable
• U našem slučaju: Zage

230
Svaki ispitanik ima pripadnu Z-vrijednost za
promatranu varijablu

231
Interpretacija Z-vrijednosti

232
Analyze → Reports → Case Summaries

• Još jedan pogodan način za deskriptivnu


statistiku
• Vrlo sličan izlaz kao Descriptives

233
Analyze → Reports → Case Summaries

234
Analyze → Reports → Case Summaries

235
Analyze → Reports → Case Summaries

• Najvjerojatnije ćete poželjeti isključiti opciju Display


cases

236
Analyze → Reports → Case Summaries

• Prebacimo varijablu za koju želimo statistiku u prozorčić


Variables

237
Analyze → Reports → Case Summaries

• Prebacimo varijablu po kojoj želimo grupirati statistiku u


prozorčić Grouping Variable(s)

238
Analyze → Reports → Case Summaries

• U prozoru Statistics … odredimo koje statistike želimo

239
Analyze → Reports → Case Summaries

• Rezultati:

240
Analyze → Reports → Case Summaries

• Grupiranje po više varijabli

241
Analyze → Reports → Case Summaries

• Rezultati:

242
Deskriptivna statistika i
nedostajući podaci

243
Tabela
- Ako postoje System-missing, a nismo definirali User-missing -

244
Grafikon
- Ako postoje System-missing, a nismo definirali User-missing -

245
Tabela
- Ako upisujemo Values 9=No data ali to nismo definirali kao User-missing -

246
Grafikon
- Ako upisujemo Values 9=No data ali to nismo definirali kao User-missing -

247
Tabela
- Ako smo definirali User-missing: 9 = No data -

248
Grafikon
- Ako smo definirali User-missing: 9 = No data -

249
Deskriptivna statistika i nedostajući
podaci
• Međutim, možda nedostajuće podatke koji su
automatski isključeni iz određene statističke
analize želimo uključiti u analizu
• To se može posebnim naredbama
• O tome kasnije …
• Također, pojedine funkcije i naredbe različito
barataju s nedostajućim podacima (ponekad čak
i iznenađujuće)
• O tome također kasnije …

250
Uporaba rezultata u drugim
programima

251
Uporaba rezultata u drugim programima

• Tabele i grafovi se iz SPSS Output-a


mogu prebaciti u druge aplikacije:
– Microsoft Word
– Microsoft Excel
– Microsoft PowerPoint
– ...
• Tabele i grafove možemo zalijepiti u
raznim formatima

252
Edit → Copy

253
Edit → Paste Special...

254
Edit → Paste Special...

255
Edit → Copy special…

256
Edit → Copy special…

257
Edit → Copy special…

• Omogućiti dodatne formate

258
Edit → Paste special…
(u slučaju lijepljenja slike)

259
Edit → Paste special…
(u slučaju lijepljenja tabele)

260
Formati

• RTF (Rich Text File) - moguće kasnije uređivanje u npr. Word-u ili
PowerPoint-u
• Unformatted Text (postoji samo za tabele) - prebacuju se samo
podaci iz tabele (bez tabele i oblikovanja teksta)
• Picture (Enhanced Metafile) - ovo bi trebao biti najbolji odabir za
prebacivanje grafikona u Microsoft Office i ispis na papiru
• Picture (PNG) - Pogodan za web stranice jer dijelovi slike mogu biti
prozirni, moguće je kontrolirati svjetlinu, …
• Picture (JPEG) - Najbolji za slike s mnogo boja (npr. fotografije)
• Unformatted Unicode Text - daje jednak rezultat kao i opcija
Unformatted Text (povijesni zaostatci)

261
Automatsko prebacivanje svih rezultata u
druge formate (doc, html, xls, pdf, txt)
• Iz SPSS Output-a:

File → Export...

262
Selekcija podskupa podataka
• Selekcija je postupak sužavanja skupa
ispitanika na posebnu podgrupu koja
zadovoljava uvjet koji zadamo
• Selekcija se u pojedinim postupcima može
raditi preko gumba If…
• Nakon selekcije kakvu ovdje opisujemo će
se svi daljnji postupci odnositi samo na
selektirane podatke (ispitanike)

263
Selekcija podskupa podataka na
temelju zadanog uvjeta
• Data → Select Cases... → If condition is satisfied

264
Selekcija podskupa podataka na
temelju zadanog uvjeta
• Kliknemo na If...

• ... i odredimo uvjet koji podaci moraju zadovoljavati (u


primjeru sa slike mora biti varijabla jobtime biti veća od 95) za
sve ispitanike nad kojima želimo vršiti daljnje analize

265
Selekcija - Output
• U donjem dijelu prozora možemo birati:
– Filter out unselected cases - selektira podatke koji zadovoljavaju
uvjet ali druge podatke ostavlja u datoteci - uobičajeno
– Copy selected cases to a new dataset - kopira podatke koji
zadovoljavaju uvjet u drugu datoteku
– Delete unselected cases - briše podatke koji ne zadovoljavaju
uvjet - Opasno!!!

266
Selekcija podskupa podataka na
temelju zadanog uvjeta
• Ako je odabrano Filter out unselected cases tada neselektirani
podaci ostaju u tabeli ali neće biti uključeni u analize, a njihov redni
broj je prekrižen kosom crtom:

267
Selekcija podskupa podataka na
temelju slučajnog izbora
• Data → Select Cases... → Random sample of cases

268
Selekcija podskupa podataka na
temelju slučajnog izbora

269
Selekcija podskupa podataka na
temelju redoslijeda u datoteci
• Data → Select Cases... → Based on time or case range

270
Selekcija podskupa podataka na
temelju redoslijeda u datoteci
• Data → Select Cases... → Based on time or case range

271
Selekcija podskupa podataka na
temelju vrijednosti neke varijable
• Data → Select Cases... → Use filter variable

Isključuje iz daljnje
obrade ispitanike
čija vrijednost
određene varijable
je jednaka 0 ili
nedostaje

272
Primjer
• U datoteci Demo.sav selektirajte muške
ispitanike sa stupnjem obrazovanja višim
od 2, koji su stariji od 50 godina i koji kod
kuće posjeduju računalo
• Samo za te ispitanike kreirajte tablicu
frekvencija i stupčasti grafikon za
zadovoljstvo poslom (varijabla Job
Satisfaction)

273
Rješenje - tabele

274
Rješenje - grafikon

275
Isključivanje selekcije
• Selekcija podataka će se odnositi na
daljnje analize sve dok se ne isključi
• Selekciju ćemo isključiti tako da ponovno
kliknemo na Data → Select Cases... i
zatim odaberemo All cases

276
Sortiranje podataka
• Sortiranje je operacija promjene redoslijeda
redova tabele tako da redovi budu uređeni u
rastući poredak (od najmanjeg prema najvećem)
ili opadajući poredak (od najvećeg prema
najmanjem) s obzirom na vrijednost neke
varijable prema kojoj se sortiranje vrši
• Ako se sortiranje vrši prema numeričkoj varijabli
tada se uzima u obzir njena veličina, a ako se
vrši prema string varijabli tada se u obzir uzima
abecedni poredak
277
Sortiranje podataka

278
Sortiranje podataka

279
Sortiranje podataka

280
Sortiranje prema vrijednosti više
varijabli

281
Sortiranje prema vrijednosti više
varijabli

282
Podjela podataka na grupe

283
Podjela podataka na grupe
Data → Split File...

284
Podjela podataka na grupe
Ako odaberemo Compare groups

285
Podjela podataka na grupe

Datoteka će biti
sortirana prema
varijabli po kojoj
vršimo grupiranje

Ako odaberemo ovu opciju,


a datoteka nije pravilno
sortirana tada SPSS
neće ispravno izvršiti
postupak koji se temelji
na grupiranju

286
Rezultati obrada nakon podjele
- tablice -

287
Rezultati obrada nakon podjele
- grafikoni -

288
Podjela podataka na grupe
Ako odaberemo Organize output by groups

289
Podjela podataka na grupe
Ako odaberemo Organize output by groups

290
Isključivanje podjele na grupe
• Nakon definiranja grupa ta podjela ostaje aktivna sve
dok se ne isključi!
• Da je podjela aktivna vidljivo je u donjem desnom kutu
prozora:

291
Ako podjelu više ne koristimo
potrebno ju je isključiti

292
Podjela podataka na grupe s
obzirom na više varijabli
• Ako odaberemo više varijabli prema
kojima želimo izvršiti grupiranje:
– prva na popisu je primarna
– u okviru kategorija prve varijable biti će
izvršeno grupiranje za drugu varijablu
– itd

293
Podjela podataka na grupe s
obzirom na više varijabli
• Grupiranje prema spolu:

294
Podjela podataka na grupe s
obzirom na više varijabli
• Dodatno grupiranje prema stupnju
obrazovanja:

295
Tabela frekvencija zadovoljstva poslom
(spol ima 2 moguće vrijednosti, a stupanj obrazovanja 5)

296
Jedan od deset grafikona frekvencija
zadovoljstva poslom

297
Agregacija podataka

298
Agregacija podataka
• Spajanje podataka tako da grupe ispitanika s jednakom
vrijednosti neke varijable čine jedan zbirni slučaj
• Primjeri primjene:
– Ako želimo razmatranje podataka spustiti sa individualnog nivoa
na neki širi nivo (npr. nivo organizacije)
– Eksperiment zahtijeva ponavljana mjerenja neke pojave koja
zatim želimo sažeti
• Za sve ispitanike koji imaju zajedničku vrijednost neke
varijable računa se neka zbirna funkcija za vrijednosti
neke druge varijable
• Data → Aggregate…

299
Agregacija podataka

300
Agregacija podataka
• Varijabla ed može poprimiti pet različitih
vrijednosti

301
Agregacija podataka

302
Agregacija podataka

303
Agregacija podataka

Varijabla na temelju
čijih vrijednosti se
sažimaju podaci

Kreira dodatnu varijablu Varijabla čije vrijednosti se sažimaju,


koja sadrži broj slučajeva funkcija sažimanja
u svakoj grupi podataka i naziv nove
varijable

Promjena funkcije
sažimanja i naziva i
labela nove varijable

304
Agregacija podataka

Mjesto pohrane
rezultata

305
Rezultat u slučaju pohrane u drugu datoteku
- Nova datoteka sadrži po jedan slučaj za svaku grupu definiranu varijablom po kojoj se vrši sažimanje
podataka -

306
Rezultat u slučaju pohrane u istu datoteku
- Svaki slučaj sa jednakom vrijednošću varijable po kojoj se podaci sažimaju poprima jednaku
vrijednost nove agregirane variable -

307
Funkcije sažimanja

Statistike:
Srednja vrijednost
Medijan
Suma
Standardna devijacija

308
Funkcije sažimanja

Specifične vrijednosti:
Prva nenedostajuća
primijećena vrijednost
Posljednja nenedostajuća
primijećena vrijednost
Minimum
Maksimum

309
Funkcije sažimanja

Broj slučajeva:
Postojećih (uzima se u obzir ponder)
Missing-a (uzima se u obzir ponder)
Postojećih (ne uzima se u obzir ponder)
Missing-a (ne uzima se u obzir ponder)

Weighting cases (ponderiranje) - omogućava zadavanje "važnosti" odn. pondera


slučajevima u skupu podataka
Na primjer:
- Ako se svaka vrijednost numeričke varijable pojavljuje s nekom frekvencijom
- Neki podaci imaju manju važnost odn. ponder, a drugi veću važnost odn. ponder
Zadavanje pondera u SPSS-u: Data -> Weight Cases… (Vidi slijedeći slajd -> …)

310
Ponderiranje podataka

311
Funkcije sažimanja

Postotak slučajeva:
Većih od vrijednosti Value
Manjih od vrijednosti Value
Između
vrijednosti Low i Hight
Koji nisu između
vrijednosti Low i Hight

312
Funkcije sažimanja

Frakcije:
Većih od vrijednosti Value
Manjih od vrijednosti Value
Između
vrijednosti Low i Hight
Koji nisu između
vrijednosti Low i Hight

Broj slučajeva u grupi Break varijable koji spadaju u frakciju


Sveukupni broj slučajeva u grupi Break varijable 313
Primjer
- U datoteci car_sales.sav su podaci o prodaji automobila -

314
Primjer
• Želimo podatak o broju prodanih primjeraka u
tisućama (varijabla sales) spustiti sa modela
(kako je sada u tablici) na marku automobila
(varijabla manufactur)
• Dakle:
– Varijabla na temelju koje sažimamo podatke (Break
Sariable) je manufact
– Varijabla čije vrijednosti sažimamo (Aggregated
Variable) je sales
– Funkcija sažimanja je Sum
– Kreiramo novi dataset koji sadrži agregirane podatke
315
Primjer

316
Rezultat

317
Prebrojavanje
• Kreiranje varijable u kojoj će biti prebrojana
pojavljivanja jedne te iste vrijednosti u skupu
varijabli za svakog ispitanika
• Na primjer:
– Istraživanje sadrži popis časopisa s da/ne mogućim
odgovorima za ispitanike
• Odgovori ispitanika kažu da li ispitanik taj časopis čita ili ne
– Možemo prebrojati broj časopisa koje čita svaki
ispitanik i rezultat smjestiti u novu varijablu

318
Prebrojavanje

319
Count Values within Cases...

320
Count Values within Cases...

321
Count Values within Cases...

322
Define Values...

323
Rezultat prebrojavanja

324
Kreiranje grafikona
korištenjem Chart Builder-a

325
Kreiranje grafikona korištenjem Chart
Builder-a
• Većina statističkih obrada ima mogućnost
automatskog kreiranja grafikona
• Grafikone je moguće kreirati i korištenjem
meni-a Graphs odn. tzv. Chart Builder-a
• Chart Builder je interaktivni prozor koji
nam omogućava da tijekom kreiranja
grafikona vidimo kako će grafikon izgledati

326
Primjer: demo.sav

327
Zanima nas povezanost primanja i zadovoljstva
radnim mjestom

328
Graphs → Chart Builder...

329
Poruka upozorenja

330
Chart Builder - interaktivni prozor

331
Odaberemo Gallery i Bar

332
Ikone su dovoljno informativne pa možemo odlučiti
koji grafikon nam je potreban

333
Povučemo npr. Simple Bar na površinu
za prikaz grafikona

334
Chart preview uses example data
Potrebno je smjestiti varijable na osi

335
Privremena promjena skale mjerenja za
varijablu koju smještamo na os
• Želimo smjestiti varijablu Job satisfaction na os x
• Ikona uz varijablu Job satisfaction znači da je skala
mjerenja te varijable kontinuirana

• Da bi kreirali ispravan grafikon, za varijablu Job


satisfaction trebamo postaviti kategoričku skalu mjerenja
– Na osi apscisa moramo imati kategorije, a ne kontinuiranu skalu
– U slučaju kontinuirane skale bi grafikon izgledao ovako
• Umjesto da se vraćamo u Variable View, možemo
privremeno promijeniti skalu mjerenja u Chart Builder-u
336
Kliknemo desnom tipkom na varijablu Job
satisfaction i odaberemo Ordinal

337
Ordinalna skala je pogodna skala za
varijablu Job satisfaction

338
Povučemo varijablu Job satisfaction na
os X

339
Na osi Y vidimo da piše Count što znači da će biti
prikazane frekvencije odabrane varijable

340
Statistiku je lako promijeniti u prozoru Element
Properties desno od Chart Builder-a

341
Element Properties nudi i druge mogućnosti - na
primjer: brisanje odabranih elemenata sa grafikona

342
Povučemo varijablu Household income ... na
os Y

343
Household income ... je kontinuirana - zato je
statistika Mean
- Za svaku kategoriju varijable jobsat će se izračunati srednja vrijednost varijable income -

344
Možemo postaviti naslov grafikona i druge
tekstualne dodatke

345
Kliknemo na OK da bismo kreirali grafikon

346
Naknadno uređivanje grafikona
• Grafikon je moguće kasnije urediti na više
načina:
– Promjena boja
– Oblikovanje brojeva
– Oblikovanje teksta
– Prikaz deskriptivnih opisa varijabli (Label-a)
– Primjenom predložaka (Chart templates)
• Dovoljno je dva puta kliknuti na grafikon u
Output-u i dobiti ćemo Chart Editor

347
Visual Binning

348
Visual Binning
• Visual Binning je razvijen kao pomoć u postupku
kreiranja novih varijabli na temelju grupiranja
susjednih vrijednosti postojećih varijabli u
ograničeni broj različitih kategorija
• Visual Binning možemo koristiti za:
– Kreiranje kategoričkih varijabli iz kontinuiranih
– Smanjivanje većeg broj kategorija u manji broj

349
Kategorizacija
- kreiranje kategoričkih varijabli iz kontinuiranih -

• Želimo kreirati kategorije na temelju varijable income


350
Transform → Visual Binning...

351
Visual Binning...

352
Visual Binning...

353
Odaberemo income u Scanned
Variable List

354
Ilustrativni grafikon prikazuje
distribuciju odabrane varijable

355
Upišemo naziv i label nove
kategorizirane varijable

356
Make Cutpoints...

357
Upišemo vrijednosti za intervale
- prema broju graničnih vrijednosti i širini razreda prema vrijednostima -

358
Upišemo vrijednosti za intervale
- prema broju graničnih vrijednosti i širini razreda u postotcima slučajeva -

359
Upišemo vrijednosti za intervale
- prema aritmetičkoj sredini i broju standardnih devijacijama kao graničnim
vrijednostima lijevo i desno od aritmetičke sredine -

360
Visual Binning

361
Upper Endpoints
- Included ili Excluded -

362
Make Labels automatski kreira
labele

363
Make Labels automatski kreira
labele

364
Visual Binning
• Numeričke vrijednosti granica kategorija
se mogu ručno prepraviti
• Labele kategorija se mogu ručno prepraviti
• Linije na grafičkom prikazu koje prikazuju
granice kategorija se mogu pomicati
mišem
• Linije se mogu brisati tako da se odvuku
izvan grafičkog prikaza
365
Klikom na OK se automatski kreira
nova varijabla

366
Popunjavanje ćelija kod kojih
postoji nedostajući podatak

367
Transform -> Replace Missing Values

368
Replace Missing Values

• Biramo varijablu za koju želimo eliminirati missing vrijednosti i


prebacujemo je u New Variable(s)
369
Replace Missing Values

• Pod Name SPSS sam zadaje ime nove varijable ali mi možemo
postaviti svoje
370
Replace Missing Values

• Pod Method biramo funkciju na temelju koje će se vršiti


popunjavanje nedostajućih podataka
371
Replace Missing Values
• Metode za zamjenu nedostajućih podataka:
– Series mean – zamjenjuje nedostajuće podatke
prosječnom vrijednošću cijelog niza podataka
– Mean of nearby points – zamjenjuje nedostajuće
podatke prosječnom vrijednošću bliskih podataka
• Misli se na fizički bliske podatke u tablici
• Broj bliskih podataka (ispred i iza nedostajućeg podatka)
određuje se u opciji Span of nearby points
– Median of nearby points – zamjenjuje nedostajuće
podatke medijanom bliskih (okružujućih) podataka
– Linear interpolation – zamjenjuje nedostajuće podatke linearnom
interpolacijom. Upotrebljavaju se posljednji postojeći podatak prije
nedostajućeg i prvi postojeći iza nedostajućeg (vidi primjer). Ako je
nedostajući podatak prvi ili posljednji tada se interpolacija ne izvodi
– Linear trend at point – zamjenjuje nedostajuće podatke linearnim
trendom
372
Replace Missing Values

• Mi ćemo u našem slučaju odabrati Series mean

373
Rezultat

374
Preuzimanje podataka iz drugih vrsta
datoteka

375
Preuzimanje podataka iz drugih
vrsta datoteka
• SPSS može uzeti podatke iz gotovo bilo
koje vrste datoteka
• Nas zanimaju ove dvije:

– Excel
– Txt

376
Otvaranje Excel datoteka u SPSS-u
- Primjer Excel datoteke -

377
File → Open → Data...

378
Odaberemo Excel datoteku → Open

379
Mogućnosti prilikom otvaranja

• Read variable names from the first row of data:


– Nazive stupaca iz Excel datoteke je moguće učitati u SPSS kao nazive
varijabli
– Ako se nazivi stupaca u Excel tablici ne slažu s pravilima zadavanja
nazivima varijabli u SPSS-u tada ih SPSS pretvara u valjane nazive
– Originalni nazivi stupaca postaju deskriptivni opisi varijabli (Labels)

380
Mogućnosti prilikom otvaranja

• Worksheet:
– Excel datoteka može sadržavati više tabela
– Po automatizmu, SPSS čita prvu tabelu
– U padajućem meni-u se može odabrati neka druga tabela ako se to želi

381
Mogućnosti prilikom otvaranja

• Range:
– Moguće je učitati samo određeni rang ćelija iz Excel datoteke
– Za definiranje ranga se upotrebljavaju ista pravila koja vrijede u Excel-u

382
Nakon učitavanja u SPSS
- Data View -

383
Nakon učitavanja u SPSS
- Variable View -

384
Poželjno je izvršiti neke izmjene

385
Poželjno je izvršiti neke izmjene
• Nazivi varijabli u SPSS-u ne mogu
sadržavati razmake
– Zato ih SPSS jednostavno obriše
• Neke poželjne izmjene SPSS ipak ne
napravi pa je dobro da ih napravimo mi
– Npr:
• Skratiti duljinu na 8 znakova
• Eliminirati Hrvatske dijakritičke znakove (č,ć,đ,š,ž)

386
Otvaranje tekstualnih datoteka u SPSS-u

• Često podatke o ispitanicima imamo


pohranjene u tekstualnim datotekama
• Mogući razlozi:
– Tijekom prikupljanja nije nam dostupan SPSS
– Razni računalni programi daju izlazne
rezultate u tekstualnom obliku
– Podaci se zbog sigurnosti prenose u
tekstualnom obliku
– ...
387
Primjer
• Primjer datoteke koja se dobije kao izlaz iz
programa kojim se provodi psihologijski
eksperiment:

388
Otvaranje tekstualnih datoteka u SPSS-u

• Podaci u tekstualnim datotekama mogu


biti odvojeni:
– Zarezima
– Točkama
– Tabovima
– Praznim mjestima
– itd

389
Drugi primjer tekstualne datoteke s
podacima o ispitanicima

390
File → Read Text Data ...

391
1. Korak:
Da li txt datoteka već ima preddefiniran format koji nam
treba ili ćemo ga odrediti sami – uobičajena je druga opcija

392
2. Korak:
- Da li postoji točan broj znakova koje zauzimaju varijable
- Da li će se prvi redak uzeti za definiranje naziva varijabli

393
3. Korak:
- U kojem retku txt datoteke počinju podaci o ispitanicima
- Koji retci prikazuju podatke

394
4. Korak:
- Koji znakovi (delimiters) označavaju razdvajanje podataka
- Kako su upisani podaci koji sadržavaju delimiter-e

395
5. Korak:
- Moguće je promijeniti nazive varijabli i njihov tip

396
6. Korak:
- Moguća pohrana ovog formata za buduću uporabu
- Moguć zapis sintakse obavljenog postupka u sintaksni
prozor (zbog kasnijih izmjena i ponovne uporabe)

397
Konačna datoteka nakon učitavanja u SPSS

398
SPSS - Rad s sintaksom

399
Rad s sintaksom

• Većina najpotrebnijih naredbi je dostupna preko menija


• Mnogo više mogućnosti je dostupno preko posebnog SPSS-ovog
naredbenog jezika
• Zašto poznavati naredbeni jezik?
– Neke naredbe i mogućnosti postoje samo u naredbenom jeziku
– Ušteda vremena u slučaju ponavljanja postupaka
– Dokumentiranje i pohranjivanje postupaka
– Ponavljanje istih postupaka nad drugim podacima (novim, obnovljenim,
...)
– Analiza istih podataka ali s manjim izmjenama u postupcima
– Programiranje novih postupaka kojih uopće nema u paketu SPSS
– Rad s sintaksom je brži od korištenja menija

400
Naredbe možemo pisati u sintaksni prozor

401
Naredbe možemo pisati u sintaksni prozor

402
Naredbe možemo pisati u sintaksni prozor

403
I pohraniti ih u obliku sintaksne datoteke

404
I pohraniti ih u obliku sintaksne datoteke

405
Najlakši način korištenja naredbenog jezika

1. Kopirati naredbe iz Output-a nakon


provedenog postupka
2. Otvoriti sintaksni prozor
3. Zalijepiti naredbe u sintaksni prozor
4. Izmijeniti naredbe (ako je potrebno)
5. Izvršiti naredbe
6. Pohraniti sintaksnu datoteku (ako je
potrebno)
406
Primjer

407
Otvorimo datoteku
Employee data.sav

408
Provedemo postupke koje želimo

409
Dobijemo rezultat u Output-u

410
Kopiramo naredbe

411
Kreiramo sintaksnu datoteku
File → New → Syntax

412
Dobijemo sintaksni prozor

413
"Lijepimo" naredbe

414
Pokretanje naredbi
Run → All

415
Naredbe u izborniku Run:

• All - Sve naredbe u sintaksnom prozoru


• Selection - Trenutno selektirane naredbe
• Current - Naredbu na kojoj se trenutno
nalazi kursor
• To End - Sve naredbe od mjesta gdje se
nalazi kursor do kraja sintaksnog prozora

416
Ista analiza ali za sve varijable

417
Rezultat nakon Run → All

Descriptive Statistics

N Minimum Maximum Mean Std. Deviation


Employee Code 474 1 474 237,50 136,976
Date of Birth 473 ********* 02/10/71 10/08/56 4302 07:54
Educational Level (years ) 474 8 21 13,49 2,885
Employment Category 474 1 3 1,41 ,773
Current Salary 474 $15,750 $135,000 ********* $17,075.661
Beginning Salary 474 $9,000 $79,980 ********* $7,870.638
Months since Hire 474 63 98 81,11 10,061
Previous Experience
474 0 476 95,86 104,586
(months)
Minority Classification 474 0 1 ,22 ,414
Valid N (lis twise) 473

418
Ako želimo samo srednju vrijednost i
standardnu devijaciju

419
Rezultat nakon Run → All

Descriptive Statistics

N Mean Std. Deviation


Employee Code 474 237,50 136,976
Date of Birth 473 10/08/56 4302 07:54
Educational Level (years) 474 13,49 2,885
Employment Category 474 1,41 ,773
Current Salary 474 ********* $17,075.661
Beginning Salary 474 ********* $7,870.638
Months since Hire 474 81,11 10,061
Previous Experience
474 95,86 104,586
(months)
Minority Classification 474 ,22 ,414
Valid N (lis twis e) 473

420
U kôd možemo umetati komentare

421
Primjer rada s sintaksom zbog ponovne analize istih
podataka ali s izmjenom u postupku

422
Obavimo postupke kojima dobijemo donje
grafikone

423
Nakon obrade dobijemo Output s sintaksom

424
Pohranimo Output: Save As..., imenujemo Output
file i odredimo mjesto gdje ćemo ga pohraniti

425
Kasnije možemo otvoriti output: File → Open →
Output... (output datoteke imaju nastavak .spo)

426
Nakon otvaranja možemo kopirati naredbe

427
... otvoriti novi Syntax prozor ...

428
... otvoriti novi Syntax prozor ...

429
Zalijepiti kopirane naredbe

430
Zalijepiti kopirane naredbe

431
Promijeniti naredbe koje želimo

432
Pokrenemo novi skup naredbi

433
I dobijemo rezultate u skladu s učinjenim
promjenama

434
Novu sintaksu možemo također pohraniti kao
Syntax (.sps) datoteku i kasnije je koristiti

435
Struktura SPSS naredbi

436
Struktura SPSS naredbi

Najprije primjer: naredba FREQUENCIES:

FREQUENCIES
VARIABLES = educ jobcat
/ORDER = ANALYSIS.

•Naredba FREQUENCIES kreira tablice frekvencija i postotaka


•Podnaredba VARIABLES očekuje imena varijabli nad kojima želimo
provesti navedenu naredbu
– Imena varijabli se razdvajaju razmacima
•Opcija /ORDER određuje da li želimo da rezultat bude poredan prema
vrsti analize ili prema varijablama

437
Struktura SPSS naredbi

• Općenito:

• Na početku naredbe pišemo njen naziv koji kaže što želimo provesti
• Slijede podnaredbe i korisničke opcije
• Naredbe završavaju točkom
• Naredbe se mogu pisati velikim (TISKANIM) ili malim (pisanim)
slovima
• Popis naredbi i opcija: "IBM SPSS Statistics 20 Command Syntax
Reference"
• Neke naredbe SPSS neće izvršiti odmah čim smo ih zadali nego će
ih zapamtiti i izvršiti kada to bude neophodno (zbog resursa)
• Da bi SPSS odmah izvršio zadanu naredbu možemo na kraj naše
sintakse dodati naredbu EXECUTE.
438
Opcija ORDER
/ORDER = ANALYSIS

439
Opcija ORDER
/ORDER = VARIABLE

440
Opcije naredbe FREQUENCIES

• Za naredbu vidi slijedeći slajd ->


• Velikim tiskanim slovima su napisane naredbe, podnaredbe,
funkcije, operatori i slično
• Malim pisanim slovima su napisane specifikacije koje korisnik treba
upisati
• Podebljano su pisane automatske (default) vrijednosti
– Ako iza te vrijednosti slijede dvije zvjezdice tada je to default ako
podnaredba nedostaje
– Ako nema dvije zvjezdice onda je to default ako je podnaredba (ili
ključna riječ) navedena
• Podnaredbe i opcije u uglatim zagradama [ ] su opcionalne (osim
kada su te zagrade dio sintakse)
• Vitičaste zagrade { } ukazuju na mogućnost odabira između više
mogućnosti
441
Opcije naredbe FREQUENCIES

442
Primjer koji koristimo u daljnjem opisu opcija naredbe FREQUENCIES:
FREQUENCIES VARIABLES = literacy

443
Opcije naredbe FREQUENCIES

Ne ispisuje tabelu frekvencija

444
Opcije naredbe FREQUENCIES

Ispisuje tabelu frekvencija


ako ima maksimalno n
različitih vrijednosti

445
Opcije naredbe FREQUENCIES

Redoslijed vrijednosti u tabeli


frekvencija

446
Opcije naredbe FREQUENCIES

Uključivanje user-missing
podataka
Podrazumijevano, user-missing
i system-missing vrijednosti:
- jesu navedene kao missing
u tabeli
- nisu uključene u valjane i
kumulativne postotke,
u izračunavanja deskriptivne
statistike, niti u grafikone i
histograme

447
FREQUENCIES VARIABLES=literacy
/BARCHART
/MISSING=INCLUDE.

448
Opcije naredbe FREQUENCIES

Podaci ispod zadanog


minimuma i iznad zadanog
maksimuma neće biti
prikazani

449
FREQUENCIES VARIABLES=literacy
/BARCHART=MINIMUM(5) MAXIMUM(90).

450
Opcije naredbe FREQUENCIES

Vertikalna skala se prikazuje u


- Frekvencijama
- Postotcima
n je maksimalna vrijednost do
koje će os biti prikazana

451
FREQUENCIES VARIABLES=literacy
/BARCHART=PERCENT(80).

452
Kraći oblici sintaksnih naredbi

453
Kraći oblici sintaksnih naredbi

• Naredbe koje se koriste u sintaksi često


imaju kraće oblike
• Također, sintaksa koju generira SPSS je
često nepotrebno duga i složena

454
Ključna riječ TO umjesto nabrajanja

• v1 TO v24 znači v1, v24 i sve varijable među njima, primjer:

DESCRIPTIVES VARIABLES=v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11 v12 v13 v14 v15 v16


v17 v18 v19 v20 v21 v22 v23 v24
/STATISTICS=MEAN STDDEV MIN MAX.

se može pisati:

DESCRIPTIVES VARIABLES=v1 TO v24


/STATISTICS=MEAN STDDEV MIN MAX.

• Pažnja: v1 TO v24 se može promijeniti ako se promijeni redoslijed varijabli


u datoteci!
• Dodatna pogodnost ovakvog pisanja:
– v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11 v12 v13 v14 v15 v16 v17 v18 v19 v20 v21 v22 v23 v24
neće raditi ako se npr. izbriše varijabla v11
– ali v1 TO v24 će svejedno raditi

455
Nepotrebne "default" opcije

• Možemo izbjeći pisanje "default" opcija koje SPSS


prilikom generiranja sintakse navodi
• Npr, ne moramo pisati ovo:

DESCRIPTIVES
VARIABLES= v1 TO v24
/STATISTICS=MEAN STDDEV MIN MAX .

• … što generira SPSS nego je dovoljno ovo:

DESCRIPTIVES
VARIABLES= v1 TO v24.

456
Moguće izostavljanje ključnih riječi

• Ako se u kôdu ne navede ključna riječ


VARIABLES tada će SPSS sam zaključiti
da je sve što slijedi iza DESCRIPTIVES
navođenje varijabli
• Dakle, prethodni kôd možemo pisati:

DESCRIPTIVES v1 TO v24.

457
Skraćivanje naredbi

• Mnoge (pod)naredbe mogu biti skraćene


na prva tri slova
• Na primjer, DESCRIPTIVES se može
pisati samo DES pa prethodni kôd postaje:

DES v1 TO v24.

458
Gradnja sintakse pomoću
menija

459
Gradnja sintakse pomoću menija

• Kada želimo završiti s nekom operacijom


tada možemo kliknuti na gumb Paste
umjesto gumba Ok
• Tako će automatski biti otvoren Syntax
prozor koji će sadržavati sintaksu koju
smo generirali preko menija
• Nakon toga tu sintaksu možemo izvršiti
ako želimo (ili učiniti s njom što želimo)

460
Gradnja sintakse pomoću menija

461
Gradnja sintakse pomoću menija

462
Gradnja sintakse pomoću menija

• Ako se sada vratimo u meni, obavimo


neku drugu operaciju i ponovno kliknemo
na gumb Paste, nova sintaksa koja sadrži
nove postupke će biti dodana postojećoj u
istom sintaksnom prozoru

463
Gradnja sintakse pomoću menija

464
Gradnja sintakse pomoću menija

465
Gradnja sintakse pomoću menija

• Opisane korake možemo ponavljati


• Na opisani način možemo izgraditi
kompletnu sintaksnu datoteku koristeći
menije

466
Konkretni primjeri upotrebe
sintaksnih naredbi

467
Izračunavanje novih varijabli

• Naredba COMPUTE - kreira novu numeričku varijablu ili modificira


vrijednosti postojećih string ili numeričkih varijabli na temelju zadanog izraza
• Naredba Compute ne čita tekući skup podataka (SPSS je sprema i čeka
izvršenje sa sljedećom naredbom koja čita tekući (otvoreni) skup podataka)
• Općenita sintaksa: COMPUTE ciljna_varijabla = izraz.
• Vježba 1: U datoteci Demo.sav sintaksom izračunajte novu varijablu prosjek
koja je jednaka kvocjentu varijabli income i reside
• Vježba 2: U datoteci Demo.sav ponovno sintaksom izračunajte novu
varijablu prosjek koja je jednaka kvocjentu varijabli income i reside ali tako
da income prethodno bude umanjena za 5 tisuća dolara troškova
– Dakle, ako varijabla koju želimo kreirati već postoji tada će naredba COMPUTE
promijeniti njene vrijednosti)
– Ako varijabla već postoji ali se iz nekog razloga neće izračunati (npr. imamo neki
missing ili zadani uvjet nije zadovoljen) tada će postojeća vrijednost ostati
nepromijenjena!!!

Za sve mogućnosti naredbe COMPUTE pogledati u "IBM SPSS Statistics 20 Command Syntax Reference"
468
Izračunavanje novih varijabli

• Vježba 3: U datoteci Demo.sav izračunajte sintaksom kvadratni korijen iz


varijable age za svakog ispitanika.
• String varijable mogu biti modificirane ali ne mogu biti kreirane naredbom
COMPUTE
• Nova string varijabla može biti deklarirana naredbom:
STRING novavar (A8).
• … gdje je 8 njena duljina, a zatim joj se može dodijeliti vrijednost ovako:
COMPUTE novavar = UPCASE(gender).
• Ako u izrazu nedostaje vrijednost neke varijable za nekog ispitanika tada će
nedostajati i vrijednost ciljne varijable za tog ispitanika
–Ovo je načelno tako ali ima slučajeva određenih funkcija kada će ciljna varijabla biti
izračunata i u slučaju kada za neke varijable u izrazu nedostaje vrijednost
• Primjer: naredba COMPUTE REZ = VAR1+VAR2+VAR3 neće izračunati REZ za
ispitanike kojima nedostaje VAR1 ili VAR2 ili VAR3, a naredba COMPUTE REZ =
SUM(VAR1,VAR2,VAR3) će izračunati rezultat ako postoji barem jedna od tri varijable

Za sve mogućnosti naredbe COMPUTE pogledati u "IBM SPSS Statistics 20 Command Syntax Reference"
469
Izračunavanje varijabli samo za vrijednosti
koje zadovoljavaju određene uvjete
Upotrebljavamo naredbu IF koja ima tri komponente:
• Logički izraz (uvjet)
• Ciljnu varijablu
• Izraz za izračunavanje ciljne varijable

Općenita sintaksa: IF (uvjet) ciljna_varijabla = izraz. (primijeti: nema naredbe COMPUTE)


Vježba 1: IF (age > 30) prosjek1 = income/reside.
Vježba 2: IF (gender = "f") prosjek2 = income/reside.

Kombiniranje više uvjeta:

Vježba 3: IF (age > 30 AND gender = "f") prosjek3 = income/reside.


Vježba 4: IF ((age < 30 OR age > 60) AND gender = "m") prosjek4 = income/reside.

Za sve mogućnosti naredbe IF pogledati u "IBM SPSS Statistics 20 Command Syntax Reference"

470
Petlje
- naredbe za ponavljano izvršavanje drugih naredbi -

• DO REPEAT
– Često se primjenjuje za ponavljanje iste naredbe
preko više varijabli
• Te varijable mogu biti i novokreirane
• Za istu namjenu se upotrebljava i kombinacija naredbi LOOP
i VECTOR (vidi dalje)
• LOOP
– Primjenjuje se za ponavljano provođenje
transformacija
– Često se upotrebljava zajedno s naredbom VECTOR

471
DO REPEAT
- Općenita sintaksa -

DO REPEAT stand-in-var={varlist | ALL }


[/stand-in-var=...]
{value list}
transformation commands
END REPEAT [PRINT]

• stand-in-var je naziv varijable kojeg sami zadajemo da bismo njime predstavili cijeli
popis varijabli varlist
• Kako se izvršavanje naredbi ponavlja tako stand-in-varijabla poprima novu vrijednost
sa popisa varlist
• Možemo navesti više stand-in-varijabli kako što vidimo u primjeru dalje
• Svaka stand-in-varijabla mora imati vlastiti znak jednakosti i pridružene varijable ili
listu vrijednosti i mora biti odijeljena od ostalih stand-invarijabi znakom /
• Svaka lista mora navesti ili generirati jednak broj objekata

472
DO REPEAT
- Primjer 1 -

• Rezultati ispitanika na testu su upisani u SPSS datoteku testiranje.sav:

• Ova datoteka se nalazi na http://www.ffri.hr/~marko/urp/materijali


473
DO REPEAT
- Primjer 1 -

Točni rezultati su:


p1: 3
p2: 3
p3: 4
p4: 4
p5: 1
p6: 5
p7: 4
p8: 2
p9: 3
p10: 3
p11: 4
p12: 4
p13: 1
p14: 5
p15: 4
p16: 2
p17: 4
p18: 4
p19: 1
p20: 5
474
DO REPEAT
- Primjer 1 -

Zadatak:

• Izračunajte na koliko pitanja je koji ispitanik točno


odgovorio!

475
DO REPEAT
- Primjer 1 -

Rješenje:

COMPUTE rezultat1=0.
DO REPEAT pit=p1 TO p20
/tocno = 3 3 4 4 1 5 4 2 3 3 4 4 1 5 4 2 4 4 1 5.
IF (pit=tocno) rezultat1=rezultat1+1.
END REPEAT.
EXECUTE.

476
DO REPEAT
- Primjer 2 -

• U upitniku imamo pitanje Skip nakon kojeg ispitanik treba preskočiti


pitanja (varijable) A, B i C ako je na Skip odgovorio sa 1 (Ne)

Skip

C
477
DO REPEAT
- Primjer 2 -

• Zato želimo na pitanja A, B i C staviti broj 9 (user


missing) bez obzira na to što se tamo nalazi
• To možemo učiniti petljom DO REPEAT preko varijabli
A, B i C:

DO REPEAT v = A B C.
IF Skip = 1 v = 9.
END REPEAT.

478
DO REPEAT
- Primjer 3 -

• Potrebno je kreirati više novih varijabli s vrijednošću 0


• Nove varijable neka se zovu podaci1, podaci2, podaci3,
podaci4 i podaci5:

DO REPEAT p=podaci1 TO podaci5.


COMPUTE p=0.
END REPEAT.
EXECUTE.

479
DO REPEAT
- Primjer 3 -

480
DO REPEAT
- Primjer 4 -

481
DO REPEAT
- Primjer 4 -

• Svaka od varijabli od country do folk treba biti


pomnožena nekim posebnim brojem (brojevi su redom 3,
4, 2, 2, 5) s tim da umnoške treba spremiti u nove
varijable:

DO REPEAT existvar=country TO folk


/novavar=novavar1 TO novavar5
/value=3 4 2 2 5.
COMPUTE novavar=existvar*value.
END REPEAT.

482
DO REPEAT
- Primjer 4 -

483
DO REPEAT
- Primjer 4 -

• Ako ne zadamo smislenu naredbu odn. ako npr. stavimo


više novih varijabli nego što smo obuhvatili postojećih:
DO REPEAT existvar=country TO folk
/novavar=novavar1 TO novavar6
/value=3 4 2 2 5 7.

>Error # 4511 in column 4. Text: value


>The number of elements in variable and value lists do
not agree in number
>with a previous variable or value list(s).
>This command not executed.

COMPUTE novavar=existvar*value.

>Error # 4285 in column 18. Text: existvar


>Incorrect variable name: either the name is more than 64
characters, or it
>is not defined by a previous command.
>This command not executed.

END REPEAT.

>Error # 4001. Command name: END REPEAT


>An END REPEAT command has appeared without a previous DO
REPEAT command.
>This command not executed.

EXECUTE.
484
LOOP petlja
- primjer 1 -

COMPUTE nova_var=age.
LOOP #I=1 TO 5.
COMPUTE nova_var=SQRT(nova_var).
END LOOP.
EXECUTE.

485
LOOP petlja
- općenita sintaksa -

LOOP [#brojac=n TO m [BY{1**}]] [IF [(]logički izraz[)]]


{n }
... naredbe ...
END LOOP [IF [(]logički izraz[)]]

** - Default ako naredba nije navedena

486
LOOP petlja

• Ponavlja skup naredbi određeni broj puta


• Prekid petlje može biti određen na različite načine
– Brojačem iza naredbe LOOP
– Uvjetom IF iza naredbe END LOOP
– Naredbom BREAK unutar petlje
– Maksimalnim brojem iteracija
• Podrazumijevano je maksimum jednak 40
• može biti promijenjen podnaredbom MXLOOPS
• Brojač ima viši prioritet od MXLOOPS
• Uvjet IF iza naredbe LOOP može služiti za primjenu petlje na
podskupu podataka (slučajeva, ispitanika)
• Ova naredba ne čita tekući (otvoreni) skup podataka (SPSS je
sprema i čeka izvršenje sa slijedećom naredbom koja čita tekući
(otvoreni) skup podataka)
487
LOOP petlja
- primjer 2 -

COMPUTE nova_var=age.
LOOP #I=1 TO 5 IF (age>40).
COMPUTE nova_var=SQRT(nova_var).
END LOOP.
EXECUTE.

488
LOOP petlja
- primjer 3 -

COMPUTE nova_var=age.
LOOP #I=1 TO 5 IF (age>40).
COMPUTE nova_var=SQRT(nova_var).
END LOOP IF nova_var LT 1.13.
EXECUTE.

489
LOOP petlja
- primjer 4 -

COMPUTE nova_var=age.
SET MXLOOPS=5.
LOOP.
COMPUTE nova_var=SQRT(nova_var).
END LOOP.
EXECUTE.

490
Naredba VECTOR

• Vektor je skup varijabli koje mogu biti pozivane preko


indeksa
• Naredba VECTOR:
– Povezuje naziv vektora s skupom postojećih varijabli:
VECTOR V = wireless TO ownfax.
ili
– Definira vektor novih varijabli V1 do Vn koje možemo pozivati s
V(1), …, V(n), npr:
VECTOR V(8).

Za sve mogućnosti, pravila i ograničenja naredbe VECTOR pogledati u "IBM SPSS Statistics 20 Command Syntax Reference"

491
Naredba VECTOR

• Vektor se može odnositi na string ili numeričke varijable


– ali jedan vektor može sadržavati samo numeričke ili samo string
varijable (string varijable moraju biti i jednake duljine)
• Za svaku varijablu na popisu naredba VECTOR generira
jedan element
– Imena tih elemenata se sastoje od imena vektora i indeksa
– U slučaju prve naredbe na prethodnom slajdu imena elemenata
vektora su V(1), V(2), …, V(13)
• Vektori se najviše koriste u naredbi LOOP jer u toj
naredbi možemo pozivati indekse vektora
Za sve mogućnosti, pravila i ograničenja naredbe VECTOR pogledati u "IBM SPSS Statistics 20 Command Syntax Reference"

492
LOOP petlja
- Riješite ponovno zadatak s datotekom testiranje.sav ali uporabom
naredbi LOOP i VECTOR -
COMPUTE rezultat=0.
VECTOR t(20).
COMPUTE t(1)=3.
COMPUTE t(2)=3.
COMPUTE t(3)=4.
COMPUTE t(4)=4.
COMPUTE t(5)=1.
COMPUTE t(6)=5.
COMPUTE t(7)=4.
COMPUTE t(8)=2.
COMPUTE t(9)=3.
COMPUTE t(10)=3.
COMPUTE t(11)=4.
COMPUTE t(12)=4.
COMPUTE t(13)=1.
COMPUTE t(14)=5.
COMPUTE t(15)=4.
COMPUTE t(16)=2.
COMPUTE t(17)=4.
COMPUTE t(18)=4.
COMPUTE t(19)=1.
COMPUTE t(20)=5.
VECTOR X=p1 TO p20.
LOOP #I=1 TO 20.
IF (X(#I)=t(#I)) rezultat=rezultat+1.
END LOOP.
EXECUTE.
DELETE VARIABLES t1 TO t20.

493
Rekodiranje sintaksom

• Sintaksnim naredbama je moguće rekodirati više varijabli


odjednom
– To nije moguće korištenjem naredbi iz menija
• Naredba RECODE
• Primjer:
– RECODE bigband blugrass country blues musicals classicl folk
jazz opera rap hvymetal attsprts visitart tvshows tvnews tvpbs
(0=5) (1=4) (2=3) (3=2) (4=1) (5=0) INTO bigband_new
blugrass_new country_new blues_new musicals_new
classicl_new folk_new jazz_new opera_new rap_new
hvymetal_new attsprts_new visitart_new tvshows_new
tvnews_new tvpbs_new.

494
Općenita sintaksa za numeričke varijable

Popis varijabli koje Popis vrijednosti koje Vrijednost u koju


želimo rekodirati želimo promijeniti želimo promijeniti

RECODE varlist (value list=value)...(value


list=value) [INTO varlist] [/varlist...]

Popis varijabli u koje Drugi popis varijabli s


želimo rekodirati drugačijim pravilima rekodiranja

495
Primjeri

RECODE V1 TO V3 (0=1) (1=0) (2,3=-1) (9=9) /QVAR (1


THRU 5=1)(6 THRU 10=2)(11 THRU HI=3)(ELSE=0).

RECODE STRVAR ('A','B','C'='A')('D','E','F'='B')(ELSE=' ').

RECODE ljubimac ('iguana', 'zmija' = 'divlji').

RECODE V1 TO V3 (0=1) (1=0) (2=-1) INTO DEFENSE


WELFARE HEALTH.

496
Rekodiranje
- Nedostajući podaci -

• Ključne riječi MISSING i SYSMIS obje označavaju nedostajuće


podatke
– MISSING uključuje:
• system-missing vrijednosti (ćelije bez upisane vrijednosti)
• user-missing (vrijednost koje su upisane ali ih je korisnik definirao kao
nedostajuće)
– SYSMIS uključuje samo system-missing vrijednosti
• Primjer:

RECODE bodovi (1=0) (2=1) (3=2) (ELSE=SYSMIS) INTO bodovi1.


EXECUTE.

Za sve mogućnosti naredbe RECODE pogledati u "IBM SPSS Statistics 20 Command Syntax Reference"

497
Sortiranje sintaksom

Primjer naredbe koja će sortirati podatke uzlazno (A - ascending)


prema varijabli age i silazno (D - descending) prema varijabli income:

SORT CASES BY age (A) income (D).

Za sve mogućnosti naredbe SORT CASES pogledati u "IBM SPSS Statistics 20 Command Syntax Reference"

498
Podjela u grupe sintaksom

• SPLIT FILE zahtijeva da podaci budu sortirani (rastuće) prema


varijablama prema kojima želimo grupirati podatke
• Primjer:
SORT CASES BY contact.
SPLIT FILE SEPARATE BY contact.
FREQUENCIES Satisfaction
/HISTOGRAM.
SPLIT FILE OFF.

– Podnaredba SEPARATE znači da će grupe biti prikazane u zasebnim


tablicama

Za sve mogućnosti naredbe SPLIT FILE pogledati u "IBM SPSS Statistics 20 Command Syntax Reference"

499
SPSS datoteke (data files) i skupovi
podataka (datasets)

500
SPSS datoteke (data files) i skupovi
podataka (datasets)

Data file

Dataset

• SPSS datoteke (data files) su podaci koji su pohranjeni na uređaju za pohranu (tvrdi
disk, USB stick, …)
– U načelu, isključivanje računala ne utječe na SPSS datoteke
• Prilikom otvaranja SPSS datoteke njeni podaci se kopiraju u radnu memoriju računala
– Ti podaci se nazivaju SPSS skup podataka (dataset)
– Dakle, SPSS dataset postoji samo u radnoj memoriji računala
– Promjene koje radimo na skupu podataka se zapisuju samo u radnoj memoriji računala
• Dakle, u slučaju isključivanja računala biti će izgubljeni
501
SPSS datoteke (data files) i skupovi
podataka (datasets)
• Istovremeno može biti otvoreno više SPSS skupova podataka
• Ali uvijek je jedan skup podataka aktivan

• Aktivan je obično posljednji otvoren (ali to se može promijeniti


naredbom DATASET ACTIVATE)
• Većina naredbi koje zadamo će biti primijenjene na aktivni skup
podataka
– (osim naredbi koje su planirane baš za rad s više skupova podataka
(npr. ADD FILES))
502
Nazivi skupova podataka

Naziv skupa podataka

• Naziv se može zadati ili promijeniti naredbom DATASET


NAME novi_naziv
• Naziv može služiti da se sintaksom pozivaju različiti
skupovi podataka
503

You might also like