Professional Documents
Culture Documents
2
Struktura SPSS datoteke
3
Nakon pokretanja programa
- Data View -
4
Nakon pokretanja programa
- Variable View -
5
Pogled na podatke
- Data View -
6
Pogled na varijable
- Variable View -
7
Data View i Variable View
• U Data View:
– Redci:
• Objekti
– U psihologiji najčešće ispitanici
– Stupci:
• Varijable
– U psihologiji npr. pitanja koja su postavljena
• U Variable View:
– Redci:
• Varijable
– Stupci:
• Osobine (atributi) varijabli
8
SPSS datoteke s primjerima
• Mnogo datoteka s primjerima
• Fiktivni ali poučni podaci
• Služe za vježbu
9
Otvaranje datoteka s primjerima
File – Open – Data...
10
Otvaranje datoteka s primjerima
11
Otvaranje datoteka s primjerima
Inače, SPSS datoteke koje sadrže podatke imaju ekstenziju .sav
12
Otvaranje datoteka s primjerima
Datoteka demo.sav
13
Svaka operacija koju izvršimo u SPSS-u se
bilježi u prozoru koji se zove Output Viewer
14
Navigation Meni
- za lakše snalaženje u glavnom prozoru -
15
Zatvaranje programa SPSS i
Output viewer
16
Kreiranje nove SPSS datoteke
17
Definiranje varijabli
- naziv -
18
Definiranje varijabli
- predodređene vrijednosti atributa -
19
Definiranje varijabli
- tip -
20
Definiranje varijabli
- tip -
21
Tipovi varijabli u SPSS-u
• Numeric
– Varijabla čije vrijednosti su brojevi
– Vrijednosti se prikazuju u standardnom numeričkom formatu
• Comma - Numerička varijabla sa slijedećim prikazom: 45,678.78
• Dot - Numerička varijabla sa slijedećim prikazom: 45.678,78
• Scientific notation - Numerička varijabla u znanstvenoj notaciji: 4,57E+004
• Date - Razni datumski formati, npr: 03/12/2016
• Dollar - Numerička varijabla sa vodećim znakom dolara: $57,24
• Custom currency - Prikazi s raznim valutama koje je moguće podešavati
• String - Varijabla čije vrijednosti su nizovi znakova
• Restricted Numeric
– Ne-negativni cijeli brojevi
– Prikazuju se vodeće nule postavljene na maksimalnu širinu varijable: 00000025
• Savjet: Za unos cijelih brojeva – upotrijebiti tip Numeric i jednostavno sakriti decimalna mjesta
(staviti broj decimala na 0)
22
Definiranje varijabli
- tip String -
23
Definiranje varijabli
- tip String -
24
Deskriptivni opisi varijabli (Label)
• Dulje, opisne oznake varijabli
• Bolje opisuju varijablu od njihovog naziva
• Možemo upisati i cijele rečenice
25
Deskriptivni opisi varijabli (Label)
• Bit će ispisani u tabelama i grafikonima
26
Zadavanje posebnih oznaka mogućim
vrijednostima varijabli (Value Labels)
• Opisuju pojedinačne vrijednosti koje može
poprimiti neka varijabla
27
Zadavanje posebnih oznaka mogućim
vrijednostima varijabli (Value Labels)
- Primjer: varijabla marital (bračno stanje) -
28
Zadavanje posebnih oznaka mogućim
vrijednostima varijabli (Value Labels)
- Primjer: varijabla marital (bračno stanje) -
29
Zadavanje posebnih oznaka mogućim
vrijednostima varijabli (Value Labels)
- Primjer: varijabla marital (bračno stanje) -
30
Zadavanje posebnih oznaka mogućim
vrijednostima varijabli (Value Labels)
- Primjer: varijabla marital (bračno stanje) -
31
Zadane oznake varijabli će se ispisivati
u tabelama i na grafikonima
32
Zadane oznake varijabli mogu se prikazati i u Data
View ako uključimo opciju View → Value Labels
33
Zadane oznake varijabli mogu se
prikazati i u Data View
34
… pa se mogu upotrijebiti za unos podataka
klikom na miša
35
Rad s nedostajućim podacima
(Missing Data)
• Postoje različiti razlozi nedostajućih podataka:
– Ispitanik odbija odgovoriti na pitanje
– Ispitanik ne zna odgovor
– Ispitanik odgovara na neočekivani način
– ...
• Važno je NE IGNORIRATI nedostajuće podatke
– Mogu biti važni za interpretaciju podataka:
• Možda je udio nedostajućih podataka velik
• Možda želimo razlikovati razloge neodgovaranja
• Zato ih je potrebno:
– Definirati
– Po želji uključiti ili isključiti iz analize
36
U SPSS-u postoje dvije vrste
nedostajućih podataka
• System-missing:
– podaci koji nedostaju bez određenog razloga
– samo za varijable numeričkog tipa
– prikazani su točkicom u tabeli
– varijabla tipa string
• ne postoji System-missing
• nedostajući podatak se interpretira kao prazan string
• User-missing:
– postoje među podacima ali ih je potrebno isključiti iz
kalkulacija i obrade
37
System-missing
38
Definiranje vrijednosti za
nedostajuće podatke
39
Definiranje vrijednosti za
nedostajuće podatke
• Dva načina:
41
Definiranje vrijednosti za
nedostajuće podatke
42
Definiranje značenja nedostajućih
podataka
43
Definiranje značenja nedostajućih
podataka
44
Definiranje značenja nedostajućih
podataka
45
Za nedostajuće podatke zatim
unosimo podatke koje smo odredili
46
A mogu se prikazati i njihove
opisne vrijednosti
47
I za string varijablu možemo
definirati missing kao i za numeric
48
I za string varijablu možemo
definirati missing kao i za numeric
49
Skala mjerenja - Measure
50
Skale mjerenja (measurements) podataka
Categorical Scale
(kvalitativni podaci) (kvantitativni, kontinuirani podaci)
Podaci koji mogu Postoji informacija o veličini svojstva koje mjerimo,
poprimiti ograničeni broj postoji uređaj među vrijednostima
različitih vrijednosti i razlika između tih vrijednosti se
može izračunati
Primanja u kunama:
Petar: 4.524,30
Sanja: 6.836,58
Nominal Ordinal
Ne postoji Postoji uređaj među podacima,
uređaj među podaci se mogu rangirati po nekom
podacima, kriteriju ali ne postoji informacija o
a brojčane vrijednosti količini mjerenog svojstva u pojedinim
su samo zamjena slučajevima niti mjerljiva razlika među
za neki naziv podacima
Zadovoljstvo poslom:
Omjerna skala
Spol: Visoko Kontinuirana skala uz dodatak apsolutne nule
Muški (0)
Ženski (1)
Srednje (nula označava nepostojanje svojstva)
Nisko
Primanja u kunama:
Studira na: Ivan: 0,00
Odsjek za psihologiju (1)
Odsjek za povijest (2)
... (3)
51
Kombinacije tipova i skala mjerenja
52
Variable View - Role
53
Variable View - Role
• Uloga koju će varijabla igrati u vašoj analizi (npr. Nezavisna
varijabla, zavisna variable…)
• Neke složenije analize u SPSS-u omogućuju da se varijable
unaprijed selektiraju na temelju definirane uloge odn. role
– samo varijable sa odgovarajućom ulogom će biti dostupne u nekoj proceduri
• Za većinu analiza uloga varijable neće značiti ništa
• Postoje slijedeće uloge:
– Input: Varijabla će biti upotrijebljena kao nezavisna (ovo je "default" uloga)
– Target: Varijabla će biti upotrijebljena kao zavisna
– Both: Varijabla će biti upotrijebljena i kao nezavisna i kao zavisna
– None: Varijabla nema određenu ulogu
– Partition: Varijabla će podijeliti podatke na zasebne grupe
– Split: Koristi se u modulu IBM SPSS Modeler (nema veze sa naredbom split)
54
Define Variable Properties
55
Data » Define Variable Properties…
56
Odaberemo (kategoričke) varijable koje
želimo i prebacimo ih u desni prozor
57
Nakon što kliknemo na Continue
58
Kliknemo na neku varijablu
59
Ako želimo promijeniti skalu mjerenja
možemo kliknuti na Suggest
60
Ako želimo promijeniti skalu mjerenja
možemo kliknuti na Suggest
61
U Label za broj 9 upišemo Bez odgovora
62
U Missing za broj 9 stavimo kvačicu (tako
definiramo User Missing)
63
Možemo definirati i druge opisne oznake
(Labels)
64
Preko naredbe To Other Variables možemo
ista svojstva primijeniti na druge varijable
65
Završavamo sa OK
66
Kopiranje atributa varijabli
Nakon što definiramo atribute za određenu varijablu možemo te atribute
kopirati i primijeniti ih na druge varijable
67
Kopiranje atributa varijabli
68
Kopiranje atributa varijabli
69
Možemo kopirati i sve atribute
jedne varijable u druge varijable
70
Možemo kopirati i sve atribute
jedne varijable u druge varijable
71
Možemo kopirati i sve atribute
jedne varijable u druge varijable
72
Možemo kopirati i sve atribute
jedne varijable u druge varijable
73
Osnovne transformacije
varijabli
74
Izračunavanje novih varijabli
75
Izračunavanje novih varijabli
• Na temelju već postojećih varijabli želimo izračunati novu
• Iz visine i težine želimo izračunati indeks tjelesne mase
• Nova varijabla će se zvati ITM sa opisom (Label): Indeks
tjelesne mase
• Indeks tjelesne mase računa se prema formuli:
Težina
Indeks tjelesne mase
Visina 2
76
Transform → Compute Variable…
77
Target Variable i Numeric Expression
78
Type & Label...
79
Kreirana je nova varijabla s izračunatim vrijednostima za
svakog ispitanika
80
Izračunavanje novih varijabli
- uporaba već definiranih funkcija -
81
Izračunavanje novih varijabli
- uporaba već definiranih funkcija -
83
Izračunavanje novih varijabli
- uporaba već definiranih funkcija, npr: kvadratni korijen -
84
Izračunavanje novih varijabli
- uporaba već definiranih funkcija, npr: kvadratni korijen -
85
Izračunavanje novih varijabli
- uporaba već definiranih funkcija, npr: kvadratni korijen -
86
Izračunavanje novih varijabli
- uporaba već definiranih funkcija, npr: dekadski logaritam -
87
Izračunavanje novih varijabli
- uporaba već definiranih funkcija, npr: prirodni logaritam -
88
Izračunavanje novih varijabli
- funkcije sa više argumenata -
89
Izračunavanje novih varijabli
- funkcije sa više argumenata -
90
Izračunavanje novih varijabli
- funkcije sa više argumenata -
91
Izračunavanje novih varijabli
- funkcije sa više argumenata -
92
Izračunavanje novih varijabli
- kombiniranje više funkcija -
93
Rad s vrijednostima koje
zadovoljavaju određene uvjete
• Kako ćemo određeni postupak provesti
samo nad ispitanicima koji zadovoljavaju
neki uvjet (npr. da su u mirovini)?
94
Rad s vrijednostima koje zadovoljavaju određene uvjete
95
Rad s vrijednostima koje zadovoljavaju određene uvjete
96
Rad s vrijednostima koje zadovoljavaju određene uvjete
income
incsvret
reside
97
Rad s vrijednostima koje zadovoljavaju određene uvjete
98
Rad s vrijednostima koje zadovoljavaju određene uvjete
99
Rad s vrijednostima koje zadovoljavaju određene uvjete
Include if case satisfies condition:
100
Rad s vrijednostima koje zadovoljavaju određene uvjete
101
Rad s vrijednostima koje zadovoljavaju određene uvjete
102
Kombiniranje više uvjeta
103
Kombiniranje više uvjeta
• Primjer:
105
Logički veznici
ne negacija u SPSS-u se piše ~
i konjunkcija u SPSS-u se piše &
ili disjunkcija u SPSS-u se piše |
~p - negacija izraza p
p & q - konjunkcija izraza p i q
p | q - disjunkcija izraza p i q
106
Logički veznici
~p - istinit izraz kada je p lažan izraz, a
lažan izraz kad je p istinit izraz
109
Kombiniranje više uvjeta
If...
110
Kombiniranje više uvjeta
111
Kombiniranje više uvjeta
112
Kombiniranje više uvjeta
113
Kombiniranje više uvjeta
• Želimo izračunati novu varijablu porez u
kojoj će biti izračunato 25% od prihoda ali
samo za zaposlenike koji:
– zarađuju manje od 30.000 ili više od 70.000
dolara godišnje i imaju između 30 i 50 godina
(uključujući i one koji imaju 30 i 50 godina)
114
Kombiniranje više uvjeta
115
Kombiniranje više uvjeta
116
Kombiniranje više uvjeta
117
Rekodiranje podataka
• U datoteci demo.sav imamo varijablu age:
118
Rekodiranje podataka
• Želimo da nam SPSS automatski izračuna u
koju starosnu skupinu spada svaki od ispitanika i
to na slijedeći način:
Ispod 12 = 1
12-17 = 2
18-24 = 3
25-34 = 4
35-44 = 5
45-54 = 6
55-64 = 7
65-74 = 8
Iznad 75 = 9
119
Rekodiranje podataka
Transform → Recode into Different Variables…
120
Rekodiranje
• Odaberemo varijablu koju želimo rekodirati i strelicom je premjestimo u
srednji prozor
121
Rekodiranje
• Odaberemo ime nove varijable i kliknemo na Change
122
Rekodiranje
• Zatim kliknemo na Old and New Values...
123
Rekodiranje
• Pod Old Value odaberemo uvjet kojeg mora zadovoljavati stara vrijednost
• Pod New Value odaberemo novu vrijednost koju mora poprimiti ta varijabla
124
Rekodiranje
• Kliknemo na Add
125
Rekodiranje
• Jedan za drugim odredimo sve uvjete
126
Mogućnosti rekodiranja
• Možemo rekodirati:
– Točno jednu određenu vrijednost u:
• Točno jednu određenu vrijednost, System-missing ili u jednaku vrijednost
kakva je bila
– System-missing u:
• Točno jednu određenu vrijednost ili System-missing
– System- or user-missing u:
• Točno jednu određenu vrijednost, System-missing ili u jednaku vrijednost
kakva je bila
– Rang vrijednosti “od ... do ...” u:
• Točno jednu određenu vrijednost, System-missing ili u jednaku vrijednost
kakva je bila
– Sve druge vrijednosti (za koje nismo odredili pravilo) u:
• Točno jednu određenu vrijednost, System-missing ili u jednaku vrijednost
kakva je bila
127
Nakon Continue i OK dobijemo varijablu
agegroup s rekodiranim vrijednostima
128
Zadatak
• Školske ocjene su u Hrvatskoj 1-5, a u
Njemačkoj 5-1 (najbolja je 1, a najmanja 5)
• U SPSS tabeli imamo varijablu ocjene iz
Hrvatske koje treba rekodirati da bismo ih
poslali u Njemačku
• Shema rekodiranja dana je na slijedećem
slajdu -->
129
Zadatak
130
Recode into Same Variables...
• Opasno!
• Nakon toga ne radi naredba Undo!
131
Automatsko rekodiranje
• Transform → Automatic Recode
• Kreira novu varijablu i automatski rekodira
sadržaj neke string ili brojčane varijable u
sekvencijalne vrijednosti
– Sekvencijalne vrijednosti pokazuju nekakav redosljed
string ili brojčanih vrijednosti
• String varijable se rekodiraju prema abecednom redoslijedu
• Brojčane vrijednosti se rekodiraju prema njihovoj stvarnoj
vrijednosti
• Možemo birati da li će kodiranje početi od najmanje ili od
najveće vrijednosti
132
Automatsko rekodiranje
Omogućava da na jednak
način rekodiramo više
varijabli
Moguće je pohraniti
Prazan string se inače ne shemu rekodiranja za
interpretira kao missing buduću uporabu
ali uz ovu opciju hoće
(user-missing vrijednosti će
automatskim rekodiranjem
biti rekodirane iza non-missing
vrijednosti) 133
Automatsko rekodiranje
- primjeri -
134
Spajanje datoteka
135
Spajanje SPSS datoteka po
ispitanicima (Cases)
• Imamo dvije datoteke: grupa1.sav i grupa2.sav
136
Spajanje SPSS datoteka po
ispitanicima (Cases)
• Obje datoteke imaju identičnu strukturu s
obzirom na varijable
• Želimo spojiti ispitanike iz prve i druge
datoteke i dobiti jednu zajedničku datoteku
• Da bismo to postigli možemo postupiti na
način kako slijedi →...
137
Otvorimo prvu datoteku grupa1.sav
138
Data → Merge Files → Add Cases...
139
Browse...
140
Open → Continue
141
Što ako datoteke ipak nemaju
identičnu strukturu?
142
Unpaired Variables
• Varijable koje će biti isključene iz konačne spojene
datoteke
• Varijable iz aktivne datoteke su označene zvjezdicom (*)
• Varijable iz druge datoteke su označene znakom plus (+)
• Lista nesparenih varijabli sadrži:
143
Spajanje više SPSS datoteka po
ispitanicima (Cases)
• Pretpostavimo da imamo (barem) tri SPSS
datoteke: grupa1.sav, grupa2.sav i grupa3.sav
• … i da sve gornje datoteke imaju identičnu
strukturu s obzirom na varijable
• Možemo spojiti ispitanike iz svih gornjih datoteka
i dobiti jednu zajedničku datoteku:
– Uzastopnom uporabom naredbe Merge
ili
– Uporabom sintakse → Vidi kasnije u nastavi → …
144
Spajanje SPSS datoteka po
varijablama
• Imamo dvije datoteke: Varijable1.sav i Varijable2.sav
145
Spajanje SPSS datoteka po
varijablama
• Obje datoteke se odnose na iste ispitanike
• Sadrže različite varijable
• Sadrže jednu zajedničku varijablu (ključ - key
variable)
• Obje datoteke moraju prije spajanja biti sortirane
po ključu
• Datoteke moraju biti sortirane rastuće
(Ascending)
146
Otvorimo prvu datoteku
147
Data → Merge Files → Add
Variables...
148
An external SPSS Statistics data file
149
Browse... i odaberemo datoteku
koju želimo spojiti s otvorenom
150
Nakon Open i Continue
151
Match Cases on key variables in
sorted files
152
Odabrati ključ za spojenu datoteku
153
Prebaciti odabrani ključ strelicom u prozor
Key Variables
154
Nakon OK
155
Spojena datoteka
156
U slučaju da obje datoteke nisu
sortirane po ključu rastuće
• SPSS Output samo daje obavijest da
spajanje ne može biti izvršeno
• Spajanje datoteka se ne obavlja
• Datoteke ostaju kakve su bile
157
Deskriptivna statistika u SPSS-u
158
Deskriptivna statistika
• Deskriptivna statistika:
– Zadaća: opisati podatke (na način da ih sredi i sažme da bi bili
što pregledniji)
– Česta potreba: prvo izračunati elemente deskriptivne statistike
pa donijeti odluku koju složeniju analizu će se raditi
– Mjere deskriptivne statistike:
• Frekvencije
• Postotci
• Centralne tendencije
• Mjere varijabilnosti (disperzije, raspršenja, odstupanja) podataka
– Za razliku od statistike zaključivanja kojom se izvode zaključci,
testiraju postavljene hipoteze, …
159
Mjere centralne tendencije
• Ukazuju na tendencije grupiranja oko neke
centralne vrijednosti u distribuciji rezultata
• Najčešće mjere centralne tendencije:
– Aritmetička sredina (srednja vrijednost, Mean) -
prosječan rezultat u dobivenoj distribuciji
– Medijan (centralna vrijednost) - vrijednost koja ima
jednak broj slučajeva "lijevo" i "desno"
– Mod (dominantna vrijednost) - govori koji se rezultat u
nekoj distribuciji najčešće pojavljuje
160
Mjere varijabilnosti
• Raspon:
– Razlika između najvećeg i najmanjeg izmjerenog rezultata
• Standardna devijacija:
– Odgovara aritmetičkoj sredini kao mjeri centralne tendencije
– Pokazuje koliko su vrijednosti udaljene od aritmetičke sredine
– Formula:
gdje je:
X - pojedinačni rezultat ispitanika
M - aritmetička sredina
N - ukupni broj slučajeva
• Varijanca:
– jednaka kvadratu standardne devijacije: ν = σ2
161
Deskriptivna statistika u SPSS-u
162
Deskriptivna statistika u SPSS-u
• Tri različita načina:
– Analyze → Descriptive Statistics →
• Frequencies…
• Descriptives…
• Explore…
• Između gornje tri naredbe postoje određena
preklapanja
• Svaka ima i svoje specifičnosti
163
Naredba Frequencies
(Frekvencije)
164
Frekvencije
• Služe da:
• istražimo distribuciju na određenim varijablama
• prebrojimo vrijednosti određene varijable
165
Frequencies prozor
168
Statistics…
Želimo li u
Output uključiti
percentile
169
Statistics…
Kvartili
(25-ti, 50-ti i
75-ti percentil)
(kvartili dijele
podatke u četiri
jednakobrojne
skupine)
170
Statistics…
Točke koje
ravnomjerno
dijele distribuciju
na određeni broj
grupa
171
Statistics…
Sami određujemo
koje percentile
želimo vidjeti
172
Statistics…
Mjere centralne
tendencije
distribucije
173
Statistics…
Srednja
vrijednost
174
Statistics…
Medijan
(zapravo 50-ti
percentil)
175
Statistics…
Mode
(najčešća
vrijednost)
176
Statistics…
Suma svih
vrijednosti
odabrane
varijable
177
Statistics…
Mjere disperzije
(raspršenja)
178
Statistics…
Standardna
devijacija
179
Statistics…
Varijanca
180
Statistics…
Raspon
181
Statistics…
Minimum
182
Statistics…
Maksimum
183
Statistics…
Standardna
pogreška
aritmetičke sredine
184
Statistics…
Ako odaberemo ovu opciju, tada će Percentile Values i Median biti izračunati s pretpostavkom
da su podaci grupirani na način da vrijednosti u tabeli predstavljaju sredine originalnih grupa 185
(npr. da za varijablu starost, vrijednost 25 predstavlja sve one koji imaju između 20 i 29 godina)
Statistics…
U slučaju kada
Values are group midpoints
nije označeno:
U slučaju kada je
Values are group midpoints
označeno:
186
Primjer podataka za opciju Values are group midpoints
Statistics…
Mjere asimetrije
(skewness)
i spljoštenosti
(kurtosis)
187
Charts…
188
Charts…
Okrugli grafikon
(u obliku torte) koji za
svaku vrijednost prikazuje
koji je njen doprinos
kao dijela cjeline
189
Charts…
190
Razlike histograma i stupčastog
grafikona
Bar Chart
191
Razlike histograma i stupčastog
grafikona
Histogram
192
Charts…
193
Charts…
195
Format…
196
Format…
197
Format…
198
Format…
199
Primjer
varijabla Age - starost ispitanika
200
Primjer
Statistics…
201
Primjer
Charts…
202
Primjer
Formats…
203
Rezultati
- Tabela i grafikon -
204
Rezultat
- Tablica frekvencija -
AGE
Cumulative
Frequency Percent Valid Percent Percent
Valid 18 12 ,2 ,2 ,2
19 33 ,5 ,5 ,7
20 42 ,7 ,7 1,4
21 73 1,1 1,1 2,5
22 69 1,1 1,1 3,6
23 98 1,5 1,5 5,1
24 109 1,7 1,7 6,8
25 121 1,9 1,9 8,7
26 120 1,9 1,9 10,6
27 127 2,0 2,0 12,6
28 139 2,2 2,2 14,7
29 154 2,4 2,4 17,1
30 167 2,6 2,6 19,8
31 181 2,8 2,8 22,6
32 177 2,8 2,8 25,3
33 174 2,7 2,7 28,1
205
34 171 2,7 2,7 30,7
35 180 2,8 2,8 33,5
Rezultat
- Tablica frekvencija -
Statistics
Level of education
N Valid 6400
Missing 0
Level of education
Cumulative
Frequency Percent Valid Percent Percent
Valid Did not complete high
1390 21,7 21,7 21,7
school
High school degree 1936 30,3 30,3 52,0
Some college 1360 21,3 21,3 73,2
College degree 1355 21,2 21,2 94,4
Post-undergraduate
359 5,6 5,6 100,0
degree
Total 6400 100,0 100,0
206
Frekvencije
• Frekvencije predstavljaju broj ispitanika koji
imaju određenu vrijednost neke varijable
Statistics
Level of education
N Valid 6400
Missing 0
Level of education
Cumulative
Frequency Percent Valid Percent Percent
Valid Did not complete high
1390 21,7 21,7 21,7
school
High school degree 1936 30,3 30,3 52,0
Some college 1360 21,3 21,3 73,2
College degree 1355 21,2 21,2 94,4
Post-undergraduate
359 5,6 5,6 100,0
degree
Total 6400 100,0 100,0
207
Postotci
• Postotci govore o odnosu broja slučajeva u
jednoj kategoriji sa ukupnim brojem slučajeva
Statistics
Level of education
N Valid 6400
Missing 0
Level of education
Cumulative
Frequency Percent Valid Percent Percent
Valid Did not complete high
1390 21,7 21,7 21,7
school
High school degree 1936 30,3 30,3 52,0
Some college 1360 21,3 21,3 73,2
College degree 1355 21,2 21,2 94,4
Post-undergraduate
359 5,6 5,6 100,0
degree
Total 6400 100,0 100,0
208
Valid percent
• Valid Percent - postotna zastupljenost pojedinih kategorija u odnosu
na valjani broj ispitanika
– U donjem slučaju nema nedostajućih podataka pa su svi valjani
Statistics
Level of education
N Valid 6400
Missing 0
Level of education
Cumulative
Frequency Percent Valid Percent Percent
Valid Did not complete high
1390 21,7 21,7 21,7
school
High school degree 1936 30,3 30,3 52,0
Some college 1360 21,3 21,3 73,2
College degree 1355 21,2 21,2 94,4
Post-undergraduate
359 5,6 5,6 100,0
degree
Total 6400 100,0 100,0
209
Cumulative percent
• Cumulative Percent - kumulativni postotci odnosno zbroj postotka
jednog razreda sa postotcima prethodnih razreda
Statistics
Level of education
N Valid 6400
Missing 0
Level of education
Cumulative
Frequency Percent Valid Percent Percent
Valid Did not complete high
1390 21,7 21,7 21,7
school
High school degree 1936 30,3 30,3 52,0
Some college 1360 21,3 21,3 73,2
College degree 1355 21,2 21,2 94,4
Post-undergraduate
359 5,6 5,6 100,0
degree
Total 6400 100,0 100,0
210
Tablica frekvencija
• U slučaju nedostajućih podataka:
Statistics
Level of education
N Valid 6134
Missing 266
Level of education
Cumulative
Frequency Percent Valid Percent Percent
Valid Did not complete high
1338 20,9 21,8 21,8
school
High school degree 1855 29,0 30,2 52,1
Some college 1296 20,3 21,1 73,2
College degree 1302 20,3 21,2 94,4
Post-undergraduate
343 5,4 5,6 100,0
degree
Total 6134 95,8 100,0
Missing System 266 4,2
Total 6400 100,0
211
Naredba Explore
212
Naredba Explore
• Također moguće izračunati osnovne podatke
deskriptivne statistike
• Razlike s obzirom na naredbu Frequencies:
– Mogu se dobiti traženi deskriptivni rezultati zasebno
za pojedinu skupinu ispitanika (a bez uporabe neke
naredbe selekcije, grupiranja i sl.)
– Moguće je dobiti grafički prikaz rezultata pomoću
Stem and Leaf postupka (vidi slijedeći slajd →)
– Može se dobiti i Boxplots prikaz rezultata (vidi
nekoliko slajdova dalje)
213
Stem and Leaf prikaz distribucije
dobi
55,00 1 . 89999
356,00 2 . 00000111111222222333333344444444444
691,00 2 . 555555555555666666666666667777777777788888888888888889999999999999999
848,00 3 . 0000000000000000011111111111111111222222222222222233333333333333334444444444444444444
971,00 3 . 5555555555555555556666666666666666666777777777777777777778888888888888888888999999999999999999999
874,00 4 . 000000000000000000111111111111111112222222222222222222333333333333333334444444444444444
815,00 4 . 555555555555555555666666666666667777777777777777778888888888888888999999999999999
681,00 5 . 00000000000000111111111111111222222222222233333333333344444444444444
489,00 5 . 5555555555566666666666777777777788888888999999999
331,00 6 . 00000011111111122222233333344444
193,00 6 . 555556666667778899
88,00 7 . 00011234
8,00 7 . &
Stem width: 10
Each leaf: 10 case(s)
214
Korištenje naredbe Explore
- prozor Explore -
216
Explore → Statistics…
217
Explore → Plots…
- mogućnosti grafičkih prikaza -
218
Explore - Rezultati primjera
- tabela Case Processing Summary -
219
Explore - Rezultati primjera
- tabela Descriptives -
220
Explore - Rezultati primjera
- Steam-and-Leaf organiziran po spolu -
24,00 1 . 8999
165,00 2 . 000001111222223333344444444
341,00 2 . 55555555556666666666677777777788888888888899999999999999
448,00 3 . 000000000000000111111111111112222222222222233333333333333344444444444444444
507,00 3 . 55555555555555566666666666666666777777777777777777888888888888888999999999999999999
441,00 4 . 00000000000000011111111111111122222222222222223333333333333334444444444444
415,00 4 . 55555555555555555666666666666777777777777778888888888888999999999999
328,00 5 . 000000000000111111111111222222222233333333334444444444
231,00 5 . 55555555556666666677777778888889999999
148,00 6 . 000001111111122233333444
94,00 6 . 5555666667778899
34,00 7 . 0011234
2,00 7 . &
1,00 Extremes (>=76)
Stem width: 10
Each leaf: 6 case(s)
31,00 1 . 899999
191,00 2 . 000001111111222222233333333444444444444
350,00 2 . 5555555555556666666666666677777777777788888888888888888999999999999999
400,00 3 . 00000000000000001111111111111111122222222222222233333333333333344444444444444444
464,00 3 . 555555555555555555666666666666666667777777777777777778888888888888888888999999999999999999999
433,00 4 . 000000000000000000111111111111111112222222222222222222233333333333333334444444444444444
400,00 4 . 5555555555555555666666666666667777777777777777778888888888888889999999999999999
353,00 5 . 00000000000000111111111111111122222222222222333333333333444444444444444
258,00 5 . 5555555555666666666666777777777777888888888999999999
183,00 6 . 000000011111111222222223333333444444
99,00 6 . 5555556666667778999
54,00 7 . 0001122334
5,00 7 . &
Stem width: 10
Each leaf: 5 case(s)
221
& denotes fractional leaves.
Explore - Rezultati primjera
- Boxplots -
222
Explore - Rezultati primjera
- Boxplots -
223
Naredba Descriptives
224
Naredba Descriptives
225
Prozor Descriptives
226
Deskripcija
- Descriptives… → Options… -
Deskriptivna
statistika
U slučaju istovremene
analize više varijabli:
redoslijed kojim će se
prikazati u tabeli
227
Rezultati
Descriptive Statistics
N Range Minimum Maximum Sum Mean Std. Variance Skew ness Kurtosis
Statistic Statistic Statistic Statistic Statistic Statistic Std. Error Deviation
Statistic Statistic Statistic Std. Error Statistic Std. Error
Age in years 6400 59 18 77 269175 42,06 ,154 12,290 151,032 ,299 ,031 -,602 ,061
Price of primary vehicle 6400 95,70 4,20 99,90 192821,60 30,1284 ,27409 21,92692 480,790 1,216 ,031 ,524 ,061
Number of people in
6400 8 1 9 15038 2,35 ,018 1,468 2,156 ,995 ,031 ,253 ,061
household
Valid N (listw ise) 6400
228
Izračunavanje Z-vrijednosti
• Opcija pod Descriptives:
– Save standardized values as variables
229
Izračunavanje Z-vrijednosti
• Nova varijabla - Znaziv_varijable
• U našem slučaju: Zage
230
Svaki ispitanik ima pripadnu Z-vrijednost za
promatranu varijablu
231
Interpretacija Z-vrijednosti
232
Analyze → Reports → Case Summaries
233
Analyze → Reports → Case Summaries
234
Analyze → Reports → Case Summaries
235
Analyze → Reports → Case Summaries
236
Analyze → Reports → Case Summaries
237
Analyze → Reports → Case Summaries
238
Analyze → Reports → Case Summaries
239
Analyze → Reports → Case Summaries
• Rezultati:
240
Analyze → Reports → Case Summaries
241
Analyze → Reports → Case Summaries
• Rezultati:
242
Deskriptivna statistika i
nedostajući podaci
243
Tabela
- Ako postoje System-missing, a nismo definirali User-missing -
244
Grafikon
- Ako postoje System-missing, a nismo definirali User-missing -
245
Tabela
- Ako upisujemo Values 9=No data ali to nismo definirali kao User-missing -
246
Grafikon
- Ako upisujemo Values 9=No data ali to nismo definirali kao User-missing -
247
Tabela
- Ako smo definirali User-missing: 9 = No data -
248
Grafikon
- Ako smo definirali User-missing: 9 = No data -
249
Deskriptivna statistika i nedostajući
podaci
• Međutim, možda nedostajuće podatke koji su
automatski isključeni iz određene statističke
analize želimo uključiti u analizu
• To se može posebnim naredbama
• O tome kasnije …
• Također, pojedine funkcije i naredbe različito
barataju s nedostajućim podacima (ponekad čak
i iznenađujuće)
• O tome također kasnije …
250
Uporaba rezultata u drugim
programima
251
Uporaba rezultata u drugim programima
252
Edit → Copy
253
Edit → Paste Special...
254
Edit → Paste Special...
255
Edit → Copy special…
256
Edit → Copy special…
257
Edit → Copy special…
258
Edit → Paste special…
(u slučaju lijepljenja slike)
259
Edit → Paste special…
(u slučaju lijepljenja tabele)
260
Formati
• RTF (Rich Text File) - moguće kasnije uređivanje u npr. Word-u ili
PowerPoint-u
• Unformatted Text (postoji samo za tabele) - prebacuju se samo
podaci iz tabele (bez tabele i oblikovanja teksta)
• Picture (Enhanced Metafile) - ovo bi trebao biti najbolji odabir za
prebacivanje grafikona u Microsoft Office i ispis na papiru
• Picture (PNG) - Pogodan za web stranice jer dijelovi slike mogu biti
prozirni, moguće je kontrolirati svjetlinu, …
• Picture (JPEG) - Najbolji za slike s mnogo boja (npr. fotografije)
• Unformatted Unicode Text - daje jednak rezultat kao i opcija
Unformatted Text (povijesni zaostatci)
261
Automatsko prebacivanje svih rezultata u
druge formate (doc, html, xls, pdf, txt)
• Iz SPSS Output-a:
File → Export...
262
Selekcija podskupa podataka
• Selekcija je postupak sužavanja skupa
ispitanika na posebnu podgrupu koja
zadovoljava uvjet koji zadamo
• Selekcija se u pojedinim postupcima može
raditi preko gumba If…
• Nakon selekcije kakvu ovdje opisujemo će
se svi daljnji postupci odnositi samo na
selektirane podatke (ispitanike)
263
Selekcija podskupa podataka na
temelju zadanog uvjeta
• Data → Select Cases... → If condition is satisfied
264
Selekcija podskupa podataka na
temelju zadanog uvjeta
• Kliknemo na If...
265
Selekcija - Output
• U donjem dijelu prozora možemo birati:
– Filter out unselected cases - selektira podatke koji zadovoljavaju
uvjet ali druge podatke ostavlja u datoteci - uobičajeno
– Copy selected cases to a new dataset - kopira podatke koji
zadovoljavaju uvjet u drugu datoteku
– Delete unselected cases - briše podatke koji ne zadovoljavaju
uvjet - Opasno!!!
266
Selekcija podskupa podataka na
temelju zadanog uvjeta
• Ako je odabrano Filter out unselected cases tada neselektirani
podaci ostaju u tabeli ali neće biti uključeni u analize, a njihov redni
broj je prekrižen kosom crtom:
267
Selekcija podskupa podataka na
temelju slučajnog izbora
• Data → Select Cases... → Random sample of cases
268
Selekcija podskupa podataka na
temelju slučajnog izbora
269
Selekcija podskupa podataka na
temelju redoslijeda u datoteci
• Data → Select Cases... → Based on time or case range
270
Selekcija podskupa podataka na
temelju redoslijeda u datoteci
• Data → Select Cases... → Based on time or case range
271
Selekcija podskupa podataka na
temelju vrijednosti neke varijable
• Data → Select Cases... → Use filter variable
Isključuje iz daljnje
obrade ispitanike
čija vrijednost
određene varijable
je jednaka 0 ili
nedostaje
272
Primjer
• U datoteci Demo.sav selektirajte muške
ispitanike sa stupnjem obrazovanja višim
od 2, koji su stariji od 50 godina i koji kod
kuće posjeduju računalo
• Samo za te ispitanike kreirajte tablicu
frekvencija i stupčasti grafikon za
zadovoljstvo poslom (varijabla Job
Satisfaction)
273
Rješenje - tabele
274
Rješenje - grafikon
275
Isključivanje selekcije
• Selekcija podataka će se odnositi na
daljnje analize sve dok se ne isključi
• Selekciju ćemo isključiti tako da ponovno
kliknemo na Data → Select Cases... i
zatim odaberemo All cases
276
Sortiranje podataka
• Sortiranje je operacija promjene redoslijeda
redova tabele tako da redovi budu uređeni u
rastući poredak (od najmanjeg prema najvećem)
ili opadajući poredak (od najvećeg prema
najmanjem) s obzirom na vrijednost neke
varijable prema kojoj se sortiranje vrši
• Ako se sortiranje vrši prema numeričkoj varijabli
tada se uzima u obzir njena veličina, a ako se
vrši prema string varijabli tada se u obzir uzima
abecedni poredak
277
Sortiranje podataka
278
Sortiranje podataka
279
Sortiranje podataka
280
Sortiranje prema vrijednosti više
varijabli
281
Sortiranje prema vrijednosti više
varijabli
282
Podjela podataka na grupe
283
Podjela podataka na grupe
Data → Split File...
284
Podjela podataka na grupe
Ako odaberemo Compare groups
285
Podjela podataka na grupe
Datoteka će biti
sortirana prema
varijabli po kojoj
vršimo grupiranje
286
Rezultati obrada nakon podjele
- tablice -
287
Rezultati obrada nakon podjele
- grafikoni -
288
Podjela podataka na grupe
Ako odaberemo Organize output by groups
289
Podjela podataka na grupe
Ako odaberemo Organize output by groups
290
Isključivanje podjele na grupe
• Nakon definiranja grupa ta podjela ostaje aktivna sve
dok se ne isključi!
• Da je podjela aktivna vidljivo je u donjem desnom kutu
prozora:
291
Ako podjelu više ne koristimo
potrebno ju je isključiti
292
Podjela podataka na grupe s
obzirom na više varijabli
• Ako odaberemo više varijabli prema
kojima želimo izvršiti grupiranje:
– prva na popisu je primarna
– u okviru kategorija prve varijable biti će
izvršeno grupiranje za drugu varijablu
– itd
293
Podjela podataka na grupe s
obzirom na više varijabli
• Grupiranje prema spolu:
294
Podjela podataka na grupe s
obzirom na više varijabli
• Dodatno grupiranje prema stupnju
obrazovanja:
295
Tabela frekvencija zadovoljstva poslom
(spol ima 2 moguće vrijednosti, a stupanj obrazovanja 5)
296
Jedan od deset grafikona frekvencija
zadovoljstva poslom
297
Agregacija podataka
298
Agregacija podataka
• Spajanje podataka tako da grupe ispitanika s jednakom
vrijednosti neke varijable čine jedan zbirni slučaj
• Primjeri primjene:
– Ako želimo razmatranje podataka spustiti sa individualnog nivoa
na neki širi nivo (npr. nivo organizacije)
– Eksperiment zahtijeva ponavljana mjerenja neke pojave koja
zatim želimo sažeti
• Za sve ispitanike koji imaju zajedničku vrijednost neke
varijable računa se neka zbirna funkcija za vrijednosti
neke druge varijable
• Data → Aggregate…
299
Agregacija podataka
300
Agregacija podataka
• Varijabla ed može poprimiti pet različitih
vrijednosti
301
Agregacija podataka
302
Agregacija podataka
303
Agregacija podataka
Varijabla na temelju
čijih vrijednosti se
sažimaju podaci
Promjena funkcije
sažimanja i naziva i
labela nove varijable
304
Agregacija podataka
Mjesto pohrane
rezultata
305
Rezultat u slučaju pohrane u drugu datoteku
- Nova datoteka sadrži po jedan slučaj za svaku grupu definiranu varijablom po kojoj se vrši sažimanje
podataka -
306
Rezultat u slučaju pohrane u istu datoteku
- Svaki slučaj sa jednakom vrijednošću varijable po kojoj se podaci sažimaju poprima jednaku
vrijednost nove agregirane variable -
307
Funkcije sažimanja
Statistike:
Srednja vrijednost
Medijan
Suma
Standardna devijacija
308
Funkcije sažimanja
Specifične vrijednosti:
Prva nenedostajuća
primijećena vrijednost
Posljednja nenedostajuća
primijećena vrijednost
Minimum
Maksimum
309
Funkcije sažimanja
Broj slučajeva:
Postojećih (uzima se u obzir ponder)
Missing-a (uzima se u obzir ponder)
Postojećih (ne uzima se u obzir ponder)
Missing-a (ne uzima se u obzir ponder)
310
Ponderiranje podataka
311
Funkcije sažimanja
Postotak slučajeva:
Većih od vrijednosti Value
Manjih od vrijednosti Value
Između
vrijednosti Low i Hight
Koji nisu između
vrijednosti Low i Hight
312
Funkcije sažimanja
Frakcije:
Većih od vrijednosti Value
Manjih od vrijednosti Value
Između
vrijednosti Low i Hight
Koji nisu između
vrijednosti Low i Hight
314
Primjer
• Želimo podatak o broju prodanih primjeraka u
tisućama (varijabla sales) spustiti sa modela
(kako je sada u tablici) na marku automobila
(varijabla manufactur)
• Dakle:
– Varijabla na temelju koje sažimamo podatke (Break
Sariable) je manufact
– Varijabla čije vrijednosti sažimamo (Aggregated
Variable) je sales
– Funkcija sažimanja je Sum
– Kreiramo novi dataset koji sadrži agregirane podatke
315
Primjer
316
Rezultat
317
Prebrojavanje
• Kreiranje varijable u kojoj će biti prebrojana
pojavljivanja jedne te iste vrijednosti u skupu
varijabli za svakog ispitanika
• Na primjer:
– Istraživanje sadrži popis časopisa s da/ne mogućim
odgovorima za ispitanike
• Odgovori ispitanika kažu da li ispitanik taj časopis čita ili ne
– Možemo prebrojati broj časopisa koje čita svaki
ispitanik i rezultat smjestiti u novu varijablu
318
Prebrojavanje
319
Count Values within Cases...
320
Count Values within Cases...
321
Count Values within Cases...
322
Define Values...
323
Rezultat prebrojavanja
324
Kreiranje grafikona
korištenjem Chart Builder-a
325
Kreiranje grafikona korištenjem Chart
Builder-a
• Većina statističkih obrada ima mogućnost
automatskog kreiranja grafikona
• Grafikone je moguće kreirati i korištenjem
meni-a Graphs odn. tzv. Chart Builder-a
• Chart Builder je interaktivni prozor koji
nam omogućava da tijekom kreiranja
grafikona vidimo kako će grafikon izgledati
326
Primjer: demo.sav
327
Zanima nas povezanost primanja i zadovoljstva
radnim mjestom
328
Graphs → Chart Builder...
329
Poruka upozorenja
330
Chart Builder - interaktivni prozor
331
Odaberemo Gallery i Bar
332
Ikone su dovoljno informativne pa možemo odlučiti
koji grafikon nam je potreban
333
Povučemo npr. Simple Bar na površinu
za prikaz grafikona
334
Chart preview uses example data
Potrebno je smjestiti varijable na osi
335
Privremena promjena skale mjerenja za
varijablu koju smještamo na os
• Želimo smjestiti varijablu Job satisfaction na os x
• Ikona uz varijablu Job satisfaction znači da je skala
mjerenja te varijable kontinuirana
337
Ordinalna skala je pogodna skala za
varijablu Job satisfaction
338
Povučemo varijablu Job satisfaction na
os X
339
Na osi Y vidimo da piše Count što znači da će biti
prikazane frekvencije odabrane varijable
340
Statistiku je lako promijeniti u prozoru Element
Properties desno od Chart Builder-a
341
Element Properties nudi i druge mogućnosti - na
primjer: brisanje odabranih elemenata sa grafikona
342
Povučemo varijablu Household income ... na
os Y
343
Household income ... je kontinuirana - zato je
statistika Mean
- Za svaku kategoriju varijable jobsat će se izračunati srednja vrijednost varijable income -
344
Možemo postaviti naslov grafikona i druge
tekstualne dodatke
345
Kliknemo na OK da bismo kreirali grafikon
346
Naknadno uređivanje grafikona
• Grafikon je moguće kasnije urediti na više
načina:
– Promjena boja
– Oblikovanje brojeva
– Oblikovanje teksta
– Prikaz deskriptivnih opisa varijabli (Label-a)
– Primjenom predložaka (Chart templates)
• Dovoljno je dva puta kliknuti na grafikon u
Output-u i dobiti ćemo Chart Editor
347
Visual Binning
348
Visual Binning
• Visual Binning je razvijen kao pomoć u postupku
kreiranja novih varijabli na temelju grupiranja
susjednih vrijednosti postojećih varijabli u
ograničeni broj različitih kategorija
• Visual Binning možemo koristiti za:
– Kreiranje kategoričkih varijabli iz kontinuiranih
– Smanjivanje većeg broj kategorija u manji broj
349
Kategorizacija
- kreiranje kategoričkih varijabli iz kontinuiranih -
351
Visual Binning...
352
Visual Binning...
353
Odaberemo income u Scanned
Variable List
354
Ilustrativni grafikon prikazuje
distribuciju odabrane varijable
355
Upišemo naziv i label nove
kategorizirane varijable
356
Make Cutpoints...
357
Upišemo vrijednosti za intervale
- prema broju graničnih vrijednosti i širini razreda prema vrijednostima -
358
Upišemo vrijednosti za intervale
- prema broju graničnih vrijednosti i širini razreda u postotcima slučajeva -
359
Upišemo vrijednosti za intervale
- prema aritmetičkoj sredini i broju standardnih devijacijama kao graničnim
vrijednostima lijevo i desno od aritmetičke sredine -
360
Visual Binning
361
Upper Endpoints
- Included ili Excluded -
362
Make Labels automatski kreira
labele
363
Make Labels automatski kreira
labele
364
Visual Binning
• Numeričke vrijednosti granica kategorija
se mogu ručno prepraviti
• Labele kategorija se mogu ručno prepraviti
• Linije na grafičkom prikazu koje prikazuju
granice kategorija se mogu pomicati
mišem
• Linije se mogu brisati tako da se odvuku
izvan grafičkog prikaza
365
Klikom na OK se automatski kreira
nova varijabla
366
Popunjavanje ćelija kod kojih
postoji nedostajući podatak
367
Transform -> Replace Missing Values
368
Replace Missing Values
• Pod Name SPSS sam zadaje ime nove varijable ali mi možemo
postaviti svoje
370
Replace Missing Values
373
Rezultat
374
Preuzimanje podataka iz drugih vrsta
datoteka
375
Preuzimanje podataka iz drugih
vrsta datoteka
• SPSS može uzeti podatke iz gotovo bilo
koje vrste datoteka
• Nas zanimaju ove dvije:
– Excel
– Txt
376
Otvaranje Excel datoteka u SPSS-u
- Primjer Excel datoteke -
377
File → Open → Data...
378
Odaberemo Excel datoteku → Open
379
Mogućnosti prilikom otvaranja
380
Mogućnosti prilikom otvaranja
• Worksheet:
– Excel datoteka može sadržavati više tabela
– Po automatizmu, SPSS čita prvu tabelu
– U padajućem meni-u se može odabrati neka druga tabela ako se to želi
381
Mogućnosti prilikom otvaranja
• Range:
– Moguće je učitati samo određeni rang ćelija iz Excel datoteke
– Za definiranje ranga se upotrebljavaju ista pravila koja vrijede u Excel-u
382
Nakon učitavanja u SPSS
- Data View -
383
Nakon učitavanja u SPSS
- Variable View -
384
Poželjno je izvršiti neke izmjene
385
Poželjno je izvršiti neke izmjene
• Nazivi varijabli u SPSS-u ne mogu
sadržavati razmake
– Zato ih SPSS jednostavno obriše
• Neke poželjne izmjene SPSS ipak ne
napravi pa je dobro da ih napravimo mi
– Npr:
• Skratiti duljinu na 8 znakova
• Eliminirati Hrvatske dijakritičke znakove (č,ć,đ,š,ž)
386
Otvaranje tekstualnih datoteka u SPSS-u
388
Otvaranje tekstualnih datoteka u SPSS-u
389
Drugi primjer tekstualne datoteke s
podacima o ispitanicima
390
File → Read Text Data ...
391
1. Korak:
Da li txt datoteka već ima preddefiniran format koji nam
treba ili ćemo ga odrediti sami – uobičajena je druga opcija
392
2. Korak:
- Da li postoji točan broj znakova koje zauzimaju varijable
- Da li će se prvi redak uzeti za definiranje naziva varijabli
393
3. Korak:
- U kojem retku txt datoteke počinju podaci o ispitanicima
- Koji retci prikazuju podatke
394
4. Korak:
- Koji znakovi (delimiters) označavaju razdvajanje podataka
- Kako su upisani podaci koji sadržavaju delimiter-e
395
5. Korak:
- Moguće je promijeniti nazive varijabli i njihov tip
396
6. Korak:
- Moguća pohrana ovog formata za buduću uporabu
- Moguć zapis sintakse obavljenog postupka u sintaksni
prozor (zbog kasnijih izmjena i ponovne uporabe)
397
Konačna datoteka nakon učitavanja u SPSS
398
SPSS - Rad s sintaksom
399
Rad s sintaksom
400
Naredbe možemo pisati u sintaksni prozor
401
Naredbe možemo pisati u sintaksni prozor
402
Naredbe možemo pisati u sintaksni prozor
403
I pohraniti ih u obliku sintaksne datoteke
404
I pohraniti ih u obliku sintaksne datoteke
405
Najlakši način korištenja naredbenog jezika
407
Otvorimo datoteku
Employee data.sav
408
Provedemo postupke koje želimo
409
Dobijemo rezultat u Output-u
410
Kopiramo naredbe
411
Kreiramo sintaksnu datoteku
File → New → Syntax
412
Dobijemo sintaksni prozor
413
"Lijepimo" naredbe
414
Pokretanje naredbi
Run → All
415
Naredbe u izborniku Run:
416
Ista analiza ali za sve varijable
417
Rezultat nakon Run → All
Descriptive Statistics
418
Ako želimo samo srednju vrijednost i
standardnu devijaciju
419
Rezultat nakon Run → All
Descriptive Statistics
420
U kôd možemo umetati komentare
421
Primjer rada s sintaksom zbog ponovne analize istih
podataka ali s izmjenom u postupku
422
Obavimo postupke kojima dobijemo donje
grafikone
423
Nakon obrade dobijemo Output s sintaksom
424
Pohranimo Output: Save As..., imenujemo Output
file i odredimo mjesto gdje ćemo ga pohraniti
425
Kasnije možemo otvoriti output: File → Open →
Output... (output datoteke imaju nastavak .spo)
426
Nakon otvaranja možemo kopirati naredbe
427
... otvoriti novi Syntax prozor ...
428
... otvoriti novi Syntax prozor ...
429
Zalijepiti kopirane naredbe
430
Zalijepiti kopirane naredbe
431
Promijeniti naredbe koje želimo
432
Pokrenemo novi skup naredbi
433
I dobijemo rezultate u skladu s učinjenim
promjenama
434
Novu sintaksu možemo također pohraniti kao
Syntax (.sps) datoteku i kasnije je koristiti
435
Struktura SPSS naredbi
436
Struktura SPSS naredbi
FREQUENCIES
VARIABLES = educ jobcat
/ORDER = ANALYSIS.
437
Struktura SPSS naredbi
• Općenito:
• Na početku naredbe pišemo njen naziv koji kaže što želimo provesti
• Slijede podnaredbe i korisničke opcije
• Naredbe završavaju točkom
• Naredbe se mogu pisati velikim (TISKANIM) ili malim (pisanim)
slovima
• Popis naredbi i opcija: "IBM SPSS Statistics 20 Command Syntax
Reference"
• Neke naredbe SPSS neće izvršiti odmah čim smo ih zadali nego će
ih zapamtiti i izvršiti kada to bude neophodno (zbog resursa)
• Da bi SPSS odmah izvršio zadanu naredbu možemo na kraj naše
sintakse dodati naredbu EXECUTE.
438
Opcija ORDER
/ORDER = ANALYSIS
439
Opcija ORDER
/ORDER = VARIABLE
440
Opcije naredbe FREQUENCIES
442
Primjer koji koristimo u daljnjem opisu opcija naredbe FREQUENCIES:
FREQUENCIES VARIABLES = literacy
443
Opcije naredbe FREQUENCIES
444
Opcije naredbe FREQUENCIES
445
Opcije naredbe FREQUENCIES
446
Opcije naredbe FREQUENCIES
Uključivanje user-missing
podataka
Podrazumijevano, user-missing
i system-missing vrijednosti:
- jesu navedene kao missing
u tabeli
- nisu uključene u valjane i
kumulativne postotke,
u izračunavanja deskriptivne
statistike, niti u grafikone i
histograme
447
FREQUENCIES VARIABLES=literacy
/BARCHART
/MISSING=INCLUDE.
448
Opcije naredbe FREQUENCIES
449
FREQUENCIES VARIABLES=literacy
/BARCHART=MINIMUM(5) MAXIMUM(90).
450
Opcije naredbe FREQUENCIES
451
FREQUENCIES VARIABLES=literacy
/BARCHART=PERCENT(80).
452
Kraći oblici sintaksnih naredbi
453
Kraći oblici sintaksnih naredbi
454
Ključna riječ TO umjesto nabrajanja
se može pisati:
455
Nepotrebne "default" opcije
DESCRIPTIVES
VARIABLES= v1 TO v24
/STATISTICS=MEAN STDDEV MIN MAX .
DESCRIPTIVES
VARIABLES= v1 TO v24.
456
Moguće izostavljanje ključnih riječi
DESCRIPTIVES v1 TO v24.
457
Skraćivanje naredbi
DES v1 TO v24.
458
Gradnja sintakse pomoću
menija
459
Gradnja sintakse pomoću menija
460
Gradnja sintakse pomoću menija
461
Gradnja sintakse pomoću menija
462
Gradnja sintakse pomoću menija
463
Gradnja sintakse pomoću menija
464
Gradnja sintakse pomoću menija
465
Gradnja sintakse pomoću menija
466
Konkretni primjeri upotrebe
sintaksnih naredbi
467
Izračunavanje novih varijabli
Za sve mogućnosti naredbe COMPUTE pogledati u "IBM SPSS Statistics 20 Command Syntax Reference"
468
Izračunavanje novih varijabli
Za sve mogućnosti naredbe COMPUTE pogledati u "IBM SPSS Statistics 20 Command Syntax Reference"
469
Izračunavanje varijabli samo za vrijednosti
koje zadovoljavaju određene uvjete
Upotrebljavamo naredbu IF koja ima tri komponente:
• Logički izraz (uvjet)
• Ciljnu varijablu
• Izraz za izračunavanje ciljne varijable
Za sve mogućnosti naredbe IF pogledati u "IBM SPSS Statistics 20 Command Syntax Reference"
470
Petlje
- naredbe za ponavljano izvršavanje drugih naredbi -
• DO REPEAT
– Često se primjenjuje za ponavljanje iste naredbe
preko više varijabli
• Te varijable mogu biti i novokreirane
• Za istu namjenu se upotrebljava i kombinacija naredbi LOOP
i VECTOR (vidi dalje)
• LOOP
– Primjenjuje se za ponavljano provođenje
transformacija
– Često se upotrebljava zajedno s naredbom VECTOR
471
DO REPEAT
- Općenita sintaksa -
• stand-in-var je naziv varijable kojeg sami zadajemo da bismo njime predstavili cijeli
popis varijabli varlist
• Kako se izvršavanje naredbi ponavlja tako stand-in-varijabla poprima novu vrijednost
sa popisa varlist
• Možemo navesti više stand-in-varijabli kako što vidimo u primjeru dalje
• Svaka stand-in-varijabla mora imati vlastiti znak jednakosti i pridružene varijable ili
listu vrijednosti i mora biti odijeljena od ostalih stand-invarijabi znakom /
• Svaka lista mora navesti ili generirati jednak broj objekata
472
DO REPEAT
- Primjer 1 -
Zadatak:
475
DO REPEAT
- Primjer 1 -
Rješenje:
COMPUTE rezultat1=0.
DO REPEAT pit=p1 TO p20
/tocno = 3 3 4 4 1 5 4 2 3 3 4 4 1 5 4 2 4 4 1 5.
IF (pit=tocno) rezultat1=rezultat1+1.
END REPEAT.
EXECUTE.
476
DO REPEAT
- Primjer 2 -
Skip
C
477
DO REPEAT
- Primjer 2 -
DO REPEAT v = A B C.
IF Skip = 1 v = 9.
END REPEAT.
478
DO REPEAT
- Primjer 3 -
479
DO REPEAT
- Primjer 3 -
480
DO REPEAT
- Primjer 4 -
481
DO REPEAT
- Primjer 4 -
482
DO REPEAT
- Primjer 4 -
483
DO REPEAT
- Primjer 4 -
COMPUTE novavar=existvar*value.
END REPEAT.
EXECUTE.
484
LOOP petlja
- primjer 1 -
COMPUTE nova_var=age.
LOOP #I=1 TO 5.
COMPUTE nova_var=SQRT(nova_var).
END LOOP.
EXECUTE.
485
LOOP petlja
- općenita sintaksa -
486
LOOP petlja
COMPUTE nova_var=age.
LOOP #I=1 TO 5 IF (age>40).
COMPUTE nova_var=SQRT(nova_var).
END LOOP.
EXECUTE.
488
LOOP petlja
- primjer 3 -
COMPUTE nova_var=age.
LOOP #I=1 TO 5 IF (age>40).
COMPUTE nova_var=SQRT(nova_var).
END LOOP IF nova_var LT 1.13.
EXECUTE.
489
LOOP petlja
- primjer 4 -
COMPUTE nova_var=age.
SET MXLOOPS=5.
LOOP.
COMPUTE nova_var=SQRT(nova_var).
END LOOP.
EXECUTE.
490
Naredba VECTOR
Za sve mogućnosti, pravila i ograničenja naredbe VECTOR pogledati u "IBM SPSS Statistics 20 Command Syntax Reference"
491
Naredba VECTOR
492
LOOP petlja
- Riješite ponovno zadatak s datotekom testiranje.sav ali uporabom
naredbi LOOP i VECTOR -
COMPUTE rezultat=0.
VECTOR t(20).
COMPUTE t(1)=3.
COMPUTE t(2)=3.
COMPUTE t(3)=4.
COMPUTE t(4)=4.
COMPUTE t(5)=1.
COMPUTE t(6)=5.
COMPUTE t(7)=4.
COMPUTE t(8)=2.
COMPUTE t(9)=3.
COMPUTE t(10)=3.
COMPUTE t(11)=4.
COMPUTE t(12)=4.
COMPUTE t(13)=1.
COMPUTE t(14)=5.
COMPUTE t(15)=4.
COMPUTE t(16)=2.
COMPUTE t(17)=4.
COMPUTE t(18)=4.
COMPUTE t(19)=1.
COMPUTE t(20)=5.
VECTOR X=p1 TO p20.
LOOP #I=1 TO 20.
IF (X(#I)=t(#I)) rezultat=rezultat+1.
END LOOP.
EXECUTE.
DELETE VARIABLES t1 TO t20.
493
Rekodiranje sintaksom
494
Općenita sintaksa za numeričke varijable
495
Primjeri
496
Rekodiranje
- Nedostajući podaci -
Za sve mogućnosti naredbe RECODE pogledati u "IBM SPSS Statistics 20 Command Syntax Reference"
497
Sortiranje sintaksom
Za sve mogućnosti naredbe SORT CASES pogledati u "IBM SPSS Statistics 20 Command Syntax Reference"
498
Podjela u grupe sintaksom
Za sve mogućnosti naredbe SPLIT FILE pogledati u "IBM SPSS Statistics 20 Command Syntax Reference"
499
SPSS datoteke (data files) i skupovi
podataka (datasets)
500
SPSS datoteke (data files) i skupovi
podataka (datasets)
Data file
Dataset
• SPSS datoteke (data files) su podaci koji su pohranjeni na uređaju za pohranu (tvrdi
disk, USB stick, …)
– U načelu, isključivanje računala ne utječe na SPSS datoteke
• Prilikom otvaranja SPSS datoteke njeni podaci se kopiraju u radnu memoriju računala
– Ti podaci se nazivaju SPSS skup podataka (dataset)
– Dakle, SPSS dataset postoji samo u radnoj memoriji računala
– Promjene koje radimo na skupu podataka se zapisuju samo u radnoj memoriji računala
• Dakle, u slučaju isključivanja računala biti će izgubljeni
501
SPSS datoteke (data files) i skupovi
podataka (datasets)
• Istovremeno može biti otvoreno više SPSS skupova podataka
• Ali uvijek je jedan skup podataka aktivan