You are on page 1of 4

Regresiona analiza

Regresiona analiza je tehnika kojom se utvrđuje karakter veze između dve ili više pojava. Analiza
pretpostavlja da je jedna varijabla zavisna a druga ili više njih nezavisne. Unapred (teorijski) treba
odrediti šta je zavisna a šta nezavisna varijabla, a test počiva na tome da se utvrdi u kojoj meri su
varijacije u zavisnoj varijabli određene varijacijama u nezavisnoj (ili nezavisnim) varijablama.

Ako se ispituje uticaj jedne varijable na zavisnu, to je prosta linearna regresija (jedna zavisna a jedna
nezavisna); a ako se ispituje uticaj više nezavisnih varijabli držeći pod kontrolom sve ostale varijable u
modelu, tada se radi o višestrukoj linearnoj regresiji.

Konkretni koraci u regresionoj analizi


Koristićemo modele u kojima koristimo više nezavisnih varijabli (u skladu sa višestrukim društvenim
determinizmom) na zavisnu varijablu.

Ono što treba znati jeste da zavisna varijabla mora obavezno biti KONTINUIRANA, dok nezavisna
varijabla može biti ILI KONTINUIRANA ILI DIHOTOMNA (da ima dva moguća odgovora). Ali,
to ne znači da mi ne možemo da upotrebljavamo kategorične varijable kao nezavisne, ali moramo da ih
transformišemo u indikatorske, ili takozvane dummy varijable (koje su u suštini dihotomne).

Primer: uzećemo neki stav koji meri autoritarnost (v064) – ovo je Likertova skala koja je ordinalna, ali
možemo je smatrati kontinuiranom. Transformisaćemo je tako da 8 ide u sysmis, a sve ostalo
kopiramo. Dakle, ovo nam je zavisna varijabla. Radićemo prost regresioni model u kome ćemo
ispitivati koliko godine (varijabla v003c.1, kao godine rođenja – moramo da je transformišemo tako da
od godina rođenja napravimo godine starosti) utiču na autoritarnost. Transform – compute – godina
rađenja istraživanja minus varijabla v003c.1.

Sada možemo da uradimo prostu linearnu regresiju:

1. Analize – regression – linear – v064.1 ide u dependent, a starost1 ide u indepentent(s).


2. U tabeli nas zanima druga tabela i kolona R square (.012), koeficijent determinacije
prikazuje relativnu meru prilagođenosti regresivne linije empirijskim podacima i dobija se
kao odnos objašnjenog varijabiliteta i ukupnog varijabiliteta (drugim rečima, kada je
pomnožimo sa 100, dobijamo koji je procenat zavisne varijable objašnjen nezavisnom).
Adjusted R square je R square koji je prilagođen da vodi računa o veličini uzorka i broju
nezavisnih varijabli u modelu.
3. ANOVA tabelu preskačemo
4. Zanima nas tabela Coefficients – „(Constant)“ nas ne zanima, ono što nas zanima je
nestandardizovani koeficijent B, standardizovani koeficijent BETA i koeficijent
značajnosti (poslednja kolona).
Koeficijent značajnosti: Da bi jedna nezavisna varijabla mogla biti tretirana kao statistički
značajan prediktor nezavisne varijable, značajnost mora biti manja od 0,05. A, u našem
primeru (0,00) možemo konstatovati da je starost značajan prediktor.
Nestandardizovani Koeficijent B prikazuje koliko se menja rezultat na skali kolektivizma,
kada se godine starosti povećaju za jednu jedinicu – sa svakom dodatnom godinom, rezultat
na skali u proseku raste za (u našem primer) 0,007 poena. Što su ispitanici stariji, to je veći
stepen prihvatanja kolektivističkog aspekta autoritarnosti.
Standardizovani koeficijent BETA nam sada kod proste ništa ne znači, ali kad bude više
varijabli, da bi smo mogli da sameravamo efekat više nezavisnih varijabli koje su date u
različitim skalarnim oblicima, BETA njihov efekat standardizuje i onda se rezultat prikazuje
u standardnim varijacijama, a ne u veličinama u koje su skale date– sa svakom dodatnom
godinom starosti, rezultat na skali koja meri kolektivističu orijentaciju, se povećava za 0.108
standardnih devijacija. Ali, ovde nas to ne interesuje.

Sada, ubacujemo više varijabli u model. Ovde nastaje problem – kada imamo kategoričke varijable
(klasa na primer), njih moramo nekako da transformišemo. I to je stvaranje dummy varijabli. Dummy
varijable se prave tako što se jedna varijabla. Recimo da imamo varijablu pol (1. Muški, 2. Ženski).
Ako hoćemo da napravimo dummy varijablu za ženski pol, ženski pol dobija šifru 1, a muški pol šifru
0. Ako imamo dva modaliteta, pravimo jednu dummy varijablu. Dakle, ovde ispitujemo koliko

Ili, kada imamo stepen školske spreme sa 4 modaliteta, onda pravimo 3 dummy-ja. Uzećemo one sa
visokim obrazovanjem kao referentne, i onda vršimo tri transformacije:

1. Dbš (dummy bez škole)= 1 ide u 1, else ide u 0


2. Doš (dummy osnovna škola)= 2 ide u 1, else ide u 0
3. Dsš (dummy srednja škola)= 3 ide u 1, else ide u 0.

Idemo u transform, pa recode into different, i odaberemo varijablu pol (v003.b.1). Sada ćemo u
regresiju da ubacimo i pol. U prethodnom modelu je R square bio 0,12. U novom modelu R square
raste, odnosno sada imamo 2% objašnjenosti varijanse. Ovde tumačimo koliki je uticaj starosti, kada
se pol drži pod kontrolom – koliki je uticaj starosti kada bi svi ispitanici bili istog pola. I ovde se,
kao što vidimo, ništa nije promenilo u odnosu na prošli model. Ali, tumačenje je drugačije – ako je
ispitanica ženskog pola, u odnosu na muškarca koji su referentne kategorije, rezultat na skali opada za
0,199, odnosno za 0,93 standardne devijacije.

B je nestandardizovani indikator, i ovde prikazuje da uticaj pola veći od starosti. Međutim, kada se
gleda BETA koja standardizuje skale, vidi se da je uticaj starosti (0,108) veći od uticaja pola.

Takođe, stariji ispitanici muškog pola imaju veću verovatnoću da ispoljavaju kolektivističku
orijentanciju nego mlađe ispitanice ženskog.
Sada ćemo uzeti obrazovanje (v003.d.1). Transformisaćemo je ovako:

- 1 i 2 idu u 1
- 3 i 4 idu u 2
- Od 5 do 7 ide u 3
- Od 8 do 15 ide u 4
- 16 ide u sysmis

Sada moramo da napravimo tri dummy-ja. Kao referentnu uzimamo visoko obrazovanje. To sve
radimo kao transform, pa recode into different. Sada pravimo regresioni model i sa ovom varijablom.
Idemo u analyze, regression i linear i ubacujemo sve tri nove varijable (Dbs, Dos i Dss) bez originalne
koju smo rekodovali, pa onda u statistics gde označavamo dve poslednje s desne strane.

Sada gledamo tabelu Coefficients, gde gledamo significance, gde vidimo da je za ženski pol i dalje
značajan faktor, a obrazovanje nije značajan faktor, jer je svugde significance veći od 0,05!
Tolerance mora biti veći od 0,1, a VIF manji od 10, da bismo mogli da kažemo da nisu u međusobno
visokoj korelaciji, odnosno da je zadovoljen preduslov da nezavisne varijable nisu u multikolinearnosti.

Ono što je bitno jeste da gledamo significance, gde vidimo da, kada se ova dva drže pod kontrolom,
obrazovanje nije značajan faktor. Dakle, ostaju nam samo starost i pol ispitanika.

Materijalni položaj – analyze, regression, linear. Varijabla je već sređena (matpolklase). Malo se
povećao R square, što nam govori da ni materijalni položaj nije značajan faktor. Tumačimo vrednosti
BETA. I dalje je starost najznačajniji prediktor kolektivističke orijentacije. Takođe, ako nam je model
dobar, i ako jedan faktor ima odlučujući, najznačajniji uticaj kao nezavisna varijabla na zavisnu, BETA
mora biti veća od 0,3, što je vrednost koju nema ni jedan faktor kod nas.

Pravljenje skala
Mi često radimo sa multidimenzionalnim pojmovima, koji imaju različite aspekte i gde se koriste
različti indikatori da bismo uhvatili različite pojavne aspekte neke pojave. Na primer, treba nam više
indikatora autoritarnosti. I zato, pravimo skale da bismo taj pojam, odnosno pojavu merili u više
dimenzija.

Neophodno je da sve varijable budu date u istim rasporedima, odnosno u istim skalama. I moramo
biti sigurni da je skala pouzdana, to znači da ispitanici pridaju približno isti smisao tim pojavama. Da
li je skala pouzdana ili ne testiramo pomoću mera pouzdanosti, Cronbachova ALFA. To je ustvari
mera međusobne interkoreliranosti varijabli koje čine neku skalu. Cronbachova ALFA uzima vrednost
od 0 do 1, pri tom je vrednost koja je veća od 0,7 ono što nas interesuje – tada imamo posla sa
pouzdanom skalom. Međutim, ona može da varira zavisno od broja stavki koje koristimo da bismo
formirali skalu, pa tako ako imamo manje od 10 stavki, a ALFA nam je manja od 0,7, to i dalje ne
znači da skala nije pouzdana, nego da je mali broj stavki (itema), pa se tada izračunava mean inter-
item correlation.
Da bismo mogli da napravimo skalu, moramo sve da ih sredimo. Autoritarnost (v064) – „interes
kolektiva uvek mora biti važniji od interesa pojedinaca“ je jedan item, ima ih mnogo. Uzećemo od
v064 do v069. Dakle, te ćemo iteme koristiti prilikom formiranja skale autoritarnosti. Da bismo mogli
da ih sredimo, moramo prvo da izbacimo osmice i sve ostalo u copy. Idemo u recode into different, i
ubacujemo sve te varijable (takođe, menjamo im nazive u, recimo, v066.1 itd.).

Sada testiramo pouzdanost. Analyze – Scale – Reliability analysis. Ubacujemo varijable. Zatim, u
statistics označavamo scale i scale if item deleted. U prozoru „Inter-item“ obeležavamo correlations i
u prozoru „Summaries“ obeležavamo means.

Vrednost Cronbachove ALFA je 0,702 što znači da imamo pouzdanu skalu.

Sada gledamo Item-Total Statistics, gde kratko proveravamo Cronbach's if items deleted, koja nam
pokazuje kako se kreće alfa ako bi se neki item obrisao. Da je alfa bio manji od 0,7, a broj itema manji
od 10, onda bismo proveravali i meru Inter-item correlation (tabela Summary item means), ali pošto
nije, nema potrebe da to gledamo.

Dakle, sada možemo da počnemo da pravimo tabelu. To se radi jednostavno – Transform – Compute
– ubacujemo iteme i sabiramo ih (v064.1+v065.1+ itd.). Sabiranjem ovih varijabli mi već dobijamo
jednu vrstu kontinuirane varijable.

Sada koristimo ovo kao zavisnu varijablu u regresionom modelu. Sve je isto, samo izbacujemo u
dependent v064.1, i ubacujemo autoscale kao dependent. Vidimo da su nam svi faktori sada značajni,
i ako pogledamo BETA, onda je najznačajniji efekat – efekat obrazovanja. Kažemo, da ako ispitanik
ima osnovnu školu, u odnosu na onog sa visokim obrazovanjem, rezultat na skali raste za 0, 277
standardnih devijacija, ako je ispitanik bez škole u odnosu na ove referentne (sa visokom školu) onda
rezultat na skali raste za 0,187. Sa svakom dodatnom godinom starosti, autoritarnost raste za 0,162
standardne devijacije. Ako se radi o ženama u odnosu na muškarce, autoritarnost opada. I sa svakom
dodatnom kategorijom materijalnog položaja, autoritarnost opada za 0,141 standardnu devijaciju.

Zaključak: Drugim rečima, ako je ispitanik pripada starijoj starosnoj dobi, pripadnik je muškog pola,
ima završenu osnovnu školu i nižeg je materijalnog položaja, veće su šanse da će biti autoritaran.

You might also like