You are on page 1of 26

Korelacija

(smisao, smjer, veliina)

Informacijske znanosti: Vjerojatnost i statistika


03.11.2015.

Pearsonov koeficijent
Spearmanov koeficijent
Point-biserijalni

koeficijent

Parcijalna korelacija

Svakodnevni ivot: meusobna zavisnost, povezanost,

asocijacija

npr. izmeu visine i teine; vii ljudi su u prosjeku tei od niih

ljudi, izmeu prosjene koliine konzumirane hrane i teine i sl.

Engl. matematiar Karl Pearson- razradio raunski postupak za

izraunavanje stupnja povezanosti, i izrazio ga brojkom


koeficijent korelacije (r)

Pojam
Korelacija u

statistici oznaava
sukladnost u
variranju dviju (ili
vie) varijabli.

Stupanj sukladnosti u

variranju se izraava
koeficijentom korelacije (r).

Vrste korelacija:

maksimalna pozitivna
(r=+1),
pozitivna (0<+1),
nulta (r=0),
negativna (-1<r<0),
maksimalna negativna (r=1)

Vrijednost koeficijenta korelacije kree se u granicama od -1, potpuno

negativna povezanost (dok jedna varijabla raste, druga opada), do


+1, potpuno pozitivna povezanost (obje varijable su u porastu).

U opisivanju povezanosti

koristimo grafike i numerike


metode.

Grafika metoda podrazumijeva

grafiki prikaz povezanosti


izmeu dvije varijable preko
scatter dijagrama.

Vrijednosti jedne varijable nanose

se na X osu, a druge na Y osu.


Svaki ispitanik se prikazuje kao
taka u koordinatnom sustavu.

Prediktorska varijabla nanosi se

na apscisu, a kriterijska na
ordinatu.

Scatter-dijagram omoguava

da:
odredimo smjer povezanosti;
procjenimo da li je povezanost
visoka, umjerena ili niska;
utvrdimo kakvog je oblika
povezanost (linearna, inverzna
U, ili neka druga);
detektiramo ekstremne rezultate.

Napomena: u dosadanjim primjerima prikazane su samo

linearne povezanosti izmeu dvije varijable (grafiki se odnos


moe prikazati ravnom crtom tj. pravcem).

Osim linearnih, postoje i druge vrste povezanosti koje bi se u

grafikom obliku prikazivale zakrivljenim linijama.

Npr., temperatura u sobi i uinak u uenju gradiva

Primjeri nelinearne povezanosti (razliiti oblici):

Obrnuto U

Periodine promjene

Primjeri nelinearne povezanosti (razliiti oblici):

Pozitivna
deceleraci
ja (pad je u
poetku
manji pa
vei)

negativna
akceleraci
ja (rast je u
poetku
vei pa
manji)

Negativna
deceleraci
ja (pad je u
poetku
vei pa
manji)

Pozitivna
akceleraci
ja (rast je u
poetku
manji pa
vei)

Ako postoji povezanost izmeu dvije varijable (npr, visina i

teina) to ne znai da postoji uzrono-posljedini odnos!

Ne mora znaiti da jedna varijabla utjee na drugu, ako su

povezane, nego da je neka trea (ili vie varijabli)


podjednako uzrokovala promjene na povezanim varijablama

Koje varijable potencijalno utjeu na podjednake promjene u

teini i visini osobe?

Skale mjerenja za mnoga mjerenja kod korelacije, od skala bi trebale biti

koritene intervalna ili omjerna skala. Jedini izuzetak je kada imamo


dihotomne nezavisne varijable (samo dvije vrijednosti) i jednu stalnu
zavisnu varijablu (point-biserijalni koeficijent).

Mjere na obje varijable svaki ispitanik mora imati rezultat na obje

varijable: X i Y (bez missing cases).

Normalnost rezultati svake varijable trebaju biti normalno distribuirani.

To moe biti provjereno, izmeu ostalog, uvidom u rezultate svake


varijable na histogramu.

Linearnost veza izmeu dvije varijable treba biti linearna. To znai, kada

pogledate na rezultate u skater dijagramu trebali bi vidjeti ravnu liniju, ne


krivulju.

Homoscedascitet varijabilitet rezultata za varijablu X treba biti slian

varijabilitetu vrijednosti varijable Y.

Normalnost distribucije

Linearnost povezanosti

Homoscedascitet

Korelacija je postupak kojim se odreuje povezanost izmeu dvije

varijable, bez poznavanja uzrono-posljedine veze.

Korelacijom saznajemo da li su dvije varijable meusobno povezane, ali

ne znamo koja varijabla utjee na koju i u kojem stupnju.

Koeficijent korelacije moe biti od -1 do +1. Ukoliko je koeficijent

korelacije 0, korelacije nema. to je vei koeficijent korelacije, vea je


povezanost i obratno.

Parametrijska korelacija (normalna distribucija varijabli) se odreuje

Pearsonovim r koeficijentom korelacije, a neparametrijska korelacija


(asimetrine distribucije) se odreuje Spearmanovim rho koeficijentom.

1. Odabrati Analyze, nakon toga kliknuti na Correlate, zatim odabrati

Bivariate.
2. Umetnuti dvije varijable u prostor Variables.
3. Ovisno od toga da li je distribucija rezultata normalna (parametrijska
statistika) ili nije (neparametrijska statistika), u prostoru Correlation
Coefficients odabrati Pearsonov ili Spearmanov koeficijent.
4. Kliknuti na Options. Za nedostajue vrijednosti (vrijednosti koje
nedostaju) kliknuti na Exclude cases pairwise. Unutar Options moete,
ako elite, odabrati aritmetiku sredinu i standardnu devijaciju.
5. Kliknuti na Continue, a zatim na OK.

Otvorite matricu podataka ViS_v4- Korelacija


a)Dijagramom rasprenja utvrdite kakav je (otprilike)

odnos izmeu Radnog iskustva i Koeficijenta plae.


Je li priblino linearan?

b)Utvrdite (Pearsonovu) korelaciju izmeu ove dvije

varijable

c)Je li korelacija znaajna? Ako da, kakvog je smjera? to

to znai?

d)Kakva je korelacija po veliini?

1. Provjera informacija o uzorku


Prvo to treba provjeriti u tabeli je vrijednost N koja oznaava broj ispitanika. Da
li je ta vrijednost odgovarajua? Ako puno podataka nedostaje, treba provjeriti
zato.

2. Utvrivanje smjera povezanosti


Sljedee to treba provjeriti je smjer povezanosti varijabli, na to upuuje
predznak + ili -. Ako je predznak koeficijenta korelacije negativan, to znai
da vei skor u jednoj varijabli odgovara manjem skoru u drugoj varijabli.
Varijable su, dakle, u negativnoj korelaciji. Kada je predznak koeficijenta
korelacije pozitivan, varijable se mijenjaju u istom smjeru.

3. Utvrivanje snage povezanosti


Pojedini teoretiari, poput Cohena, objanjavaju da je korelacija mala ako je

vrijednost koeficijenta korelacije izmeu .10 i .29, srednja izmeu .30 i .49 i
visoka izmeu .50 i 1.0.

Povezanost od .5 i -.5 je u potpunosti ista, odnosno velika, jer predznak odreuje

samo smjer povezanosti, a ne i snagu te povezanosti.

4. Izraunavanje koeficijenta determinacije


Kvadriranjem vrijednosti koeficijenta korelacije dobiva se koeficijent

determinacije, i ako potom dobiveni koeficijent determinacije pomnoimo sa 100,


dobit emo broj koji nam govori koliki postotak varijance obuhvaaju odreene
varijable.

5. Procjena znaajnosti koeficijenta korelacije

Koliki je koeficijent determinacije izmeu Radnog iskustva i

Koeficijenta plae?

Koliki je koeficijent determinacije izmeu Koeficijenta plae i

Opsega struka?

Koji od ove dvije kombinacije varijabli ima vie zajednikih

faktora?

Utvrdite povezanost spola i koeficijenta plae, primjenom

point-biserijalnog koeficijenta korelacije (=Pearsonov)

Je li povezanost znaajna? Kakva je veliina korelacije?


Utvrdite povezanost spola i opsega struka
Je li povezanost znaajna? Kakva je veliina korelacije?

Nekada se izmeu dvije

varijable moe dobiti visoka


korelacija zato to na obje
varijable istovremeno, na isti
nain djeluje na neka trea
varijabla.
Npr., mjerenje duljine stopala i

sposobnosti pisanja kod djecekorelacija je velika, ali zbog utjecaja


treeg faktora, a to je starost/dob .
Kada bi iskljuili taj faktor starosti,
povezanosti vjerovatno ne bi bilo.

Formulom za parcijalnu korelaciju rauna se povezanost dvije

varijable, uz istovremeno iskljuivanje utjecaja tree varijable


na prvu i drugu varijablu.

*Bazirana na Pearsonovoj formuli za korelaciju, mogue


raunanje koeficijenta determinacije

1. Kliknite na Analyze, te na Correlate, pa zatim odaberite

Partial.

2. Kliknite na dvije varijable koje elite meusobno korelirati i

prebacite ih u okvir Variables.

3. Potom kliknite na varijablu iji doprinos toj korelaciji elite

kontrolirati i prebacite je u okvir Controlling for.

4. Kliknite na Options.
U sekciji Missing Values, odaberi Exclude Cases Pairwise.
U sekciji Statistics, odaberi Zero Order Correlations.
5. Kliknite na Continue, zatim na OK.

Utvrdite povezanost izmeu Opsega struka, Koeficijenta

plae i Radnog iskustva

Utvrdite povezanost Opsega struka i Koeficijenta plae, uz

istovremenu kontrolu varijable Radn iskustva

Usporedite povezanost Opsega struka i Koef. plae prije i nakon

kontrole godina Radnog iskustva? Zato se promijenila?

Utvrdite povezanost izmeu Koeficijenta plae, Ukupnog broja

sati sna u tjednu i Radnog iskustva

Ponovno utvrdite povezanost izmeu Koef. Plae i Sati sna, uz

kontrolu varijable Radno iskustvo

Do kakve je promjene u povezanosti dolo?

You might also like