You are on page 1of 29

KORELACIJA

UNIVARIJATNE I BIVARIJATNE DISTRIBUCIJE

• Do sada smo se bavili opisom distribucije jedne varijable (univarijatne distribucije)


• Za korelaciju su nam potrebne dve varijable
• Dijagram raspršenja se koristi za opis skorova na
dve varijable (bivarijatne distribucije).
Crvene tačke predstavlju poziciju
ispitanika i njihovih skorova na X i Y osi.
ŠTA JE KORELACIJA?

• Pirsonova korelacija (Karl Pearson, 1857-1936), označavamo sa r


• Pun naziv „Pirsonova produkt-moment korelacija“
• Koeficijent korelacije predstavlja linearnu povezanost dve varijable.
• Korelacija može biti nulta, pozitivna i negativna.
• Odgovara na pitanje: „Šta se dešava sa vrednostima jedne varijable kada vrednosti druge
opadaju ili rastu?“
• Korelacija je standardizovana kovarijansa i predstavljena je brojem od -1 do +1
VARIJANSA I KOVARIJANSA

• Koja je razlika između ove dve formule?


KOJE SU RAZLIKE?

• Varijansa je mera rasprešenja varijable X oko njene aritmetičke sredine


• Kovarijansa je mera zajedničkog variranja dve varijable.
• Varijansa mora biti samo POZITIVAN broj (ili nula), a kovarijansa može biti i
NEGATIVNA i POZITIVNA (ili nula).
KORELACIJA

• Ukoliko koristimo z-skorove u formuli za kovarijansu, dobićemo korelaciju (r). S toga,


kovarijansa je standardizovana korelacija.
• Kovarijansa, isto kao i varijansa, je nedimenzionalan broj.
• Korelacija je broj koji se kreće od -1 do +1
• Korelacija je takođe nedimenzonalan broj, ali je predstavljen u obliku indeksa (-1 do +1)
KAKO SE RAČUNA KORELACIJA

• Za računanje korelacije koristimo z-skorove. Pomnožimo z skor varijable X sa koresponirajućom


vrednošću z-skora varijable Y, sve saberemo, pa zatim podelimo sa n-1.
POZITIVNA KORELACIJA

• Vrednosti dve varijable se kreću u istom pravcu. Kako vrednosti varijable X rastu, tako
rastu i vrednosti Y varijable.
• I obrnuto, kako X opada, tako i Y opada.
• Suština je da se kreću u istom pravcu.
• Ima pozitivan predznak (npr. r = 0.30, r = 0.50)
• Korelacija od r = 1 ukazuje na savršeno preklapanje dve varijable. U praksi se ovaj ishod
skoro nikad neće dogoditi.
PRIMERI POZITIVNE KORELACIJE

Temperatura i zarada od prodaje


sladoleda.
Kako temperatura raste, tako se
prodaje sve više sladoleda. Kako
temperatura opada, prodaje se sve
manje sladoleda.
PRIMER NEGATIVNE KORELACIJE

Kako broj ispijenih piva raste, tako


rezultat na ispitu opada. I suprotno, što
manje piva, to veći rezultat. Korelacija je
negativna zato što kretanje ove dve
varijable ima suprotan smer.
POČETAK ISTRAŽIVAČKOG RAZMIŠLJANJA

• Pokušajte da smislite dve varijable i da ocenite u kakvoj bi one bile korelaciji. Drugačije
rečeno, postavite hipotezu o uzajamnom ponašanju dve varijable.
• Zadovoljvsto životom i depresija 
• Stepen socijalne podrške i emocionalno blagostanje 
• IQ i percipirana samoefikasnost 
• Narcizam i broj prijatelja 
MOGLI BISMO PRETPOSTAVITI...

• Zadovoljvsto životom i depresija  negativna korelacija


• Stepen socijalne podrške i emocionalno blagostanje  pozitivna korelacija
• IQ i percipirana samoefikasnost  pozitivna korelacija
• Narcizam i broj prijatelja  negativna korelacija
NULTA KORELACIJA

• Nema povezanosti između dve pojave.


• Variranje varijable X se ne može dovesti u vezi sa variranjem varijable Y
• Drugačije, za neku vrednost varijable X uočavamo bilo koju drugu vrednost varijable Y.
• Ne postoji obrazac zajedničkog rasta/opadanja vrednost dve varijable.
NULTA KORELACIJA PRIMER

Varijabla 1 je visina studenta. Varijabla 2 je ocena na


ispitu. Ovo znači da ocene na ispitu nemaju nikakve
veze sa visinom studenta koji je polagao taj ispit.
INTERPRETACIJA VREDNOSTI KOEFICIJENTA
KORELACIJE

• r od 0.10 do 0.30 – niska povezanost (sve ispod 0.10 je neznačajno)


• r od 0.30 do 0.50 – srednja/umerena povezanost
• r preko 0.50 – visoka povezanosti

OVE VREDNOSTI VAŽE I KADA JE KORELACIJA NEGATIVNA.


Znači, od r = -0.10 do -0.30 je niska negativna povezanost, -0.30 do -0.50 umerena negativna
povezanost i preko -0.50 visoka negativna povezanost
RAZLIČITE KORELACIJE
JOŠ NEKA VAŽNA SVOJSTVA KORELACIJE

• Pirsonovo r ćemo koristiti kada je odnos dve varijable linearan.


• Ne pravi razliku između zavisne i nezavisne varijable. Korelacija X sa Y je jednaka
korelaciji Y sa X.
• Što je indeks korelacije bliži -1 ili +1 to je veza između dve varijable jača.
• Koeficijent korelacije je osetljiv na eksteremne vrednosti, tj. štrčke.
DEFINISANJE REGRESIONE PRAVE

• Regresiona prava služi za definisanje linearnog odnosa između pojava koje smo izmerili.
SAMO ZA LINEARNE ODNOSE!

• Ukoliko se poslužimo Pirsonovom produkt moment korelacijom da opišemo nelinearan


odnos, doći ćemo do nepreciznih zaključaka.
• O tome više kasnije...
REGRESIONA PRAVA

• Regresiona prava preseca naše empirijske podatke, tako da suma kvadriranih odustupanja
od te linije bude najmanja moguća.
• Jednostavno, ta suma predstavlja razliku između naših nesavršenih podataka i
„savršenog“ matematičkog modela.
Plave tačke su skorovi naših ispitanika na
varijablama X i Y. Regresiona prava je tako
formirana da suma odstupanja naših
opservacija od vrednosti na savršenoj pravi
bude najmanja moguća. Ta odstupanja su
zapravo greška našeg predviđanja.
KOEFICIJENT DETERMINACIJE

• Koeficijent determinacije nam govori koji procenat varijanse varijable Y je objašnjen


varijasnom varijable X.
• Dobijamo ga tako što kvardiramo korelaciju rxy

• Označava se sa r2
• Ukoliko je korelacija r = 0.50, koeficijent determinacije je r 2 = 0.25
(jer smo računali 0.50 x 0.50)
• To znači da je 25% varijanse varijable Y objašnjeno varijansom varijable X.
• Koeficijent determinacije se kreće od 0 do 1, i uvek je pozitivan (ili nula).
• 1-r2 je koeficijent nedeterminacije jer 75% varijanse varijable Y ostaje neobjašnjeno
DEFINISANJE PRAVE LINIJE I JEDNOSTRUKA
LINEARNA REGRESIJA
• Pre toga, razlikujemo:
• Odsečak ili intercept (konstanta a) – vrednost Y varijable kada je vrednost X = 0
• Nagib ili slope (konstanta b)– pravac ili nagib linije u odnosu na X osu.
• Prava linija je definisana sledećom jednačinom:

Y = a + bX + e Pretpostavićemo da je greska e
jednaka nuli.
NAGIB ILI SLOPE

• Označavamo sa b

• b = rxy
• Ukoliko je korelacija između x i y pozitivna, i regresiona prava će biti pozitivna. Ukoliko
je korelacija x i y negativna, i regresiona prava će biti negativna (vidi slajd 18.)
• Nagib (slope) nam govori o tome koliko se vrednost varijable Y promeni kada se
vrednost varijable X promeni za 1.
ODSEČAK ILI INTERCEPT

• Označavamo sa a i govori nam kolika je vrednost varijable Y kada je varijabla X jednaka


0.

•a = My - bMx
PRIMER

• Predviđamo rezultat na ispitu na osnovu broja sati provedenih učeći (obe vrednosti su
nam poznate)
• Nezavisna varijabla ili prediktor X su broj sati učenja
• Zavisna ili kriterijumska varijabla Y je ishod, tj. rezultat na ispitu
• U regresionoj analizi nezavisna varijabla se zove PREDIKTOR, a zavisna KRITERIJUM
VARIJABLE

• X (broj sati) = 3, 4, 5, 6, 7 M = 5, SD = 1.58


• Y (bodovi na ispitu) = 65, 75, 80, 85, 90 M = 79, SD = 9.61
• Korelacija očigledno pozitivna, r = 0.88.
• Koristeći formulu dobijamo b = 0.88 • (9.61/1.58) = 5.35

• a = My – bMx

• a = 79 – 5.35 • 5 = 79 – 26.75 = 52.25


• Y = 52.25 + 5.35 • 5
• Y = 79
ŠTA TO ZNAČI?!

• Y = a + bX
• Y = 52.3 + 5.35 • 5
To znači da je intercept 52.3, tj. ovo je skor kada bi vreme učenja naših ispitanika bilo
NULA. Kada niko ne bi učio, predviđamo prosečan skor na ispitu od 52.3 boda.
5.35 (b ili nagib) znači da ZA SVAKI DODATNI SAT UČENJA predviđamo da će se
rezultat na ispitu POVEĆATI ZA 5.35 poena. Množili smo sa 5 jer je to prosek sati učenja.
Tada dobijamo Y koji je 79, tj. prosečni uspeh na ispitu.

You might also like