You are on page 1of 5

KORELACIONA ANALIZA

VEŽBE - OSMA NEDELJA


PIRSON-ov i SPIRMAN-ov koeficijent korelacije
___________________________________________________________________________
Najpre pročitajte teorijski deo iz školske knjige (predavanja - osma nedelja, objavljen na
portalu za e-učenje). Ova oblast spada u lakše oblasti. Zadatke iz ove oblasti IMATE na
ispitu.
Obratite posebno pažnju na:
1. Koeficijent proste linearne korelacije (izračunavanje Pirson-ovog koeficijenta )
2. Prostu linearnu korelacionu analizu zasnovanu na rangiranim podacima
(izračunavanje Spirman-ovog koeficijenta)
Nemojte da mešate korelacionu analizu sa regresionom analizom. I u jednoj i u drugoj analizi
se (u zadacima koje mi radimo) govori o dvema promenljivim X i Y. U regresionoj analizi
jedna promenljiva je uvek zavisna - Y a druga nezavisna - X. U korelacinoj analizi nije važno
koja promenljiva je zavisna a koja nezavisna.
___________________________________________________________________________

1. Koeficijent proste linearne korelacije


(izračunavanje Pirson-ovog koeficijenta )
Primer zadatka kakav možete imati na ispitu ili domaćem:
Koristim 2. zadatak iz školske zbirke na str 72. i dajem postupno objašnjenje ovog zadatka i svakog
drugog zadatka iz oblasti proste linearne korelacije.

Na osnovu podataka o kretanju zarada i investicija u jednom preduzeću, ispitati da li između


varijacija ovih pojava postoji kvantitativno slaganje i u kojoj meri.

Zarade u (000)
12 15 14 18 20 20 21 23
dinara (x)
Investicije u
(000) dinara 4 6 5 7 9 10 12 12
(y)

Najpre, na osnovu samog teksta zadatka treba da prepoznate da se radi o korelacionoj analizi (ne
regresionoj). U tekstu zadatka vam kaže ''… ispitati da li …. postoji kvantitativno slaganje i u kojoj
meri''. Dakle, kada se od vas u zadatku traži da ispitate/utvrdite da li postoji KVANTITATIVNO
SLAGANJE (i ako postoji, koliko je, odnosno u kojoj meri) između varijacija nekih pojava (u ovom
slučaju imate dve pojave tj. dve promenljive: zarade i investicije), onda treba da vam je jasno da se
radi o prostoj korelacionoj analizi, i da treba da izračunate i prokomentarišete Pirson-ov koeficijent
korelacije. Takođe, ukoliko vam u samom tekstu zadatka piše: ''Na osnovu….izračunajte Pirson-ov
koeficijent korelacije'' onda vam je odmah jasno šta treba da uradite.

Pirson-ov koeficijent korelacije se izračunava prema sledećoj formuli:

n ∑ xy −∑ x ∑ y
R= 2
√n ∑ x −¿ ¿ ¿ ¿ ¿
Napomena* U zadatku su vam Zarade obeležene sa x a Investicije sa y. Moglo je da bude i obrnuto:
Zarade sa y, a Investicije sa x i dobili bi istu vrednost koeficijenta.

Rešenje:

Prva i druga kolona su vam date u zadatku. Zbog formule za R, potrebno je da otvorite još tri nove
kolone: x2, y2 i x*y (formula za izračunavanje nekog parametra vam uvek kaže koje kolone treba
otvorite. U praksi, kada vidite da se nešto množi (deli) sa nečim, onda treba da otvorite novu kolonu) .
Takođe, zbog formule za R, trebaju vam i sume svih kolona. n je broj podataka za x (ili y). Dakle n je 8,
jer imate 8 iks-ova (ili 8 ipsilon-a).

1. 2.
3. 4. 5.
x y
x2 y2 x*y
zarade investicije

12 4 144 16 48
15 6 225 36 90

14 5 196 25 70
18 7 324 49 126

20 9 400 81 180
20 10 400 100 200

21 12 441 144 252


23 12 529 144 276

Suma: 143 65 2659 595 1242

n ∑ xy −∑ x ∑ y
R= 2
√n ∑ x −¿ ¿ ¿ ¿ ¿
9936−9295 641 641 641
R= = = = =0,966
√ 21272−20449∗√ 4760−4225 √ 823∗√535 28,69∗23,13 663,6
R uzima vrednosti od -1 do 1. Što je R vrednost bliže 1 (ili -1) veza je jača (postoji visoko kvantitativno
slaganje: direktno ili obrnuto/inverzno). Ukoliko je R blizu 0, onda kažemo da postoji vrlo slabo
kvantitativno slaganje. U našem slučaju R od 0,966 nam pokazuje da postoji jako visoko kvantitativno
direktno slaganje (kada zarade rastu za jednu jedinicu onda investicije rastu za 0,996 jedinica). Da je R
iznosilo npr. -0,87 onda bi postojalo jako visoko obrnuto slaganje (kada zarade rastu za jednu jedinicu
onda investicije opadaju za 0,87 jedinica, što u praksi ne može da se desi jer nema logike).

__________________________________________________________________________________

Prosta linearna korelaciona analiza zasnovanu na rangiranim podacima


(izračunavanje Spirman-ovog koeficijenta)
Koristim 1. zadatak iz školske zbirke na str 76. i dajem postupno objašnjenje ovog zadatka i svakog
drugog zadatka iz oblasti proste linearne korelacije zasnovane na rangiranim podacima.

Pomoću Spirmanovog koeficijenta korelacije odredi da li između varijacija posmatranih pojava h i u


postoji kvantitativno slaganje.

Gradovi A B V G D Đ E Ž Z I
Cene
38 36 34 45 39 32 26 34 36 33
slanine (h)
Cene
svinjskog 22 28 30 39 17 19 15 24 28 22
mesa (u)

U ovim zadacima vam se jasno kaže da treba da izračunate Spirmanov koeficijent korelacije (i ne
razumem zašto na ispitu vi uporno računate Pirsonov koeficijent, a lepo vam piše da treba
Spirmanov, verovatno vas zbuni što piše ''kvantitativno slaganje'' u nastavku teksta zadatka). Dakle,
kada u tekstu zadatka piše (samo) …izračunaj kvantitativno slaganje, onda izračunavate Pirson-ov
koeficijent. A kada u zadatku piše izračunaj Spirman-ov koeficijent, onda lepo izračunavate Spirman-
ov koeficijent.

Rešenje:

Rešenje zadatka je lepo objašenjeno u zbirci a ja ću ga samo dopuniti.

Ponovo imate dve promenljive: h i u. Potrebno je da rangirate podatke za h (cena slanine) prema
visini počev od najvišeg podatka, i da rangirate podatke za u (cena svinjskog mesa) prema visini
počev od najvišeg podatka.

Rangiranje h vršite na sledeći način: Pronađite najveći podatak za h. To je 45. Njemu dodelite rang 1.
Rang 1 unosite u novu kolonu koju formirate (treća kolona koja se zove rang h). Sledeći podatak (po
visini) je 39. Njemu dodeljujete rang 2 i to upisujete u treću kolonu. Treći podatak po visini je 38.
Njemu pripada rang 3 i tu trojku upisujete u trećoj koloni.

Sledeći podatak po visini je 36. Međutim 36 se javlja dva puta. Prvoj u nizu 36 bi mogao da pripadne
rang 4, a drugoj 36 rang 5 (ili obrnuto). Pošto je reč o istoj vrednosti (koja se javlja dva puta 36=36)
nije u redu da jednoj pripadne viši rang nego li drugoj (nije prva 36 lepša od druge niti je druga 36
lepša od prve). Zbog ovog problema, obe 36 treba da dobiju isti rang na konačnoj rang listi. Taj ''isti''
rang je u stvari prosta aritmetička sredina rangova koje smo mogli da im dodelimo. Drugim rečima, 4.
rang (prve 36) i 5. rang (druge 36) saberemo pa podelimo sa 2. (Da smo imali da se 36 tri puta javlja,
onda bi sabrali njihove rangove 4+5+6 pa bi ovu sumu delili sa 3). U slučaju našeg zadatka:
(4+5)/2=4,5. Na ovaj način obe 36 dobijaju isti rang od 4,5 i to upisujemo u treću kolonu. Primetite da
ste iskoristili ovde dva ranga (4 i 5) i da je sledeći slobodni rang 6.

Sledeći podatak po visini je 34. 34 se kao i 36 javlja dva puta. I ovde koristimo istu logiku. Prvoj 34 bi
mogli da dodelimo rang 6, drugoj 34 rang 7 (može i obrnuto), ali mi to ne činimo već i jednoj i drugoj
34 dodeljujemo isti rang (6+7)/2=6,5.

Sledeći podatak po visini je 33. Njemu pripada rang 8 (rangove 6 i 7 ste iskoristili u prethodnom
koraku). Zatim 32. Njemu pripada rang 9. I na kraju 26 kome pripada rang 10.

Završili smo sa rangiranjem h, i prelazimo na rangiranje u koristeći isti princip i istu logiku. Otvaramo
novu četvrtu kolonu koja se zove rang u. 39 je najviši podatak u koloni u i on dobija rang 1. Sledeći po
visini je 30 i on dobija rang 2. Zatim sledi 28 koji se javlja dva puta. Njima dodeljujemo istom logikom
rang: (3+4)/2=3,5. Dalje, 24 koje dobija prvi sledeći slobodni rang 5. Zatim 22 se javlja dva puta pa
dobija rang: (6+7)/2=6,5. I tako dalje istom logikom do kraja, odnosno dok sve vrednosti u koloni ne
dobiju rangove.

Spirmanov koeficijent se izračunava prema sledećoj formuli:

6∗∑ di 2
rs = 1 - N∗( N 2−1)

N je broj podataka za h ili za u. Imate 10 podataka za h (ili 10 za u) pa N iznosi 10. di je razlika rangova
koje ste prethodno formirali. To unosite u novoj koloni koju otvarate (kolona 5.) Vrednosti u petoj
koloni su razlika vrednosti treće i četvrte kolone (3 - 6,5 = -3,5 ; 4,5 - 3,5 = 1 itd). Otvarate još šestu
kolonu di 2 koja predstavlja kvadrirane vrednosti iz pete kolone (-3,5 2 = 12,25, 12=1 itd.). Treba vam
(zbog formule) suma ova kolone. Suma šeste kolone iznosi 89. Sada možemo da izračunamo vrednost
Spirmanov-og koeficijenta.

6∗89 534 534


r s=1− =1− =1− =1−0,54=0,46
10∗(100−1 ) 10∗99 990

Spirmanov koeficijent interpretirate na isti način kao i Pirsonov koeficijent. U slučaju ovog zadatka:
Postoji slabo i direktno kvantitativno slaganje od 0,46.

5. 6.
1. 2.
3. 4. d(h,u) d(h,u)2
Cene Cene
slanine svinjskog Rang h Rang u ili ili
h mesa u
di di2
38 22 3 6,5 -3,5 12,25

36 28 4,5 3,5 1 1
34 30 6,5 2 4,5 20,25
45 39 1 1 0 0

39 17 2 9 -7 49
32 19 9 8 1 1

26 15 10 10 0 0
34 24 6,5 5 1,5 2,25

36 28 4,5 3,5 1 1
33 22 8 6,5 1,5 2,25

Suma: 89

___________________________________________________________________________
Zadaci za samostalnu vežbu (ne treba da mi ih šaljete na mejl, oni su urađeni postupno u
školskoj zbirci, predlažem da probate sami da ih rešite pa da vaše rešenje upredite sa onim u
zbirci:
Zadaci za vežbu. To su zadatak 2. na str 72; zadatak 4 na str 74; zadatak 5 na str. 75; bilo koji
zadatak na str 76-79. Provežbajte ih. Na ispitu mozete dobiti ovakav zadatak sa nešto
izmenjenim vrednostima i tekstom.

You might also like