You are on page 1of 30

Poglavlje 5

Veza izmeu 2 varijable


plot rasturanja
koeficijent korelacije
Prosta regresija

Veza izmeu 2 varijable

1 Varijabla

2 Varijable

Grafiiki Pregled

Histogrami i sl.

Plot Rasturanja

Numeriki Opis

Centar, Rasturanje

Korelacija

Modeli

Gustoa raspodjele Regresija

Plot rasturanja
Ukoliko oznaimo dvije varijable sa x i y

Pitanje 1: Da li postoji veza izmeu dvije varijable?


Pitanje 2: Da li tee da zajedno variraju?

Grafiko rjeenje: Plot rasturanja

Plot rasturanja je najei nain za Grafiko istraivanje veze izmeu


dvije kvantitativne varijable

Plot rasturanja
Pri predstavljanju uvijek treba plotati zavisnu varijablu
na y a nezavisnu na x osu
Zavisna Varijabla je mjera (veliina) izlaza
prouavanja
Nezavisna Varijabla objanjava ili uzrokuje
promjenu izlazne varijable

Primjeri: zavisne i nezavisne varijable


1.

Ukoliko postoji veza nezavisne i zavisne varijable koja je Zavisna a koja Nezavisna ?

2.

Vrijeme pripremanja ispita/Ocjena ispita


Tvrdoa odlivka/Vrijeme skladitenja
Smjer valjanja lima/Napon poetka teenja
Tvrdoa materijala/istroenost rezne otrice

Nazivanje jedne varijable nezavisnom a druge zavisnom ne mora neophodno da


znai da promjena jedne uzrokuje promjenu druge

Visina mua/Visina ene


Koeficijent trenja/Sila deformisanja (slobodno savijanje, duboko izvlaenje)
Vrijeme naknadnog pritiska/masa otpreska (ranije peaenje <Talata)

Ispitivanje Plota Rasturanja


Karakteristike ablona podataka

1.
2.
3.

Oblik
Smjer
Jaina

Oblik
Linearan

Grupisan

Zakrivljen

Smjer
Pozitivna veza

Negativna veza

Pozitivna veza kako se vrijednosti x varijable poveavaju, poveavaju se


vrijednosti y varijable

Negativna veza kako se vrijednosti x varijable poveavaju, smanjuju se


vrijednosti y varijable

Jaina
Kako su rastureni podaci oko pravca

Slaba

Srednja

Jaka

Kako su rastureni podaci oko krive linije


Slaba

Jaka

Ekstremi
Ekstrem je individualna vrijednost koja pada van ukupnog ablona (obrasca) zavisnosti

Ekstremi padaju van ukupnog ablona veze izmeu varijabli

Primjer 2:

Tjelesna masa (iskljuujui masnoe)/ brzina metabolizma


(brzina kojom organizam troi energiju)

Kakav je oblik veze (forma)?


Dali je veza Pozitivna ili Negativna
Kako je jaka veza?
Da li ima ekstrema, gdje, da li jaaju ili slabe
linearnu vezu?

Svrha Plota rasturanja

1. Istraiti prirodu veze izmeu dvije varijable


2. Pokazati da jedna varijabla moe objasniti
varijaciju druge varijable

Numerike mjere Linearne


Veze
Kovarijansa
Koeficijent korelacije
Mjere smjera i jaine linearne veze izmeu dvije
varijable.

13

Kovariansa
(x i x )( yi y )
Kovariansa Populacije COV(X,Y)
N

x (y) su aritmetike sredine varijabli X i Y, respektivno.


N je veliina Populacije.
(x i x )( yi y )
Kovariansa Uzorka COV(X,Y)
n -1
x (y) su aritmetike sredine varijabli X i Y, respektivno.

n je veliina Uzorka.

14

Ukrteni proizvod

SCP (x i x )( yi y )

POMJERANJE ISHODITA U CENTROID DOBIJA SE 4 KVADRANTA


Q1 (-+); Q2 (++); Q3(+-); Q4 (--)
Veina podataka pada u Q1(7) i Q3 (8)
5 podataka lei na liniji i ne daju nam informacije o korelaciji
Nedostatak je da se u ovom koraku ne uzimaju sve informacije iz Plota rasturanja.
Ekstremne vrijednosti vie ukazuju na VEZU nego one blizu centra Plota Rasturanja (primjer a i b podatak)

Kovariansa
Ako dvije varijable idu u istom smjeru, (obje se
poveavaju ili smanjuju), kovarijansa je veliki
pozitivni broj.
(x i x )( yi y )
COV(X,Y)

n -1

8
6
3
1

10

X
16

Kovariansa
Ako dvije varijable idu u suprotnim smjerovima,
(jedna se poveava a druga smanjuje),
kovarijansa je veliki negativan broj.
(x i x )( yi y )
COV(X,Y)
n -1

8
6
3
1

10

X
17

Kovariansa
Ako dvije varijable nisu u relaciji, kovarijansa e
biti blizu nuli.

(x i x )( yi y )
COV(X,Y)
n -1

8
6
3
1

10

X
18

Kovarijansa
Kovariansa odgovara na pitanje:

Da li postoji bilo kakav ablon koji vezuje dvije varijable?


Problem: Orginalna jedinica mjere (npr: procenat
ugljika x Mpa, broj slova x broj rijei u reenici,
stepen celizijusa x % iskoritenosti i sl)

19

Koeficient Korelacije
Da bi se eliminasala orginalna jedinica mjerenja radi se NORMALIZACIJA
kovarijanse dijeljenjem sa standardnom devijacijom svake od varijabli

Koeficient korelacije Populacije


COV ( X , Y )

x y

Koeficijent korelacije Uzorka


cov( X , Y )
r
sx s y
20

Koeficient Korelacije
Ukoliko su dvije varijable jako pozitivno linearno
vezane, koeficijent korelacije je blizu +1 (jaka
pozitivna linearna veza).

21

Koeficient Korelacije
Ukoliko su dvije varijable jako negativno linearno
vezane, koeficijent korelacije je blizu -1 (jaka
negativna linearna veza).

22

Koeficient Korelacije
Na slabu linearnu vezu ukazuje koeficijent koji je
blizu nuli.
Takoer, nelinearna veza dovodi do slabe
linearne povezanosti

23

Osobine Koeficienta Korelacije


Bezdimenziona veliina
Uzima vrijednosti od -1 do +1
+ pozitivna veza, - negativna veza
0 ; dva mjerenja nemaju nita zajedniko
+1 ; dva mjerenja mjere istu stvar (moe se
mjeriti samo jedna veliina)
-1 ; mjerenje dvije inverzne veliine
(iskoritenost-gubici...)

Koeficient Korelacije
Koeficijent Korelacije odgovara na pitanje:

Koliko je jaka i kojeg je smjera linearna veza


izmeu dvije varijable?

Osnovna ideja Korelacije-primjena


Za dvije zavisne varijable indeks procjenjuje slinost
dva seta mjerenja dobijena istim eksperimentom (koliko
zajednikog imaju te dvije varijable)
Za dvije nezavisne varijable Poeljno je da se za
nezavisne varijable biraju one koje nisu u
korelaciji....ukoliko su vezane poveava se broj
eksperimenata nepotrebno...?
Za zavisnu i nezavisnu da li promjena nezavisne utie
na promjenu zavisne koliko i kako?

Primjer izraunavanja
Primjer 1
Izraunati kovarijansu i koeficijent korelacije kao
pokazatelje veze brzine automobila (milja/h) i
potronje goriva (milja/gal).
Rjeenje

Ukoliko vjerujemo da brzina utie na potronju:


Brzinu oznaimo sa X
Potronju u milja/gal sa Y

27

Primjer izraunavanja
Primjer 1 nastavak
x
1
2
3
4
5
6
7
8
9
10

Brzina(X) Gorivo (Y) X2


15
7,1
35
15,5
35
18,5
40
19,7
40
22,4
45
21,3
45
22,8
45
23,1
50
22,8
50
21,3

Cov( x, y)

x2

y2
Y2

225
1225
1225
1600
1600
2025
2025
2025
2500
2500

xy
XY

50,41
240,25
342,25
388,09
501,76
453,69
519,84
533,61
519,84
453,69

106,5
542,5
647,5
788
896
958,5
1026
1039,5
1140
1065

Razvijene formule
Cov( x, y )

n
n
1

y
n
i 1 i
i 1 i
(400)(194.4)

i 1 xi yi
8209
.
5

47
.
7

n 1
n

1
10 1

10

2
n

1
i 1 x
2
n
2
s
i 1 xi

n 1
n

28

Primjer izraunavanja
Primjer 1 nastavak

1
4002
sx
(16950)
10.27
10 1
10
sy

1
194.52
(4003.43)
4.948
10 1
10

Razvijene formule
Cov( x, y )
1 n
in1 xi in1 yi
i 1 xi yi
n 1
n
2
n

1
i 1 x
2
n
2
s
i 1 xi

n 1
n

29

Primjer izraunavanja
Primjer 1 nastavak

cov (X, Y)
r

sxsy
47.7

.9938
(10.27)( 4.948)
Interpretacija: postoji jaka linearna pozitivna veza izmeu
brzine i potronje goriva za posmatrani rang varijacije brzine.
30

You might also like