You are on page 1of 15

АКАДЕМИЈА СТРУКОВНИХ СТУДИЈА ЗАПАДНА СРБИЈА

Одсек Ужице 31000 Ужице

Трг Светог Саве 34

www.vpts.edu.rs

Seminarski rad :
Kovarijaciona i korelaciona matrica

Studenti :
Profesor:
Nikola Dragic др. Милован
Миливојевић

Predrag Vujadinovic

Nenad Stamenic
Sasa Lojpur

Znacaj korelacione analize

Korelaciona analiza je skup statističkih metoda kojima se istražuje


jačina veze između posmatranih pojava.
Korelacija predstavlja međusobnu povezanost obeležja posmatranih
pojava.

• Stepen veze između promenljivih koje se posmatraju se ispituje


korelacionom analizom.
• Mera korelacije se izražava koeficijentom korelacije koji uzima
vrednosti u intervalu [-1, 1].
• Korelacija se može podeliti prema:
- smeru (pozitivna ili negativna)
- broju posmatranih promenljivih (prosta ili
višestruka)
- obliku veza (linearna ili nelinearna).

Neposredna korelacija: ako su pojave neposredno povezane,


npr. tražnja i cena.
Posredna korelacija:
cena naftnih derivata (kerozina)  cena avio-prevoza
cena avio-prevoza  cena turističkih aranžmana.
Teorijska podloga

Коваријанције претпоставља јединице из умношка јединица две


променљиве.
С друге стране, корелација је бездимензионална.
То је јединица мере мере односа између променљивих.
То је зато што вредност коваријансе делимо са умношком
стандардних девијација које имају исте јединице.
На вредност коваријанце утиче промена скале променљивих.
Ако се све вредности дате променљиве помноже са константом
и све вредности друге променљиве помноже са сличном или
другачијом константом, тада се мења и вредност коваријансе.
Међутим, ако се ради исто, на вредност корелације не утиче
промена скале вредности.
Друга разлика између коваријанције и корелације је опсег
вредности које могу да претпоставе.
Док су коефицијенти корелације између -1 и +1, коваријанција
може попримити било коју вредност између -∞ и + ∞.
Kovarijaciona matrica

Коваријанција две променљиве (x и y) може се представити као


cov (x, y). Ако је Е [к] очекивана вредност или средња вредност
узорка „x“, тада се cov (x, y) може представити на следећи начин:

cov ( n , y )=E [(n , μ y )]

¿ E[ny ]−E[n] E[ y ]

¿ E[ny ]−μn μ y

∀ μx ∆ μ y =E [n]∆ E[ y ]

Ако погледамо једну променљиву, рецимо „y“, cov (y, y), израз се
може написати на следећи начин:

cov ( y , y )=Var ( y )=δ ( y ) =δ 2 y

Var ( y )=E ¿

Var ( y )=s2

Сада као што видимо, на горњој слици, „s²“ или узоркована


варијанса у основи је коваријанција променљиве са собом. Овај
појам се такође може дефинисати на следећи начин:
n
s2=cov ( y , y )=∑ ¿ ¿ ¿ ¿
i=1
n

∑ (n i−ń)(ni− ń) --------------- A


¿ i=1
n−1

Za 2 varijable :
n

∑ ( ni−x́)( y i− ý ) ------------------- B
cov ( n , y )= i=1
n−1

У горњој формули, бројилац једначине (A) назива се збиром


квадрата одступања. У једначини (B) са две променљиве x и y
назива се збир унакрсних производа. У горњој формули, n је број
узорака у скупу података. Вредност (n-1) означава степене
слободе.
Korelaciona matrica

„Корелација“ мери и снагу и смер линеарног односа између две


променљиве. Корелација је функција коваријанце.
Коефицијент корелације две променљиве можете добити
дељењем коваријантности ових променљивих производом
стандардних одступања истих вредности. Ако поново погледамо
дефиницију стандардне девијације, она у суштини мери
апсолутну варијабилност дистрибуције скупова података. Када
вредности коваријанце поделите са стандардном девијацијом,
она у суштини смањује вредност на ограничени опсег од -1 до +1.
То је управо опсег вредности корелације.Коефицијент корелације
познат је и као Пеарсонов коефицијент корелације производа и
момента или Пеарсонов коефицијент корелације. Као што је
раније поменуто, добија се дељењем коваријантности две
променљиве са производом њихових стандардних девијација.
Математички приказ исте може се приказати на следећи начин:

cov ( n , y ) E [(n−μn )( y−μ y )]


e x 1 y =corr ( n , y ) = =
Sx Sy Sn S y
E [(n−μn )( y−μ y )]
¿
σn σ y

Вредности коефицијента корелације могу се кретати од -1 до +1.


Што је ближе +1 или -1, то су две променљиве ближе повезане.
Позитивни знак означава смер корелације..
Odredjivanje COV i COR matrica

matematicki

Заронимо се такође мало дубље и погледајмо матрични приказ


коваријанције.

За матрицу података, X где X може бити представљен на следећи


начин:

x 11 ⋯ x1 p

[
X= ⋮ ⋱
xn 1 ⋯

x np ]
Редослед од
X =nxp

вектор ‘xј’ би у основи подразумевао (n × 1) вектор извучен из ј-те


колоне Кс где ј припада скупу (1,2, ..., p). Слично томе, „xi“
представља (1 × p) вектор из и-тог реда Кс. Овде „y“ може узети
вредност из скупа (1,2,…, n). Такође можете да протумачите Кс
као матрицу променљивих где је „xiј“ ј-та променљива (колона)
прикупљена из и-те ставке (реда). Ради лакшег сналажења
назовимо редове као ставке / предмете, а ступце као
променљиве. Погледајмо сада средњу вредност колоне горње
матрице података:
n
1
xj= ∑ nij =n−1 ń x j
n i=1
Користећи горњи концепт, дефинишемо сада средњу вредност
реда. То је у основи просек елемената присутних у наведеном
реду.
p
1
x i= ∑ x ij =p−1 x i 1 p
p j=1

Сада, када имамо горњу метрику, биће лакше дефинисати


коваријантну матрицу (С):

S 21 S 12 S 13 S1 p

[ ⋮
S 21 S 22 S 23
S= S 31 S 32 S 23

S p1 Sp2 Sp3
⋯ S2 p
S3 p
⋱ ⋮
⋯ S 2p
]
Где је :
n
1
S2j= ( n )∑ ( xij−x́ j )2 : варијанса j¿ променљиве
i=1

n
1
S jk= ( n ) ∑ ( xij−x́ j ) ( xik−x́k ): коваријанса b / ρ и j¿∧ jikпроменљиве.
i=1

n
1
x́ j= ( n ) ∑ xij: средња вредност променљиве j
i=1

У горњој матрици видимо да је димензија матрице коваријанце p


× p. Ово је у основи симетрична матрица, тј. Квадратна матрица
која је једнака њеном транспоновању (S`). Појмови који граде
матрицу коваријанце називају се варијансе дате променљиве,
формирајући дијагоналу матрице или коваријансу две
променљиве које попуњавају остатак простора.
Коваријанција ј-те променљиве са к-том променљивом
еквивалентна је коваријанси к-те променљиве са ј-том
променљивом, тј. „Sjk“ = „Sjk“.

Матрицу коваријанце можемо створити из матрице података на


следећи начин:

1
S= x'c x c
n

Xc= X−1n x́' =CX ∀ x c =¿ центрирана матрица

∀ x́' = ( x́1 , x́ 2 , … , x́ p ) : вектор променљивих средина

C=I n−n−1 1n 1'n : матрица за центрирање

x 11−x́ 1 x 12−x́ 2 x 1 p−x́ p


Xc=
[
x21− x́ 1 x 22− x́ 2


x n 1− x́ 1 x n 2−x́ 2 ⋯
x 2 p− x́ p

x np−x́ p ]
Овде је „Xc“ центрирана матрица која има одвојена средства у
колони одузета од сваког елемента. Користећи то као централну
компоненту, матрица коваријанце „S“ је производ
транспоновања „Xc“ и самог „Xc“, која се затим дели бројем
ставки или редова („n“) у подацима матрица.

Слично томе, користећи исту матрицу података и матрицу


коваријанце, дефинишемо матрицу корелације (R):
r 11 r 21 r 31 r1 p

[
r 12 r 22
R= r 13 r 23

r p1 r p2
r 32
r 33

r p3
⋯ r2 p
r3 p
⋱ ⋮
⋯ r
]
n

S ∑ ( x ij −x́ j ) ( x ik −x́ k )
∀ r jk = jk = i=1
S j Sk n n

√∑ (
i=1
x ij− x́ j )
2
√∑ (
i=1
2
x ik − x́ k )

r jk =¿ коефицијент корелације између x j и x k

Као што овде видимо, димензија корелационе матрице је поново


p × p. Ако сада погледамо појединачне елементе матрице
корелације, главна дијагонала се састоји од 1. То указује на то да
је корелација елемента са самим собом 1 или највећа могућа
вредност. Ово логично и интуитивно има потпуни смисао. Остали
елементи „рјк“ је Пеарсонов коефицијент корелације између две
вредности: „Xј“ и „Xк“. Као што смо раније видели, „Xј“ означава
ј-ти ступац матрице података, X. Прелазећи на то како се матрица
корелације може добити из матрице података:

из матрице података

1
R= x's x s
n
( x 11 − x́1 ) /S1 ( x 12− x́ 2 ) /S2 ( x1 p − x́ p ) /S p

[ x −x́ /S
X s= ( 21 1) 1 ( 2 2 2) 2

x − x́ / S

x
x −x́ /S


( n1 1) 1 ( n2 2) 2x́ / S

⋯ x


( x2 p −x́ p ) /S p

( n p p ) /S p
−x́
]
„Xs“ у горњој дефиницији назива се скалирана или
стандардизована матрица.
Овде видимо да се матрица корелације може дефинисати као
продукт транспоновања скалиране матрице са собом, подељен
са ’n’.
Поновним прегледом дефиниције стандардне девијације одозго,
видимо да је сваки елемент (сличан горњој матрици
коваријанце) стандардизоване матрице „Xs“ подељен
стандардном девијацијом одговарајуће колоне. Ово појачава
наше разумевање матрице корелације која је стандардизовани
или скалирани дериват матрице коваријанце.

Algoritamska sema i objasnjenje


Konzolna C# aplikacija COV i COR matrica
Case study
Case study je istrazivacka metoda u prirodnim i drustvenim naukama koja
podrazumijeva detaljno ispitivanje odredjenog slucaja, kao naprimer neki
program, dogadjaj , proces , jednu osobu ili vise ljudi.
Case study predstavlja ogranicen sistem izmedju vremena i prostora.
Koristi vise oblika podataka da bise slucaj sto bolje razumio.
Case study podrazumijeva sve vrste kvantitativnih podataka kao sto je intervju,
neki dokument ili artefakt.
Postoje 3 vrste case study-a:
1.Single instrumental case study –istrazivac se fokusira na pitanje ili problem,
zatim bira ogranicenu metodu kako bi sto bolje ilustrovao taj problem.
2.Collective or Multiple case study – istrazivac se fokusira na pitanje ili problem,
zatim bira nekoliko ogranicenih metoda kako bi sto bolje ilustrovao taj
problem.
3.Intrinsic case study – istrazivac proucava slucaj bez prethodne dorade na tom
slucaju.
Metode Case Study-a
1.Odredjuje da li ce case study odgovoriti na nase pitanje.
2.Odredjuje slucaj i koju vrstu slucaja ce koristiti.
3.Nakon prikupljanja podataka istrazivac analizira podatke.

Ogranicenja
 Pronaci problem ili uzrok, a zatim pronaci slucaj koji ce ga ilustrovati ili
prouciti taj slucaj.
 Odrediti da li treba posmatrati jedan ili vise slucajeva.
 Definisati granice slucaja.
 Proucavanje vise slucaja istovremeno znaci da ce istrazivac uci u manju
dubinu nego pojedinacno.

You might also like