You are on page 1of 9

 Multivarijaciona statistička analiza podataka

zahteva tehnike koje se razlikuju od tehnika


predviđenih za ispitivanje jednodimenzionalnih
podataka.
 Podaci koji se originalno dobijaju na osnovu
višedimenzionalnih uzoraka mogu biti međusobno
značajno korelirani i u tom slučaju je u cilju lakšeg i
inuitivnijeg prikazivanja i tumačenja podataka
potrebno smanjiti početan broj dimenzija.
 Višedimenzionalni uzorak

 x11 x12 ... x1p 


 
 x 21 x 22 ... x 2p 
X=
... ... ... ... 
 
x x n2 ... x np 
 n1
 Osnovni statistički pokazatelji potrebni za analizu
glavnih komponenata

s XY
1 n
( )(
=  x i − x yi − y ,
n i =1
) s XX
1 n
=  (x i − x )
n i =1
2

s XY
rXY =
s XX s YY

 SX1X1 ... SX1X P   rX1X1 ... rX1X P 


   
S =  ... ... ...  R =  ... ... ... 
   
 SX P X1 ... SX P X P   rX P X1 ... rX P X P 
 Matrica sopstvenih vektora
Γ = ( γ1 ,..., γ p )

 Matrica sopstvenih vrednosti


Λ = diag(λ1 ,..., λ p )

 eigen(S) + diag(x)
 Glavnekomponente se dobijaju kao sledeće
linearne kombinacije

Y =  (X - µ)
T
 Ne postoji nijedna standardizovana linearna
kombinacija koja ima veću varijansu od sopstvene
vrednosti
EYi = 0
VarYi = i
Cov (Yi , Y j ) = 0
VarY1  VarY2  ...  VarYp
p

VarY
i =1
i = tr ()

Cov ( X , Y ) = 
 Tumačenje glavnih komponenata se najjednostavnije,
ako je to moguće, realizuje preko matrice opterećenja.
 Matrica opterećenja je matrica koju čine korelacije
izvornih promenljivih i glavnih komponenata
Cov( X , Y ) = 
R( X , Y ) = D −1/ 2 1/ 2
1/2
γ ij λ j  λj 
ρ X i Yj = = γ ij  
(σ X i X i λ j )1/2  σX X 
 i i 

prcomp(x, center = T, scale = T)


biplot(prcomp_obj)

You might also like