You are on page 1of 12

MULTIVARIJATNA ANALIZA

Osnovna ideja multivarijatne analize je da simultano promatra vie meusobno


povezanih varijabli, pri emu je svaka pojedina varijabla, barem inicijalno, jednako
vana.
Jedan od razloga este uporabe multivarijatnih metoda je dostupnost kompjutorskih
programa za potrebna izraunavanja, jer je nuan uvjet za primjenu tih metoda pristup
prikladnom softare!u.
"nanstveno istraivanje je iterativni proces uenja. #akon to se definiraju ciljevi
objanjavanja drutvenih ili fizikih pojava provodi se testiranje na temelju
raspoloivih i analiziranih podataka. $rovedena analiza obino %e zahtijevati
modifikaciju objanjenja pojave. &ijekom tog iterativnog procesa uenja varijable se
esto dodaju ili iskljuuju iz analize. 'toga, sloenost ve%ine fenomena zahtjeva od
istraivaa prikupljanje opaanja na velikom broju razliitih varijabli. (udu%i da
podaci koji se koriste zahtijevaju istovremena mjerenja na vie razliitih varijabli,
takva se vrsta analize zove multivarijatna analiza )*+. )*+ moe se provoditi nad
svim vrstama podataka i skala.
,azliite multivarijatne metode mogu se klasificirati na nekoliko naina -ne postoji
jedinstvena klasifikacija.
/iljevi znanstvenog istraivanja ukljuuju0
1. ,edukciju podataka ili pojednostavnjenje strukture. $ojava koja se istrauje
predouje se to je mogu%e jednostavnije bez gubitka vanih informacija. #a
taj se nain nastoji posti%i jednostavnija interpretacija.
2. 3reivanja i grupiranje . $odaci se svrstavaju u grupe slinih objekata ili
varijabli na osnovi mjerenih karakteristika. +lternativno se mogu traiti
pravila za klasifikaciju objekata u dobro definirane grupe.
4. 5straivanje zavisnosti meu varijablama. Od interesa je priroda povezanosti
varijabli. Jesu li sve varijable meusobno nezavisne, ili jedna ili vie njih ovisi
o drugim varijablama. +ko da, na koji nain.
6. $redvianje. ,elacije meu varijablama odreuju se s ciljem predvianja
vrijednosti jedne ili vie varijabli na osnovi opaanja ostalih varijabli.
1
7. 8ormuliranje statistikih hipoteza i testiranje. &estiranje odreene statistike
hipoteze o parametrima multivarijatne populacije provodi se npr. zbog
potvrivanja9odbacivanja postavljenih pretpostavki.
$romatrat %emo nekoliko primjera koji %e posluiti za ilustraciju multivarijatnih
metoda.
$rimjer 1.1
#akon snane oluje 1. veljae 1:;:. u <erman (umpus!ovom laboratoriju na (ron
3niversit= na ,hode 5slandu prouavan je ve%i broj -nastradalih. umiru%ih vrabaca.
Oko polovica ptica je uginula, a (umpus je taj dogaaj tretirao kao priliku da ispita
moe li dati potporu >arinovoj teoriji prirodne selekcije. $roveo je : morfolokih
mjerenja na svakoj ptici, a takoer je izmjerio njihovu teinu. ,ezultati 7 mjerenja za
ptice enskog spola predoeni su u &abeli 1.1.
#a osnovi prikupljenih podataka (umpus je zakljuio da ptice koje su stradale, nisu
stradale sluajno, nego stoga jer su bile fiziki diskvalificirane, a da su one ptice koje
su preivjele, preivjele zato jer su imale odreene fizike karakteristike. $osebno je
utvrdio da su preivjele ptice bile kra%e, manje teke, te da su imale dulje kosti krila,
dulje noge, dulju prsnu kost i ve%i modani kapacitet od onih koje nisu preivjele.
&akoer je zakljuio da je proces selektivne eliminacije najjae povezan s
ekstremnom varijablom jedinke, bez obzira na smjer varijacije. "akljuio je da je
jednako opasno biti iznad odreenog standarda organske izvrsnosti, kao i ispod tog
standarda. &ime je reeno da se dogodila stabilizacija selekcije i da su jedinke s
mjerenjima blie prosjeku bolje preivjele od jedinki s mjerenjima daleko od
prosjeka.
3 doba dok je (umpus pisao svoj rad razvoj multivarijatnih metoda je bio na poetku.
1:;?. je 8rancis @alton predstavio koeficijent korelacije kao mjeru povezanosti meu
varijablama. &ek 7A godina kasnije <arold <otelling je opisao metodu provoenja
analize glavnih komponenata, koja se moe primijeniti na (umpusove podatke.
(umpus nije ak ni raunao standardne devijacije, no njegove su podatke ponovo
analizirali brojni autori i op%enito potvrdili njegove zakljuke.
2
Odaberu li se opisani podaci kao primjer za ilustraciju multivarijatnih metoda,
javljaju se slijede%a interesantna pitanja0
#a koji su nain povezana razliita mjerenjaB Je li npr velika vrijednost
jedne varijable povezana s velikom vrijednosti druge varijableB
Jesu li sredine varijabli preivjelih i uginulih jedinki sitatistiki
signifikantno razliiteB
5maju li preivjele i uginule jedinke slini iznos varijacije za pojedine
varijableB
+ko su distribucije varijabli za preivjele i uginule jedinke razliite, je li
mogu%e konstruirati neku funkciju tih varijabli koja razdvaja te dvije
grupeB 3 tom bi sluaju bilo dobro da ako se velike vrijednosti varijabli
veu uz preivjele, da se definira funkcija indeksa >arvinove prikladnosti
promatranih ptica.
&abela 1.1 )jerenja tijela enki
$&5/+ C1 C2 C4 C6 C7
1 17A 267 41,A 1:,7 2D,7
2 176 26D 4D,6 1?,; 1;,A
4 174 26D 41,D 1:,6 2D,A
6 174 24A 4D,; 1?,? 2D,2
7 177 264 41,7 1:,A 2D,4
A 1A4 26? 42,D 1;,D 2D,;
? 17? 24: 4D,; 1:,6 2D,2
: 177 24; 42,: 1:,A 21,2
; 1A6 26: 42,? 1;,1 21,1
1D 17: 24: 41,D 1:,: 22,D
11 17: 26D 41,4 1:,A 22,D
12 1AD 266 41,1 1:,A 2D,7
14 1A1 26A 42,4 1;,4 21,:
16 17? 267 42,D 1;,1 2D,D
17 17? 247 41,7 1:,1 1;,:
1A 17A 24? 4D,; 1:,D 2D,4
1? 17A 266 41,6 1:,7 21,A
1: 174 24: 4D,7 1:,2 2D,;
1; 174 24A 4D,4 1:,7 2D,1
2D 1A4 26A 42,7 1:,A 21,;
21 17; 24A 41,7 1:,D 21,7
22 177 26D 41,6 1:,D 2D,?
24 17A 26D 41,7 1:,2 2D,A
26 1AD 262 42,A 1:,: 21,?
27 172 242 4D,4 1?,2 1;,:
4
2A 1AD 27D 41,? 1:,: 22,7
2? 177 24? 41,D 1:,7 2D,D
2: 17? 267 42,2 1;,7 21,6
2; 1A7 267 44,1 1;,: 22,?
4D 174 241 4D,1 1?,4 1;,:
41 1A2 24; 4D,4 1:,D 24,1
42 1A2 264 41,A 1:,: 21,4
44 17; 267 41,: 1:,7 21,?
46 17; 26? 4D,; 1:,1 1;,D
47 177 264 4D,; 1:,7 21,4
4A 1A2 272 41,; 1;,1 22,2
4? 172 24D 4D,6 1?,4 1:,A
4: 17; 262 4D,: 1:,2 2D,7
4; 177 24: 41,2 1?,; 1;,4
6D 1A4 26; 44,6 1;,7 22,:
61 1A4 262 41,D 1:,1 2D,?
62 17A 24? 41,? 1:,2 2D,4
64 17; 24: 41,7 1:,6 2D,4
66 1A1 267 42,1 1;,1 2D,:
67 177 247 4D,? 1?,? 1;,A
6A 1A2 26? 41,; 1;,1 2D,6
6? 174 24? 4D,A 1:,A 2D,6
6: 1A2 267 42,7 1:,7 21,1
6; 1A6 26: 42,4 1:,: 2D,;
C1Eduljina tijela C2Eduljina krila C4Eduljina vrata i glave C6E duljina
humerusa -nadlaktina kost. C7Eduljina prsne kosti
$tice 1!21 su preivjele, a 22!6; su uginule. 5zvor podataka (umpus -1:;:. koji je
mjeranja izrazio u inima i milimetrima.
$rimjer 1.2. Fgipatske lubanje
Gao drugi primjer promatrat %emo podatke iz &abele 1.2 koji se odnose na mjerenja
napravljena na mukim lubanjama iz podruja &hebe u Fgiptu. >ano je 7 uzoraka od
4D lubanja koje potjeu iz ranog preddinastijskog perioda -oko 6DDD godina p.n.e..,
kasnog preddinastijskog perioda -oko 44DD godina p.n.e.., 12. i 14. dinastije -oko
1:7D gidina p.n.e.., $tolomejskog perioda -oko 2DD godina p.n.e.. i iz rimskog
perioda -oko 17D godine. #a svakoj je lubanji izvreno 6 mjerenja.
&+(FH+ 1.2.
Rani preddinastijski
period.
Kasni preddinastijski
period 12. i 13. dinastija Ptoloejski period Riski period
L!". #1 #2 #3 #$ #1 #2 #3 #$ #1 #2 #3 #$ #1 #2 #3 #$ #1 #2 #3 #$
1
13
1
13
% %& $& 12$
13
%
1'
1 $% 13(
1$
1 &) *2 13(
13
$
1'
( *$
13
(
12
3 &1 *'
2
12
*
13
1 &2 $% 133
13
$ &( $% 12&
13
3 &3 $( 1$1
12
% &* *3
13
)
13
1 &* $&
3
13
1
13
2 && *' 13%
13
$ &% $* 132
13
% %( $% 1$1
13
' %( $&
12
%
12
) &1 *(
$
11
&
13
2 &) $$ 1$%
12
&
1'
$ *1 13'
13
$
1'
) *' 13*
13
1 && *1
13
'
13
$ &2 *2
6
*
13
)
1$
3
1'
' *$ 12)
12
$ &* $* 13$
13
$ &) $* 133
12
' &1 $)
13
%
12
( %) $(
)
13
%
13
( %& *) 13*
13
) &% *2 1$'
13
3 &% *' 131
13
* &' *'
12
)
13
%
1'
1 *2
(
13
&
13
'
1'
% $% 132
1$
*
1'
' *$ 13%
13
% &* $( 1$'
13
( &$ )'
13
)
13
% &( *%
%
12
*
13
) &3 $% 133
13
'
1'
2 $% 13)
1$
* && ** 13&
13
' &' $%
12
)
12
) &2 $*
&
13
1
13
$
1'
2 *1 131
13
$ &) *' 13)
13
1 &2 $) 1$'
13
$ &' *1
13
2
13
2 && **
1'
13
$
13
$ && *1 133
12
* &$ $) 12)
13
) &* *) 13%
1$
'
1'
' *2
13
&
13
* &2 *$
11
12
&
13
% &* *' 133
13
)
1'
3 *3 13(
12
&
1'
' *3 132
13
3 &' *3
1$
3
12
' &* *1
12
13
$
12
1 &* *3 131
13
& &% *1 13(
13
& &( *' 13$
13
$ &( *$
1$
1
13
)
1'
1 *$
13
12
)
12
&
1'
& *1 131
13
) && *) 13)
12
)
1'
1 *' 13*
13
* && *'
13
*
13
* &* *)
1$
13
2
13
)
1'
' *' 13%
13
$ &% $& 13(
13
3 &' $& 133
13
) &* *2
13
(
13
$ &3 *3
1*
1$
1
1$
'
1'
' *1 13'
13
)
1'
$ *3 12&
1$
2
1'
$ $( 13)
13
' && **
1$
2
13
* &) *2
1)
13
1
13
$ &( *$ 131
12
% &% $* 13*
13
%
1'
2 ** 13$
13
( &3 *2
13
&
13
$ &* $(
1(
13
*
13
(
1'
3 *' 13%
12
&
1'
( *3 12&
13
* &2 *' 131
1$
1 && *$
13
%
12
* && *1
1%
13
2
13
3 &3 *3 123
13
1
1'
1 *1 13$
12
* &' )' 12&
13
* &* $(
13
(
13
* &) *$
1&
13
&
13
) &) *' 13'
12
&
1'
* $( 13%
13
$ &) *1 13)
12
% &3 *$
13
3
12
* &2 *'
2'
13
2
13
1
1'
1 $& 13$
13
' &3 *$ 13)
13
* &$ *3 131
12
* %% $%
1$
*
12
& %& $(
21
12
)
13
3
1'
2 *1 13(
13
)
1'
) $& 132
13
' &1 *2 13&
13
' &$ *3
13
%
13
) &2 $)
22
13
*
13
*
1'
3 $( 12)
13
1
1'
' $% 133
13
1
1'
' *' 1$$
12
$ %) *'
13
1
12
& &( $$
23
13
$
12
$ &3 *3 13*
13
) &( *2 13%
13
( &$ *1 1$1
13
1 &( *3
1$
3
12
) %% *$
2$
12
%
13
$
1'
3 *' 12&
12
) &1 *' 13'
12
( && $* 13'
13
1 &% *3
13
$
12
$ &1 **
2*
13
'
13
'
1'
$ $& 13$
13
&
1'
1 $& 13)
13
3 &1 $& 133
12
% &2 *1
13
2
12
( &( *2
2)
13
%
13
*
1'
' ** 131
13
$ &' *3 13$
12
3 &* *2 13%
12
) &( *$
13
(
12
* %* *(
2(
12
%
13
2 &3 *3 132
13
'
1'
$ *' 13)
13
(
1'
1 *$ 131
1$
2 &* *3
12
&
12
% %1 *2
2%
12
(
12
&
1'
) $% 13'
13
2 &3 *2 133
13
1 &) $& 13)
13
% &$ **
1$
'
13
*
1'
3 $%
2&
13
1
13
)
11
$ *$ 13*
13
2 &% *$ 13%
13
3
1'
' ** 132
13
) &2 *2
1$
(
12
& %( $%
3'
12
$
13
%
1'
1 $) 13'
12
%
1'
1 *1 13%
13
3 &1 $) 13*
13
'
1'
' *1
13
)
13
3 &( *1
3z ovaj se primjer name%u slijede%a pitanja0
o Gako su povezana ova etiri mjerenjaB
o $ostoje li signifikantne razlike sredinaB +ko postoje, moe li se zakljuiti da je
to posljedica promjena oblika i veliine lubanjeB
7
o $ostoje li signifikantne razlike standardnih devijacija promatranih varijabli
nad razliitim populacijamaB +ko postoje, moe li se zakljuiti da je to
posljedica postupne promjene tokom vremena u veliini varijacijaB
o )oe li se konstruirati funkcija ove etiri varijable koja opisuje promjene
tokom vremenaB
$ostavljena su pitanja slina pitanjima uz primjer 1.1.
Gao to %e se kasnije vidjeti postoji razlika meu promatranim uzorcima koja se
djelomino moe protumaiti kao vremenski trend. ,azlozi nastalih promjena nisu
poznati, a migracija drugih rasa u promatranu regiju mogla bi biti najznaajniji faktor.
$rimjer 1.4. >istribucija leptira
'tudija 1A kolonija leptira Fuphidr=as editha u Galiforniji i Oregonu rezultirala je
podacima u &abeli 1.4. 3 tabeli su etiri varijable okruenja -nadmorska visina,
godinja koliina oborina, minimalna i maksimalna temperatura. i est genetikih
varijabli -postoci za razliite $gi gene odreene tehnikom elektroforeze.. "a analizu
podataka iz ovog primjera nije nuno znati kako su odreene frekvencije gena, ve% je
dovoljno re%i da frekvencije gena opisuju u odreenoj mjeri genetiku distribuciju
leptira. 'lika 1.2 pokazuje geografske lokacije kolonija.
&abela 1.4.varijable okruenja i $hospoglucose!5somerase -$gi. genske frekvencije za
kolonije leptira Fuphidr=as editha u Galiforniji i Oregonu
Temperatura(
0
F)
Frekvencije u % Pgi mobilnosti
gena
Kolonij
a a a.p max min 0,4 0, 0,! " "," ",#0
$$ %00 4# &! "' 0 # ((
%
' "' "
$) !0! (0 &( #( 0 " (0
#
! "# "#
*$) %'0 (! &! ( 0 (! 4 "' #
A

+,- %%0 (! &! ( 0 4 "&


4
' (' #
+,. %%0 (! &! ( 0 " !
%
0 #%
$+ #!0 "% && (! 0 ( "&
4
4 #( #
-, &#0 (" && (! 0 0 "%
%
0 (' !
/0 %0 "0 "0" (' "0 (" 40
(
% 4 0
10 00 "0 "0" (' "4 ( #(
(
! 0 0
2P "%00 "& && (# 0 "
!
0 "( "
P3 "'%0 (( "0" (' " 4 #4
#
# ((
4- (000 %! "00 "! 0 ' "4

"# 0
5F (%00 #4 "0( " 0 & "%
4
' (" !
6F (000 (" "0% (0 # ' "'
#
( (' "4
7. '!%0 4( !4 % 0 % '
!
4 4 0
71 "0%00 %0 !" 8"( 0 # "
&
( 4 0
$itanja koja se mogu postaviti uz $rimjer 1.40
o Jesu li $gi frekvencije sline za kolonije koje su prostorno blizu jedna drugeB
o Jesu li uop%e i do koje mjere $gi frekvencije povezane s varijablama
okruenjaB
Ova su pitanja vana pri donoenju odluke o tome kako su odreene $gi frekvencije.
+ko je genetika kompozicija kolonija bila iroko odreena prolim i sadanjim
migracijama, frekvencije gena %e biti sline za kolonije koje nisu prostorno udaljene,
a takoer mogu biti slabo povezane s varijablama okruenja.
' druge strane, ako je neko okruenje najznaajnije to se mora uoiti iz relacija
povezanosti genskih frekvencija i varijabli okruenja -uz pretpostavku da su mjerene
prave varijable.. #o bliske kolonije %e imati sline genske frekvencije samo onda ako
imaju slina okruenja. Oito je da bliske kolonije obino imaju slina okruenja, pa
je teko do%i do istog zakljuka.
?
Pre+led !lti,arijatni- etoda
#avedeni primjeri su tipini materijal za multivarijatne statistike metode. 3 svim je
primjerima nekoliko varijabli od interesa i te varijable nisu meusobno nezavisne.
Anali.a +la,ni- koponenata /Prin0ipal 0oponent Anal1sis2P3A4
!je dizajnirana tako da se promatrani broj varijabli reducira na mali broj glavnih
komponenata, koje su linearne kombinacije polaznih varijabli. $rimjerice, velik dio
varijacija varijabli
* $ 3 2 1
5 5 5 5 X X X X X
kojima su mjerene tjelesne karakteristike
vrabaca povezane su s op%om veliinom ptica. "broj
* $ 3 2 1 1
X X X X X I + + + + =
sasvim dobro mjeri taj aspekt podataka.
>ruga je glavna komponenta0
* $ 3 2 1 1
X X X X X I + + =
izraena kao kontrast izmeu prva tri i posljednja dva mjerenja i ona odraava drugu
dimenziju mjerenja podataka. +naliza glavnih komponenata omogu%ava objektivni
nain pronalaenja ovog tipa pokazatelja kojima se varijacije podataka mogu opisati
to je mogu%e konciznije.
)oe se pokazati da dvije ili tri glavne komponente dobro opisuju sve originalne
varijable. ,azmatranje vrijednosti glavnih komponenata umjesto vrijednosti
originalnih varijabli omogu%ava jednostavnije razumijevanje podataka. 3kratko,
analiza glavnih komponenata je postupak pojednostavnjenja podataka kroz smanjenje
broja varijabli.
6aktorska anali.a /6a0tor Anal1sis26A45
'lino kao i analiza glavnih komponenata, faktorska analiza je statistika metoda
primjenjena na skup varijabli s ciljem da se otkrije koje varijable iz polaznog skupa
ine koherentne podskupove, koji su meusobno relativno neovisni. )eusobno
:
korelirane varijable, ali neovisne o varijablama iz drugih podskupova kombiniraju se
u faktore.
$retpostavlja se da se svaka originalna varijabla moe izraziti kao linearna
kombinacija faktora i sluajnog lana. #pr dvofaktorski model za podatke iz primjera
1.1 -vrapci.0
* 2 *2 1 *1 *
$ 2 $2 1 $1 $
3 2 32 1 31 3
2 2 22 1 21 2
1 2 12 1 11 1
e F a F a X
e F a F a X
e F a F a X
e F a F a X
e F a F a X
+ + =
+ + =
+ + =
+ + =
+ + =
$ri emu su
{ } 2 5 1 7 * 5 5 2 5 1 5 = = j i a
ij

konstante,
2 1
5 F F
su faktori, a
{ } * 5 2 5 1 5 = i e
i
su sluajne varijable koje izraavaju varijacije od
i
X
neovisne o
varijacijama drugih polaznih varijabli. 3 promatranom primjeru
1
F
moe biti faktor
veliine. 3 tom su sluaju svi koeficijenti
{ } * 5 5 2 5 1 5
1
= i a
i
pozitivni, to je
posljedica injenice da su neke ptice velike, a neke male u svim tjelesnim mjerenjima.
>rugi faktor
2
F
moe biti mjera nekog aspekta oblika ptice, s nekim pozitivnim i
nekim negativnim koeficijentima. 3 sluaju da se ovaj dvofaktorski model dobro
prilagoava podacima, on %e omogu%iti relativno jednostavni opis povezanosti izmeu
pet promatranih tjelesnih mjerenja.
Jedan tip faktorske analize uzima kao faktore prvih nekoliko glavnih komponenata.
$olazni se faktori zatim modificiraju posebnim procesom transformacije koji se zove
rotacija faktora. ,otacija faktora provodi se zbog jednostavnije interpretacije.
$rovode se i druge metode za pronalaenje poetnih faktora. ,otacija na jednostavnije
faktore se gotovo uvijek provodi.
8iskriina0ijska anali.a /8is0riinant Anal1sis28A4

>iskriminacijska analiza je metoda koja omogu%ava da se utvrdi koje varijable prave
razliku izmeu dviju ili vie prirodno formiranih grupa entiteta -objekata.. 3ilj
anali.e je da se definira anji "roj 99no,i-99 ,arija"li, koje bi opisale razlike meu
grupama. &e se nove varijable nazivaju diskriina0ijski ,arija"laa.
8iskriina0ijske ,arija"le dobivaju se kao linearne ko"ina0ije ori+inalni-
;
,arija"li, uz uvjet da te varijable aksialno ra.d,ajaj! +r!pe. Interpreta0ija
diskriina0ijski- ,arija"li temelji se na odnos! -korelaciji. orginalnih i
diskriminacijskih varijabli, tj. atri0i str!kt!re.
Zada:a diskriina0ijske anali.e
Odreivanje varijabli na temelju kojih istraiva moe izvriti diskriminaciju
izmeu razliitih -prirodno formiranih. grupa i
Glasificiranje entiteta -objekata. u razliite grupe s ve%om tono%u nego to
je sluajna -nasumice. klasifikacija.
>iskriminacijska se analiza moe primijeniti na podatke iz $rimjera 1.1 , da se utvrdi
kako se dobro mogu razdvojiti preivjele i uginule jedinke ptica polaze%i od njihovih
tjelesnih mjerenja. 'lino, u $rimjeru 1.2 moe se primjenom diskriminacijske analize
grupirati lubanje iz razliitih epoha u razliite grupe na osnovi veliine izvrenih
mjerenja
Klaster anali.a /3l!ster Anal1sis4
Klaster analiza je post!pak prepo.na,anja +r!pa ili klasa sli;ni-
eleenata, tj. ra.,rsta,anje odre<eno+ "roja entiteta ! +r!pe5 e<!so"no
sli;ni- karakteristika.
Klaster analiza je .ajedni;ki na.i, .a sk!p ra.li;iti- klasi=ika0ijski-
post!paka, koji se ne teelje na nekim odreenim statisti;ki testo,ia.
"a razliku od drugih statistikih metoda, klaster analiza se naje%e koristi u
sluajevima kada jo> neao !naprijed /tj. u eksplorati,no dijel!
istra?i,anja4 de=inirane statisti;ke -ipote.e /t,rdnje4 koje elimo testirati.
'tatistiki testovi se ne koriste u klaster analizi.
#ema smisla provoditi klaster analizu nad podacima iz primjera 1.1 i 1.2 jer su grupe
-preivjele9uginule jedinke., odnosno epohe ve% poznate.
3 primjeru 1.4 mogle bi se kolonije leptira grupirati s obzirom na varijable okruenja
ili s obzirom na $gi frekvencije.
1D
Kanoni;ka korela0ijska anali.a /3anoni0al 3orrelation Anal1sis4
Ganonika korelacijska analiza je logino proirenje multiple regresijske analize.
)odel viestruke regresije ukljuuje jednu zavisnu metriku varijablu i nekoliko
nezavisnih metrikih varijabli. /ilj kanonike analize je simultano korelirati vie
zavisnih metrikih varijabli i vie nezavisnih metrikih varijabli. "a razliku od
regresijske analize koja je ukljuivala samo jednu metriku zavisnu varijablu,
kanonika korelacija ukljuuje vie zavisnih metrikih varijabli. /ilj analize je
napraviti linearnu kombinaciju za svaki skup varijabli -zavisnih i nezavisnih. s
namjerom da se maksimiziraju korelacije izmeu skupa zavisnih i skupa nezavisnih
varijabli.
3 primjeru 1.4 prve etiri varijable su varijable okruenja, a preostalih est varijabli
odraava genetiku distribuciju razliitih kolonija Fuphidr=as editha. $ronalaenje
relacije -ako uop%e postoji. izmeu ove dvije grupe varijabli je od znaajnog
biolokog interesa.
M!lti,arijatna noralna distri"!0ija
)ultivarijatna normalna distribucija zauzima centralno mjesto u multivarijatnoj
statistikoj analizi. )noge metode polaze od pretpostavke da analizirani podaci imaju
multivarijatnu normalnu distribuciju.
Iesto se pretpostavlja da su podaci normalno distribuirani, osim ako postoji razlog
zbog kojeg se vjeruje da to nije istina.
11
k!dimenzionalna -vektorska. sluajna varijabla #0
4 5 5 5 /
2 1 k
X X X X =
Reali.a0ija k!dimenzionalne sluajne varijable C0
4 5 5 5 /
2 1 k
x x x x =
Zajedni;ka k!!lati,na =!nk0ija distri"!0ije ,jerojatnosti k!dimenzionalne
sluajne varijable C0
{ }
k k k
x X x X x X P x x x F = 5 5 5 4 5 5 5 /
2 2 1 1 2 1

"ajednika funkcija gusto%e vjerojatnosti 0
4 / 4 /
2
1
2
1
2
2 1
1
4 2 /
1
4 5 5 5 /


=
x x
k k
e x x x f

je oznaka za vector sredina komponentnih varijabli


i
X
0
( )

=
k i

2 1
je matrica varijanci i kovarijanci.
12

You might also like