Professional Documents
Culture Documents
Mva Uvod
Mva Uvod
"# 0
5F (%00 #4 "0( " 0 & "%
4
' (" !
6F (000 (" "0% (0 # ' "'
#
( (' "4
7. '!%0 4( !4 % 0 % '
!
4 4 0
71 "0%00 %0 !" 8"( 0 # "
&
( 4 0
$itanja koja se mogu postaviti uz $rimjer 1.40
o Jesu li $gi frekvencije sline za kolonije koje su prostorno blizu jedna drugeB
o Jesu li uop%e i do koje mjere $gi frekvencije povezane s varijablama
okruenjaB
Ova su pitanja vana pri donoenju odluke o tome kako su odreene $gi frekvencije.
+ko je genetika kompozicija kolonija bila iroko odreena prolim i sadanjim
migracijama, frekvencije gena %e biti sline za kolonije koje nisu prostorno udaljene,
a takoer mogu biti slabo povezane s varijablama okruenja.
' druge strane, ako je neko okruenje najznaajnije to se mora uoiti iz relacija
povezanosti genskih frekvencija i varijabli okruenja -uz pretpostavku da su mjerene
prave varijable.. #o bliske kolonije %e imati sline genske frekvencije samo onda ako
imaju slina okruenja. Oito je da bliske kolonije obino imaju slina okruenja, pa
je teko do%i do istog zakljuka.
?
Pre+led !lti,arijatni- etoda
#avedeni primjeri su tipini materijal za multivarijatne statistike metode. 3 svim je
primjerima nekoliko varijabli od interesa i te varijable nisu meusobno nezavisne.
Anali.a +la,ni- koponenata /Prin0ipal 0oponent Anal1sis2P3A4
!je dizajnirana tako da se promatrani broj varijabli reducira na mali broj glavnih
komponenata, koje su linearne kombinacije polaznih varijabli. $rimjerice, velik dio
varijacija varijabli
* $ 3 2 1
5 5 5 5 X X X X X
kojima su mjerene tjelesne karakteristike
vrabaca povezane su s op%om veliinom ptica. "broj
* $ 3 2 1 1
X X X X X I + + + + =
sasvim dobro mjeri taj aspekt podataka.
>ruga je glavna komponenta0
* $ 3 2 1 1
X X X X X I + + =
izraena kao kontrast izmeu prva tri i posljednja dva mjerenja i ona odraava drugu
dimenziju mjerenja podataka. +naliza glavnih komponenata omogu%ava objektivni
nain pronalaenja ovog tipa pokazatelja kojima se varijacije podataka mogu opisati
to je mogu%e konciznije.
)oe se pokazati da dvije ili tri glavne komponente dobro opisuju sve originalne
varijable. ,azmatranje vrijednosti glavnih komponenata umjesto vrijednosti
originalnih varijabli omogu%ava jednostavnije razumijevanje podataka. 3kratko,
analiza glavnih komponenata je postupak pojednostavnjenja podataka kroz smanjenje
broja varijabli.
6aktorska anali.a /6a0tor Anal1sis26A45
'lino kao i analiza glavnih komponenata, faktorska analiza je statistika metoda
primjenjena na skup varijabli s ciljem da se otkrije koje varijable iz polaznog skupa
ine koherentne podskupove, koji su meusobno relativno neovisni. )eusobno
:
korelirane varijable, ali neovisne o varijablama iz drugih podskupova kombiniraju se
u faktore.
$retpostavlja se da se svaka originalna varijabla moe izraziti kao linearna
kombinacija faktora i sluajnog lana. #pr dvofaktorski model za podatke iz primjera
1.1 -vrapci.0
* 2 *2 1 *1 *
$ 2 $2 1 $1 $
3 2 32 1 31 3
2 2 22 1 21 2
1 2 12 1 11 1
e F a F a X
e F a F a X
e F a F a X
e F a F a X
e F a F a X
+ + =
+ + =
+ + =
+ + =
+ + =
$ri emu su
{ } 2 5 1 7 * 5 5 2 5 1 5 = = j i a
ij
konstante,
2 1
5 F F
su faktori, a
{ } * 5 2 5 1 5 = i e
i
su sluajne varijable koje izraavaju varijacije od
i
X
neovisne o
varijacijama drugih polaznih varijabli. 3 promatranom primjeru
1
F
moe biti faktor
veliine. 3 tom su sluaju svi koeficijenti
{ } * 5 5 2 5 1 5
1
= i a
i
pozitivni, to je
posljedica injenice da su neke ptice velike, a neke male u svim tjelesnim mjerenjima.
>rugi faktor
2
F
moe biti mjera nekog aspekta oblika ptice, s nekim pozitivnim i
nekim negativnim koeficijentima. 3 sluaju da se ovaj dvofaktorski model dobro
prilagoava podacima, on %e omogu%iti relativno jednostavni opis povezanosti izmeu
pet promatranih tjelesnih mjerenja.
Jedan tip faktorske analize uzima kao faktore prvih nekoliko glavnih komponenata.
$olazni se faktori zatim modificiraju posebnim procesom transformacije koji se zove
rotacija faktora. ,otacija faktora provodi se zbog jednostavnije interpretacije.
$rovode se i druge metode za pronalaenje poetnih faktora. ,otacija na jednostavnije
faktore se gotovo uvijek provodi.
8iskriina0ijska anali.a /8is0riinant Anal1sis28A4
>iskriminacijska analiza je metoda koja omogu%ava da se utvrdi koje varijable prave
razliku izmeu dviju ili vie prirodno formiranih grupa entiteta -objekata.. 3ilj
anali.e je da se definira anji "roj 99no,i-99 ,arija"li, koje bi opisale razlike meu
grupama. &e se nove varijable nazivaju diskriina0ijski ,arija"laa.
8iskriina0ijske ,arija"le dobivaju se kao linearne ko"ina0ije ori+inalni-
;
,arija"li, uz uvjet da te varijable aksialno ra.d,ajaj! +r!pe. Interpreta0ija
diskriina0ijski- ,arija"li temelji se na odnos! -korelaciji. orginalnih i
diskriminacijskih varijabli, tj. atri0i str!kt!re.
Zada:a diskriina0ijske anali.e
Odreivanje varijabli na temelju kojih istraiva moe izvriti diskriminaciju
izmeu razliitih -prirodno formiranih. grupa i
Glasificiranje entiteta -objekata. u razliite grupe s ve%om tono%u nego to
je sluajna -nasumice. klasifikacija.
>iskriminacijska se analiza moe primijeniti na podatke iz $rimjera 1.1 , da se utvrdi
kako se dobro mogu razdvojiti preivjele i uginule jedinke ptica polaze%i od njihovih
tjelesnih mjerenja. 'lino, u $rimjeru 1.2 moe se primjenom diskriminacijske analize
grupirati lubanje iz razliitih epoha u razliite grupe na osnovi veliine izvrenih
mjerenja
Klaster anali.a /3l!ster Anal1sis4
Klaster analiza je post!pak prepo.na,anja +r!pa ili klasa sli;ni-
eleenata, tj. ra.,rsta,anje odre<eno+ "roja entiteta ! +r!pe5 e<!so"no
sli;ni- karakteristika.
Klaster analiza je .ajedni;ki na.i, .a sk!p ra.li;iti- klasi=ika0ijski-
post!paka, koji se ne teelje na nekim odreenim statisti;ki testo,ia.
"a razliku od drugih statistikih metoda, klaster analiza se naje%e koristi u
sluajevima kada jo> neao !naprijed /tj. u eksplorati,no dijel!
istra?i,anja4 de=inirane statisti;ke -ipote.e /t,rdnje4 koje elimo testirati.
'tatistiki testovi se ne koriste u klaster analizi.
#ema smisla provoditi klaster analizu nad podacima iz primjera 1.1 i 1.2 jer su grupe
-preivjele9uginule jedinke., odnosno epohe ve% poznate.
3 primjeru 1.4 mogle bi se kolonije leptira grupirati s obzirom na varijable okruenja
ili s obzirom na $gi frekvencije.
1D
Kanoni;ka korela0ijska anali.a /3anoni0al 3orrelation Anal1sis4
Ganonika korelacijska analiza je logino proirenje multiple regresijske analize.
)odel viestruke regresije ukljuuje jednu zavisnu metriku varijablu i nekoliko
nezavisnih metrikih varijabli. /ilj kanonike analize je simultano korelirati vie
zavisnih metrikih varijabli i vie nezavisnih metrikih varijabli. "a razliku od
regresijske analize koja je ukljuivala samo jednu metriku zavisnu varijablu,
kanonika korelacija ukljuuje vie zavisnih metrikih varijabli. /ilj analize je
napraviti linearnu kombinaciju za svaki skup varijabli -zavisnih i nezavisnih. s
namjerom da se maksimiziraju korelacije izmeu skupa zavisnih i skupa nezavisnih
varijabli.
3 primjeru 1.4 prve etiri varijable su varijable okruenja, a preostalih est varijabli
odraava genetiku distribuciju razliitih kolonija Fuphidr=as editha. $ronalaenje
relacije -ako uop%e postoji. izmeu ove dvije grupe varijabli je od znaajnog
biolokog interesa.
M!lti,arijatna noralna distri"!0ija
)ultivarijatna normalna distribucija zauzima centralno mjesto u multivarijatnoj
statistikoj analizi. )noge metode polaze od pretpostavke da analizirani podaci imaju
multivarijatnu normalnu distribuciju.
Iesto se pretpostavlja da su podaci normalno distribuirani, osim ako postoji razlog
zbog kojeg se vjeruje da to nije istina.
11
k!dimenzionalna -vektorska. sluajna varijabla #0
4 5 5 5 /
2 1 k
X X X X =
Reali.a0ija k!dimenzionalne sluajne varijable C0
4 5 5 5 /
2 1 k
x x x x =
Zajedni;ka k!!lati,na =!nk0ija distri"!0ije ,jerojatnosti k!dimenzionalne
sluajne varijable C0
{ }
k k k
x X x X x X P x x x F = 5 5 5 4 5 5 5 /
2 2 1 1 2 1
"ajednika funkcija gusto%e vjerojatnosti 0
4 / 4 /
2
1
2
1
2
2 1
1
4 2 /
1
4 5 5 5 /
=
x x
k k
e x x x f
=
k i
2 1
je matrica varijanci i kovarijanci.
12