You are on page 1of 23

M.

Pahor: Multivariatna analiza

Vaje 1, sreda, 6.11.2008

Uvod v SPSS
SPSS je kratica za Statistical package for Social Sciences. Zadnja verzija je 16.0. Delovno okolje v SPSS-u je sestavljeno iz ve oken: okna s podatki (data editor), okna z rezultati (output) in sintakse. Hkrati imate lahko odprtih po ve oken vsakega tipa, privzeta je vedno zadnja odprta.1 Okno s podatki ima dva pogleda pogled na podatke (data view) in pogled na spremenljivke (variable view). Pogled na spremenljivke podaja opis spremenljivk: ime, tip (numerina, opisna,), oznako (label) spremenljivke, oznako vrednosti, manjkajoe vrednosti in format zapisa. Do vkljuno verzije 12 je veljalo, da imajo imena spremenljivk lahko najve osem znakov, od verzije 13 pa so lahko imena tudi dalja. e vedno pa velja, da se imena spremenljivk ne morejo zaeti s tevilko (eprav lahko vsebujejo tevilke), omejeni pa smo tudi pri uporabi posebnih znakov (dovoljeni so le _, $ in od verzije 13 dalje tudi @). umnike lahko uporabljate, jih pa ne priporoam. Vaja: Ustvari dve novi spremenljivki, tevilsko in opisno. Dolo i, naj 999 pomeni manjkajo o vrednost.

Branje in izvoz podatkov


SPSS bere podatke v razlinih formatih. Najpogosteja formata, s katerima se boste verjetno sreali sta delimited text in Excelov format. S tabulatorji ali podpiji loen tekst je verjetno najpogosteji format za prenos podatkov med razlinimi programi in sistemi. Tekst uvozite z izbiro File | Open | Data in kot tip podatkov izberete tekst. Niz menijev vas vodi skozi proces uvoza podatkov. Uvoz iz Excelove datoteke (*.xls) poteka podobno. Noveje verzije SPSS-a berejo podatke iz vseh verzij Excela, stareje so brale le do verzije 4.0 ali stareje. Izvoz podatkov poteka na podoben nain kot uvoz, izberete File | Save as in izberete elen tip zapisa. Izmenjave podatkov med SPSS-om in drugimi programi, npr. Excelom, lahko potekajo tudi prek sistema kopiraj-prilepi. Vaja: Uvozi podatke iz datoteke formata delimited text (data.txt) in iz excelove datoteke (data.xls).

Verzije SPSS-a do vklju no verzije 13 imajo lahko odprtih ve

oken z rezultati in sintakso, a le eno s

podatki.

1 / 23

M. Pahor: Multivariatna analiza

Vaje 1, sreda, 6.11.2008

Koristne nastavitve v SPSS-u in okno Syntax


Do sistemskih nastavitev SPSS-a pridemo z izbiro Edit | Options. Tu najdemo kar nekaj listov, najpomembneja sta General in Viewer. Na listu General nastavimo npr. dnevnik (journal), ki sledi vsem naim ukazom. V listu Viewer nastavljamo prikaz rezultatov. Sintakso uporabljamo za vpisovanje ukazov v programskem jeziku SPSS. V ve ini primerov je to hitreji in u inkoviteji na in dela od dela prek menijev. Sintakse se najla e nau imo tako, da jo najprej prilepimo iz menijev in jo nato popravljamo. Prilepimo jo lahko tudi iz dnevnika ali iz izpisa, e se nam tam izpisuje. Vodnik po sintaksi nam je v pomo pri pisanju ukazov.

Vaja: Prilepi ukaz iz dnevnika v okno s sintakso.

Opisne mere
Opisne mere za spremenljivke lahko dobimo s pomo jo dveh procedur, vgrajenih v SPSS. Prvo dobimo z izbiro Analyze | Descriptive statistics | Desriptives. Vendar te procedure ne bomo podrobno obravnavali, saj so v drugih zajete skoraj vse funkcije te procedure.2 Frequencies je druga procedura za izra un opisnih mer. Dobimo jo s pomo jo izbire Analyze | Descriptive statistics | Frequencies.. Odpre se naslednje pogovorno okno3:

V levem okvirju je seznam spremenljivk. S pomo jo osrednje pu ice jih premaknemo v desni okvir, kjer se nahajajo spremenljivke, ki so izbrane za analizo. V osnovnem oknu dolo ite tudi,

Edinstvena funkcija te procedure je le, da preprosto standardizira spremenljivke, kar je v dolo enih Vse slike pogovornih oken so vzete iz SPSS 14. e uporabljate zgodnejo verzijo programa so mo ne

primerih koristno.
3

manje razlike v videzu ali tevilu izbir.

2 / 23

M. Pahor: Multivariatna analiza

Vaje 1, sreda, 6.11.2008

ali naj se izpie tabela frekven ne porazdelitve (vse vrednosti spremenljivke in ustrezne frekvence). To je smiselno le za spremenljivke z relativno malo vrednostmi (npr. do 20 razli nih vrednosti). Izbira Format... vam prika e okno, v katerem dolo ite format izpisa. Gumb Charts... vam da mo nost izrisa grafikonov. Izbirate lahko med primerjavo) vriemo rtnimi grafikoni in torticami (oboje za absolutne in relativne frekvence) ter histogram, v katerega lahko (za vizuelno rto normalne porazdelitve (z isto aritmeti no sredino in standardnim odklonom; to je smiselno le za intervalne ali razmernostne spremenljivke!!!!). V statisti ne namene se najpogosteje uporabljajo histogrami. Izbira Statistics... vam da naslednji podmeni:

e so podatki razvreni v skupine in predstavljeni s sredino skupine, morate za pravilen izraun nekaterih parametrov izbrati Values are group midpoints Poleg te izbire so v meniju tirje okvirji. Percentiles (centili) so vrednosti spremenljivke, ki razvrstijo urejene podatke v dve skupini, doloen odstotek pod to vrednostjo in preostanek nad to vrednostjo. Kvartili (25., 50. in 75. centil) razvrstijo podatke v tiri enake skupine. Doloite lahko tudi drugano tevilo enako velikih skupin, ali pa posamezne kvantile. Izraunate lahko tiri razline mere centralnosti aritmetino sredino (mean), mediano (ki je 50. centil) in modus (ki je v primeru zvezne spremenljivke dokaj neuporaben). Sum nam da

vsoto vrednosti spremenljivke.


Okvir Dispersion ponija poleg treh mer razprenosti e najvejo in najmanjo vrednost ter standardno napako ocene aritmetine sredine. Variacijski razmik (Range) je razlika med najvejo in najmanjo vrednostjo, varianca je povpreen kvadratni odklon opazovanja od ocenjene aritmetine sredine, standardni odklon (Standard deviation) pa je pozitiven

3 / 23

M. Pahor: Multivariatna analiza

Vaje 1, sreda, 6.11.2008

kvadratni koren variance. Standardna napaka ocene aritmetine sredine (Standard error of the mean) je izraunana kot V okvirju Distribution najdemo dve meri, ki opisujejo porazdelitev. Obe primerjata dano porazdelitev z normalno. Skewness je mera asimetrije. Simetrina distribucija ima vrednost 0, pozitivna vrednost kae asimetrijo v desno in negativna asimetrijo v levo. Kaj je kritina vrednost je stvar okusa, veje od 1 je ponavadi precej asimetrino. Kurtosis je mera sploenosti. Normalna porazdelitev ima vrednost 0, pozitivno je bolj sploeno, negativno pa manj. Kritina vrednost je nekje okrog 3. Vaja: Izraunaj kvartile, mere centralnosti, mere variabilnosti in mere porazdelitve za dve spremenljivki iz baze. Nekaj opisnih mer je mogo e dobiti v okviru ve ine SPSS-ovih procedur. Obi ajno jih pregledamo zato, da preverimo, ali podatki v grobem ustrezajo pri akovanjem.

Grupiranje in izra unavanje vrednosti


Vasih moramo vrednosti spremenljivke razvrstiti v manj vrednosti, spremeniti negativne vrednosti v ni, nadomestiti manjkajoe vrednosti, itd. To naredimo s pomojo izbire Transform | Recode | Into different variables. Pri tem dobimo naslednji meni

4 / 23

M. Pahor: Multivariatna analiza

Vaje 1, sreda, 6.11.2008

Izberemo spremenljivko, ki jo elimo grupirati ali ji spremeniti vrednosti, poimenujemo novo spremenljivko in kliknemo Change. Pravila za spremembo opredelimo z izbiro Old and New Values...; pri emer dobimo naslednji meni:

Na levi strani izberemo vrednosti, ki jih elimo spremeniti, na desni strani pa opredelimo nove vrednosti. Pravilo dodamo z gumbom Add. Ko konano, kliknemo gumb Continue. Vaja: Prekodiraj vrednosti spremenljivke v tiri enako velike skupine. Izraunaj opisne statistike za grupirano spremenljivko. Nove spremenljivke lahko izraunamo z izbiro Transform |Compute... Poimenujemo ciljno spremenljivko ter vnesemo matematini izraz v okvir na desni.

5 / 23

M. Pahor: Multivariatna analiza

Vaje 1, sreda, 6.11.2008

Vaja: Izraunaj celotno stopnjo nezaposlenosti. Predpostavljaj, da je dele mokih in ensk v aktivnem prebivalstvu 50%.

6 / 23

M. Pahor: Multivariatna analiza

Vaje 1, sreda, 6.11.2008

Preizkuanje domnev
Pri preizkuanju domnev imamo opravka z dvema izkljuujoima domnevama: nielno domnevo H0 in alternativno domnevo H1. Obiajno damo v alternativno domnevo to, kar nas zanima oz. kar elimo dokazati, v nielno domnevo pa ostalo (trenutno stanje). Po uporabi ustreznega preizkusnega izraza dobimo neko stopnjo znailnosti, ki je v grobem verjetnost za napako prve vrste. e je ta manja od neke izbrane mejne vrednosti (obiajno 5%, lahko tudi ve ali manj, odvisno od okoliin) zavrnemo nielno domnevo in sprejmemo alternativno. e je pa ta verjetnost veja od doloene mejne vrednosti, preprosto ne zavrnemo nielne domneve, ne sprejemamo pa niesar (v tem primeru v bistvu ne vemo niesar, ker ne poznamo verjetnosti za napako druge vrste). Domneve so lahko enostranske ali dvostranske. e v SPSS-u ni eksplicitno podano, da gre za enostransko domnevo, potem je stopnja znailnosti veinoma izraunana tako, kot bi lo za dvostransko domnevo, obstajajo pa tudi izjeme. Stopnjo znailnost pri enostranski domnevi dobimo preprosto tako, da stopnjo znailnosti dvostranskega preizkusa delimo z dva. e imamo teorijo o tem, na kateri strani porazdelitve bi morala biti znailnost, podamo enostransko domnevo, e pa smo v dvomih, podamo dvostransko domnevo.

Preizkus domneve o eni aritmetini sredini


Pri vseh teh preizkusih je vpraljivo, ali so smiselni za take podatke (razmislite o tem) Pri preizkusu o eni aritmetini sredini gre za to, da ima neko domnevo o tem, koliko bi morala biti aritmetina sredina in preizkua, ali je res toliko Domneve H0: =0 ; H1: 0 Primer: Domnevamo, da teje povpreno gospodinjstvo 4 lane. Preizkusimo to na naem vzorcu. Stopnja znailnosti je nad 0,5, razlike niso znailne. To pomeni, da ni razloga za trditev, da je tevilo lanov gospodinjstva v populaciji razlino od 4. Izberemo Analyze | Compare means | One sample t-test

7 / 23

M. Pahor: Multivariatna analiza

Vaje 1, sreda, 6.11.2008

Primer: Ali je povpreen GDPpc manji od 7500$ H0: GDPpc=6500 ; H1: GDPpc< 7500 Preizkus je pokazal znailne razlike pri =0,05 (enostranski preizkus)

T-TEST /TESTVAL = 7500 /MISSING = ANALYSIS /VARIABLES = gdppc /CRITERIA = CI(.95) .

T-Test

Preizkus domneve o razliki med aritmetinima sredinama za odvisne vzorce (preizkus dvojic)
Potrebno je najprej definirati, kaj pomeni odvisni vzorec. To pomeni, da gre za iste enote, pri katerih merimo isto stvar v dveh razlinih situacijah. Tipien primer odvisnega vzorca je kaka panelna raziskava. Domneve H0: d=0 ; H1: d0 Preizkus dvojic je lahko zanimiv in koristen, njegova uporaba je velikokrat vpraljiv Izberemo Analyze | Compare means | Paired samples t-test

8 / 23

M. Pahor: Multivariatna analiza

Vaje 1, sreda, 6.11.2008

Primer: Ali se stopnja brezposelnosti med mokimi in enskami razlikuje Preizkus je pokazal znailne razlike

T-TEST PAIRS = unempl_m WITH unempl_f (PAIRED) /CRITERIA = CI(.95) /MISSING = ANALYSIS.

9 / 23

M. Pahor: Multivariatna analiza

Vaje 1, sreda, 6.11.2008

Preizkus domneve o razliki med aritmetinima sredinama za neodvisne vzorce (preizkus skupin)
preizkuamo razliko med dvema skupinama skupini tvori druga spremenljivka; enote lahko razdelimo po emerkoli Ta preizkus lahko tudi uporabimo, e elimo prouiti razliko med variancama za dva vzorca Domneve H0: 1=2 ; H1: 12 Izberemo Analyze | Compare means | Indipendent samples t-test

Primer: dve skupini oblikujemo glede na GDPpc revne in premone drave; preizkuamo domnevo, da se stopnja rasti med tema skupinama drav razlikuje F test ne pokae znailnih razlik ne moremo domnevati, da se varianca med skupinama razlikuje Preizkus je pokazal znailne razlike, prebivalstvo raste razlino hitro v razlino premonih dravah

T-TEST GROUPS = gdppc(2000) /MISSING = ANALYSIS /VARIABLES = agr95_00 /CRITERIA = CI(.95) .

T-Test
10 / 23

M. Pahor: Multivariatna analiza

Vaje 1, sreda, 6.11.2008

ANALIZA VARIANCE
Analiza variance je namenjena preizkuanju razlik med aritmetinimi sredinami za ve neodvisnih vzorcev skupin. S tega vidika je sorodno t.i. preizkusu skupin oz. pomeni njegovo raziritev. Ime analiza variance izhaja iz tega, da primerjamo varianco med skupinami in varianco znotraj skupin. Pri analizi variance imamo obiajno opravka z dvema spremenljivkama: odvisno spremenljivko, ki jo prouujemo in neodvisno spremenljivko. Ta se v analizi variance imenuje faktor4 in nam populacijo (oz. vzorec) razdeli v ve skupin.. V osnovi testiramo naslednjo domnevo za odvisno spremenljivko:

Ime faktor se uporablja tudi v nekaterih drugih naprednih statisti nih modelih (logisti na regresija,

posploeni linearni modeli). S tem imenom vedno ozna ujemo neodvisno nominalno spremenljivko.

11 / 23

M. Pahor: Multivariatna analiza

Vaje 1, sreda, 6.11.2008

K je tevilo skupin, ki jih doloa faktor. Ta spremenljivka mora torej biti diskretna in imeti konno tevilo vrednosti. Za uspeno izvedbo analizo variance morajo biti izpolnjene predpostavke, na katerih metoda temelji. Te predpostavke so: 1. Predpostavka o normalnosti predpostavljamo, da se mora spremenljivka porazdeljevati normalno v celoti in znotraj vsake posamezne skupine. e je tevilo enot dovolj veliko, veljajo sklepi, bazirani na podlagi predpostavke o normalnosti, tudi e se spremenljivke ne porazdeljujejo normalno. Kljub temu je tudi pri velikih vzorcih normalna porazdelitev zaelena. e porazdelitev znotraj skupin ni normalna, je pa med skupinami priblino enaka, so sklepi na podlagi predpostavke o normalnosti e vedno pravilni 2. Predpostavka o enakosti varianc Predpostavka pravi, da je varianca v vseh skupinah enaka enakost varianc preizkuamo z Levenovim preizkusom o enakosti varianc predpostavka je lahko krena, e imamo enako velike skupine, posebej e, e imamo opravka z velikimi vzorci 3. Predpostavka o neodvisnosti domnevamo, da znotraj skupin ni odvisnosti predpostavka se uporablja le pri (kronoloko) zaporednih podatkih predpostavko prouujemo s koeficientom avtokorelacije

OSNOVNI PREIZKUS PRI ANALIZI VARIANCE

V osnovi preizkuamo e zapisano domnevo

To naredimo F preizkusom in sicer s pomojo naslednje tabele

12 / 23

M. Pahor: Multivariatna analiza

Vaje 1, sreda, 6.11.2008

Vir variiranja Med skupinami Znotraj skupin Skupaj

Vsota odklonov

kvadratov Stopinje prostosti K-1

Ocena variance Preizkus

Nk

N-1

Izberemo Analyze | Compare means | One-way ANOVA.

APRIORNA ANALIZA ANALIZA S KONTRASTI


Pri kontrastih primerjamo razmerje med dvema ali ve aritmetinimi sredinami posameznih skupin. Pri tem izhajamo iz vsebine problema in vnaprej predpostavljenimi razmerji med temi aritmetinimi sredinami. Kontrast obiajno oznaimo z D, oblikujemo pa ga tako, da aritmetini sredini vsake skupine pripiemo nek ponder cj. Da lahko govorimo o kontrastih, mora veljati . V nasprotnem primeru

govorimo o linearnih kombinacijah, za katere pa veljajo posebna pravila. Splono lahko domnevo, ki jo preizkuamo pri analizi s kontrasti zapiemo kot

13 / 23

M. Pahor: Multivariatna analiza

Vaje 1, sreda, 6.11.2008

, pri emer gre pri j' in j'' za razline skupine.

Kontrasti so med sabo lahko odvisni ali neodvisni. Za vsako kombinacijo skupin imamo najve k-1 neodvisnih kontrastov. Kontrasta sta neodvisna ko je vsota produktov istolenih ponderjev enaka 0, torej ko velja ponder v prvem in c2j ponder v drugem kontrastu. Podobno kot pri preizkusu skupin (ki ga lahko izvedemo tudi kot kontrast) se tudi pri analizi s kontrasti obrazci za izraun kontrastov se razlikujejo glede na to, ali imamo opravka z enakimi ali razlinimi variancami med skupinami. e predpostavka o enakosti varianc velja, kontraste preizkuamo z naslednjim obrazcem: , pri emer je prvi D ocenjen, drugi pa predpostavljen; slednji je obiajno 0, v tem primeru vrednost t izraunamo tako , kjer je c1j

Preizkus se porazdeljuje v t porazdelitvi z n-k stopinjami prostosti. e predpostavka o enakosti varianc ne velja, t izraunamo po druganem obrazcu in sicer

Preizkus pa se porazdeljuje z naslednjimi stopinjami prostosti

14 / 23

M. Pahor: Multivariatna analiza

Vaje 1, sreda, 6.11.2008

V pogovornem oknu analize variance kliknemo gumb Contrasts Dobimo okno:

Ute i dodamo v oken ku Coefficients po vrsti, kot gredo skupine. elimo vklju iti, ji damo ute jih s pritiskom na gub Next.

e katere skupine ne elimo, dodajamo

0. Dodamo lahko kolikor kontrastov

APOSTERIORNA ANALIZA

Aposteriorno analizo uporabljamo tedaj, ko ne moremo ali ne znamo vnaprej, glede na vsebino problema, postaviti neke domneve o aritmetinih sredinah. S pomojo aposteriorne analize ugotavljamo, katere skupine se glede na obravnavano odvisno spremenljivko razlikujejo med sabo in oblikujemo t.i. homogene skupine. Homogeno skupino tvorijo skupine, pri katerih znotraj skupine ni znailnih razlik v aritmetinih sredinah, med skupinami pa take razlike obstajajo. Pri aposteriorni analizi med sabo primerjamo pare skupin. Skupine najprej razvrstimo v ranirno vrsto glede na oceno aritmetine sredine. Izraunamo absolutne razlike med pari aritmetinih skupin porazdelitvi. Razlike so znailne ko 15 / 23 , ki se porazdeljujejo v t.i. studentizirani q

M. Pahor: Multivariatna analiza

Vaje 1, sreda, 6.11.2008

q se porazdeljuje v posebni, q porazdelitvi z dvojimi stopinjami prostosti prve stopinje prostosti so m = n k druge oznaimo z r in pomenijo razdaljo v rangih med skupinami. Dve sosednji (zaporedni) enoti imajo r=2, kar je tudi najmanji r sploh. Ko primerjamo aritmetine sredine skupin med sabo, razline procedure uporabljajo razline vrednosti q-ja in razline vrednosti za r. Glede na to se razline procedure med sabo loijo po strogosti in po tem, kako strog je test. Stroji ko je test, manj znailnih razlik odkrije in obratno. Tukey, Student-Newman-Keuls in LSD (least significant difference) uporabljajo iste vrednosti q porazdelitve in te vrednosti navadno tudi najdemo tabelirane v knjigah. Ti testi se med seboj razlikujejo po tem, kaj vzamejo za vrednost r; glede na to se razlikujejo v strogosti in tevilu znailnih razlik, ki jih odkrijejo. r LSD Duncan S-N-K Tukey Shaffe rmin=2 r r rmax rmax strogost zna. razlike Posebnost

vije vrednosti q nije vrednosti q

Dejanska odloitev o tem, kateri test sprejmemo je stvar primera in nae odloitve. Obiajno se odloimo za tisti test, ki nam najbolje odkrije homegene skupine oz. tisti, pri katerem homogene skupine najlae pojasnimo. V pogovornem oknu analize variance kliknemo gumb Post Hoc Dobimo okno:

16 / 23

M. Pahor: Multivariatna analiza

Vaje 1, sreda, 6.11.2008

PRIMER

Na primeru podatku o razvitosti bomo ugotavljali, ali in kako se razlikuje povprena letna stopnja rasti prebivalstva po regijah sveta. Svet je v bazi razdeljen v est regij in sicer 1 Afrika 2 Azija 3 Srednja in Juna Amerika 4 Zahodna in Severna Evropa ter Severna Amerika 5 Vzhodna, Srednja in Juna Evropa 6 Avstralija in pacifike drave Regije so sestavljene iz precej heterogenih drav, ki jih drui predvsem geografska bliina. To je eden od problemov, ki se jih moramo v tem primeru zavedati. Druga dva sta e gre za stopnje rasti, pri katerih je geometrijska sredina praviloma primerneja od aritmetine podatke bi morda kazalo uteiti s tevilom prebivalstva (bralec lahko to poskusi sam, paziti pa mora, da pri tem ne dobi prevelikega vzorca. Vsi preizkusi so namre obutljivi na velikost vzorca in pri velikih vzorcih hitro pokaejo znailne razlike)

17 / 23

M. Pahor: Multivariatna analiza

Vaje 1, sreda, 6.11.2008

Analiza predpostavk Zavedajo se problemov pristopimo k analizi. Najprej preizkusimo predpostavke modela s pomojo kazalcev sploenosti in asimetrije.
Report Povprena letna stopnja rasti prebivalstva Regija Afrika Azija Srednja in Juzna Amerika Zahodna Evropa in Severna Amerika Vzhodna, Srednja in Juzna Evropa Avstralija in pacifiska drzave Total N 54 38 38 19 35 14 198 Mean 2.5281 2.0395 1.4366 .6032 .2860 1.7336 1.5876 Median 2.4400 2.0050 1.4050 .5200 .0200 1.5950 1.6500 Skewness 2.941 .010 .360 .355 1.479 .195 1.008 Kurtosis 11.656 -.306 .831 -1.144 2.909 -.725 4.617

Iz kazalnikov lahko ugotovimo, da je porazdelitev spremenljivke v celoti rahlo asimetrina v desno in precej sploena. Po posameznih skupinah se porazdelitev dokaj dobro pribliuje normalni porazdelitvi, razen v Afriki, kjer je porazdelitev precej asimetrina v desno in hudo sploena. Predpostavka o normalni porazdelitvi je do neke mere krena, imamo pa opravka z relativno velikim vzorcem. Predpostavko o enakosti varianc preizkuamo z Levenovim preizkusom. Levenov preizkus izvedemo takole5:
v vseh skupinah izraunamo vrednosti nove spremenljivke V , ki so enake absolutnim vrednostim odklonov vrednosti spremenljivke Y od ocene pripadajoe aritmetine sredine skupine: ; ; izvedemo postopek analize variance: na podlagi vrednosti nove spremenljivke V izraunamo vrednost Levenovega preizkusa kot razmerja med oceno variance med skupinami in oceno variance znotraj skupin. Najprej ocenimo aritmetine sredine nove spremenljivke V za vse skupine ; nato skupno aritmetino sredino
5

Vir: Rovan, 2000, neobjavljeno

18 / 23

M. Pahor: Multivariatna analiza

Vaje 1, sreda, 6.11.2008

pri emer je

in konno vrednost Levenovega preizkusa

Zaradi poenostavitve raunanja in zmanjanja zaokroitvenih napak je najprimerneje, da vsote kvadratov v zgornjem izrazu izraunamo takole:

in

kjer je: ; ; ; ;

Nielno

domnevo

zavrnemo,

je

vrednost

Levenovega preizkusa alternativno domnevo

v kritinem obmoju, pri emer upotevamo naslednjo

kjer je Ker smo za izraun vrednosti Levenovega preizkusa uporabili postopek analize variance, izvedemo enostranski F-preizkus. Pri tem je vrednost F-porazdelitve pri stopinjah prostosti in ter stopnji znailnosti .

Levenov preizkus je za raunanje na roke zelo zamuden, zato se ustavimo le pri tolmaenju raunalnikega izpisa.
Test of Homogeneity of Variances Povprena letna stopnja rasti prebivalstva Levene Statistic 1.250 df1 5 df2 192 Sig. .287

19 / 23

M. Pahor: Multivariatna analiza

Vaje 1, sreda, 6.11.2008

Test ne pokae znailnih razlik. To pomeni, da ne moremo zavrniti nielne domneve, da so vse variance enake. Nadaljnje teste torej delamo pod to predpostavko. Osnovni preizkus Preverimo najprej osnovno domnevo analize variance, torej domnevo

Domnevo preverimo z izraunom Fisherjeve tabele


ANOVA Povprena letna stopnja rasti prebivalstva Sum of Squares 134.403 197.403 331.807 df 5 192 197 Mean Square 26.881 1.028 F 26.145 Sig. .000

Between Groups Within Groups Total

F preizkus pokae znailne razlike pri zanemarljivi stopnji tveganja. Torej lahko zavrnemo nielno domnevo in sprejmemo sklep, da je povprena stopnja rasti vsaj v eni regiji drugana kot v ostalih. Analiza s kontrasti Pri analizi s kontrasti si vsebinsko zastavimo nekaj primerjav, ki jih elimo izvesti znotraj analize variance. Ker imamo 6 skupin imamo lahko 5 neodvisnih kontrastov. Oblikovali bomo tri in sicer bomo primerjali 1. stopnjo rasti v manj razvitih regijah (Azija, Afrika, Srednja in Juna Amerika) s tisto v bolj razvitih regijah (S. Amerika, Evropa, Avstralija) 2. Primerjali bomo stopnje rasti v Afriki in Aziji 3. Ali se stopnja rasti v S. Ameriki in Z. Evropi razlikuje od tiste v J. in V. Evropi. Ker domneve o enakosti varianc nismo zavrnili, uporabljamo obrazce, ki veljajo pri tej predpostavki. Prvi kontrast

20 / 23

M. Pahor: Multivariatna analiza

Vaje 1, sreda, 6.11.2008

Vrednost preizkusnega izraza

m = n k = 205 6 = 199

Razlike so znailne pri zanemarljivi stopnji tveganja. Zavrnemo nielno domnevo in sprejmemo sklep, da imajo manj razvite regije razlino (vijo) povpreno stopnjo rasti prebivalstva kot bolj razvite regije.

Podobno kot pri prvem lahko zavrnemo nielno domnevo tudi pri drugem kontrastu, le da tu pri nekoliko viji, 4,8% stopnji znailnosti. Pri tretjem kontrastu ne moremo zavrniti nielne domneve. Ne moremo torej trditi, da se stopnja rasti v S. Ameriki in Z. Evropi razlikuje od tiste v J. in V. Evropi. Aposteriorna analiza Aposteriorno analizo uporabljamo za doloanje homogenih skupin. Na voljo imamo ve razlinih procedur, ki se med sabo loijo po strogosti. Najve znailnih razlik ugotovi LSD procedura. Procedura primerja absolutno vrednost razlike med dvema skupinama s studentiziranim razmikom. Za prvi par (Afrika in Azija) znaa absolutna razlika 0,4472. Kritino vrednost, s katero primerjamo to porazdelitev izraunamo 21 / 23

M. Pahor: Multivariatna analiza

Vaje 1, sreda, 6.11.2008

vrednost oditamo v tabelah

, razlike niso znailne

Nadaljnje razlike, ki jih odkrije LSD procedura, lahko zapiemo tudi v taki tabeli, kjer zvezdice predstavljajo znailne razlike
V. V. in J. in J. Z. Evropa in S. Amerika Lat. Amerika Azija Australija Afrika

Evropa Evropa Z. Evropa in S. Amerika Lat. Amerika Azija Australija Afrika

* * * *

* * * * * * *

LSD in tudi veina ostalih procedur loi Evropske in S. Amerike drave od ostalih, pri tem pa e loi Afriko od Lat. Amerike. Praktino to pomeni, da imamo opravka z dvema homogenima skupinama.

22 / 23

M. Pahor: Multivariatna analiza

Vaje 1, sreda, 6.11.2008

23 / 23

You might also like