You are on page 1of 6

Korelacija

je sukladnost u variranju. Često se može primijetiti da dvije pojave pokazuju neku međusobnu zavisnost, povezanost. Tako npr. znamo da postoji određena povezanost između težine i visine ljudi, krvnog tlaka i dobi, količine oborina i gustoće vegetacije itd. Ako porastu vrijednosti u nekoj varijabli odgovara porast vrijednosti u drugoj varijabli tada je korelacija pozitivna, a ako porastu vrijednosti u prvoj varijabli odgovara pad u vrijednostima druge varijable, korelacija je negativna. Odnos između dvije varijable može se grafički prikazati i taj dvodimenzionalni prikaz naziva se dijagram raspršenja (scatter diagram). Podaci na kojima određujemo korelaciju moraju naravno biti zavisni (vezani). Ako je jedna određena vrijednost neke varijable povezana sa samo jednom korespodentnom vrijednosti druge varijable, te ako linearnom porastu jedne varijable odgovara linearni porast druge varijable, tada je korelacija pozitivna i potpuna, tj. maksimalna: r= +1.

Ako linearnom porastu jedne varijable odgovara linearni porast druge varijable, te ako je jedna vrijednost prve varijable povezana sa samo jednom vrijednosti u drugoj varijabli, korelacija je negativna i potpuna, a vrijednost koeficijenta korelacije iznosi r= -1. Potpuna povezanost varijabli postoji u matematskim funkcijama (npr. povezanost između opsega i promjera kruga). No ovakve potpune povezanosti se ne nalaze između varijabli koje proučavaju društvene znanosti.

ali jedna određena visina nije vezana za samo jednu određenu težinu. .Ako linearnom porastu jedne varijable uglavnom odgovara linearni porast druge varijable. a vrijednost koeficijenta korelacije je manja od 1 i veća od 0. korelacija je pozitivna ali nije maksimalna.. Npr. i to tako da je jedna određena vrijednost prve varijable povezana s više vrijednosti druge varijable. visina i težina kod ljudi su u pozitivnoj korelaciji: viši ljudi su u prosjeku teži od nižih.

te je pri tom jedna određena vrijednost prve varijable povezana s više vrijednosti druge varijable (npr. povezanost duljine nosa i visine krvnog tlaka kod ljudi) . t. a vrijednost koeficijenta korelacije kreće se između -1 i 0.j.Ako linearnom porastu jedne varijable odgovara linearno opadanje vrijednosti u drugoj varijabli. BDP države i prosječan broj djece). ako pojedinoj vrijednosti u prvoj varijabli odgovara bilo koja vrijednost druge varijable tada nema korelacije između dvije varijable. (npr. tada je povezanost negativna ali nije maksimalna. Ako iz određene vrijednosti jedne varijable ne možemo ništa zaključiti o vjerojatnoj vrijednosti druge varijable. a koeficijent korelacije iznosi r=0.

Ili preciznije.Φ Kad radimo s varijablama koje se raspoređuju u dvije očito odijeljene karakteristike. a smije se primijeniti u slučaju da su podaci izraženi na barem intervalnoj skali te da je distribucija rezultata u varijablama normalna ili barem simetrična. jednostavno se može dobiti i točna pvrijednost. kad u populaciji ne bi postojala stvarna povezanost ispitivanih varijabli. može se samo zadati da se odredi pearsonov r između neke dihotomne i jedne kontinuirane varijable. npr. Također je potrebno imati dovoljno veliki broj ispitanika odnosno jedinica analize.05 koeficijent korelacije se smatra statistički neznačajnim i tretira ga se kao da je r=0.05 koeficijent korelacije statistički značajan na razini rizika od 5%. 1=prošao ispit). a povezanost između varijabli linearna. Budući da s takvim podacima pouzdano znamo samo redoslijed. grafički prikazanog odnosa povezanosti rezultata u jednoj varijabli i prosjeka vrijednosti druge varijable koje odgovaraju toj određenoj vrijednosti u prvoj varijabli). Kad je p<0. 1997) uz stupnjeve slobode df=N-2 očita granična vrijednost t za željenu razinu značajnosti (1% ili 5% rizika).»ro« koeficijent: ρ Kad su jedna ili obe varijable na rang ljestvici. Ako je t značajan.Pearsonov koeficijent korelacije je jedan od najčešće korištenih koeficijenata korelacije. i dobivena r je statistički značajna. Linearnost se provjerava pomoću crte regresije (tj. koja treba biti pravac. Prethodno treba pridodati brojčane vrijednosti dihotomnoj varijabli (npr. možemo odrediti fi koeficijent. ne možemo računati precizniji Pearsonov koeficijent korelacije. . 1997). varijabla spol).01. Ako se korelacije izračunavaju pomoću računala. N>30. računa se rang-korelacija. 5% slučajeva dobili bismo takvu vrijednost. Point-biserijalni koeficijent korelacije – rpb računa se kad je jedna varijabla dihotomna (varijabla koja se dijeli na dvije jasno odvojene vrijednosti. koji je usko povezan uz χ2 test.0. Računa se prema formuli: _______ Φ = √ (χ2 : N) INTERPRETACIJA KOEFICIJENTA KORELACIJE Smatra se da vrijednosti korelacije od 0 do +/. dok je uz nešto blaži kriterij. Ako je p>0. 0 =pao.20 označavaju malu ili nikakvu povezanost. vrijednost koeficijenta korelacije je značajna uz nivo rizika od 1%. √ (N-2) / (1-r2) Za t-vrijednost se u odgovarajućim tablicama (vidi Petz.zy N-1 ________ t= r. Pearsonov r računa se prema sljedećoj formuli: r= Σzx. Testiranje statističke značajnosti koeficijenta korelacije Značajnost različitih vrsta koeficijenta korelacije može se provjeriti u odgovarajućim tablicama prema veličini uzorka (N) odnosno stupnjeva slobode (df) i dobivenoj vrijednosti korelacije (vidi Petz. ali ne i stvarne razlike među pojedinim rezultatima. Kad ga se računa pomoću SPSS-a. P se interpretira kao vjerojatnost da je određena vrijednost korelacije dobivena po slučaju. u 1% odn. p<0. i kad bismo jako veliki broj puta po slučaju prikupili uzorak veličine N i izračunali koeficijente korelacije između varijabli. Fi-koeficijent . Spearmanova rang korelacija. ili podijelimo rezultate u nekoj varijabli u dvije kategorije (ispodprosječni/iznadprosječni u nekom testu).

što ne znači nužno da rode direktno utječu na natalitet.r2. udio zajedničkih faktora dvije varijable. r2.40 laganu povezanost.od +/-0. Može se odrediti korelacija za svaku dobnu skupinu posebno.72=. tj.2-3 = (r1. Obje varijable mogu biti pod utjecajem nekog trećeg faktora. Npr. Naime. Uzročno-poslijedični odnos može se utvrditi samo putem kontroliranog eksperimenta.3 : korelacija između varijable 1 i varijable 3.7 objašnjeno tek manje od 50% varijance (0. r1. može se koristiti slijedeća formula: ________ ________ r1. pa bez kontrole dobi nećemo dobiti realne rezultate. √ 1.49) Problem sa kauzalnim zaključivanjem na temelju korelacija: ako su neke dvije pojave visoko povezane.70 stvarnu značajnu povezanost. Neka treća varijabla može prikrivati stvarnu povezanost dvije varijable koje ispitujemo.2-3: korelacija između varijable 1 i varijable 2 nakon što je parcijaliziran utjecaj varijable 3 MULTIPLA KORELACIJA.k .40 do +/-0.3 . ako bi željeli ispitati korelaciju između duljine stopala i sposobnosti pisanja u djece mogli bi se iznenaditi kad bi uzeli djecu iz svih 8 osnovnoškolskih razreda i na ukupnom uzorku odredili korelacije.Rx. od +/-0. jer bi one mogle biti prilično visoke. r2.r1.3 2 .3 2) r1.00 znače visoku ili vrlo visoku povezanost.20 do +/-0. Tako je za r=0. dok vrijednosti r od +/-0. i duljina stopala i sposobnost pisanja povećavaju se s dobi djeteta. a može se i računski parcijalizirati utjecaj dobi.3: korelacija između varijable 2 i varijable 3 r1. odnosno kvadrirana vrijednost koeficijenta korelacije predstavlja udio objašnjene varijance. 1. to ne znači nužno da jedna uzrokuje drugu. Kad se računski parcijalizira utjecaj treće varijable iz povezanosti dvije varijable. PARCIJALNA KORELACIJA Stvarna korelacija može biti iskrivljena ako u jednoj ili obje varijable postoje skupine koje imaju različite aritmetičke sredine.70 do +/-1.2 : korelacija između varijable 1 i varijable 2.2 – r1. već broj roda i broj djece ovisi o broju kućanstava u naselju (rode u selima često gnijezde na dimnjacima).3) / (√ 1. Koeficijent determinacije. r2. (ova raspodjela predstavlja tek grubu aproksimaciju i to samo za slučaj kad je broj mjerenja (N) vrlo velik). Može postojati pozitivna i statistički značajna korelacija između broja roda u naselju i broja djece..

prosječni prihodi u zemljama EU u proteklih 6 mjeseci. U pravilu se nastoji uvrstiti prediktore koji su u što većoj korelaciji s kriterijem te u što manjim međusobnim korelacijama.Ponekad želimo doznati kakva je korelacija između nekoliko varijabli. takozvanih »prediktora« i jedne varijable. ili niza ekonomskih (npr. između niza testova i uspješnosti na nekom radnom mjestu. srpnju i kolovozu). »kriterija«. tj. npr. Budući da se želi postići što viši stupanj multiple korelacije i tako bolju mogućnost prognoze rezultata. prosječne cijene smještaja i nafte) i klimatskih (broj sunčanih dana u dalmaciji u lipnju) pokazatelja i uspješnosti turističke sezone (operacionalizirane kao broj noćenja u lipnju. . To se postiže tako da se u jednadžbi veću važnost. Multipla korelacija je maksimalno mogući koeficijent korelacije između dva ili više prediktora i jednog kriterija. tj. traži se optimalna kombinacija kriterija. onima koji mogu objasniti veći dio varijance kriterija. veći ponder daje »važnijim« prediktorima.