You are on page 1of 17

Visoka Tehnoloka kola Strukovnih Studija

abac
Odsek: Inenjerski menadment









SEMINARSKI RAD IZ PREDMETA
Statistika



Tema rada:
Dvodimenzionalna regresiona I korelaciona analiza











.
Profesor: Student:
Dr. Aleksa Macanovi Igor Feger 5-24/2013


abac, Januar 2014


2

Sadraj
Sadraj ........................................................................................................................ 2
Uvod ........................................................................................................................... 3
Korelaciona analiza .................................................................................................... 4
Linearna korelacija ..................................................................................................... 5
Korelacija ranga ......................................................................................................... 5
Korelacija vremenskih nizova .................................................................................... 6
Regresiona analiza ..................................................................................................... 6
Linearna regresija i multipla regresija ....................................................................... 7
Odnos izmeu varijabli ............................................................................................10
Koeficijenti korelacije ..............................................................................................10
Pearsonov koeficijent korelacije ..............................................................................11
Spearmanov koeficijent korelacije ...........................................................................12
Matrica korelacije ....................................................................................................13
Primena korelacije ....................................................................................................13
Zakljuak ..................................................................................................................16
Literatura ..................................................................................................................17

3

Uvod
Termin korelacija potice od latinske reci correlatio medjuodnos. Pod
pojmom korelacijska analiza se podrazumeva merenje jacine stohastickih
meduzavisnosti tj. merenje stepena slaganja varijacija posmatranih pojava u
relativnom smislu.
Za merenje stepena korelacije ( zavisnosti) izmedu dva obiljeja koristi se
koeficijent proste linearne korelacije ili indeks korelacija za krivolinijske
regresione modele. Za merenje stepena slaganja varijacija koristi se koificijent
viestruke linearne korelacije.
Izmedu regresione i korelacione analize postoje uske veze. Zahvaljujuci redovima
engleskih naucnika Galtona i Persona termini korelacija i regresija su postali opte
statisticki prihvaceni. U praksi se najcece srecemo sa pojavama koje su u
medusobnoj vezi, uticu jedna na drugu kao npr. potronja domacinstva zavisi od
zarade; prinos penice od utroka dubriva, kvalitet penice, kvalitet zemljita;
uspjeh studenata od predznanja, ucenja profesora.
Prema tome znacajno je ispitivanje medusobnih veza i vie pojave. Ispitivanje
moe da se vri na bazi osnovnog skupa ili na bazi uzoraka o osnovnom skupu a
sve to nosi odreden rizik greke koji se moe kontrolisati.
Funkcionalna veza izmedu pojava moe da bude deterministicka (strogo odredena
matematicka ) ili stohasticka. Stohasticka zavisnost izmedu promenjivih se
ispoljava u masi slucajeva, kao prosjecan odnos i ima vecu ili manju varijaciju
individualnih slucajeva u odnosu u funkcionalnu vezu.
Stohasticka zavisnost izraava se uslovno matematickim funkcijama koje najbolje
aproksimiraju data emparijska obiljeja uz odredenu greku izbora.
Cilj regresione analize je da se odredi funkcionalna veza izmedu posmatranih
pojmova.
Za odredivanje oblika regresije najcece se kao najprikladnije i najjednostavnije
sredstvo koristi dijagram rasipanja.
Dijagram rasipanja se konstruie tako to se u kordinatima sistem unose
parovi vrednosti varijabile X i Y, odnosno on se sastoji od tacaka (xi i yi) a iz
rasporeda ovih tacaka zakljucujemo o obliku i smeru i jakosti veze.

4

Korelaciona analiza
Meu masovnim pojavama postoje meusobni uticaji u smislu da promena jedne
pojave (ili vie pojava) ima za posljedicu i promenu neke druge pojave. Ako
izmeu dvaju ili vie obiljeja X1 , . . ., Xn postoji veza, onda kaemo da su ta
obiljeja u korelaciji ili da su korelirana. Matematiki zakon koji reprezentira tu
vezu nazivamo funkcija regresije, a njen grafik kriva regresije. Korelacionom
(korelacijskom) analizom prouava se uzajamna zavisnost i varijacije meu
pojavama. Ako je x uzrok a y posljedica, vredi:
1) Y= f(x), radi se o regresijskom modelu i regresijskoj analizi.
2) Kada je svejedno koja se relacija moze napisati, tj. Y = f(x) i X = f(y) govori se
o korelacijskom modelu.
Veze meu pojavama mogu biti:
a) po obliku: linearna i krivolinijska;
b) po smeru: pozitivna ili negativna;
c) po intenzitetu: funkcionalna ili stohastika.

a) Kada promena jedne pojave za jedinicu mere povlai za sobom promenu druge
pojave za odreeni jednaki iznos, radi se o linearnoj vezi, tj. linearnoj korelaciji.
Kada promena jedne pojave nije praena jednakim iznosima druge pojave, radi se
o krivolinijskoj korelaciji.
b) Pozitivni smer veze je kada rast (ili pad) jedne pojave prati rast (pad) druge
pojave. Negativni smer je kada jedna pojava pokazuje rast, a druga pad i obratno.
c) Veoma jake veze tzv. teoretske veze meu pojavama zovu se funkcionalne veze.
To je kada svakoj vrednosti jedne pojave korespondira tano odreena vrednost
druge pojave. Labavije veze nazivaju se stohastike veze.

5

Linearna korelacija
Linearna korelacija zadana je funkcijama
Y = f (x) i X = g (y);
Yc =a+bx, Xc = a + b y - pravci regresije.
Ako su b i b pozitivnog predznaka radi se o linearnoj vezi pozitivnog smera i
obratno.
Prva informacija o postojanju linearne veze najjednostavnije se dobije tako da se u
koordinatni sistem na apscisu nanese vrednosti pojave x a na ordinatu pojave y.
Svaka taka je dakle odreena parom X, Y. Takav grafikon zovemo dijagram
rasipanja. Ako je oblak taaka zadan uzdu nekog zamiljenog pravca, veza je
linearna. to je oblak taaka zbijeniji s obzirom na liniju regresije, veza meu
pojavama je jaa i obratno.
Koeficijent determinacije je mera jakosti veza meu pojavama izraena u
drugom stupnju. To je odnos izmeu protumaenog dela varijanse i ukupne
varijanse (r
2
).
Pearsonov koeficijent korelacije je mera jakosti linearne veze meu
pojavama izraena u prvom stepenu (

). Moe imati vrednost od 1 do +1.


to je blii krajnjim granicama, veza je vra. Kada je nula izmeu promatranih
pojava, ne postoji linearna zavisnost.


Korelacija ranga
Da bi se ustanovilo postoji li veza izmeu dve pojave istrauje se postojanje veze
izmeu rangova promatranih pojava. Jakost veze meu rangovima X i Y meri se
Spearmanovim koeficijentom korelacije ranga:

Taj koeficijent moe imati vrednost od 1 do +1 i to je vrednost blia svojim
granicama, veza meu rangovima X i Y je jaa.
6


Korelacija vremenskih nizova
Kod ispitivanja veze izmeu pojava promatranih u vremenu treba provjeriti
postojanje trenda kod tih pojava, a to utjee na veliinu koeficijenta korelacije
ukoliko trendovi nisu paralelni sa apscisom. Ukoliko postoji djelovanje trenda na
koeficijent korelacije, pre izraunavanja koef. korelacije treba eliminirati utjecaj
trendova i to se vri izraunavanjem parcijalnog trenda korelacije.

Regresiona analiza
Regresiona (regresijska) analiza je najvanija analiza u statistici, a koristi se za
utvrivanje da li promena svojstva jedinice neke serije podataka zavisi od promene
svojstva jedinice nekog drugog skupa. Ako postoji paralelnost kretanja promena
svojstava jedinica promatranih skupova, onda se moe rei da postoji izvjesna
zavosnost izmeu ta dva skupa. Zavisnost izmeu dva posmatrana skupa moe biti:
1. funkiconalna zavisnost - ako svakoj vrednosti jedne promenjive (pojave)
odgovara jedna vrednost neke druge promenjive (pojave)
2. tohastika zavisnost ako jednoj vrednosti nezavisne promenjive y odgovara
itav niz moguih vrednosti zavisne pormenjive x.

Regresiona analiza se bavi istraivanjem varijabiliteta i otkrivanjem funkcionalnog
oblika, kojem se najvie pribliava kvantitativno slaganje varijacija posmatranih
pojava.

Linearni model regresije se koristi u situaciji kada empirijski podaci u nekoj seriji
pokazuju tendenciju linearnog poveanja ili smanjenja, odnosno, koristi se kada se
ele istraiti dve pojave i ustanoviti postoji li linearna veza izmeu njih (linearna
veza postoji ako porast jedne pojave izaziva porast druge pojave).

Linearna funkcija regresije je:
Y= a + bx
a i b parametri su konstante x i y odnos izmeu njih predstavljaju sve mogue
vrednosti koje zadovoljavaju jednainu.
7







Parametar b u jednaini regresije oznaava intenzitet oekivanih promena pojave
(y), koje nastaju iz promene pojave (x). Intenzitet tih promena apsolutno je
odreen parametrom b, tako da su mogui sluajevi:
1. b > 0
poveanjem pojave (x) doi e do poveanja pojave (y)
2. b < 0
poveanjem pojave (x) doi e do smanjenja pojave (y)
3. b = 0
promena pojave (x) nee uticati na promenu pojave (y)


Linearna regresija i multipla regresija
Linearna regresija
Regresijska analiza jedna je od metoda multivarijatne analize koja pretpostavlja
postojanje najmanje dvaju skupova varijabli, a koristi se za prouavanje i
modeliranje povezanosti i razlika izmeu tih skupova varijabli. Regresijskom
metodom pokuava se ustanoviti postojanje i razina povezanosti izmeu jedne ili
vie zavisnih (kriterijskih) varijabli i prediktora ( nezavisnih varijabli ), pri emu se
posebna vanost pridaje mogunosti prognoziranja ili predikcije vrednosti (ili
varijabilnosti) jedne varijable na osnovu drugih.
Ako se odnos izmeu parametara u regresijskoj analizi moe prikazati nekom
linearnom funkcijom, govorimo o linearnom regresijskom modelu.

8

Prvi oblik linearne regresije pojavio se jo poetkom 19. stoljea kao metoda
najmanjih kvadrata od strane francuskog matematiara Adrien-Marie Legendrea
(1805.) i njemakog znanstvenika Carla Friedricha Gaussa (1809.), koji su se
njome sluili pri odreivanju orbita nebeskih tela oko sunca. Pojam regresije uveo
je sir Francis Galton (1877.), koji je studirajui zajedno sa Karlom Pearsonom
nasljeivanje u biologiji istraivao vezu izmeu visine oeva i sinova, te je
ustanovio fenomen koji je nazvao regresijom prema prosjeku, tj. otkrio je da visoki
oevi imaju visoke sinove, no u prosjeku ne toliko visoke kao to su oni sami a da
niski oevi imaju takoer niske sinove, ali opet malo vie nego to su oni.

Dok je za Galtona ovo otkrie imalo samo bioloku vanost, Pearson je kasnije
proirio i razradio pojam regresije i uveo ga u statistiku. On je pretpostavio da se
ovisnost visine sinova o visini njihovih oeva moe izraziti kao funkcija , pri emu
je y zavisna ili kriterijska varijabla (visina sinova), a x nezavisna ili prediktorska
varijabla (visina oeva). y=f(x)

Openito, ukoliko se radi o problemu zavisnosti koji se realno moe opisati samo
dvjema varijablama, jednom kriterijskom (y) i jednom prediktorskom (x),
zavisnost varijable y o varijabli x moe se prikazati linearnom funkcijom od x u
obliku y=bx+a.

Ta je funkcija ujedno jednadba regresijskog pravca u kojoj je odsjeak na osi y, a
b koeficijent regresije, odnosno tangens ugla koji regresijski pravac zatvara s osom
x. Poto jaina povezanosti ne ovisi o konstanti a, pravac se esto moe pomaknuti
u ishodite koordinatnog sistema tako da je a=0, pa funkcija poprima oblik y=bx.

Na osnovu pravca regresije mogue je prognozirati rezultate jedne varijable na
osnovi druge. Tako moemo izraunati regresijski pravac za varijablu x na osnovu
rezultata varijable y i obrnuto, regresijski pravac za varijablu y na temelju rezultata
varijable x. Za dobivanje najtanijeg prikaza pravca regresije u statistici najee
se koristi metoda najmanjih kvadrata koja se sastoji od minimiziranja sume
kvadrata rezidualnih vrednosti (razlika izmeu dvu vrednosti varijabli). Tako
dobiveni pravac je najreprezentativniji jer ima najmanju sumu kvadrata odstupanja
pojedinanih rezultata od stvarnog pravca regresije.

9

Ovakav model je pogodan za koritenje u sluajevima kad se promatrana pojava
moe opisati sa samo dvjema varijablama, jednom zavisnom i jednom nezavisnom,
dakle ne postoji utjecaj drugih nezavisnih varijabli. Takoer, opisana metoda
najee pretpostavlja da je zavisna varijabla kontinuirana, te da su rezultati
normalno (gausovski) distribuirani. Ako ti uvjeti nisu zadovoljeni, primenjujemo
razliite poluparametrijske ili neparametrijske regresijske modele.

Znanstvena istraivanja su, meutim, najee mnogo sloenija i ukljuuju vie
nezavisnih varijabli koje nazivamo prediktorskim skupom, a zavisnost meu
varijablama prikazujemo generalnim regresijskim modelom. Tada govorimo o
multivarijatnoj ili multiploj regresijskoj analizi

Multipla regresija
Jednainom pravca regresije procjenjuje se zavisna varijabla za odreenu vrednost
nezavisne varijable. Procjena je to bolja sto je veza meu varijablama, tj. pojavama
ua, odnosno, to je korelacija jaa. Pojedina pojava nije u vezi samo s jednom od
pojava, nego je povezana s mnogo njih.
to je vei broj varijabli koje koreliraju s varijablom iju vrednost procjenjujemo
uvrtenih u jednainu to je procjena te varijable bolja. Uvrtavanjem varijabli u
jednainu linijom regresije izraava se vie odnosa (multipli odnosi) a korelaciju
meu njima nazivamo multipla korelacija.
Multipla korelacija zasniva se na istim naelima kao i korelacija izmeu dve
pojave, samo je procedura raunanja dulja i sloenija. U ovom je sluaju varijabla
koju procjenjujemo zavisna, a sve ostale pomou kojih se ona procjenjuje
nezavisne varijable.

Jednaina multiple regresije za procjenu jedne pojave kad su poznate vrednosti
drugih dvaju pojava s kojima je u vezi glasi:
Xc1.23 = a1.23 + b12.3X2 + b13.2X3

Jednaina takvog oblika je jednaina ravnine koja se najbolje prilagoava
originalnim vrednostima geometrijski prikazanim u trodimenzionalnom
koordinatnom sistemu. Kad se uvode tri ili vie neovisnih varijabli u raun,
jednaina multiple korelacije predstavlja jednainu multidimenzionalne
hiperravnine, a ta se geometrijska konfiguracija ne moe predoiti. Jednaina tada
ima oblik:
10

Xc1.234 = a1.234 + b12.34X2 + b13.24X3 + b14.23X4
-na analogan nain raunamo vezu izmeu jedne pojave i etiri, pet, est i vie
pojava. Imali bismo jednu zavisnu i etiri, pet ili est nezavisnih varijabli.

Odnos izmeu varijabli
Meusoban odnos izmeu dve varijable, grafiki moemo prikazati pomou
dvodimenzionalnog grafa, tzv. scatter dijagram (dijagrama rasprenja). Vrednosti
jedne varijable prikazane su na x osi, a druge na y osi dijagrama. Toke presjeka
kreu se oko odreenog pravca koji se naziva linija regresije. to su toke blie
pravcu, korelacija je vea. to su toke rasprenije korelacija je manja. U praksi je
vizualno vrlo teko, osim u sluaju savren korelacije odrediti stupanj povezanosti
izmeu varijabli. Ovisno o meusobnom odnosu dve varijabli meu kojima postoji
korelacija, ona moe biti linearna ili nelinearna. Kod linearne korelacije, toke su
grupirane oko pravca. Kod nelinearne korelacije, toke su grupirane oko neke
druge krivulje.
Dve varijable koje promatramo sa ciljem utvrivanja njihove korelacijske
povezanosti mogu biti u 4 razliita odnosa:
1. kada mala vrednost jedne varijable odgovara maloj vrednosti druge varijable,
kao i kada velika vrednost jedne varijable odgovara velikoj vrednosti druge
varijable, radi se o pozitivnoj korelaciji.
2. kada mala vrednost jedne varijable odgovara velikoj vrednosti druge varijable i
obratno, radi se o negativnoj korelaciji.
3. kada vrednost jedne varijable u nekim intervalima odgovara maloj vrednosti
druge varijable, a u drugim intervalima velikoj vrednosti, radi se o nemonotonoj
korelaciji. Ako se korelacija vie nego jednom menja od pozitivne prema
negativnoj, takva korelacija naziva se ciklika korelacija.
4. kada se na osnovu vrednosti jedne varijable ne moe zakljuiti nita o vrednosti
druge varijable, tada korelacija ne postoji. Toke u takvom grafu su rasprene.

Koeficijenti korelacije
Koeficijenti korelacije izraavaju meru povezanosti izmeu dve varijable u
jedinicama neovisnima o konkretnim jedinicama mere u kojima su iskazane
vrednosti varijabli. Postoji vie koeficijenata korelacije koji se koriste u razliitim
11

sluajevima. U praksi se prilikom rada s linearnim modelima najee koristi
Pearsonov koeficijent korelacije (produkt moment koeficijent korelacije). Prilikom
rada s modelima koji nisu linearni najee se koristi Spearmanov koeficijent
korelacije (produkt rang koeficijent korelacije).

Pearsonov koeficijent korelacije
Pearsonov koeficijent korelacije koristi se u sluajevima kada izmeu varijabli
promatranog modela postoji linearna povezanost i neprekidna normalna
distribucija. Vrednost Pearsonovog koeficijenta korelacije kree se od +1 (savrena
pozitivna korelacija) do 1 (savrena negativna korelacija). Predznak koeficijenta
nas upuuje na smer korelacije da li je pozitivna ili negativna, ali nas ne upuuje
na snagu korelacije. Pearsonov koeficijent korelacije bazira se na usporedbi
stvarnog utjecaja promatranih varijabli jedne na drugu u odnosu na maksimalni
mogui utjecaj dvu varijabli. Oznaava se malim latinikim slovom r. Za izraun
koeficijenta korelacije potrebna su tri razliite sume kvadrata (SS): suma kvadrata
varijable X, suma kvadrata varijable Y i suma umnoaka varijabli X i Y.
Suma kvadrata varijable X jednaka je sumi kvadrata odstupanja vrednosti varijable
X od njezine prosjene vrednosti:

Prosjena vrednost varijable X jednaka je:



Prosjena vrednost varijable Y jednaka je:

Suma umnoaka varijabli X i Y jednaka je sumi umnoaka odstupanja vrednosti
varijabli X i Y od njihovih prosjeka:
12


Koeficijent korelacije jednak je omeru:

U sluaju da meu varijablama ne postoji linearna povezanost, moe se provesti
odgovarajua transformacija kojom se vrednosti varijabli modela svode na
linearne.

Spearmanov koeficijent korelacije
Spearmanov koeficijent korelacije (produkt rang korelacije) koristi se za merenje
povezanosti izmeu varijabli u sluajevima kada nije mogue primeniti Pearsonov
koeficijent korelacije. Bazira se na tome da se izmeri dosljednost povezanosti
izmeu poredanih varijabli, a oblik povezanosti (npr. linearni oblik koji je
preduvjet za koritenje Pearsonovog koeficijenta) nije bitan. Sluajevi u kojima se
koristi Spearmanov koficijent su npr. kada meu varijablama ne postoji linearna
povezanost, a nije mogue primeniti odgovarajuu transformaciju kojom bi se
povezanost prevela u linearnu (npr. veza izmeu seizmikog atributa i buotinskog
podataka u naftnoj geologiji). Spearmanov koeficijent korelacije kao rezultat daje
priblinu vrednost koeficijenta korelacije koji se tretira kao njegova dovoljno
dobra aproksimacija. Prilikom koritenja Spearmanovog koeficijenta, vrednosti
varijabli potrebno je rangirati i na takav nain svesti na zajedniku meru.
Najjednostavniji nain rangiranja je da se najmanjoj vrednosti svake varijable
pridjeli rang 1, slijedeoj po veliini rang 2 i tako sve do posljednje kojoj se
pridjeljuje maksimalan rang. Izraunavanje koeficenta radi se koritenjem
vrednosti prideljenih rangova. Spearmanov koeficijent oznaavati emo sa rS.
Formula za izraun Spearmanovog koeficijenta korelacije je:

gdje je d razlika vrednosti rangova dve promatrane varijable, a n je broj razliitih
serija.
13


Matrica korelacije
Ponekad nam u istraivanju nije dovoljna informacija o korelaciji dve promatrane
varijable, ve nas zanima na koji nain vie varijabli meusobno utjee jedna na
drugu. Nakon to se promatranjem meusobnog odnosa svih parova dvaju varijabli
utvrdi njihova meusobna korelacija, izrauje se matrica korelacije. Retci i stupci
matrice predstavljaju promatrane varijable, a podatak na presjeku odreenog retka i
stupca predstavlja koeficijent korelacije izmeu varijabli u odgovarajuem retku i
stupcu. Matrica na dijagonali ima podatak 1 (poto je svaka varijabla sama sa
sobom u potpunoj korelaciji). Dobivena matrica je simetrina - podaci iznad i
ispod dijagonale za isti par varijabli su identini. Zbog tih svojstava matrica je
redundantna i dovoljno je promatrati jedan njezin dio, iznad dijagonale ili ispod
dijagonale. Vizualno moemo utvrditi u kojoj meri su dve pojedinane varijable u
korelaciji, koje varijable u meusobnom odnosu imaju najvei ili najmanji
koeficijent korelacije, te koji skupovi varijabli se istiu slinim koeficijentima.
Vizualno ne moemo utvrditi na koji nain i u kolikoj meri vie varijabli zajedniki
utjee na drugu pojedinanu varijablu.

Primena korelacije
Rezultati korelacije imaju brojne praktike primene, ali se ni u kojem sluaju ne bi
smeli samo na osnovu rezultata utvrene korelacije donositi zakljuci o uzrono-
poljedinoj vezi. Korelacija se ne bi trebala koristiti za donoenje zakljuaka o
uzrono-posljedinoj vezi izmeu dve varijable poto je velika vjerojatnost da e
zakljuak biti kriv. est sluaj je da se promatra odnos izmeu dve varijable koje
su u korelaciji visokog stupnja. Meutim, postoji i skrivena trea varijabla koju bi
takoer trebalo staviti u odnos sa promatrane dve, kako bi se ispravno protumaio
uzrono-posljedini odnos.
Jedan od klasinih, u literaturi esto spominjanih primera, je pojava uoena u
Kopenhagenu nekoliko godina posle zavretka Drugog svjetskog rata. Zamecena je
korelacija izmeu poveanja broja novoroene djece i broja roda koje su se
gnezdile u gradu. Ako bi se korelacija bez razmiljanja protumaila kao uzrono-
posljedini odnos, moglo bi se zakljuiti da rode donose djecu. Pravi uzrok lei u
tome to se po zavretku rata velik dio stanovnitva sa sela preselio u grad, to je
14

uzrokovalo poveanje broja stanovnika u gradu, a samim tim i poveanje broja
novoroene djece. Istovremeno, za nove stanovnike grada izgradile su se nove
kue, tako da su i rode dobile vei broj dimnjaka za svoja gnezda. Tu je dakle,
postojala skrivena varijabla - broj stanovnika, koju je prilikom donoenje zakljuka
o uzrono-posljedinoj vezi trebalo uzeti u obzir.
Naravno, ima i suprotnih primera kada ne postoji skrivena varijabla. Vrlo rano je
ustanovljena korelacija izmeu puenja i vjerojatnosti da e osoba oboljeti od
raka. Duhanska industrija branila je svoju tezu da se ne moe uspostaviti uzrono-
posljedina veza izmeu puenja i vjerojatnosti dobivanja raka. Oni su tezu
obrazlagali time da su puai vrlo esto nervozne osobe, koje zbog toga to su
nervozne poinju puiti. Istovremeno postoji korelacija izmeu toga da je osoba
nervozna i vjerojatnosti da e takva osoba dobiti rak. S druge strane, lekari su
tvrdili da postoji izravna uzrono-posljedina veza izmeu puenja i vjerojatnosti
da e osoba dobiti rak, to je kasnije i potvreno.
Na osnovu utvrene korelacije ne moemo sa sigurnou utvrditi uzrono-
posljedinu vezu izmeu dvu varijable. Unato tome korelacija nam daje
informaciju o tome da su te dve varijable na odreeni nain povezane. Iako ne
shvaamo u potpunosti mehanizam te povezanosti, znamo da povezanost postoji i
prilikom opisa varijabli to moemo uzeti u obzir. Npr. poznato nam je da je
poveana tjelesna teina u korelaciji sa poveanom smrtnou i moemo rei da su
te dve varijable u meusobnom odnosu. Korelacija se najee koristi za
predvianje vrednosti jedne varijable ovisno o promeni vrednosti druge varijable, u
sluaju ako su te dve varijable u korelaciji. Saznanje o korelaciji izmeu dve
varijable pomae nam da s veom sigurnou predvidimo na koji nain e se
menjati vrednost druge varijable. Npr. poznato nam je da su koliina unesene soli u
organizam i visina krvnog tlaka osoba odreenog spola i dobi u korelacijskom
odnosu i taj odnos nam je poznat. Na osnovu tih informacija moemo dozirati unos
potrebne koliine soli u organizam kako bi krvni tlak ostao unutar granica normale,
a organizam bi primio dovoljnu koliinu soli za normalno funkcioniranje.
Utvrivanjem korelacije izmeu vrednosti dve varijable moe se dobiti prva
informacija o njihovoj meusobnoj povezanosti. Nakon toga se utvrena
povezanost moe detaljnije istraiti drugim statistikim metodama. Npr.
korelacijom se utvrdi da postoji veza izmeu koritenje nekog kemijskog sredstva i
pojave odreene bolesti. Nakon toga se moe u eksperimentalnim uvjetima, na
laboratorijskim ivotinjama utvrditi da li stvarno postoji uzrono-posljedina veza
15

izmeu tih varijabli. Korelacija je tu odigrala ulogu da izolira varijable koje
meusobno na neki nain utjeu jedna na drugu, a nakon toga druge metode, koje
to mogu, potvruju ili odbacuju odgovarajuu uzrono-posljedinu hipotezu.
Korelacija se esto koristi za provjeru rezultata testiranja. Nakon provednog
testiranja utvruje se odgovarajua korelacija izmeu testiranja i dobivenih
rezultata. Nakon to se testiranje ponovi, ponovno se utvruje korelacija izmeu
novih i prethodno dobivenih rezultata. U sluaju da korelacija ne postoji, obino se
zakljuuje da je provedeni eksperiment vrlo nestabilan poto ponovljeni
eksperiment ne moe ponoviti prethodne rezultate.
16

Zakljuak
Korelacija (lat. con = sa, relatio = odnos) predstavlja suodnos ili meusobnu
povezanost izmeu razliitih pojava predstavljenih vrednostima dve varijabli. Pri
tome povezanost znai da je vrednost jedne varijable mogue sa odreenom
vjerojatnou predvidjeti na osnovu saznanja o vrednosti druge varijable. Klasini
primeri povezanosti su npr. saznanje o utjecaju koliine padalina na urod itarica, o
povezanosti slane hrane i visokog krvnog tlaka i sl. Promena vrednosti jedne
varijable utjee na promenu vrednosti druge varijable. Varijabla koja svojom
vrednou ne utjee na drugu varijablu naziva se neovisna varijabla. Varijabla na
koju se utie naziva se ovisna varijabla. Npr. unoenje vie soli u organizam utjee
na porast krvnog tlaka, dok porast krvnog tlaka ne utjee na poveanje unoenja
soli u organizam. U ovom primeru unoenje soli u organizam je neovisna varijabla,
a poveanje krvnog tlaka je ovisna varijabla. Mogui su sluajevi da dve varijable
istovremeno utjeu jedna na drugu, pa su u tom sluaju obe varijable istovremeno i
ovisne i neovisne.



17

Literatura
1. Internet linkovi:
www.ef.uns.ac.rs
www.nastava.fsk.unsa.ba
www.profesorka.wordpress.com

You might also like