You are on page 1of 13

Veleuilite u Karlovcu

Poslovni odjel
Specijalistiki diplomski struni studij Poslovno upravljanje








Ivan Biani
REGRESIJA

PRED PRISTUPNI RAD








Kolegij: Poslovne raunice
Mentor: prof.dr.sc. emso Tankovi






Karlovac, veljaa, 2012.



SADRAJ



1.UVOD ................................................................................................................ 3
2. REGRESIJA .................................................................................................... 4
2.1. MODEL JEDNOSTAVNE REGRESIJE ................................................................. 4
2.2. JEDNOSTAVNA LINEARNA REGRESIJA ............................................................ 5
2.3. REGRESIJSKE VRIJEDNOSTI, REZIDUALNA ODSTUPANJA .............................. 7
3. ZAKLJUAK ................................................................................................ 12
LITERATURA .................................................................................................. 13





















1.UVOD


Mnoge su pojave u gospodarstvu meusobno povezane. Promjenom jedne veliine
dolazi do promjene druge veliine. Temeljem tih pretpostavki regresija je odlina metoda da
se vidi odnos izmeu dvije pojave ili da se predvidi budui odnos veliina.
Modelom jednostavne linearne regresije prikazujemo odnos izmeu dviju varijabli
koje imaju svojstvo da svakom jedininom porastu jedne varijable odgovara priblino jednaka
linearna promjena druge varijable. Grafiki prikaz zavisne i nezavisne veliine naziva se
dijagram rasipanja. Prema dijagramu rasipanja moemo prepoznati veze izmeu varijabli koje
mogu biti: funkcionalne veze, statistike veza, krivolinijske veze ili bez prisutnosti veze meu
pojavama.
Ako je odnos izmeu pojava mogue objasniti formulom bx a y + =

onda je to
jednostavna linearna regresija. Parametar a naziva se konstantnim lanom i on je vrijednost
regresijske funkcije kada je neovisna varijabla x = 0, a parametar b nazivamo regresijskim
koeficijentom te on pokazuje za koliko se u prosjeku promijeni pojava Y ako se pojava X
promijeni za jedinicu mjere.
Nakon rjeavanja modela bitno je ocijeniti reprezentativnost tog modela izraunom
apsolutnih ili relativnih mjera reprezentativnosti. Apsolutna mjera je standardna devijacija
regresijskog modela, a relativna mjera su koeficijent varijacije i koeficijent determinacije.
Model je reprezentativniji to je koeficijent determinacije blii jedinici.














2. REGRESIJA


Zadaa regresijske analize je da pronae analitiko-matematiki oblik veze izmeu jedne
ovisne i jedne ili vie neovisnih varijabli. Osim objanjavanja prirode ovisnosti promatranih
pojava na temelju tog analitikog oblika moe se vriti predvianje vrijednosti ovisne
varijable pri odreenim vrijednostima neovisne-ih varijabli.


2.1. Model jednostavne regresije

Modelom jednostavne linearne regresije prikazujemo odnos izmeu dviju varijabli koje imaju
svojstvo da svakom jedininom porastu jedne varijable odgovara priblino jednaka linearna
promjena druge varijable.Za statistiku analizu modela jednostavne regresije izbor oblika
modela svodi se na izbor funkcije f(X). Koja poprima razliite oblike, izbor koji ovisi od
sluaja do sluaja.
Pomono sredstvo za izbor opeg oblika funkcije je dijagram rasipanja. To je grafiki
prikaz koji se konstruira u pravokutnom koordinatnom sustavu. Na apcisu nanosimo x
i

vrijednosti nezavisne varijable X, a na ordinatu y
i
vrijednosti zavisne varijable Y Ovisno o
rasporedu toaka u dijagramu donosi se odgovarajui zakljuak.
Slika 2.1. Dijagram rasipanja
a) b)


c) d)

(Izvor: oo I. i Serdar V.;Uvod u statistiku, kolska knjiga, Zagreb, 1997.)



Rasporeuju li se toke u dijagramu rasipanja od donjeg lijevog kuta kvadranta prema
gornjem desnom kutu oko zamiljenog pravca onda moemo zakljuiti da izmeu varijabli
postoji statistika povezanost linearnog oblika i pozitivnog smjera. Raspored toaka od
gornjeg lijevog kuta prema donjem desnom kutu uzdu zamiljenog pravca takoer govori o
postojanju linearne veze meu pojavama ali negativnog smjera . Ako se toke u dijagramu
rasipanja rasporeuju oko razliitih krivulja onda e biti prikladan model krivolinijske
regresije. Ne postoji li sistematsko rasporeivanje toaka u dijagramu radit e se o odsutnosti
korelacije. Jakost korelacije ovisi o udaljenosti toaka od zamiljenog pravaca, ukoliko su
udaljenosti manje korelacija je jaa i obratno ukoliko su udaljenosti vee korelacija je slabija.

2.2. Jednostavna linearna regresija


Kada u dijagram rasipanja uvrstimo vrijednosti x
i
nezavisne varijable i vrijednosti y
i

zavisne varijable dobivamo prosudbu o moguem obliku povezanosti pojave X i Y. Kada se ta
povezanost definira jednadbom regresije:
bx a y + =


Govori se o jednostavnoj linearnoj regresiji. Parametar a naziva se konstantnim lanom. To je
zapravo vrijednost regresijske funkcije kada je neovisna varijabla x = 0. Parametar b se naziva
regresijskim koeficijentom te pokazuje za koliko se u prosjeku promijeni pojava Y ako se
pojava X promijeni za jedinicu mjere. Njegov predznak odreuje smjer veze izmeu ovih
pojava.
Primjenom metode najmanjih kvadrata rjeavanjem dviju jednadbi s dvije nepoznanice
parametri a i b izraunavaju se na sljedei nain:

=
=

=
k
i
i
k
i
i i
x n x
xy n y x
b
1
2
2
1
b x y a =

Ocijenjeni model linearne regresije ima sljedea svojstva:
- zbroj rezidualnih odstupanja mora biti jednak nuli,
- zbroj kvadrata tih odstupanja jednak je minimumu.



Primjer 1
Izraunajte parametre pravca regresije ( y

) te napiite jednadbu regresije


Tablica 1. Broj zaposlenih i vrijednost prometa

Promet
Broj
zaposlenih
250 22
300 31
920 90
850 82
410 43
680 65
630 59
180 16
670 61
420 46
350 35
460 50
6120 600
Izvor podataka oi, I.; Statistika, kolska knjiga, Zagreb (2006), str.208

Izraunajte parametre pravca regresije ( y

) te napiite jednadbu regresije



Tablica 1.1. Broj zaposlenih, vrijednost prometa i parametri potrebni za raunanje zadatka
Yi Xi X^2 XiYi

250 22 484 5500

300 31 961 9300

920 90 8100 82800

850 82 6724 69700

410 43 1849 17630

680 65 4225 44200

630 59 3481 37170

180 16 256 2880

670 61 3721 40870 n 12
420 46 2116 19320 X srednje 50
350 35 1225 12250 Y srednje 510
460 50 2500 23000 a -9,497
6120 600 35642 364620 b 10,39

50
12
600
= = =

n
x
x
i
510 12 = = =

n
y
y
i



39 . 10
50 12 35642
510 50 12 364620
2
1
2
2
1
=


=

=
=
k
i
i
k
i
i i
x n x
xy n y x
b

497 . 9 39 . 10 50 510 = = = b x y a

x bx a y 39 . 10 497 . 9 + = + =




2.3. Regresijske vrijednosti, rezidualna odstupanja

Pomou regresijske jednadbe s ocijenjenim parametrima utvruju se regresijske
vrijednosti. Regresijske su vrijednosti dane izrazom:


i i
bx a y + =

i =1,2,,n.

Regresijske vrijednosti su procijenjene vrijednosti zavisne varijable za dane vrijednosti
nezavisne varijable. Regresijske vrijednosti odstupaju od stvarne vrijednosti zavisne varijable,
a ta odstupanja se nazivaju rezidualna odstupanja.
Rezidualna odstupanja izraunavaju se tako da od veliina zavisne varijable
i
y odbije
pripadajua regresijska veliina
i
y

.
Ukoliko se rezidualno odstupanje podijeli sa
pripadajuom stvarnom veliinom zavisne varijable
i
y i omjer pomnoi sa 100 dobiva se
relativno rezidualno odstupanje. Standardizirana rezidualna odstupanja dobivaju se
dijeljenjem rezidualnih odstupanja regresijskom standardnom devijacijom. Model jednostavne
linearne regresije je reprezentativni ukoliko su manja rezidualna odstupanja, kojih je toliko
koliko i regresijskih veliina odnosno parova varijabli ( x , y ). Rezidualna odstupanja iskazuju
disperziju u odnosu na regresijsku jednadbu kao prosjenu veliinu
Izraunavanjem zbroja kvadrata ukupnog, protumaenog i rezidualnog odstupanja
pojednostavljuje se uporabom sljedeih formula:






Tablica 2. Tablica Anova
Izvor varijacija Stupnjevi
slobode
Zbroj kvadrata Sredina
kvadrata
Empirijski
F-omjer
1 2 3 4 5
Protumaenih
modelom

Rezidualna
odstupanja
1


n-2
( )

=
=
n
i
i
y y SP
1
2



( )

=
=
n
i
i i
y y SR
1
2

SP/1


SR/n-2
SP/(SR/n-2)


-
Ukupno n-1
( )

=
=
n
i
i
y y ST
1
2

- -


( )

= =
= =
n
i
i
n
i
i
y n y y y ST
1
2
2
1
2

( )
2
1 1 1
2
y n y x b y a y y SP
n
i
i i
n
i
i
n
i
i
+ = =

= = =


( )

= = = =
= =
n
i
i i
n
i
i
n
i
i
n
i
i i
y x b y a y y y SR
1 1 1
2
1
2

ST= ukupna suma kvadrata
SP = protumaena suma kvadrata
SR = suma kvadrata rezidualnih odstupanja
Empirijski F-omjer = omjer protumaene sredine kvadrata i rezidualne sredine kvadrata. Ovaj
omjer je test veliina za ispitivanje hipoteze o znaajnosti linearne regresije.

Jednadba analize varijacije se simboliki moe zapisati
ST=SP+SR
Vidimo da je polazna veliina za mjerenje disperzije rezidualni zbroj kvadrata.

Polazna veliina za mjerenje disperzije je rezidualni zbroj kvadrata. Varijanca regresije je
prosjeni rezidualni zbroj kvadrata:


( )
n
y y
n
i
i i
y
2
1 2

=

=

o

Standardna devijacija je drugi korijen iz varijance:
( )
n
y y
n
i
i i
y
2
1

=

=

o
Standardna devijacija regresije pokazuje koliko je prosjeno odstupanje empirijskih
vrijednosti zavisne varijable od njezinih regresijskih vrijednosti. Relativna mjera disperzije
oko regresije je koeficijent varijacije.
100 =
y
V
y
y
o


Varijanca odnosno standardna devijacija i koeficijent varijacije ovise o rezidualnom
zbroju kvadrata. Kada bi svako rezidualno odstupanje bilo jednako 0 rezidualni zbroj kvadrata
bio bi jednak 0, i u tom bi sluaju vrijednosti regresije bile jednake vrijednostima linearne
funkcije. Odnos izmeu varijabli u tom primjeru ne bi bio statistiki nego deterministiki. U
naelu, mala vrijednost tih pokazatelja moe biti pokazatelj dobre reprezentativnosti
analitikog izraza odnosa izmeu pojava.
Ako se suma kvadrata protumaenih odstupanja podijeli sa sumom kvadrata ukupnih
odstupanja dobije se koeficijent determinacije:
( )
( )

=
=

=
n
i
i
n
i
i
y y
y y
r
1
2
1
2
2

1 0
2
s s r
Ovaj koeficijent pomnoen sa 100 izraava u postotku koliko je modelom jednostavne
linearne regresije protumaeno ukupnog kvadrata odstupanja.
Koeficijent determinacije nalazi se u zatvorenom intervalu od 0 do 1. poeljno je da je
on blii jedinici a to znai da se radi o maloj vrijednosti rezidualnog zbroja kvadrata. to
uvjetuje maloj disperziji oko regresije. U prosudbi kvalitete regresije koristi se i korigirani
koeficijent determinacije koji se dobije izrazom:
( )
2
2
1
2
1
1 r
n
n
r

=



Primjer 2
Na temelju predhodnog primjera:
- izraunajte zbroj kvadrata protumaenih, ne protumaenih (rezidualnih) i ukupnih
odstupanja.
- Izraunajte koeficijent determinacije i korigirani koeficijent determinacije
- Izraunajte varijancu, standardnu devijaciju i koeficijent varijacije regresija
Tablica 3.
Yi Xi X^2 Xi*Yi Y^ ST SP SR
250 22 484 5500 219,08189 67600 84633,35 955,93
300 31 961 9300 312,59128 44100 38970,20 158,54
920 90 8100 82800 925,59731 168100 172721,12 31,33
850 82 6724 69700 842,47784 115600 110541,52 56,58
410 43 1849 17630 437,27047 10000 5289,58 743,68
680 65 4225 44200 665,84899 28900 24288,91 200,25
630 59 3481 37170 603,50939 14400 8744,01 701,75
180 16 256 2880 156,74229 108900 124791,01 540,92
670 61 3721 40870 624,28926 25600 13062,03 2089,47
420 46 2116 19320 468,44027 8100 1727,21 2346,46
350 35 1225 12250 354,15101 25600 24288,91 17,23
460 50 2500 23000 510 2500 0,00 2500,00
6120 600 35642 364620 6120 619400 609057,85 10342,15



Tablica 3.1.
n 12

X srednje 50

Y srednje 510

a -9,497

b 10,39



r^2 0,98

r 0,99

Varijanca 861,85

Standardna devijacija 29,357

Koeficijent varijacije 5,7563 %






Tablica 3.2.

ANOVA

Izvor var Stupanj slob Sume kvadr Sred kvad F-omjer
Protum 1 609057,85 609057,85 588,91
Neprot 10 10342,15 1034,21
Ukupno 11 619400,00 -




















( )
85 , 861
2
1 2
n
y y
n
i
i i
y

=

=

o

( )
357 , 29
2
1
=

=

=
n
y y
n
i
i i
y

o



5,7563 100 = =
y
V
y
y
o











609057,85 ) (
2
1
= =

=

y y SP
k
i

10342,15 ) (
2
1
= =

=
y y SR
k
i
i

2
1
2
1 2
) (
) (

y y
y y
r
k
i
i
k
i

0,98 = 99 , 0 = r
619400 ) (
2
1
= =

=

y y ST
k
i
i



3. ZAKLJUAK


U dananje vrijeme pronalaenje odnosa izmeu dvije veliine moe biti kljuno za
planiranje daljnjeg rada ili razvoja neke tvrtke. Regresijska analiza sastoji se u primjeni
metoda kojima se analitiki objanjava ovisnost jedne pojave o drugoj. Analiza modela
regresije ukljuuje ocjenjivanje nepoznatih parametara, izraunavanje mjera disperzije i
drugih statistiko analitikih pokazatelja, te primjenu postupaka kojima se ispituje kvaliteta
dobivenih rezultata s obzirom na polazne pretpostavke o modelu i svojstvima varijabli u
njemu. to je koeficijent determinacije blii jedinici to je regresija reprezentativnija.
Analizom modela iz primjera vidljivo je da su broj zaposlenih i promet dvije meusobno
zavisne veliine. Broj zaposlenih je nezavisna, a promet zavisna veliina.




























LITERATURA




1. oi I.; Primijenjena statistika, kolska knjiga, Zagreb, 2004

2. oi I., Serdar V.; Uvod u statistiku, kolska knjiga, Zagreb, 1997.

3. oi I.; Statistika, kolska knjiga, Zagreb, 2006

4. Vrani V.; Vjerojatnost i statistika, Tehnika knjiga, Zagreb, 1971.

You might also like