You are on page 1of 16

ANALIZA PODATAKA

Predavanje 20: Linearna regresija


Šta ćete naučiti na ovom času?


Da primenite linarni regresioni model kako biste
ustanovili kako jedna varijabla utiče na drugu.
Kauzalnost i korelacija

U raznim životnim problemima, kako u privatnoj, tako i u poslovnoj


sferi značajno je utvrditi od čega sve zavisi i na koji način neka
varijabla (na primer, cena polovnog automobila, ponuda neke robe
na tržištu, itd.)
Do sada smo videli neke metode na osnovu kojih možemo utvrditi da
li su dve varijable (dva obeležja) zavisne, ali ne i koja od njih je
prediktor druge.
Kauzalnost i korelacija

https://www.youtube.com/watch?v=8B271L3NtAw
Ekonomski i ekonometrijski
model
Najčešće se tehnika koja će ovde biti opisana koristi u ekonomiji. Da
bi se napravio model koji opisuje zavisnost neke varijable od drugih,
prvo se izgrađuje ekonomski model, tj. utvrđuje se od čega sve zavisi
neka promenljiva i na koji način teorijski, a zatim se statističkim
aparatom određuju parametri ekonomskog modela, i dobijamo
takozvani ekonometrijski model.
Ekonomski i ekonometrijski
model
Na primer, možemo pretpostaviti da cena nekog modela polovnog
automobila zavisi od toga koliko je taj automobil prešao i od starosti.
Ako pretpostavimo da je ta zavisnost linearna dobijamo model:

Y =α+β1 X 1+β2 X 2
Ekonomski i ekonometrijski
model
Ovo je ekonomski, teorijski model, koji ne mora biti dobar. Ako
istražimo tržište i prikupimo dovoljno podataka, ovaj model možemo
statistički proveriti i dobiti ekonometrijski model. Taj model je:
̂ β̂1 X 1+β̂2 X 2 +u
Y =α+

gde su koeficijenti statistički ocenjeni, a u je greška modela


(pretpostavka je da je ona slučajna varijabla sa normalnom
raspodelom sa očekivanjem 0).
Metod najmanjih kvadrata

Kako se nalaze koeficijenti regresije? Ovo pitanje ćemo razmatrati u


situaciji kada imamo jednu objašnjavajuću varijablu.
Pretpostavimo da smo dobili n vrednosti varijable X i varijable Y koje
smo nekom vrstom istraživanja. Neka su to x1, x2, …, xn i y1, y2, …, yn.
Vrednosti xk, odgovara vrednost yk.

Primer kako ove vrednosti možemo prikazati grafički je na sledećem


slajdu.
Metod najmanjih kvadrata
y

x
Metod najmanjih kvadrata

Naš cilj je da nađemo pravu liniju (kao na slici) koja “najbolje fituje”
sa podacima.
Najčešće korišćen metod je nalaženje takve prave linije za koju je zbir
kvadrata rastojanja tačaka do nje (po vertikalnoj liniji) minimalan. Taj
metod se zove metod najmanjih kvadrata.
Metod najmanjih kvadrata
Kada imamo samo jednu objašnjavajuću promenljivu, onda je model
Y =α+β X

Naš zadatak je da ocenimo koeficijente ove linearne funkcije. Ako


zapišemo model u obliku
y j=α+β x j+u j

tražimo one koeficijente za koje je zbir kvadrata grešaka najmanji.


Metod najmanjih kvadrata

Dakle, minimizujemo sumu


n n

∑ ∑ j
u = ( 2
y
j −α−β x j )2

j=1 j=1

Ovo je kvadratna funkcija po α i β i njen minimum nalazimo


traženjem parcijalnih izvoda. Vrednosti ocenjenih koeficijenata date
su na sledećem slajdu.
Metod najmanjih kvadrata
n

∑ x j y j−n x̄n ȳn


̂ j=1
β= n

∑ j ̄n
x 2
−n x 2

j=1

̂ ȳn−β̂ x̄n
α=
Pitanja za samostalan rad

1. Po čemu se razlikuje kauzalna zavisnost varijabli od obične


zavisnosti? Navesti primer.
2. Navesti primer jednog ekonomskog modela. Šta je objašnjavajuća,
a šta objašnjena varijabla? Zašto mislite da je u tom modelu
prikladan linearan, a ne neki drugi (na primer eksponencijalni)
model?
Najava sledećeg časa

Linearni modeli
Hvala na pažnji!

You might also like