You are on page 1of 10

SEMINARSKI RAD IZ PREDMETA STATISTIKA

LINEARNI REGRESIJSKI MODEL


LINEARNI REGRESIJSKI MODEL

SADRŽAJ

1. UVOD.................................................................................................................................3
2. LINEARNA REGRESIJA..................................................................................................4
2.1. Vrste regresije..................................................................................................................5
2.2. Metoda najmanjih kvadrata u regresiji............................................................................5
2.3. Primjer proste linearne regresije......................................................................................6
3. ZAKLJUČAK.....................................................................................................................9
4. LITERATURA.................................................................................................................10

2|
LINEARNI REGRESIJSKI MODEL

1. UVOD

Regresija je postupak modeliranja numeričke izlazne vrijednosti na temelju numeričkih ili


kategoričkih ulaznih vrijednosti. Mnogo je situacija u kojima treba predvidjeti numeričku
vrijednost na temelju nekih ulaznih patametara: predviđanje cijena nekeretnina na temelju
kvadrature i starosti nekretnine, predviđanje prihoda osoba na temelju stepena obrazovanja,
dobi i dužine staža ili previđanje ocjene filma na temelju informacije o temi, režiseru,
glumačkoj postavi i cijeni produkcije, tipični su slučajevi gdje bismo upotrijebili regresiju.
Regresijski modeli imaju dugu i zanimljivu tradiciju u statistici, gdje se regresija, pored
korelacijske analize, prvenstveno koristi kako bi se analizirali i objasnili odnosi izmedu dvaju
skupova varijabli. Statistika je razvila niz različitih regresijskih metoda, čija primjenjivost
zavisi o vrsti podataka i pretpostavkama koje o podacima možemo napraviti. Pritom je glavni
cilj objasniti kako izlazna varijabla zavisi o ulaznim varijablama: koje ulazne varijable utječu
na izlaznu varijablu, u kojoj mjeri, koliko pouzdano to možemo zaključiti te koliko je,
ukupno gledano, naš model uspješan u objašnjavanju ponašanja izlazne varijable kao funkcije
ulaznih varijabli.

U ovom radu predstavljen je linearan model regresije, koji obuhvata linearnu i nelinearnu
regresiju koja igra važnu ulogu u statistici. Prvo poglavlje predstavlja pojam i definiciju
linearnog modela regresije. U središnjem dijelu rada opisane su vrste regresije te predstavljen
model jednostavne linearne regresije. Na kraju rada dati su primjeri linearne regresije koji su
računati u programskom alatu SPSS .

3|
LINEARNI REGRESIJSKI MODEL

2. LINEARNA REGRESIJA

Linearna regresija se koristi za modeliranje međusobne funkcionalne zavisnosti (ne statističke


zavisnosti) između dvije promjenjive (varijable) na način da se linearna jednačina prilagodi
podacima. Pri tome se jedna promjenjiva smatra zavisnom promjenjivom, a druga
eksploratornom (nezavisnom, deskriptivnom). Na primjer, neka se želi istražiti kako bodovi
na ispitu zavise od broja sati učenja. (podaci su prikazani u Tabeli 1).

Sati
učenja (h) 12 31 22 7 10,8 25 15,6 23,5 17,2 14
Bodovi
(B) 45 60 88 25 42 85 51 80 60 53

Tabela 1. Zavisnost bodova od vremena učenja

Postojanje povezanosti ne implicira nužno da je jedna promjenjiva uzrok promjene druge, već
samo da postoji neka vrsta značajne povezanosti među njima. Jedan od korisnih instrumenata
za istraživanje povezanosti je tzv. scatterplot (prikaz parova vrijednosti u dvodimenzionom
koordinatnom sistemu). Ukoliko se na grafikonu ne vidi nikakva značajna povezanost
(ukoliko su tačke nepravilno razasute po koordinatnom sistemu), linearna aproksimacija ne
mora imati smisla. Podaci iz Tabele 1 su prikazani na Slici 1.

Slika 1. Grafički prikaz regresionog modela zavisnosti bodova od vremena učenja

4|
LINEARNI REGRESIJSKI MODEL

Kako se sa Slike 1 vidi da su podaci grupisani linearno, u ovom slučaju ima smisla istražiti
oblik linearne zavisnosti. Numerički pokazatelj povezanosti podataka koji se veoma često
koristi u praksi je koeficijent korelacije. Njime se može ustanoviti ne samo postojanje, nego i
jačina povezanosti. U ovom slučaju je vrijednost koeficijenta korelacije 𝜌=0.775, što
implicira da među podacima postoji značajna pozitivna povezanost.

Prava linearne regresije ima jednačinu općeg oblika 𝑌=𝑎+𝑏𝑋 , gdje je 𝑌 zavisna promjenjiva,
𝑋 eksploratorna (nezavisna) promjenjiva, 𝑎 presjek sa 𝑦−osom, a 𝑏 nagib prave. Koeficijent
𝑎 se još tumači kao početna vrijednost regresije (u ovom slučaju koliki bi bio prinos bez
navodnjavanja) i u modeliranju se može zahtjevati da se on postavi na nulu, ukoliko to ima
više smisla. Sa druge strane, uobičajeno tumačenje nagiba 𝑏 je da on predstavlja povećanje
zavisno promjenjive ukoliko se nezavisno promjenjiva poveća za jednu.

2.1. Vrste regresije

Najjednostavniji model linearne regresije jeste onaj kod kojeg imamo samo jednu ulaznu
varijablu. To je takozvana jednostavna (jednostruka) regresija (engl. simple regression).
Primjer jednostavne regresije jest previđanje prihoda osobe na temelju dobi. U općenitom
slučaju, regresijski model može imati više ulaznih varijabli, ali i više izlaznih varijabli. Ako
model ima više od jedne ulazne (prediktorske) varijable, onda govorimo o modelu višestruke
ili multipla regresije. Primjer višestruke regresije jest previđanje prihoda osobe na temelju
dobi i duljine staža. U oba ova primjera postoji samo jedna izlazna varijabla, i takvu regresiju
nazivamo univarijatnom ili jednoizlaznom. Ako ipak model ima više izlaznih (zavisnih)
varijabli onda govorimo o multivarijatnoj ili višeizlaznoj regresiji.

2.2. Metoda najmanjih kvadrata u regresiji

Kada su podaci za 𝑋 i 𝑌 poznati, onda se mogu aproksimirati i vrijednosti za koeficijente 𝑎 i


𝑏. Jedna od najčešće korištenih metoda je metoda najmanjih kvadrata u kojoj se minimizira
greška regresije. Greška se posmatra kao rastojanje pojedinačnih tačaka od prave regresije
(ukoliko tačka leži na pravoj njeno odstupanje jednako je nuli). Kako se odstupanja od prave
kvadriraju, to se pozitivne i negativne vrijednosti ne mogu anulirati.

5|
LINEARNI REGRESIJSKI MODEL

Za realizaciju ove metode, potrebno je jednačinu regresije zapisati u obliku 𝑦𝑖=𝑎+𝑏𝑥𝑖+𝑒𝑖,


gdje su malim slovima označene realizacije slučajnih promjenjivih, a sa 𝑒𝑖 je označena greška
regresije. Dalje se greška izrazi eksplicitno, kvadrira, a zatim se dobijene jednakosti
parcijalno deriviraju po promjenjivim.

2.3. Primjer proste linearne regresije

Regresijska analiza koristi se za donošenje zaključaka o nizu slučajnih varijabli Y1, . . . , Yn


koje ovise o nezavisnoj varijabli x. Zaključci se donose na temelju niza sparenih mjerenja
(x1, y1), . . . , (xn, yn), gdje su x1, . . . , xn vrijednosti nezavisne varijable x, a y1, . . . , yn
odgovarajuće vrijednosti slučajnih varijabli y1, . . . , yn., U konkretnim primjerima nezavisnu
varijablu x često zovemo kontroliranom ili prediktornom varijablom. Cilj je na temelju
sparenih mjerenja (x1, y1), . . . , (xn, yn) ustanoviti ovisnost slučajnih varijabli yi o
nezavisnoj varijabli x. Matematički model definirali smo relacijom
yi = f(xi) + ei (i = 1, …, n)
gdje je:
x → f(x) realna funkcija jedne realne varijable,
e1, . . . , en nezavisne slučajne varijable tako da je E[ei] = 0 i Var(ei) = σ2.

Prvi korak u uspostavljanju veza između varijabli y i x je prikaz podataka u dijagramu


raspršenosti iz kojeg se lako vidi grupiraju li se točke (sparena mjerenja) oko pravca (linearna
zavisnost) ili neke krivulje.

U narednom primjeru će biti objašnjena linerana regresija, kroz primjer osovojenih bodova na
ispitu u zavisnoti od broja sati učenja studenata u programu SPSS. Podaci su dati u slijedećoj
tabeli. (Tabeli 2).

Sati
učenja (h) 12 31 22 7 10,8 25 15,6 23,5 17,2 14
Bodovi
(B) 45 60 88 25 42 85 51 80 60 53

Tabela 2. Zavisnost bodova od vremena učenja

6|
LINEARNI REGRESIJSKI MODEL

Podatke smo unijeli u SPSS.


Sljedeće što treba uraditi je Analyze -> Regression -> Linear

Izvor: Obrada autora u Statističkom programu SPSS 25.

Nakon toga je potrebno u Dependent (zavisne) dodati bodove, a u Independent (nezavisne)


sate.

Izvor: Obrada autora u Statističkom programu SPSS 25.

Zatim, kliknemo na opciju Plots, gdje je potrebno za y varijablu dodati *ZRESID, te za x


varijablu *ZSPRED. Nakon toga u Output prozoru nam se pojave rezultati koji će biti
prikazani na narednoj stranici.

7|
LINEARNI REGRESIJSKI MODEL

Model Summaryb
Adjusted R Std. Error of the
Model R R Square Square Estimate
1 .775 a
.601 .551 13.59219
a. Predictors: (Constant), sati
b. Dependent Variable: bodovi

Izvor: Obrada autora u Statističkom programu SPSS 25.

U ovoj tabeli vidimo da je koeficijent korelacije prediktora 0,775, što nam govori da je
njihova veza veoma jaka. Koeficijent determinacije iznosi 0,601, i on nam predstavlja
kvadratno odstupanje koeficijenta korelcije i pokazuje da ovim primjerom objašnjeno 60,1%
varijabli, a da na ostalih 39,99% utječu nepoznati faktori.

Ovaj grafikon pokazuje da se radi o linearnoj regresiji, jer su podaci grupisani linearno i da
između njih postoji povezanost.

8|
LINEARNI REGRESIJSKI MODEL

3. ZAKLJUČAK:

Regresijska se analiza koristi za donošenje zaključaka o nizu slučajnih varijabli Y1, . . . , Yn


koje ovise o nezavisnoj varijabli x. Zaključci se donose na temelju niza sparenih mjerenja
(x1, y1), . . . , (xn, yn), gdje su x1, . . . , xn vrijednosti nezavisne varijable x, a y1, . . . , yn
odgovarajuće vrijednosti slučajnih varijabli Y1, . . . , Yn.
U konkretnim primjerima nezavisnu varijablu x često zovemo kontroliranom ili prediktornom
varijablom (važno za odabir varijabli u programskom paketu SPSS).
U ovom radu smo došli do sljedećih zaključaka

- koeficijent korelacije prediktora iznosio je 0,775, što nam govori da je njihova veza
veoma jaka.
- koeficijent determinacije iznosi 0,601, i on nam predstavlja kvadratno odstupanje
koeficijenta korelcije i pokazuje da ovim primjerom objašnjeno 60,1% varijabli, a da
na ostalih 39,99% utječu nepoznati faktori
- grafikon pokazuje da se radi o linearnoj regresiji, jer su podaci grupisani linearno i da
između njih postoji povezanost.

9|
LINEARNI REGRESIJSKI MODEL

4. LITERATURA

Šnajder J. (2017): Linearan model regresije, verzija 05.

a) http literaturni izvori

https://www.pmf.unizg.hr/_download/repository/PREDAVANJE11.pdf
http://www.unizd.hr/portals/4/nastavni_mat/2_godina/statistika/10_predavanje.pdf
http://www.mathos.unios.hr/ptfstatistika/Vjezbe/materijali_7.pdf

10 |

You might also like