UVOD U statističkim istraživanjima često se interes istraživača usmerava prema problemu povezanosti među varijablama.

Pri tom je od posebnog interesa mogućnost prognoziranja ili predikcije vrednosti (ili varijabilnosti) jedne varijable na osnovu drugih varijabli. Regresiona analiza podrazumeva odnos između odabranih vrednosti jedne varijable (varijable X) i s njima povezanih vrednosti druge varijable (varijable Y). Ova analiza se koristi u situaciji kada se želi istražiti mogućnost procene jedne varijable (varijable Y) na temelju poznate vrednosti druge varijable (varijable X). Zadatak regresione analize odnosi se na utvrđivanje postojanje veze između dve ili više numeričke varijable, te utvrđivanje oblika, jačine i smera veze. U regresionoj analizi se mora utvrditi da li je objašnjavajuća promenljiva značajna za ponašanje zavisne promenljive, što je nužno kod predviđanja vrednosti zavisne promenljive

1. Regresiona analiza i povezanost pojava Povezanost dveju pojava postojiako sa porastom jedne pojave koju nazivamo nezavisnom pojavom ili nezavisnom promenljivom, obeležja druge pojave, koju nazivamo zavisnom promenljivom rastu ili opadaju. Oblik veza između posmatranih pojava može biti linearan, krivolinijski i prostorni. Ako se originalnim podacima posmatranih pojava može prilagoditi linearni oblik matematičke funkcije, govorimo o linearnom obliku veza. Kada se originalnim podacima može dobro prilagoditi neka krivolinijska matematička funkcija (kvadratna parabola, kubna parabola, eksponencijalna itd.), onda kažemo da je oblik veza između posmatranih pojava krivolinijski. Nekada je moguće, ako posmatramo povezanost između više od dve pojave, originalnim oblicima dobro prilagoditi neki prostorni oblik matematičke funkcije (ravan, hiperravan, itd), pa u tom slučaju kažemo da imamo prostorni oblik veza između pojava. 1 Kada je u pitanju smer veza između pojava, razlikujemo pozitivnu i negativnu vezu. Pozitivna veza postoji kada sa porastom vrednosti nezavisne promenljive raste i zavisna promenljiva. Negativna veza je prisutna kada sa porastom vrednosti nezavisne promenljive dolazi do pada vrednosti zavisne promenljive. Po jačini prisutne su deterministička i stohastička veza. Deterministička (funkcionalna ) veza se javlja kada jednoj vrednosti nezavisne promenljive X odgovara samo jedna zavisna promenljiva Y. Npr. površina kruga se izracunava po nekoj formuli , pri čemu za bilo koji poluprečnik kruga mozemo izracunati njegovu površinu. Ovakav tip veze mozemo prikazati izrazom Y=f(X) , gde je f(X) neka funkcija od X . Determinističke veze su u ekonomskoj praksi retkost. Stohastičke veze su slabije od determinističkih i kod njih jednoj vrednosti nezavisne promenljive X odgovara više vrednosti zavisne promenljive Y. Dakle, vrednost zavisne promenljive varira u nekom intervalu, odnosno, ona se na slučajan način pojavljuje više puta. To podrazumeva da se vrednosti zavisne promenljive ne javljaju sigurno, već uz neku verovatnoću, pa zato ove vrednosti možemo smatrati slučajnim promenljivim.2 Između pojedinih vrednosti nezavisne promenljive X i prosečnih vrednosti zavisne promenljive Y ( ocekivanih vrednosti ) postoji cvrsta tj. funkcionalna veza. Prosek Y=f(X) Kod stohastičke veze često se dešava da individualne vrednosti Y odstupaju od proseka, pa do pravilnosti posmatranih pojava dolazimo ispitivanjem velikog broja podataka. Individualne vrednosti su slučajne promenljive zbog delovanja velikog broja faktora. Za određivanje oblika, smera i jačine veze između dve pojave nam služi regresioni model koji kroz matematičke formule najbolje iskazuje kvantitativnu zavisnost pojava. Zahvaljujući modelu mozemo da:

1 2

Stojković, M (1991): STATISTIKA U EKONOMIJI, Subotica, Ekonomski fakultet, str. 126 IBID, 127

2

a koja nezavisne promenljive. a na ordinatnoj osi vrednosti zavisno promenljive y. a koju kao nezavisnu promenljivu. 2.1. Dijagram rasturanja. Na apscisnoj osi nanose se vrednosti nezavisno promenljive x. a koji zavisnu promenljivu. za jednofaktorni eksperiment (zavisnost promenljivih x i y). U regresionoj analizi. ili pretpostavki o prirodi analiziranih pojava. tačke maksimuma i/ili minimuma ili prevojne tačke. Razlika između regresione i korelacione analize Osnovna razlika između regresione i korelacione analize jeste u tretmanu zavisnih. budući da ćemo uvek dobiti identičan rezultat. takođe. Ovi parovi su prikazani kao tačke u koordinatnom sistemu koji na X osi ima vrednosti za varijablu X. Tako konstruisan grafik naziva se grafik funkcija eksperimentalnih podataka. pokazuje kako se funkcija menja kada njen argument uzima sve vrednosti iz oblasti definisanosti. a na Y osi vrednosti za varijablu Y. Na sledećoj slici prikazani 3 . konstruiše na osnovu dobijenog eksperimentalnog skupa podataka. a često i sistematske i slučajne greške ravnomernim rasipanjem eksperimentalnih podataka oko aproksimativne krive. svejedno koju ćemo pojavu tretirati kao zavisnu. Prevojne tačke eksperimentalne krive na dijagramu rasturanja mogu značiti granicu između dva različita mehanizma iste pojave ili granicu poremećaja u merenju. isto tako. kriva. Međutim. Na dijagramu rasturanja se. odnosno nezavisnih promenljivih. 2. Dijagram rasturanja. odnosno izmerenih vrednosti parova x i y. niti se može precizno iskazati određenje koji od datih skupova podataka predstavlja nezavisnu.. Predviđamo individualne vrednosti zavisne promenljive za date vrednosti nezavisne promenljive. Dijagram rasturanja se koristi da bi se ilustrovalo kako izlazne karakteristike objekta istraživanja variraju zbog nekog određenog faktora (promenljive). u pravouglom koordinatnom sistemu sa specijalno odabranim skalama merenja na apscisnoj i ordinatnoj osi. na očigledan način otkriva ekstremne vrednosti. omogućava slikovitu predstavu o tome da li postoji ili ne postoji zavisnost i međuzavisnost izmeđupromenljivih x i y kao i njen tok (ponašanje) funkcije. tj. Dijagram rasturanja Dijagram rasturanja predstavlja grafički prikaz zavisnosti i međuzavisnosti između promenljivih. Koja će promenljiva biti izabrana za nezavisnu promenljivu utvrđuje se na osnovu prethodnih teorijskih ili empirijskih saznanja. odnosno dijagram rasturanja. Naime kod korelacione analize. pa je najpogodnija metoda analize pri određivanju optimuma. Tako npr. za koje se ne može utvrditi funkcionalna zavisnost. na osnovu nacrtanih eksperimentalnih tačaka može se vizuelno uočiti oblik aproksimativne linije: prava. opadajuća ili periodična linija. mogu lako uočiti grube greške. monotono rastuća. kod regresione analize je nužno definisati koja će pojava imati ulogu zavisne. vrednosti merenja predstavljaju se kao parovi rezultata koji se sastoje od podatka za nezavisnu varijablu (varijablu X) i od podatka za zavisnu varijablu (varijablu Y). na očigledan način. Dijagram ili grafik rasturanja se. 3. Ocenjujemo prosečne vrednosti zavisne promenljive za date vrednosti nezavisne promenljive.

koja na dijagramu rasipanja označava upravo proporcionalnu vezu između promenljivih.  4 . sa porastom nezavisno promenljive X zavisno promenljiva Y. odnosno da opadanje nezavisne promenljive X dovodi do opadanja i zavisno promenljive y (slučaj kada je koeficijent korelacije negativan. Na osnovu izgleda oblika eksperimentalnih tačaka u dijagramu rasturanja.su različiti dijagrami zavisnosti i međuzavisnost između dve promenljive X i Y. koja na dijagramu rasipanja pokazuje da je veza između promenljivih obrnuto proporcionalna. veći od nule: 0<r<+1). Opadajuća ili negativna zavisnost eksperimentalnih tačaka. može se utvrditi karakter i intenzitet istraživane zavisnosti i međuzavisnosti. koja predstavlja pravolinijski oblik dijagrama rasipanja. Nelinearna zavisnost eksperimentalnih tačaka. Zavisnost i međuzavisnost. zavisno od oblika dijagrama rasipanja. odnosno. takođe. koja predstavlja krivolinijski oblik dijagrama rasipanja. može biti:  Rastuća ili pozitivna zavisnost eksperimentalnih tačaka. raste(slučaj kada je koeficijent korelacije pozitivan. na osnovu dijagrama rasipanja. manji od nule: 0>r>-1). može biti:   Linearna zavisnost eksperimentalnih tačaka. Zavisnost i međuzavisnost.

Y2)…(Xn. Dva numerička obeležja ( X i Y) imaju karakter slučajnih promenljivih. Y1). Mladenovac. 333-334 5 . str. Nj. (X2. 3 Šolak. Pečat.B.Slika br. (2001): STATISTIKA U EKONOMIJI I MENADŽMENTU. Jednostavna linearna regresija Model proste linearne regresije populacije se definiše na osnovu sledećih pretpostavki:3 1. Parovi vrednosti obeležja (X1. 1 – Oblici dijagrama rasturenosti 4.. Yn) predstavljaju dvodimenzionalnu slučajnu promenljivu.

Promene vrednosti obeležja X su nezavisne (nezavisna slučajna promenljiva). Modelom jednostavne regresije analitički se izražava odnos između dve pojava:’Y– zavisne varijable. Odnosno. σ2yx1 = σ2yx2 = σ2yxn. Slučajna promenljiva µ predstavlja posledicu svih nemerljivih faktora zbog kojih zavisnost između slučajnih promenljivih X i Y nije funkcionalna. zavisno obeležje Y ima normalni uslovni zakon verovatnoće sa uslovnom sredinom . 4. Obeležja X i Y su korelirajuća obeležja. Jednostavna linearna regresija predstavlja odnos između dve pojave. 3. Komponente modela poseduju aditivno svojstvo. pol. Ima normalnu raspodelu i nezavisna je od slučajne promenljive X. komponentu slučajnosti. obrazovanje). stvarne vrednosti pojave kojom se objašnjavaju varijacije zavisne varijable (npr. 7. 6. vrednosti pojave čije se varijacije objašnjavaju modelom (npr. varijabla koja izražava nepoznate i apstrahovane uticaje na varijaciju varijable Y Za statističku analizu potrebno je izabrati: 6 . X – nezavisne varijable. i to takav da promenu jedne pojave prati približna linearna promena druge. tako što za svaku fiksnu vrednost nezavisnog obeležja X = x. 8. Nezavisna promenljiva X postaje neslučajna jer se u model uključuju samo njene fiksne vrednosti. Slučajna promenljiva X.Y) imaju normalne raspodele.2. dok promene vrednosti obeležja Y zavise od promena vrednosti obeležja X (zavisna slučajna promenljiva). Slučajna promenljiva µ predstavlja tzv. Varijanse su homogene. To se može prikazati u obliku opšteg aditivnog modela: Y = f (X) + µ Deterministički deo modela se izražava: f(X) = a + bX Model jednostavne linearne regresije: Y = a + bX + µ Gde je: X– nezavisna varijabla Y – zavisna varijabla u – greška relacije. godine. Između promena vrednosti nezavisnog i zavisnog obeležja može se uspostaviti očekivana veza. 5. Između njih postoji nepuna (delimična) zavisnost. broj kupljenih komada proizvoda A). slučajna promenljiva Y i dvodimenzionalna slučajna promenljiva (X. Zavisna promenljiva Y zadržava karakter slučajnosti.

mora biti ravan nuli. 134 7 . 2. Pokazuje za koliko se linearno menja vrednost regresione funkcije za jedinični porast vrednosti nezavisne varijable. Parametar b je tangens ugla koga pravac zatvara s pozitivnim delom X ose ili nagib pravca. odnosno skupu parova (X1. Y1). funkciju f(X). n y −ˆ  = y  0  i  ∑ i i= 1 4 Stojković. dok je a odečak na ordinati. Jačina povezanosti ne zavisi od a. tj.1. odnosno linije regresije. a regresija prima oblik y = bx . M (1991): STATISTIKA U EKONOMIJI. On opredeljuje položaj početne tačke na liniji regresije u koordinatnom sistemu. Nazivamo ga koeficijentom regresije. (X2. tako da je a = 0. Ekonomski fakultet. U pitanju je konstantni član.Y2)… (Xn. 2 – Parametri linearne regresije Parametar a označava odsečak na y osi. pa zato ukoliko ne postoje neki posebni razlozi. U slučaju da originalnim podacima. Značaj ovog parametra je u tome što može poslužiti za odvajanje varijacija zavisnog obeležja na deo koji je vezan za nezavisno obeležje i na deo koji nije vezan za nezavisno obeležje. Subotica. odnosno vrednosti regresione funkcije kada je x jednako nuli. Najbolje prilagođena prava biće ona koja najbolje prezentuje skup ovih parova podataka. str. Slika br. Oblik modela. Yn) možemo prilagoditi (interpolirati) nekoliko linearnih funkcija. Algebarski zbir odstupanja originalnih vrednosti od te prave. postavlja se pitanje kako ćemo izabrati najbolje prilagođenu pravu. U zavisnosti od znaka ispred parametra b. pravac se pomera u ishodište koordinatnog sistema. Ova prava mora ispuniti dva uslova:4 1. Empirijske vrednosti varijabli X i Y. funkcija može biti rastuća (pozitivan predznak) ili opadajuća (negativan predznak).

To se može prikazati na sledećem grafikonu: Slika br. U oblasti regresije. moguće je zapisati model: y = a +bx +u i =1. Zbog postojanja slučajne promenljive.. godine.. 2 n  y  m  ∑ yi −ˆi  = in   i= 1 U realnim situacijama. Ovaj metod ima značajnu ulogu u statistici. vrednostima nezavisne promenljive odgovaraju rasporedi frekvencija zavisne promenljive koji imaju normalan rasored sa istom standardnom devijacijom i sa aritmetičkim sredinama koje se nalaze na regresionoj pravoj.2. n i i i ˆ yi = a +bxi ˆ yi = yi +ui Rezidualna odstupanja iznose: ˆ ui =yi −yi Parametre linearne regresije ocenjujemo metodom najmanjih kvadrata. godine i nemački matematičar Gaus (Gauss) 1808.2.. za istu vrednost varijable X možemo imati više vrednosti varijable y za koje se u regresijskoj analizi pretpostavlja da su normalno distribuirane.yi) varijabli X i Y. njim se minimizira suma kvadrata odstupanja svih pojedinačnih vrednosti od linije regresije. Ovaj metod pronašli su nezavisno jedan od drugog francuski matematičar Ležandr (Legendre) 1806. Zbir kvadrata odstupanja mora biti minimalan.. Kao što je već 8 . 3 – Rasporedi frekvencija zavisne promenljive Ako se raspolaže skupom od n vrednosti (xi.

str. Drugim rečima. 336 Sistem normalnih jednačina glasi: na + bΣX = ΣY aΣX + bΣX2 = ΣXY Rešenja ovog sistema jednačina su parametri a i b. 4 – Načini merenja odstupanja IZVOR: Šolak. to se može prikazati na sledeći način: Slika br. (2001): STATISTIKA U EKONOMIJI I MENADŽMENTU.B. Paralelno sa Y osom. Mladenovac. Nj.spomenuto.. Mladenovac. str.B. Nj. Parametri modela linearne regresije se računaju na sledeći način: 5 Šolak. Pečat. cilj je da zbir kvadrata odstupanja stvarnih vrednosti Yi od očekivanih vrednosti Y’i bude najmanji. tražimo minimum funkcije: 2 n  y  m  ∑ yi −ˆi  = in   i= 1 Odstupanje se može meriti na tri načina:5    Pod pravim uglom u odnosu na liniju regresije. Paralelno sa X osom. (2001): STATISTIKA U EKONOMIJI I MENADŽMENTU. Grafički. Pečat.. 336 9 .

Ovo odstupanje se može prikazati u vidu sledećeg izraza: ^ -^ (yi – y) = (yi – y) + (yi . Mladenovac. Subotica. pokazuje prosečno slaganje varijacija posmatranih pojava X i Y. sa povećanjem uzorka teže normalnim rasporedima. veza između posmatranih pojava je jača. prema centralnoj graničnoj teoremi. (2001): STATISTIKA U EKONOMIJI I MENADŽMENTU.∑ ( x − x)( y − y) i i b = i =1 n 2 ∑ ( x − x) i i =1 n ∑ xi yi − nx y b = i=1 n 2 ∑ xi − nx 2 i =1 a = y − bx n Parametri a I b su ocene sa minimalnim varijansama. Naziva se još sistematskom ili funkcionalnom komponentom. Od odstupanja originalnih vrednosti od odgovarajuće vrednosti regresije. 135 10 . str 340 Stojković.6 Model jednostavne linearne regresije s procenjenim parametrima glasi: ˆ y = a +bx Jednačina proste linearne regresije. odnosno očekivanu prosečnu vezu između nezavisne promenljive X i zavisne promenljive Y. odnosno prava izražena ovom relacijom.B. Njihove raspodele.yi) ^ -Odstupanje (yi – y) je odstupanje koje se može protumačiti vezom između nezavisne i zavisne promenljive. M (1991): STATISTIKA U EKONOMIJI. odnosno. Standardna greška linearne regresije predstavlja srednju meru odstupanja originalnih vrednosti zavisne promenljive od linije regresije. Odstupanje originalnih podataka od linije regresije meri standardna greška linearne regresije. Pri tome treba imati u vidu da se svako odstupanje originalnih vrednosti zavisne promenljive od njene aritmeričke sredine sastoji od dva dela: 1.7 Od linije regresije originalni (empirijski) podaci manje ili više odstupaju. ^ 6 7 Šolak. Mogu se posmatrati I kao slučajne promenljive. Ekonomski fakultet. U slučaju da su odstupanja originalnih podataka od linije regresije manja.. i 2. Nj. Od odstupanja vrednosti regresije od aritmetičke sredine. sve je bliža funkcionalnoj vezi. str. Pečat.

yi) se ne može protumačiti vezom između nezavisne i zavisne promenljive i naziva se još slučajno.. Na veličinu standardne greške utiču sledeći faktori:10  Raspršenost tačaka. Stević. Mladenovac. Komić. Banja Luka. str. str.yi) kvadriramo. 8 Lovrić. veza između nezavisne i zavisne promenljive je slabija. Pečat. J. latentno odstupanje ili rezidijum. te ih podelimo sa brojem posmatranja. Ukoliko je rezidijum manji.Sa druge strane. (2006): STATISTIČKA ANALIZA .B.. Standardna greška je veća ukoliko su empirijske tačke više raspršene. te se ta veza sve više približava stohastičkoj vezi. M. S. odnosno varijansu slučajne promenljive µ. Objašnjena suma kvadrata se često naziva i regresionom sumom kvadrata. 391 9 Šolak. 393 11 . S. a neobjašnjena suma kvadrata rezidualnom ili sumom kvadrata greške. Banja Luka.METODI I PRIMJENA.. dok se koeficijent determinacije zasniva na poređenju veličine objašnjene sume kvadrata u odnosu na ukupnu sumu kvadrata.. (2001): STATISTIKA U EKONOMIJI I MENADŽMENTU. J. i ona se sve više približava funkcionalnoj vezi. dobićemo tri varijanse: ^ -^ Σ(yi – y)2 = Σ (yi – y)2 + Σ (yi – yi)2 ---------------------. 337 10 Lovrić.METODI I PRIMJENA. Varijansa regresije predstavlja aritmetičku sredinu kvadrata rezidualnih odstupanja. Stević. (2006): STATISTIČKA ANALIZA . Komić. Izračunava se po formuli: 2 n ˆ ∑  yi − yi  σ 2 = i=1 ˆ n− 2 y Standardna greška regresije se zasniva na neobjšanjenoj sumi kvadrata.. odstupanje (yi .9 Ova jednačina predstavlja temelj statističke analize reprezentativnosti regresionog modela.-----------n n n UKUPNA VARIJANSA PROTUMAČENI NEPROTUMAČENI DEO VARIJANSE DEO VARIJANSE Navedeni izraz ukazuje da se ukupna varijansa zavisne promenljive deli na protumačeni i na neprotumačeni deo. M. 8 Neprotumačeni deo varijanse predstavlja rezidijumsku varijansu srednje kvadratne regresione prave. U takvoj situaciji su manje pouzdana predviđanja zasnovana na takvoj liniji regresije. ukoliko je rezidijum veći. Isto tako. str. ^ -^ Ukoliko sva tri člana izraza (yi – y) = (yi – y) + (yi . Nj. veza između nezavisne i zavisne promenljive je jača.

  Veličina uzorka. Viši nivo vrednosti promenljive Y podrazumeva i veću standardnu grešku regresije. uvedeno je nekoliko stepena jačine korelacione veze.5 – korelaciona veza je slaba. a se izračunava po formuli: ˆ 100 V = y⋅ y ˆ y σ Koeficijent determinacije R2 predstavlja odnos protumačenih i ukupnih odstupanja: R2 = SSR SSE = 1− SS yy SS yy 2 n   ˆ ∑ yi −y   1 R 2 =i= .0 ≤R 2 ≤ 1 2 n   ∑ y −y   i=  i 1 Visina koeficijenta determinacije govori o reprezentativnosti modela (model je reprezentativniji što je R2 bliži 1). Kvadratni koren iz koeficijenta determinacije predstavlja koeficijent korelacije: r = R2 U statističkoj praksi. Izračunava se po formuli: 2 n  ˆ  ∑  yi − yi    1 σ = i= n − 2 ˆ y Koeficijent varijacije regresije jeste količnik standardne devijacije regresije i aritmetičke sredine zavisne promenljive.7 – korelaciona veza je značajna 12 . Kod manjeg uzorka veća je standardna greška regresije i obrnuto. Standardna greška je iskazana u istim mernim jedinicama kao i zavisna promenljiva. ako je: 0 < │r│≤ 0. 0. Izražava se u jedinicama mere zavisne promenljive Y i predstavlja srednju meru odstupanja empirijskih vrednosti zavisne promenljive od linije regresije. i zavisi od njenog nivoa. veći uzorak ima manju standardnu grešku. Nivo vrednosti promenljive Y. Tako. Standardna devijacija regresije ili standardna greška regresije predstavlja kvadratni koren iz varijanse regresije.5 < │r│≤ 0.

Ako stavimo u odnos sumu kvadrata neobjašnjenog odstupanja sa sumom kvadrata ukupnog varijabiliteta.-----------------.= 1 . a smer korelacione veze određuje predznak koeficijenta korelacije ± r. on se dobija kada se od 1 oduzme koeficijenat determinacije. pri čemu razlikujemo tri krajnja slučaja:  r’ = + 1 – veza je jaka i pozitivna 13 . dobijamo koeficijent koji pokazuje stepen nepostojanja povezanosti između nezavisne i zavisne promenljive. Odnosno. Najčešće se koristi Spearmanov koeficijent korelacije ranga koji se izračunava po formuli: 6 Σ ( rx – ry)2 6 Σ d2 r’ = 1 . K2 = 1 – R 2 Izračunati procenat ukazuje na to koji deo varijabiliteta između zavisne i nezavisne promenljive nije objašnjen.7 < │r│≤ 1 – korelaciona veza je vrlo jaka.------------n (n2 – 1) n3 – n Gde je: n – broj parova vrednosti X i Y rx – rangirane vrednosti varijable X ry – rangirane vrednosti varijable Y d = rx – ry – diferencijacija rangiranih vrednosti X i Y Koeficijent korelacije ranga može poprimiti vrednosti od – 1 do + 1.0. intenzitet veze između nezavisne i zavisne promenljive pokazuje vrednost koeficijenta korelacije. Prema tome. Ako se iz vrednosti proste linearne nedeterminacije izvuče kvadratni koren. Korelacija ranga Korelacija ranga je neparametrijska metoda izračunavanja koeficijenta korelacije.9 – korelaciona veza je jaka 0.7 < │r│≤ 0. Taj koeficijent se naziva koeficijent proste linearne alienacije i izračunava se po formuli: k= K2 5. dobijamo relativnu meru koja se naziva koeficijent proste linearne nedeterminacije.

ali negativna 6.1 – veza je potpuna. Koeficijent nagiba b može biti jednak nuli samo u slučaju kada između pojava ne postoji nikakva kvantitativna veza ili kada između promenljivih postoji nelinearna funkcionalna veza. Interval ima oblik: b. treba zaključiti da nemamo dovoljno dokaza da nezavisna promenljiva utiče na zavisnu.raspored 14 .tn-2.  r’ = 0 – nema korelacije između varijabli X i Y r’ = . te će se nagib prave razlikovati od nule. Izračunava se po sledećoj formuli: ^ σy sb1 = -----------------------_ Σx2 – nx2 Nakon sprovedene statistike testa. α/2 x sb1 ≤ b ≤ b + tn-2. Standardna greška ocene nagiba se koristi i za formiranje intervala poverenja koji bi sa verovatnoćom 1 – α obuhvatio nepoznati parametar b. uz rizik 0. α/2 x sb1 Kada god interval ocene parametra b obuhvata i nulu. Statistiku testa vršimo tako što ocenu parametra stavljamo u odnos sa ocenom standardne greške nagiba. odbacujemo nultu hipotezu. Samim tim. U ostalim situacijama. nulta hipoteza o nepostojanju linearne veze neće se moći odbaciti. postoji linearna veza između varijacija posmatranih pojava u osnovnom skupu i regresionu liniju tada možemo koristiti u svrhu predviđanja.05 da se parametar nagiba b u regresionoj liniji osnovnog skupa razlikuje od nule. 7. Testiranje značajnosti regresione veze Da bi primena regresione linije uzorka prilikom predviđanja vrednosti zavisne promenljive bila opravdana. U situaciji kada se nulta hipoteza ne odbacuje. odnosno odbacivanju hipoteze. kako bi se na osnovu poređenja veličina statistike testa i vrednosti u tablicama donela odluka o prihvatanju. Standandardna greška nagiba zavisi od nepoznate standardne devijacije slučajne greške σ. prisutna je bar slaba linearna veza između nezavisne i zavisne promenljive. Alternativna hipoteza bi bila da je b različito od nule. vrši se provera vrednosti u tablicama studentovog rasporeda. Ako je vrednost u tablicama manja od izračunate statistike testa. treba utvrditi da li je objašnjavajuća promenljiva značajna za ponašanje zavisne promenljive. Zaključujemo. Studentov t. Stoga treba testirati hipotezu da je parametar nagiba b jednak nuli.

Ovaj raspored ima samo jedan parametar n.f(t) ϕ (u) Normalni raspored Studentov raspored u 0 t Slika br. 6 – Snedekerov F raspored Ovaj raspored pripada grupi neprekidnih rasporeda slučajne promenljive X. 5 – Studentov t raspored Ovaj raspored se koristi kod malih uzoraka za ocenjivanje parametara osnovnog skupa i za testiranje hipoteza o parametrima osnovnog skupa. a već za n = 30 je vrlo blizak normalnom. Vrednosti Studentovog rasporeda za određeni broj stepeni slobode i verovatnoću 1 – α se očitavaju iz tablica. Primer testiranja značajnosti regresione veze 15 . Mali uzorak je onaj koji ima manje od 30 jedinica (n<30). 8. 9. Studentov raspored se izjednačava sa normalnim. koga nazivamo broj stepeni slobode. Snedekorov F raspored f(F ) F 0 Slika br. Koristi se za analizu varijanse. Kriva Studentovog rasporeda je nešto niža od normalnog i razvučenija. a vrednosti F rasporeda za odgovarajući rizik greške α i broj stepeni slobode r1 i r2 očitavaju se iz tablica. Kada n teži beskonačnosi.

00 700. u okviru jedne branše. te na osnovu dobijenog rezultata testirati moć predviđanja modela: a) Dijagram rasturenosti podataka izgleda ovako: 16 .00 A B 6.70 C 6. k) Pod pretpostavkom da je deveta jedinica posmatranja preduzeće J.40 6.30 D 5.00 800.50 E 6. Odrediti koeficijent proste linearne nedeterminacije. Odrediti koeficijent proste linarne alienacije. Odrediti koeficijent proste linearne determinacije. Definisati jednačinu linearne regresije.00 1250. a vrednost prodaje 1420 x 103 dinara.00 850. dat je pregled izdataka za propagandu i vrednost prodaje u određenom periodu: PREDUZEĆE IZDACI ZA PROPAGANDU U 000 DINARA 5.90 H a) b) c) d) e) f) g) h) Nacrtati dijagram rasturenosti podataka. Odrediti koeficijent proste linearne korelacije.00 1200.60 G 6. j) Pomoću F – testa testirati statističku značajnost koeficijenta determinacije.40 F 5. za koje je vrednost izdataka za propagandu 8 x 103 dinara. Izračunati srednju meru odstupanja originalnih podataka od linije regresije.00 1100. Izvršiti testiranje nulte hipoteze pomoću studentovog t testa da između varijacija vrednosti prodaje i visine izdataka za propagandu ne postoji veza.00 VREDNOST PRODAJE U 000 DINARA 900. izračunati predviđenu vrednost za Y kao jedinstvenu veličinu i kao interval. i) Izvršiti testiranje nulte hipoteze pomoću Snedekovog F testa da između varijacija vrednosti prodaje i visine izdataka za propagandu ne postoji veza.00 750.Zadatak: Za osam preduzeća.

00 800.00 7.00 1.00 1200. što znači da sa porastom visine izdataka u propagandu (kao nezavisne promenljive X).00 200. odnosno prava linija.00 IZDACI ZA PROPAGANDU U 000 DIN Slika br.VREDNOST PRODAJE I IZDACI ZA PROPAGANDU 1400.00 1000. jer se tačke grupišu oko zamišljene prave linije interpolirane u dijagramu rasturanja.00 5.00 0. Što se tiče jačine korelacione veze.00 4. b) VREDNOST PRODAJE U 000 DIN 17 . u proseku se povećava vrednost prodaje (kao zavisna promenljiva Y).00 3. 7 – Dijagram rasturenosti izdataka za propagandu i obima prodaje Na dijagramu rasturenosti se uočava da između visine izdataka za propagandu i vrednosti prodaje postoji pozitivna korelaciona veza.00 0.00 6.00 2.00 600. Isto tako uočava se da se ovim originalnim podacima može prilagoditi (interpolirati) linearna funkcija. može se reći da je ona jaka.00 8. jer se podaci grupišu od donjeg levog ka gornjem desnom uglu.00 400.

00 750.00 750.00 700. u 000 din.80 757.00 xy 4860.30 5.50 6.73 1129.90 48.92 b 18 .00 6.17 -11.00 562500.00 8040.40 6.30 5.56 912.64 3317.80 VREDNOST PRODAJE u 000 din.61 24273.09 155.49 3368.00 2 x 29.00 7437500.00 4500.00 640000.00 490000.00 7040.00 800.59 -63. (y) 900.00 1440000.07 3990.38 -58.43 26480.60 6.40 5.00 1200.8 a + 299.00 44.25 40.80 57.PREDUZEĆE A B C D E F G H Σ IZDACI ZA PROPAG.00 8625.62 1191.50 6.8 b 46750 = 48. u 000 din.00 3850.00 7550.83 788.61 299.96 7550.00 1210000.40 6. (x) 5.60 6.89 39.00 1100.00 550.00 1100.00 800.00 1562500.00 ^ y-y 173.00 850.00 850.73 Na osnovu metoda najmanjih kvadrata.40 4912.40 5.80 IZDACI ZA PROPAG.64 96553.00 4480.00 5355.44 162.00 VREDNOST PRODAJE u 000 din. (x) 5.04 0.00 700.00 46750.45 129.96 31.00 1250. (y) 900.16 36.00 ^2 (y .y) 30081.00 6.00 1200.92 2 y 810000.69 30.73 -70.00 1250.70 6.70 6.00 722500.00 PREDUZEĆE A B C D E F G H Σ ^ y 726.91 1005.90 48.36 47. dobijamo: 7550 = 8 a + 48.59 1036.

ako uopšte nema izdataka za propagandu. To znači. vrednost prodaje bi iznosila -948.968 pokazuje.968 x 103 dinara. koja se teško može objasniti.73 = 126.0 ≤R 2 ≤ 1 2 n   ∑ y −y   i=  i 1 19 . c) Srednja mera odstupanja originalnih podataka od linije regresije izračunava se po formuli: 2 n  ˆ  ∑  yi − yi   1 σ = i= ˆ y n −2 ^ 96553. Ova vrednost pokazuje u kojoj tački regresiona prava seče y osu. jer u praksi uvek postoji bar neki manji obim prodaje i kada nema izdataka za ekonomsku propagandu. vrednost zavisne promenljive y (vrednost prodaje) se poveća za 310. d) Koeficijent determinacije izračunava se na sledeći način: 2 n   ˆ ∑ yi −y    1 R 2 =i= .268 x Parametar a = -948.86 x 103 din.86 8-2 σy = Srednja mera odstupanja originalnih podataka zavisne promenljive (vrednost prodaje ) od linije regresije.948. Ovo je samo teorijska vrednost.268 Jednačina proste linearne regresije za zavisnost vrednosti prodaje od izdataka za propagandu glasi: ^ y = .88 x 103 dinara.88 b = 310. dobijamo: a = -948. ako nezavisna promenljiva x (izdaci za propagandu) ima vrednost nulu. mereno paralelno sa Y osom iznosi 109. da pri svakom povećanju nezavisne promenljive x (povećanju izdataka za propagandu za 1 x 103 dinara).88 pokazuje teorijsku vrednost zavisne promenljive y (obima prodaje). Parametar b = 310.88 + 310.Primenom metoda zamene za rešavanje dve jednačine sa dve nepoznate.

e) Koeficijent proste linearne korelacije iznosi: r= 0.75 34654.07% 312187.75 34655. 20 .00 3850.75 943.02 186.82 R2 = __________________ = 0.36 193.25 -93.75 943.07% od izdataka za propagandu.y) 1914.19 -31.06 24414.50 y-y .75 962.75 943.06 37539.13 248.831 Izračunati koeficijent korelacije pokazuje da je veza između vrednosti prodaje i visine izdataka za propagandu jaka i pozitivna.06 243.25 0.06 93789. odnosno da vrednost prodaje zavisi 69.75 8663.06 59414.20 0.6907 = 0.25 24065.75 943.6907 = 69.2 (y .50 Koeficijent proste linearne determinacije pokazuje da je 69.20 306.06 8789.16 62.75 943.82 Zamenom vrednosti iz tabele u brojiocu i imeniocu izraza. dobijamo da koeficijent determinacije iznosi: 215630.08 -155.75 61608.06 65664.07 143.75 ^ y-y -217.16 93.75 943.50 -43.07% ukupnog varijabiliteta objašnjeno linearnom vezom između vrednosti prodaje i visine izdataka za propagandu.06 312187.55 256.y) 47171.2 (y .PREDUZEĆE A B C D E F G H Σ y 943.75 943.00 215630.05 -186.21 ^ .75 943.89 156.06 20664.

76 Statistika testa: b 21 . odnosno da 30.93 % Koeficijent proste linearne nedeterminacije pokazuje da vrednost prodaje zavisi 30.93 % varijabiliteta između vrednosti prodaje i visine izdataka za propagandu nije objašnjeno.86 sb1 = ----------------------------------299.93 % i od drugih uticaja i slučajnosti.92 – 8 x 37. odnosno da X ne utiče na Y: H0: b = 0 Ograničićemo se na dvosmernu alternativnu hipotezu: H1: b ≠ 0 b t = ------sb1 Ocena standardne greške nagiba: ^ σy sb1 = -----------------------_ 2 Σx – nx2 126.3093 = 0.3093 ili 30.5561 Koeficijent proste linearne alienacije k = 0.f) Koeficijent proste linearne nedeterminacije: K2 = 1 – 0.6907 = 0.21 sb1 = 84. g) Koeficijent proste linearne alienacije: k= 0. h) Testiranje nulte hipoteze da između varijacija vrednosti prodaje i visine izdataka za propagandu ne postoji veza.5561 pokazuje stepen nepostojanja povezanosti između vrednosti prodaje i visine izdataka za propagandu.76 Standardna greška ocene nagiba iznosi 84.

zaključujemo da visina izdataka za propagandu utiče na vrednosti prodaje.82 16092.40 > 5.6) = 5. i) I statistikom F testa možemo testirati nultu hipotezu da objašnjavajuće promenljive nemaju značajnog uticaja na Y. R2 22 .66 i kao takva. 0.t = ------sb1 310. uz rizik. tj.82) Neobjašnjenih varijacija: (96553.66 84.66 > 2. Kako je 13. H0: b = 0.447. Samim tim.05.= 13.= 3. IZVOR VARIJACIJA X REZIDUAL UKUPNO ZBIR KVADRATA BROJ STEPENI SLOBODE 1 n-2 (6) n-1 (7) VARIJANSA (zbir kvadrata/broj stepeni slobode) 215630.55) 215630.29 Uz nivo značajnosti 5 % i broj stepeni slobode 1 u brojiocu.268 t = -----------. odbacujemo nultu hipotezu i automatski usvajamo alternativu H1: b ≠ 0.99.76 Statistika testa iznosi 3. Pored toga. U slučaju jedne objašnjavajuće promenljive F test je istog značenja kao i t test značajnosti ocenjenog parametra uz objašnjavajuću promenljivu. i 6 u imeniocu. Takođe. dobija se tablična vrednost F (5%. veća je od najveće kritične vrednosti u tablici t rasporeda za 6 stepeni slobode. prag značajnosti (tablična vrednost) je t (0.99.29 Objašnjenih varijacija (215630. sledi da postoji statistički značajna zavisnost vrednosti prodaje od visine izdataka za propagandu. Uz nivo signifikantnosti 5% i broj stepeni slobode 6 (8-2).82 F = ---------------. postoji linearna veza između vrednosti prodaje i visine izdataka za propagandu u osnovnom skupu.73) Ukupne varijacije: (312187.447. Zaključujemo. S obzirom da je 3.05 da se parametar nagiba b u regresionoj liniji osnovnog skupa znatno razlikuje od nule. konstatujemo da je ocena b statistički značajna. j) F testom možemo testirati i statističku značajnost koeficijenta determinacije.40 16092. 1.6) = 2.

264 t = --------------------------.447 Interval poverenja za verovatnoću od 95% i broj stepeni slobode r = 8 – 2 = 6 glasi: 1533.88 + 310.447 = t (5%.268 (8) = 1533.69 Za izdatke za propagandu od 8 x 103 dinara.264 – 2. izračunaćemo predviđenu vrednost za Y kao jedinstvenu veličinu i kao interval.računa se na osnovu izraza: ^ y = . 6). možemo smatrati moć predviđanja modelom zadovoljavajućom. može se očekivati vrednost prodaje u intervalu od 1222.447 Pošto je │t│ = 1.948. 1530 – 1533. odnosno R2 je visoko statistički značajan.= 13.40 > 5. dobijeni rezultat ukazuje da je koeficijent determinacije statistički značajan.99.33 2.40 (1 – 0. a na osnovu dobijenog rezultata ćemo testirati moć predviđanja modela: Očekivana vrednost prodaje za vrednost izdataka za propagandu u iznosu od 8. odnosno da postoji visoko statistički značajna zavisnost vrednosti prodaje od visine izdataka za propagandu.6907) / 6 Kako je 13. očitavamo da je vrednost t = 2.F = -----------1 – R2 ---------n–2 U našem primeru je: 0.= -1.264 Na osnovu tablica studentovog t rasporeda za verovatnoću od 95% i r = 8-2 = 6. a vrednost prodaje 1530 x 103 dinara. uz verovatnoću 95 %.6907 F = ---------------------.69 x 103 dinara. zaključujemo da nije značajna razlika između stvarne i modelom predviđene vrednosti.86 ≤ y ≤ 1533.84 x 103 do 1843.86 1222. 23 . tj.84 ≤ y ≤ 1843.00 x 103 dinara.447 x 126.264 + 2.33 < 2. za koje je vrednost izdataka za propagandu 8 x 103 dinara. k) Pod pretpostavkom da je deveta jedinica posmatranja preduzeće J.447 x 126.

ZAKLJUČAK Regresiona analiza podrazumeva odnos između odabranih vrednosti jedne varijable (varijable X) i s njima povezanih vrednosti druge varijable (varijable Y). 24 . te utvrđivanje oblika. jačine i smera veze. Zadatak regresione analize odnosi se na utvrđivanje postojanje veze između dve ili više numeričke varijable.

za razliku od regresione. Za određivanje oblika. 11 Neprotumačeni deo varijanse predstavlja rezidijumsku varijansu srednje kvadratne regresione prave. Jednostavna linearna regresija predstavlja odnos između dve pojave. Statistiku testa vršimo tako što ocenu parametra stavljamo u odnos sa ocenom standardne greške nagiba. prema smeru razlikujemo pozitivnu i negativnu vezu. odnosno linije regresije. Navedeni izraz ukazuje da se ukupna varijansa zavisne promenljive deli na protumačeni i na neprotumačeni deo. dobijamo relativnu meru koja se naziva koeficijent proste linearne nedeterminacije. a kvadratni koren iz koeficijenta nedeterminacije je koeficijent proste linearne alienacije koji ukazuje na stepen nepostojanja zavisnosti između dve promenljive. Svako odstupanje originalnih vrednosti zavisne promenljive od njene aritmetičke sredine sastoji od dva dela: a) od odstupanja vrednosti regresije od aritmetičke sredine. Standardna greška ocene nagiba se koristi i za formiranje intervala poverenja koji bi sa verovatnoćom 1 – α obuhvatio nepoznati parametar b 11 Lovrić. str. 391 25 . Dijagram rasturanja predstavlja grafički prikaz zavisnosti i međuzavisnosti između promenljivih. Parametar a u jednačini regresije označava odsečak na y osi. Banja Luka. a parametar b nagib prave. Stević. nije bitno koju ćemo pojavu uzeti za objašnjavajuću promenljivu. mora biti ravan nuli. J.. a koju za nezavisnu. a prema jačini determinisičku i stohastičku. smera i jačine veze između dve pojave nam služi regresioni model koji kroz matematičke formule najbolje iskazuje kvantitativnu zavisnost pojava. (2006): STATISTIČKA ANALIZA . Ako stavimo u odnos sumu kvadrata neobjašnjenog odstupanja sa sumom kvadrata ukupnog varijabiliteta. Ovo odstupanje može se meriti pod pravim uglom u odnosu na liniju regresije. a standardna greška regresije predstavlja kvadratni koren iz varijanse. Objašnjena suma kvadrata se često naziva i regresionom sumom kvadrata. Da bi primena regresione linije uzorka prilikom predviđanja vrednosti zavisne promenljive bila opravdana.. Komić. a koji zavisnu promenljivu. krivolinijski i prostorni.METODI I PRIMJENA. a neobjašnjena suma kvadrata rezidualnom ili sumom kvadrata greške. a kvadratni koren iz koeficijenta determinacije je koeficijent korelacije. koji ukazuje na jačinu veze izmešu zavisne i nezavisne promenljive. odnosno varijansu slučajne promenljive µ. treba utvrditi da li je objašnjavajuća promenljiva značajna za ponašanje zavisne promenljive. i to takav da promenu jedne pojave prati približna linearna promena druge. Varijansa regresije predstavlja aritmetičku sredinu kvadrata rezidualnih odstupanja. M. S. Kod korelacione analize. za koje se ne može utvrditi funkcionalna zavisnost. Koeficijent determinacije R2 predstavlja odnos protumačenih i ukupnih odstupanja. i b) od odstupanja originalnih vrednosti od odgovarajuće vrednosti regresije. a zbir kvadrata odstupanja minimum. Parametre linearne regresije najčešće ocenjujemo metodom najmanjih kvadrata Algebarski zbir odstupanja originalnih vrednosti od linije regresije. niti se može precizno iskazati određenje koji od datih skupova podataka predstavlja nezavisnu. paralelno sa X osom ili paralelno sa Y osom.Oblik veza između pojava može biti pravolinijski.

Komić. Ekonomski fakultet 26 . (1994): EKONOMETRIJA. S. Čileg.. (2006): STATISTIČKA ANALIZA METODI I PRIMJENA. M..LITERATURA 1. Banja Luka Kiš. Lovrić. Stević. J. 2. D. M. Vugdelija.. Subotica. T.

Regresiona analiza i povezanost pojava 2. Pečat SADRŽAJ UVOD 1. Mladenovac. M (1991): STATISTIKA U EKONOMIJI. Razlika između regresione i korelacione analize 3. Nj.. Dijagram rasturanja 1 2 3 3 27 . (2001): STATISTIKA U EKONOMIJI I MENADŽMENTU.3. Stojković. 4.B. Subotica. Ekonomski fakultet Šolak.

Primer testiranja značajnoti regresione veze ZAKLJUČAK LITERATURA 5 13 14 15 15 16 25 27 28 . Studentov t raspored 8. Jednostavna linearna regresija 5. Testiranje značajnosti regresione veze 7.4. Korelacija ranga 6. Snedekorov F raspored 9.