You are on page 1of 26
Capitolul 4 Modelul regresiei liniare simple _ 4.1, Aplicabilitatea regresiei simple In practica analizei economice modelul liniar de regresie are numeroase aplicatii. m preciza pentru inceput cateva aplicatii ale acestuia: ¢ functia de consum din modelul lui Keynes este: C,=a+b-Y, (4.1) C, este consumul pentru un an; _ Y; este venitul pentru aceeasi perioada; a,b sunt parametrii modelului de regresie. © relatia liniard care exista intre pregatirea profesionala si venitul obtinut; © dependenfa liniard intre gradul de dezvoltare a unei fari si gradul de coruptie din aceasta tara: H,=a+b-CR,, (4.2) ‘Hyeste indicele dezvoltarii umane inregistrat de o fara; CR; — nivelul coruptici, ce se exprima printr-un numar cu o zecimal din intervalul Nivelul cel mai scdzut al coruptiei este in cazul in care indicele este egal cu 10. privire la modelul liniar de regresie sunt necesare urmitoarele precizi ° identificarea celor doua variabile folosite pentru definirea modelului notate: simbolul pentru variabila rezultativa. Seria de date se noteaza prin Oana simbolul pentru variabila explicativa sau factoriala definita de seria (x;),.,,, Re doi parametri se defineste o dependenfi deterministi intre cele dou’ (4.3) nt estimati prin intermediul seriilor de date constituite pentru orii celor doi parametri se definese prin 6 si 4. Parametrii stocasticai, pe baza estimatorilor: ire — ree ] etre, Teorie, concepte si modele dean, —— ll riqbila reziduala prin . Accasta ‘real Notim va Jei reziduale. ! : Un Ea rsia const Variabila reziduala este inclu 9 dependent’ liniara functional in, © definirea variabil antl repartizata normal, mS ee gntotdeauna = in economic nu se e intot a dout variabile, ci una de tip probabilist; are cu influent asupra est seriile de date sunt afectate imi celor doi paramett!; j - seriile de date se stabilese pm © utilizarea modeluli domenii de utilizare a modelului jm analiza dependentei d jnregistrate la nivelul unit moment, folosind notatia: y, =bta-x, +8» ra unor egantioane tura seriilor de date, sunt doy n observari asup! Dupa nal je: iabil J, in cazul in care seriile de date sun populatici pentru o perioada say yp, (4.4) unde: zultativa (explicata); yjeste caracteristica r explica x, caraoteristica factorial (explicativa); - pentru evidenfierca dependentet dintre dot timp sunt folosite seriile de timp. « utilizarea setului de ipoteze. Pentru es Jjului de regresie sunt utilizate serie de ipoteze: - I); seriile de date nu sunt afectate de erori de masura; Ip: variabila reziduald are media 0; © fg: dispersia variabilei reziduale este invarianta in timp, de homoscedasticitate; - Ig: reziduurile nu sunt autocorelate; variabile intr-un anumit orizont de timarea parametrilor si utilizarea adica are proprietatea = Is €, > N(0,0;). hee oe acestor ipoteze sunt folosite o serie de teste statistice. oie zn esedenendenia liniard este regasita in urma efectuarii re transformiri el ile, vom spul i ini ee csstie, pune ci modelul de regresie este liniar in raport De exemplu, modelul Y , =b+alnX e: iniar it Paes model liniar in raport cu cei doi Sead per Ce Feat est nr in rapor eu varisila futeiall, der on oats a — Hast cifa report cu si ina, ala, dar nu este liniar in raport cu 0% Pentru elucid: disponibil si idarea acestor aspecte si consumul populatiei vom lua exemplul de; i dit it i i pendentei dintre yenitl Capitolul 4. Modelul regresiei liniare simple 49 Horioka asupra unui numar de 21 de {ari in perioada 2000-2005, s-a stabilit urmatorul model liniar de regresie: y! = 0,035 +0,887)! , R?=0,91. in cadrul modelului de mai sus s-au folosit urmatoarele not ~ ¥) reprezinta ponderea medie a investitiilor in PIB in perioada 2000-2005 pentru fiecare tard inclusa in esantion; ~ ¥; cuantific’ ponderea medie a economiilor populatiei in PIB pentru fiecare fara. Raportul de corelatie demonstreaza ci intre cele doua serii exist o dependenta puternica. In literatura economica se gasesc si alte modele liniare de regresie, in analizele Ja nivel microeconomic sau macroeconomic. in tabelul urmator sunt prezentate valorile PIB real/locuitor si ale salariului mediu "real din perioada 1992-2005, inregistrate in cazul Roménici. Cei doi indicatori sunt _ exprimati in prefurile anului 1985. ‘Anul PIB real/locuitor Salariul reaVlocuitor (X), mii RON (¥), RON 1992 35,892 2819 1993 36,517 2841 1994 36,617 2858 1995 36,325 2877 1996 34,093 3018 1997 32,093 2933 1998 27,952 2193 1999 25,924 1973 26,349 1787 27,406 1777 29,420 1955 30,672 2045 28,635 1629 26,588 1897 _Economett Teorie, concepte model deg ta liniara intre cele dowd var; rformantele economiei, masurate doua variabile este stocastica, Vom bilei reziduale in cadrul acestui modg| <"* economie este o marime determinay, precum si de alti factori, care rm influenfeaz salariul mediu po 5 domeniul ete. i EEE «a ntiazi 0 dependel Graficul prezentat evidentiaz 0 cae -ct corela Salariul mediu pe economie este a See ; endenta dintre nivelul PIB/locuitor. Dependenta din a modelul liniar de regresic. Considerarea vi" i inevitabili, deoarece nivelu! salariului ee mod cert de performantele generale rT are cuantificati prin termenul rezidual. ee comes nivelul de instruire, varsta persoane!, regiunea, delelor neliniare in modele liniare re, care sunt liniarizate prin transform. Astfel de modele neliniare transforma 4.2. Transformarea mo' ; Exist diverse modele unifactoriale neliniat ce sunt aplicate variabilelor modelului de regresie- in modele liniare su | 20 1 qx? se transforma intr-un model liniar prin logaritmarea celor doi terme, ai egalitatii de mai sus: logy, =loga+b-logx, (4.5) Rezulti un model liniar in raport = Modelul exponential sau modelul log definit prin relatia: yaar aa (46) liniarizeaza prin logaritmare, rezultand modelul liniar: logy, =loga+x, -logh Utilizarea modelului se recomanda cand punctele (x, logy, );.1,, Sunt in jurul unei . | cu variabilele log y; si log x;- | | (4.7) | Oserie de modele neliniare nu pot fi scrise sub forma unor modele liniare prin ficarea unor transformari elementare. in alte cazuri, pentru estimarea parametrilor se folosesc alte tehnici de estimare. leputand fi liniarizat prin transformari elementare, estimarea parametrilor se face prin ‘metode numerice. 4.3. Forma vectoriala a modelului liniar de regresie F Estimarea modelului liniar de regresie, se face pe baza seriilor de date pentru cele loud caracteristici. Acestea sunt reprezentate prin vectorii: pentru caracteristica explicativa (factorial). Capitolul 4. Modelul regresieiliniare simple 54 yi V2 Y ica explicata (rezultativa). Vn Un model liniar de regresie presupune cunoasterea: - metodelor folosite pentru estimarea celor doi parametri; - metodelor utilizate pentru testarea proprictatilor estimatorilor modelului de regresie; - principalelor aspecte privind folosirea modelului de regresic in efectuarea de __ previziuni. ; in definirea regresie liniare sunt considerate o serie de ipoteze. Luand in “considerare relatia y; = a x b*; se observa ca valoarea estimata a variabilei rezultative, “ estimatorilor parametrilor modelului si proprietitile acestora depind de caracteristicile " variabilei independente si proprictatile variabilei reziduale. Cele patru ipoteze se refera la " yariabilele ce definesc modelul de regresie, precum si la variabila reziduala. a) Seriile de date nu sunt afectate de erori de inregistrare Ipoteza postuleaz’ caracteristicile seriilor de valori ce sunt folosite pentru estimarea parametrilor. Plecdm de la faptul ca estimarea parametrilor se realizeaza pe baza ce reprezinté valori pentru cele doua variabile. ‘tabilirea functici analitice folosite pentru analiza dependentei dintre cele doua variabile Ja baz un numar mare de observatii statistice, astfel incat estimarea parametrilor se damenteaza pe legea numerelor mari. Consideram c& valorile pentru cele doua variabile sunt afectate de erori semnificative de masuri care sa distorsioneze calitatea timatorilor parametrilor. in cazul modelului clasic de regresie se considera c& valorile caracteristicii toriale sunt deterministe (valori fixate). Valorile caracteristicii rezultative sunt astice. ‘Aceasta proprietate este importanti in definirea si stabilirea proprietatilor ‘modelului liniar de regresic. : Vom spune ca valorile caracteristicii factoriale sunt nestocastice daca fiecdrei lori a acestei caracteristici ti corespunde o familie de valori ale caracteristicii rezultative. Se calculeaza, pentru fiecare valoare x a caracteristicii factoriale, o medie a familici acteristic rezultative si se determint seria de valori H[Y|X'=x,}i=17. Pentru fiecare valoare fixat a caracteristicii factoriale, variabila reziduala este de die zero, respectiv: Ele, |X = x,]= 0, pentru orice i (48) Caracteristicii factoriale, nu au o influenfi sistematicad asupra mediei cara, ee e ive. x ia e Cherie, rezultative. Daca ipoteza este satisfticutti de modelul liniar de regresie, putem serig. Ely X =x,|=5+ax, (4.9) ¢— dispersia reziduului este constant ributiile conditionale (¥/x=x) au aceeasi gig Peni Aceasta proprietate arata ca dis Teprezentati prin egalitatea urmatoar varle,|V = x, ]=o2, este constanta pentru orice i & proprictate, vom spune ci modetul deregs. He Daca variabilele reziduale nu sa aceast i vor este heteroscedastic si variabilcle reziduale au variante diferite: varfe,|X (4.11) c) Lipsa corelarii reziduurilor Aceasta proprictate exprima fap fenomenul de covarianta. Aceasta proprict cov(é,,é,) = 0, pentru orice i#] ful c& intre termenii reziduali nu se manifeys tate poate fi scrisa sub forma: (4.12) Daca variabila reziduala indeplineste ipotezele ,,b” si ,,c”, rezulta relatia: ee covlexe,)={ te (4.13) mel situatie diferita este atunci cand variabila reziduala prezinta o autocorelatie de intai, adica: = PE, +U,. ide 1, este zgomot alb. (4.14) d) Necorelarea vari bilei reziduale cu variabila independent. | in cazul cand aceasta ipoteza este indeplinita, putem scrie: P cov(X,2,)=0 , pentru orice j, ceea ce inseamna ca o crestere a valorilor | variabilei factoriale nu duce automat la un spor al valorilor variabilei reziduale. | Valorile reziduale sunt distribuite dupa o repartitie normala, de medie 0 si dispersie 2 C7 ma 2 cei attirenttioe imeem OMG), Modelul liniar de regresie se prezinta in figura 4.2: J, =b+ax, tolul 4. Modelul regresieiliniare simple 53 p(=) Figura 4.2. Modelul clasic liniar de regresie Pe baza ipotezelor prezentate definim modelul liniar de regresie printr-una din cele 14 forme echivalente: a) y, =b+a-x,+6,,i=1,..0 Tpotezele sunt formulate asupra variabilei reziduale: E(e,)=0 colene,)={e i (4.15) ¢, > N(0,02) Bb) y,=b+a-x,+6,,i=1,...0 Ipotezele sunt formulate asupra variabilei rezultative: E(y, |X =x,)=b+a-x, Oi47 cov( yi, yj) = “ (4.16) (viv) ee -¥ (4.16) y,> N(b+a-x, -0?) Cand intre cele doua variabile existé o dependent liniara, folosind serii de date 1,7, valorile variabilei rezultative sunt estimate prin relatia: 5, =b+ax,. (4.17) (4.18) # Econometric. Teorie, concept $i mode g. i aan isface egalitatea: Apreciem ca seria reziduurilor satisface ¢84 e= (4.19) > 0 ial 4.4, Estimarea parametrilor modelului liniar 4.4.1. Estimarea parametrilor prin utilizarea metodei celor mai mici patrate es sind relatia: Valorile caracteristicii rezultative sunt estimate folo: t di > : ls fs unde @ gi b sunt estimatorii parametrilor dreptei d b+ (420) b+ax,, regresie. Valorile reale ale caracteristicii rezultative sunt oa ol j | modelului de regresie, corectatd cu eroarea reziduala, adica: ajutorul model ie oa ie fi wd Cc r ; ; E timarea parametrilor are la baz conditia ca suma patratelor diferentelor diny, sti sical ie | valoarea reala si cea estimata prin modelul de regresie s& fie minima | nypol.i)=min =min S)(v/-6-ax,) Conditiile de optim ale functiei conduc Ia urmatoarele ecuat ala,b hee uips “el =-lyi-b—ax, )=0 ha 423) aa, . 2t=-2) (yi aay 7 Ecuafiile sunt stabilite aplicand metoda momentelor. Cele dou’ ecuatii se obtit dupa cum urmeaza: ~ prima ecuatie rezult din conditia E(e,)= 0, definind egalitatea: ie =0 sau) 4 doua ecuatie a sistemului de ecuatii se stabileste plecdnd de Ia ipoteza & hecorelare a seriilor valorilor variabilei factoriale cu cea a valorilor reziduale (cov(X, ¢)= (0), avand egalitatea: 1 ) pete =0. (4.22) b- ar, }-x, =0 (4.24) 4. Modelul regresiei liniare simple 55 nb+ a M4 iJ=E [Bx)eazs)-E>, __ Testarea daci solutia sistemului indeplineste conditiile de ordinul al doilea se face inarea derivatelor de ordinul al doilea ale functici: (4.26) eo(a,by/ 0a? io. 2 ef os % “ Pye : —(69(4,b)/ e406? 0° 9(4,b)/ ab yy ba - Matricea astfel definita are doua proprictati: este pozitiv definita; determinantul matricei este pozitiv: Fi -{5) = de, -7] >0 (4.28) (4.29) —— yan 30) 56 Econometrie. Teorie, concepte si Mode| $= eg Seria de valori (w,),.,,, are proprietatile: Proprietatea a: W; == Proprietatea b: YW) = — Proprietatea ¢: sy wx) = wi 0% — x)=1. (431) A atorului termenului liber al dreptei de regres, atii sau findnd seama de faptul e& drean, adica: te Formula de calcul a estim determina prin rezolvarea sistemului de ecu: regresic trece prin centrul norului de puncte, b+ax=y. Estimatorul pat j oh (4.33) (4.32) rametrului b se obtine din relatia: Astfel, pentru estimarea parametrilor modelului de regresie sa luam situatia in care, Salariul mediu real=f(PIB real/locuitor) Calcukim prin metoda celor mai mici piatrate marimile: ya) ar Sistemul liniar de ecuatii devine: i + 434,4824 = 32600 434,482 + 10265954 = 13706,19 Prin rezolvarea sistemului de ecuatii obtinem cei doi estimatori: 6 =-1277,8624 si @ = 115,2580 Funetia de regresie este acum definita: ~1277,8624 +115,258x, Capitolul 4. Modelul regresieiliniare simple 57. Calculele intermediare gis cuprinse in tabelul urmator: riile de date estimate folosite in sistemul de ecuatii sunt ‘Anil x yi xii # 3, , 1 35,892 | 2819 | 101164 | 1288,259 | 28514.0 | -40.4710 2 36,517 | 2841 | 103737 | 1333,506_|_2931,0 -90,2578 3 36,617 | 2858 | 104639 | 1340,782_|_ 2942.5 =84,8109, 4 36,325 | 2877 | 104494 | 1319,472_ [2908.8 -32,1626 SI 34,093 | 3018 | 102894 | 1162,303 | 2651.6 | 366,5001 6 32,093 | 2933 | 94115 | 1029,944 | 2421.1 511.4994 1 27,952 | 2193 | 61290 | 781,3272_|_1943,9_ | 248,8215 8 25,924 | 1973 | 51154 _|_672,0616 _|_ 1710.1 263,102 9 26,349 | 1787 |_ 47087 | _694,2738_|_ 1759.1 27,9592 to | 27.406 | 1777 [48690 | 751,0730_ |" 1880,9 | -104.2439 i 29,420 | 1955 | 57524 | 865.5274 | 21130 | -157,7342 12__| 30,672 | 2045 [62715 _|_940,7704_|_ 2257. -212,6428 13__| 28,635 | 1629 [_46652_|_819,9827_|_ 2022.6 | -393,3979 14 | 26,588 | 1897 [50441 | 706,9039 | 2199.3 | -302,1692 TOTAL [434,482 [32600 [1036595 _|13706,1900 | 32600.2 0,0000 reziduale. £,€N(Q,o,)2 Se) notind prin 4”,b” estimatorii determinati pe baza seriei (xi, %), Consideram ca variabila reziduala are proprietatea: nu ofera rezultate acceptabile daca nu sunt satisfacute ipotezele formulate; 4.4.2. Verosimilitatea maxima utilizata in estimarea parametrilor (4.34) Utilizarea metodei celor mai mici patrate are si unele inconveniente, dintre care Ln iarprin ”™!,6"" pe cei evaluati pentru seria de valori (x, y), 7=1n+1, rezulta c& intre cele doua perechi de estimatori nu exist’ o relatie simpla de recurenta; estimatorii sunt distorsionati daca seriile de date prezinta schimbari majore, sub forma rupturilor de nivel. Aplicarea metodei celor mai mici patrate a luat in considerare o serie de ipoteze ipra variabilei reziduale €;, care nu s-au referit la forma repartitici variabile aleatorii €; Metoda verosimilitatii maxime are la baz tocmai specificarea functiei de repartitie Econometrie. si de aici rezulti pie N(b,ax,,2,). Modelul de regresie devine determinati parametrii G,b si &,.. Avem, asadar, relatia: IQi1x)= Pentru modelul liniar de Tegresie, functia de verosimilitate este d ileb,62) = T1s0,/s). Utilizind formula densitafi de repartiti, functia de verosimilita sub forma: Relatiile de calcul Pentru : estimatorij Parametri cel al dispersie; Variabilei reziduale Tezulta din conditi max ae, b, =) a,b,a2 € Mai simplu, d lcterminarea formei estimatorilor se maximum pentru | face utilizand conditiite g logaritmul functiei de verosimilitate, adicy led Ua,,02)=Ini(a,6,02)= glia) ine] SG, any? (440) 59 (4.41) Constatiim ca si prin metoda verosimilitatii maxime acelasi set de estimatori pentru tri modelului ca in cazul aplicarii metodei celor mai mici patrate. In cazul utilizirii metodei verosimilitatii maxime se obtine direct si estimatorul spersici variabilei reziduale. Expresia acestui estimator rezulta din conditia dtoaale?) aay Dupi efectuarea calculelor se objine ecuatia pentru determinarea formule limitei timatorului variantei variabilei reziduale, respectiv: dloge?)_n 1, =a =z +=), -b -Gx,)? =0 (4.42) 0a? 26? 26 @ il Tinand seama de formula de calcul a erorilor de ajustare, dispersia variabilei (4.43) © Relatii intre parametrii dreptelor reciproce Consideram dreapta de regresie definita pe baza relatici: dy: yi=b + axj Definim dreapta de regresie reciproca d; utilizand relatia: b+ayi. Xi __Determinarea formulei estimatorului coeficientului pantei dreptei de regresie se pe baza relatici: (4.44) Bgalitatea rezulta din relatia de calcul a estimatorului daca se impart numaratorul umitorul la volumul esantionului. Pe baza relatiei de mai sus, rezulta ca estimatorul si nta calculata pentru cele dou’ variabile au acelasi semn, stabilind ca. aS stele it ~ intre parametrii pantelor de regresic exista relat os a _vat(y) Gas 3 a’ var(x) it » jntersecteaza in centrul de - Cele doua drepte, 1 acelasi plan, S° as a greutate hte de puncte, deci cele doua drepte °° prin punctul O\%, ‘ot FORAY ce poate demonstra acl VOT tine seama de faptul c& pentry model de regresie sunt valabile egalitatic* cca, fe regresie definit de di: YO, -8- 4%) =0; iA ‘ = pentru modelul d definit prin ds: 0%, —b-a'y,)=0. i=l lor dou egalitati, care trece prin punctul G(R 3) rr), pentru al doilea model de rogresie, Daca impartim la n termenii cel obtinem sistemul: ‘i +b=7e(d) an ‘Valoarea (mirimea) unghiului format de cele doua drepte arats intensitete " Jegaturii dintre cele doua variabile. azul legaturii reciproce dintre cele doua variabile, rezuliy Cum dreptele coincid in ¢: cA, cu cat marimea unghiului dintre acestea este mai mica, cu atat legatura liniara reciprog, dintre cele doua caracteristici este mai puternica. + x ‘ x Figura 4.3. Unghiul format din dreptele di $i d2 Obtinem apoi formul: er ele de calcul eo alee se cun¢ ean entru term losc cei doi coeficienti ai pantelor de beet Ff a ate coe ee ns Ries =x-a'y ~ Capitolul 4. Modelul regresieitiniare simple 61 in final, din ecuatiile celor doua drepte si din relatiile de mai sus obtinem formele pentru cele doua drepte de regresie: cov) ye = We ar) @- x), Fee oY) Sy, (447) var(y) ~* 1 b —x-——, care a a Din ecuatia dreptei d;, x = b’ + a’y, determinim ecuatia y - defineste dreapta care se reprezinta in acelasi plan cu dreapta dh. 7 Unghiul format prin intersectia dreptelor reprezentate in acelasi plan are tangenta calculata pe baza relatici (4.48) Semnul parametrului pantei de regresie exprima sensul dependentei dintre cele oui variabile. in raport cu semnul estimatorului parametrului a, distingem: - daca G > 0, dependenta intre cele doua variabile este directa; - daca estimatia parametrului a este egala cu zero, intre cele dowd variabile nu exist o dependenta liniara; - dacd coeficientul pantei de regresie este @ <0, atunci intre cele dowd variabile se manifesta o dependent liniara inversa. Semnul coeficientului pantei dreptei de regresie coincide cu cel al semnului arian{ei calculate pentru cele doua variabile. j - Estimatorul coeficientului pantei dreptei de regresie determinat prin aplicare odei celor mai mici patrate este un estimator nedeplasat si de dispersie minima. Deci, tru estimatorul @ sunt valabile egalitatile: E(a)=a (4.49) BE) areas 2 - 5 (4.50) Pentru a demonstra cele doua relatii, luand in considerare relatia de calcul a atorului, se observa ca acesta este o combinatie liniara a seriei de valori y;, yo, ..., Yin. ‘om folosi cele trei proprietati ale serici de valori (w,), Evidentierea ipotezei c& estimatorul obfinut in urma aplicarii metodei celor mai patrate este nedeplasat, se aplica operatorul de medic termenilor egalitatii. Daca 0, pentru orice i, se obtin progresiv egalitatile: Econometrie. Teorie, =a E(a) = E(a)+ BQ me) = ary w,E(é,) 4 Evidentierea celei isa doua cme - cadrul proprietatii ,, a geile ispersici est Jui considerand relatia: calculul dispersiei estimatoru a ? = 2 = ECD wie? +) my var(a) = E(a- 4)" = vat we) = CL) 0 2 » , = Swf Acer) +L vw ee) Pe baza ipotezei ,,d” (variabilele reziduale nu sunt corelat homoscedasticitatii variabilelor reziduale, rezulta: s var(@) = Dowie: =: a] Din ultima relatie, rezulta ci dispersia estimatorului este cu at dispersia caracteristici factoriale este mai mare. egalitatea: G, = Y)a,y, . Este evident c& ponderile combinatiei liniare din coincid cu cele ale seriei (w,),;,,- Deoarece y, =h+ax, +e, pentru t rezulta: i 4. = bya, + ax, + Dae, Dara doua restrictie a estimatoruluid, doua proprietati ce sunt satisficute de sistemul - Ya, =0 7 5 DCE =0. 7 Pe baza acestor egalititi, 4.=a+ Yas, 7 se refera la faptul ca este nedeph de ponderi (4,), — | respectiv: Tezult& c& estimatorul se objing prin t urmatoarea rel : : : 4.55 Din relatia (4.55) se obtine dispersi i 7 ‘persia noului esti ene oy : loului estimator: Comparam dispersiile celor doi estimatori ned | liniare ale valorilor variabilei rezultati omulice are ale ; ~aulltative, Observam c& intre seriit ont °%Primati estimatori Sunt verificate relatiile a, = w, + d; pentru a a pede er Bee relatie, obtinem: Tice i. Inlocuing apo} ale celord "4 in ultin Capitolul 4, Modelul regresiei liniare simple 63 yar(4.) = 07 (Dw? + Dod? +2) w,d,) (4.57) Demonstrim cA a treia suma din ultima relafie este nulé, tinand seama de proprictatile sistemului de ponderi ale primului estimator si de restrictiile impuse sistemului Etc ponderi pentru cel de-al doilea estimator. Se obtine rezultatul urmator: 4, yd, 21) ee " Leary Ya-v =0 (4.58) Din acest rezultat deriva inegalitatea intre variantele celor doi estimator: rs 25 2 if var(a.) = 02 Ww? +02) (a, —w,)? 2var(a.) (4.59) in cazul in care variabila reziduali urmeazi repartitia normald, estimatorul Gi saio., ‘Am notat prin o, abaterea standard a variabilei factoriale, iar 7, reprezinta uurmeaza si el o repartitie normala, de medie a si abatere standard abaterea standard a variabilei reziduale. ‘Cea mai buna estimatie a dreptei de regresie se obfine prin reducerea pe cat posibil aabaterii standard a estimatorului pantei de regresie. Reducerea acestei miarimi are la baza posibilitatea de a scrie indicatorul sub forma: mea. Dee ito Asadar, abaterea standard este direct proportionala cu dispersia observatiilor yi, ¥25 we» Yin in jurul dreptei de regresie si invers proportionala cu numarul de observatii si dispersia valorilor x1, X2, ...) Xin- (4.60) Cu cat valorile variabilei factoriale sunt mai dispersate, cu atat precizia estimarit este mai mare (gradul de dispersare a seriei valorilor caracteristicii exogene este masurat prin abaterea medic standard a seriei). Estimatorul termenului liber al dreptei de regresie obfinut prin aplicarea metodei celor mai mici patrate este un estimator nedeplasat si de dispersie minima. Se definesc urmatoarele doud relatii: . am A ca E(b) = bsi var(b) = ei +3] (461) n Norul de puncte determina posibilitatea de a serie egalitatile: Ye, 4.62) ny yy, -ae= 1 b+ an, +6)-a nz ny Econometrie, i ietru gi e: in relatia (4.62) rezulta cd abaterea dintre parametru ¢ Din relatia (4.62) rez ie combinatie liniara de variabile rezidi 1 aa aya Ponderile combinatiei liniare sunt C, = w, ro Pentru a demonstra proprietitile estimatorului termenului lil de regresie consideram proprietatile seriei de valori ic » Tespecti IG ye 1 a 2 aie - cov(C,,¢,) =0. Demonstrim ci estimatorul termenului {i nedeplasat, pornind de la Faptul a ipotezele ,b” gi KK aplic’ o b c E(b—b) ber al modelutui dom © ale modelutui liniar ip Peratorul de medie, rezultind 0,ce se Poate scrie sub E(b)=5 Pentru caleulul dispersig; Yom tine Seama de si se obtine telatia: faptul ca estimatorul este, var(b) = 2(5— By ES Ce)? Considerand ipotezele b> Prezentare a dispersie; acestui esti var(b) = (Zee) e = 3 a ce g e 2 eae BE Zz a g 3 E £ viii Beis ° Ponte dan i le regresig nstra ca > Matricea de COVvarianta a estimatorilor este reprezentata prin: Modeluluj lini. or de represig gi a 1 Q24)=| YO — cowa,éy StS ba) beni var(b) | ~%: (4.68) tolul 4. Modelul regresie iniare simple oo 65 Definirea matricei de covariant a estin oe a estimat cov(dsd) = var(a),cov(b,) = var(6) Morilor are in vedere rel: stn ati: s0v(a,b) = cov(h, @y Formula de calcul a covariante ae rosie, reek neue celomuolvestnnate i modelului c resi, ‘nd: Stimatori {ine seam’ de ipotezele covtvh) = Bla ano 5) = af Toe lao laneryy : 1a ne (4.69) a - Estimatorul ,,4” converge in Probabilitate cat : tre parametrul ,,a”. in mod similar, esiimatorul termenului liber al modelutui clasie de regresie, 5 : . Afirmatiile sunt evi “ 3 eatre .b if me ‘idente daca avem in vedere ca: var(4) = 59 no, ”, tinde in probabilitate (4.70) Covarianta lui @ si }, pentru x; fixat, este nula: cov(4, ¥) = co m7] =m, covly,,7) an) ; ; - 1 1 2 Dar cov(y,,7) = o(ot59,] = 2D e0.9,) = Ze intrucat yy si y 5 n 7 sunt variabile independente, dact i#j. vom avea atunci, seriei de valori (w,),_-, , urmatoarele egalit Wo 7S ig ie ya lund in considerare proprietatile (4.72) 4.6. Coeficientul liniar de corelatie Vom examina, prin intermediul coeficientului liniar de corelatie, daca intre variabilele modelului de regresie exist o dependenti liniara semnificativa. Consideram c& ayem un esantion de forma (x,,Y,),;,,- Prin coeficientul liniar de corelatie vom pune in evident prezenta sau absenta legaturii liniare dintre cele doua variabile ale modelului de regresic, sensul legaturii, precum si intensitatea acesteia. * Pentru a studia caracteristicile dependenfei liniare dintre doua se utilizeazi covarianta. Aceasti misurd se utilizeaza mai rar deoarece prezinta doud neajunsuri majore: ~ covarianta nu este un indicator normalizat. Neincadrndu-se intr-un anumit interval de valori, indicatorul nu va furniza informatii exacte pentru izarea intensititii dependentei ‘ ; ° depict Tan ne asi ale celor doua variabile gi satisface relatia: (4.73) y) FFF onveniente trebuic s& Plece de -a,0, $00 cele doud ine are si inlature De aceea, un indicator ¢ la domeniul de valori al covariantel: Pe. §G,0, SOV YE 7 oC. i jtatii pri zulta: Daca impartim termenii inegalitif prin 0, 0.71 (4.75) ede masura ale celor doug O,o% indicator ce depinde de unitatil nut astfel un now eae cease ae statistica normalizata denumit coeficien’ ling de corelatie, introdus in statisticd de K. Pearson. Indicatorul s¢ calculeaz4 prin relatia: XG x, -Y) we (4.76) no,0, Coeficientul liniar de corelatie este eficient pentru masurarea intensitatij dependentei dintre ‘variabile numai daca este de tip liniar. . jn continuare vor fi prezentate proprictatile coeficientului liniar de intru estimatorii parametrilor modelului liniar de ‘ie de calcul pe area acestuia. Re: latie es jentia: zumativ putem evid 3 verificandu-se egalitatea je, stabilind relatii te o masurd simetric: tie de valo ‘cjentul liniar de corel: corelati regresie in func! a) coefi rosy) = 10.9)- b) este invariant it Ia transformarea datelor si schimbarea originii si unitatii seriilor ) rag ce satisfac relatiile u; de date. = 1 (M% ari de corelatie calculati pentru Daca dispunem de seriile de date (x,,:), =c+dy,cu ade R,, atunci coeficientii lini =b+ ais cele douti serii sunt egali. Considerand si proprietatile covariantei si ale dispersiei, rezult: oa cov(u,v) _ ad cov(x, Y) Gi © acide, =r(x,¥) (4.77) rea transformarilor ce i liza modelului de regresie se poate face si prin utilizal u ee o, c) Estimatorul coefi i felatiei: icientului pantei dreptei de regresi a gresie se calculeaza a ae pe baz SpA S, (4.78) apitolul 4 Modell regrese iniare simple zach Pentru dreapta reciproca X, = b'+a' , , vom utiliza relatia: (4.79) Constatém c& @ sir au acelasi semn putand distinge trei cazuri: _ daca r > 0, atunci > 0, dependenta dintre cele doua variabile este directa; _ cand r = 0 si G = 0, si nu avem dependente liniare intre variabile (modelul de regresie coincide cu o dreapta paralela cu axa ox); - cand r > 0, estimatorul pantei dreptei de regresie va avea 0 valoare negativa; dependenta find inversa. d) Daca variabilele modelului liniar de regresie sunt liniar independente, atunci yaloarea coeficientului liniar de corelatie este zero. Reciproca nu este intotdeauna adevarat’, deoarece valoarea nul a coeficientului liniar de corelatie calculat pentru variabilele modelului nu implica in mod automat si independenta variabilclor. Prima parte a afirmatici se deduce din egalitatea: a-[ Variabilele sunt independente daci dreptele de regresie reciproce sunt perpendiculare. Va rezulta c& cei doi coeficienti satisfac egalitatea@-a'= 0. Deci, in cazul in care variabilele sunt liniar independente, r = 0. ¢) Coeficientul liniar de corelatic nu este masura tranzitiva. ‘Astfel, daca x este o variabil’ y, iar la randul sau y este corelata cu z, nu implica in mod - obligatoriu ca intre x si z exist o dependenfa linear’. f) Pentru dou’ variabile se verificd relatia r2 = 1 daca si variabilele X si Y sunt corelate functional. ] Prima parte a afirmatiei se demonstreazi finand seama de relajia peels) “rezulti c& cele dou’ drepte reciproce sunt paralele, fiind corelate functional. Reciproca acestci afirmatii se demonstreaz’ daci considerim c& cele dou’ variabile sunt ‘independente. Dreptele de regresie reciproce sunt paralele si satisfac relatia 7 = 1. 7 Cu cat 7? este mai mare, cu atit intensitatea dependentei liniare dintre cele doua ‘variabile este mai puternica. Valoarea coeficientului liniar de corelatie este invers sportionala cu unghiul dintre cele doua drepte reciproce de regresic. g) Cand variabilele X si Y sunt liniar independente, atunci coeficientul liniar de ‘latie si raportul de determinare satisfac egalitatea: (4.80) 2 cand yom obtine egalitatea @-G'=1. Din aceasta egalitate Econometrie. Teorie, cor 0 ar de corelatie se interpreteaza pe ba coeficientului | le corelatie se int Valoarea coef de SPR _ Sqfn “sr SPT. «S/n yr SPT Sy ll SPE YO, — 5) , cuantificd acea parte a dispersiei unde am notat SPE = ))(¥; aa «cal = , — pi) reprezinta act intermediul variabilei de regresie; SPR = Xb, Si) si daci pentru masurarea intensitatii dependentei se calculeazi ambii acestia verificd relatia de ordine: Os? 0,46 ; daca volumul egantionului creste la 40, rezulta a |r| > 0,32 and n = 50, valoarea limita se micsoreaza, rezultand |r| > 0,28 ; daca.» ~ 100, avem conditia |r| > 0,20. Daca vom micsora probabilitatea de garantare a rezultatelor, la nivelul @ =10%, pentru aceasta yaloare a pragului de semnificatie analiza pe cele patru dimensiuni ale esantionului conduce la: pentru esantioanele de volum redus, n = 20, este satisfacuta conditia |r| > 0,39 ; cand n = 40, |r|>0,27; daca n = 50, | > 0,24; dacd volumul ntul liniar de corelatie n= 100, valoarea se reduce, satisfacdnd relafia|r| > 0,17. in concluzie, putem aprecia ci pe masura ce volumul esantionului creste, pentru valoarea critica a coeficientului liniar de corelatie scade si un prag de semnificatie stabilit, in cazul in care volumul esantionului este stabilit, creste pe yaloarea critica a indicatorului, masurd ce pragul de semnificatie scade. in cazul in care p = 0, repartitia variabilei I” este dificil de stabilit. In acest caz, pe sur ce valoarea lui p se indeparteazi de zero, dispersia variabilei scade, iar repartitia se indeparteaz4 tot mai mult de o repartitie simetrica. in acest caz, caracteristicile variabilei sunt: p - Ee \s aoe (4.86) 2n n-1 E(R)= Af = in cazul in care seria de date este suficient de mare (m > 25), Oe N =lg— == (3 [ap 53) Folosind coeficientul liniar de corelatie, vom spune (4.87) ca variabilele modelului de _ iT regresie sunt liniar independente, dac& 1, =~" ¥"— 2>t,2- -r _Teorie, concente 91 modele dean, BLUE Teor’ al ay 70 calculeazi marimea: vn=2 (4.88) Pentrn testul bilateral se respinge ipoteza nuld daci este indeplinita egatita, 0 se respinge ipt _ se va citi din tabelul repartitiei Student, 2 grade de libertate. i a eva nul daca 1 i t,| > 1, >. in cazul testului unilateral p> oteza mula dacd f, > 1, , jar penis, p w.e, , obtinem: e, ee (4.91) - Dis sabileiiresi estima pin Bee wena reziduale pentru modelul clasic de regresie (parametrii su! 4 Celor mai mici patrate) este estimata prin relatia: 5 (4.92) Capitolul 4. Modelul regresiei liniare simple 1 Vom lua in consideratie ipotezele ce g E(E,)=9, var(e,)=0?, cove i, Calculand ¢? tau la baza modelului clasic de regresic: DE )=0,ViF j si cov(X,¢,) =0 pentru toti indicii $i aplicand operatorul de medie, rezulta pentru fiecare indice i egalitatea: Py =e GEIR) Blej)= 02 +°= +02(x,-) Lei 2, “A -aEma,| pageee (4.93) = 03% 60%, -2) xt 2arl tsa, So-9Ee, lee 4] Utiliznd operatorul de insumare, finand seama de Proprietatile seriei (w,) obtinem: E(Ye,) =(n=2)02 Determinim estimatorul variatici reziduale. be bin? (4.94) > €€ se compara cu estimatorul , estimator nedeplasat. - Pentru modelul liniar de regresie, marimea dispersiei seriei ecarturilor (e, ds ; ste cu att mai mare cu cat seria valorilor caracteristicii rezultative este mai mare, dar mai cd daca dependenta dintre cele doua caracteristici este mai puternica. Intre dispersia seriei ecarturilor, a valorilor caracteristicii endogene si coeficientul iar de corelatie se verifica egalitatea: 02 =(l-r’)o? (4.95) Vom demonstra ultima relatic tinand seama de faptul c4, in cazul in care intre cele SPE Sa unde SPT = SPR + SPE. SPT loud variabile dependenta este liniara, 7 Deoarece 1-r? ae din formula de calcul a dispersiei variabilei reziduale btinem: SPR SPT 2 =r? Jo? = ag’ «Se pee aa S-a calculat dispersia ecarturilor prin formula: (4.96) (4.97) Econometrie. Teorie, concepte si modele de aNaligs 72 ~ Din ipoteza de normalitate a reziduului, rezulta: 2 (4.98) Se poate determina un interval de ineredere pentru dispersia variabilei Teziduale daca se fixeazi un Prag de semnificatie @ , intervalul de incredere fiind: semnificatie q stabilit. Prin reprezentarea grafic’ a punctelor de coordonate benzi orizontale, ipoteza este valabi

You might also like