Professional Documents
Culture Documents
Num r mediu de salaria i din sectorul energiei electrice termice, gaze i ap (2007) 3365 1234 4656 1602 963 1076 3853 1406 4447 1762 2718 1529 5149 5094 3209 1832 4018
Regiunile de dezvoltare
Nr. Crt.
Judete
C tig salarial din sectorul energiei electrice termice, gaze i ap (2007) 2037 1775 2157 1877 1904 1710 2131 1987 2158 2245 2110 1671 2087 2551 2288 1961 2207
Nord-Vest
Nord-Est
Sud-Vest Oltenia
1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5
Bihor Bistri a-N s ud Cluj Maramure Satu Mare S laj Bac u Boto ani Ia i Neam Suceva Vaslui Dolj Gorj Mehedin i Olt Vlcea
11488.9 4976.4 18020.9 7012.7 5341.6 3883.6 9846.2 4737.6 12071.9 6659.7 8864.8 3809.9 10675.0 7613.9 3755.6 5566.3 6808.8
594 316 692 513 366 243 719 454 825 566 705 455 712 381 298 475 411
Nr. mediu salaria i din sectorul energiei electrice termice, gaze i ap = f (PIB) X- variabila cauz , explicativ ; PIB Y- variabila efect, explicata; Nr. mediu salaria i din sectorul energiei electrice termice, gaze i ap
10
15
20
Pentru fiecare dintre cele n=17 jude e s-au notat valorile celor dou variabile, X i Y, ob inndu-se astfel seria de date _ x1 , y1 , x2 , y 2 ,..., x n , y n sau xi , yi , i ! 1, n . Pe baza acestui a e antion vom determina estimatorii a i b ai parametrilor E i F ai modelului de regresie. Estimatorii a i b reprezint solu ia sistemului ecua iilor normale:
n n na b xi ! yi i !1 i !1 n n n x b x2 ! x y a i i i i i !1 i !1 i !1
(a ( si b ! b , ( (
n unde ( !
n i i !1 n
x
i !1 n i !1 n
x x yi
iar (a !
i !1 n i i i !1
xi
i !1 n i !1
n , (b !
n i i !1
y
i !1 n i i !1
x y x
necunoscute.
! a b !
2 i
x x y
xi
2
132,25 25 324 49 25 16 100 25 144 49 81 16 121 64 16 36 49
yi
2
11,323225 1,522756 21,678336 2,566404 0,927369 1,157776 14,845609 1,976836 19,775809 3,104644 7,387524 2,337841 26,512201 25,948836 10,297681 3,356224 16,144324
xi yi
38,6975 6,17 83,808 11,214 4,815 4,304 38,53 7,03 53,364 12,334 24,462 6,116 56,639 40,752 12,836 10,992 28,126
1272,25
170,863395
440,1895
Se ob ine:
( a 47,913 v 1272,25 133,5 v 440,1895 ! ! 0,58 ( 17 v 1272,25 17822,25 (b 17 v 440,19 133,5 v 47,913 ! 0,28 , ! b! 17 v 1272, 25 17822,25 ( a!
O alta metoda de determinare a ecuatiei de regresie se bazeaza pe baza datelor din urm torul tabel:
Coefficients
Standard Error
t Stat
P-value
Lower 95%
Upper 95%
Lower 95,0%
Intercept 0,575936942 0,625713051 0,920448983 0,371904825 0,757738851 1,909613 -0,75774 PIB(2007)(miliarde lei) 0,285558592 0,072329164 3,948042208 0,001288647 0,131392629 0,439725 0,131393
prin urmare dreapta de regresie este de ecua ie y ! a b x ! 0.58 0.28 x , ecua ia de regresie liniar n e antion este y i ! a b xi ei ! 0.58 0.28 x i ei , i ! 1,17 , iar valorile ajustate ale observa iilor y i , i ! 1,17 prin regresie sunt y i ! a b xi ! 0,58 0.28 xi , i ! 1,17 . a = 0,58- intercept, termen liber, reprezint valoarea pe care o ia variabila efect atunci cand nivelul variabilei cauz este 0. In cazul nostru, coeficientul nu are o interpretare semnificativ statistic. b = 0,28 la cre terea cu o unitate (1 miliard lei) a PIB, nr de salaria i va cre te cu 0,28 mii persoane. b>0 legatur direct ntre cele 2 variabile.
F!
unde k este num rul de variabile explicative din modelul de regresie (n cazul nostru, k=1 deoarece avem un model de regresie liniar unifactorial sau simpl , adic cu o singur variabil explicativ ). Fie nivelul sau pragul de semnifica ie al testului, iar 1- este nivelul de ncredere al testului. n cazul nostru = 5%= 0,05. 5
Valoarea statisticii F
2 sy / x
Fcritic
SSR ! (2y / x ! yi y
i !1
(2y / x k
Fcalc !
se2
FE ';k ,n k 1
SSE ! (2e ! y i yi
i !1
nk1
2
2 se !
(2e n k 1
Total
SST ! ( ! yi y
i !1
2 y
n1
s !
2 y
(2y n 1
Tabelul ANOVA calculat cu ajutorul programului informatic Excel este urm torul:
ANOVA Df Regression Residual Total 1 15 16 SS 18,2561975 17,56863461 35,82483212 MS 18,2561975 1,171242308 F 15,58703727 Significance F 0,001288647
Fcalc " Fcritic ! FE ';k ,n k 1 , adic Fcalc se g se te n regiunea critic , atunci respingem H0 i
accept m H1, c modelul de regresie este valid statistic.
x2 2 1 s ! se n unde a n xi x 2 i !1
2 2 standard) a estimatorului a, s e este disperia reziduala, iar s e ! s e este abaterea standard rezidual (eroarea standard rezidual sau a erorilor).
=0, este
t calc !
nu
este semnificativ statistic. Testarea semnifica iei parametrului H0: =0 (parametrul este nesemnificativ statistic) H1: 0 (parametrul este semnificativ statistic, adic semnificativ diferit de 0)
x
i !1
x
estimatorului b,
2 2 s e este dispersia rezidual , iar s e ! s e este abaterea standard rezidual (eroarea standard
rezidual ). Pentru calcularea statisticii testului am folosit acela i tabel de mai sus.
=0, este
t calc !
Cum t E ';n k 1 ! t 0 , 05 ;15 ! 2,131 , atunci t calc ! 3,948 Rc ! g;2,131
2,131; g
, deci respingen
2 2
H0 i concluzion m ca este semnificativ statistic, cu o probabilitate de 0,05 de a comite o eroare de primul tip (s respingem H0 cnd aceasta este adev rat ).
5. S se m soare intensitatea leg turii dintre variabile folosind coeficientul de corela ie i raportul de corela ie, testnd semnifica ia acestora pentru un nivel de semnifica ie 0,05.
1. M surarea intensit ii utiliznd coeficientul liniar de corela ie Pearson
xi x
yi y
rxy !
i !1
x y
i
nx y !
x x
i i !1
y y
i i !1
!
2
i !1
n 2 n xi n x 2 yi2 n y 2 i !1 i !1
n n n n xi yi xi yi i !1 i !1 i !1 n 2 n 2 n 2 n 2 n xi xi n yi yi i !1 i !1 i !1 i !1
rxy !
Valoarea coeficientului de corela ie Pearson, pozitiv i relativ apropiat de 1, arat c ntre cele dou variabile exist o leg tura liniar direct i de intensitate puternica. Testarea semnifica iei coeficientului de corela ie Pierson Ipotezele testate sunt: : =0 ( nu este semnificativ statistic) : 0 ( este semnificativ statistic) Statistica testului este: t=
Valoarea critica a lui t, pentru un prag de semnifica ie de 5% i 15 grade de libertate este de 2,131 rezult c : > , adic , adic resping , accept , deci coeficientul de corela ie Pierson este semnificativ statistic.
R!
SSR ! SST
(2y / x (2y
Cum b>0, |R|=|r|. Valoarea raportului de corela ie, pozitiv i relativ apropiat de 1, arat c ntre cele dou variabile exist o leg tura liniar direct i de intensitate puternica Testarea semnifica iei coeficientului de corela ie Pierson Testarea validit ii sau semnifica iei raportului de corela ie const n testarea H0: Raportul de corela ie este nesemnificativ statistic (variabila X nu are influen semnificativ asupra lui Y) cu alternativa H1: Raportul de corela ie este semnificativ statistic (semnificativ diferit de 0, adic variabila X are influen semnificativ asupra lui Y).
10
0,509 1 Valoarea calculat a statisticii testului este F ! 1 0,509 ! 15,9 , 17 1 1 accea i valoare ca la testarea validit ii modelului de regresie folosind ANOVA.
Daca
testearea
se
realizeaza
la
un
prag
de
semnifica ie
=0,05,
atunci
de variatia
Pentru ponderea din varia ia variabilei efect numarul mediu de salaria i din sectorul energiei electrice, termice, gaze si apa (2007) explicat de variabila cauz PIB (2007) vom utiliza coeficientul de determina ie, R 2 , R square. Valoarea acestuia a fost calculat de programul informatic Excel, Rsquare=0,509, cu valoarea procentual de 50,9%. 11
n concluzie, din varia ia total a variabilei efect n propor ie de 50,9% este explicat de variabila cauz , restul de 49,1% fiind explicat de varia ia factorilor aleatori.
SUMMARY OUTPUT Regression Statistics Multiple R R Square Adjusted R Square Standard Error Observations 0,713860055 0,509596177 0,476902589 1,082239487 17
F 15,5870372
Coefficients
Standard Error
t Stat
P-value
12
0,575936942 0,285558592
0,625713051 0,072329164
0,920448983 3,948042208
0,37190482 0,00128864
RESIDUAL OUTPUT Observation 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Predicted Numarul mediu de salariati 3,859860746 2,0037299 5,715991592 2,574847084 2,0037299 1,718171308 3,431522859 2,0037299 4,002640042 2,574847084 3,145964267 1,718171308 3,71708145 2,860405675 1,718171308 2,289288492 2,574847084 Residuals -0,494860746 -0,7697299 -1,059991592 -0,972847084 -1,0407299 -0,642171308 0,421477141 -0,5977299 0,444359958 -0,812847084 -0,427964267 -0,189171308 1,43191855 2,233594325 1,490828692 -0,457288492 1,443152916
13
b. Realizarea i interpretarea regresiei multifactoriale: y i ! f x1i , x 2i , x3i
Unde: yi - num r mediu de salaria i din sectorul energiei electrice termice, gaze i ap (2007) (mii
persoane) x1i - c tig salarial din sectorul energiei electrice termice, gaze i ap (2007)( mii lei)
x 2i - PIB din 2007 (miliarde lei) x3i - popula ia din 2007 ( sute de mii persoane) ..
Num r mediu salaria i din sectorul energiei electrice termice, gaze i ap = f (C tig salarial din sectorul energiei electrice termice, gaze i ap , PIB, Popula ie)
Intercept Castig salarial (mii lei) PIB(2007)(miliarde lei) populatie(sute mii persoane)
Pe baza tabelului de mai sus, calculat de programul informatic Excel, am determinat modelul de regresie la nivelul e antionului: (Intercept)= -6,14 = termenul liber al modelului, care arat care este valoarea medie a variabilei explicate (efect) atunci cnd nivelul tuturor celor K variabile explicative este 0. (C tig salarial(mii lei))= 3,58 (PIB (2007)(miliarde lei))= 0,2 (Popula ue (sute mii persoane))= 0,01 Coeficien ii , i arat influen a par ial a fiec rei variabile independente, atunci cnd influen a tuturor celorlalte variabile independente este considerat constant . A adar, , i={1,2,...,17} 14
F!
2 e
unde k este num rul de variabile explicative din modelul de regresie (n cazul nostru, k=3 deoarece avem un model de regresie liniar multifactorial sau multipl ) Fie nivelul sau pragul de semnifica ie al testului, iar 1- este nivelul de ncredere al testului. n cazul nostru = 5%= 0,05. Pentru calculul statisticii Fcalc folosim tabelul ANOVA:
Valoarea statisticii F
2 sy / x
Fcritic
SSR ! (2y / x ! yi y
i !1
(2y / x k
Fcalc !
se2
FE ';k ,n k 1
SSE ! (2e ! y i yi
i !1
nk1
2
2 se !
(2e n k 1
Total
SST ! (2y ! yi y
i !1
n1
s !
2 y
(2y n 1
15
Tabelul ANOVA calculat cu ajutorul programului informatic Excel este urm torul:
ANOVA df Regression Residual Total 3 13 16 SS 26,99677791 8,828054206 35,82483212 MS F 8,99892597 13,25162 0,679081093 Significance F 0,0003
Fcalc !
2 sy / x
se2
Regula de decizie:
Fcalc " Fcritic ! FE ';k ,n k 1 , adic Fcalc se g se te n regiunea critic , atunci respingem H0 i
accept m H1, c modelul de regresie este valid statistic.
Coefficients Intercept Castig salarial (mii lei) PIB(2007)(miliarde lei) populatie(sute mii persoane)
Standard Error
t Stat
3,57846274 0,998767972 3,582876946 0,003339 1,420755723 0,198832498 0,092276007 2,154758361 0,050515 0,000517695 0,011611699 0,19184961 0,060525007 0,952658 0,402854185
16
Coefficients
P-value
Intercept
b0= -6,14
s b0
tb0 !
=2
b0 sb 0 b1 s b1 b2 sb 2
0,009104<0,05
este semnificativ
-3,06
-10,47289011 b0 t E / 2 ; n 3 s b 0 1,420755723 b1 tE / 2; n 3 s b1
b1= 3,57
s b1 = 0,2
t b1 !
0,003339<0,05
coeficientul b1 este semnificativ
3,58
b2=0,19
PIB(2007)(miliarde lei)
=0,01
s b2
tb2 !
= 0,92
0,050515>0,05
coeficientul b2 nu este semnificativ
2,15
-0,000517695 b2 t E / 2; n 3 s b 2 -0,402854185
0,398182692 b2 tE / 2; n 3 s b 2
0,06
0,426077583
Testarea semnifica iei parametrului F 0 H0 : F 0 = 0 (panta F 0 este zero, adic F 0 nu este semnificativ diferit de zero, deci F 0 nu este semnificativ statistic) H1 : F 0 { 0, (panta F 0 nu este diferit de zero, adic F 0 este semnificativ diferit de zero, deci F 0 este semnificativ statistic) Deoarece n = 17 30 avem e antion de volum redus i pentru testare vom utiliza testul t. tiind c pragul de semnifica ie este E ! 0,05 i k ! 3 (exist trei factori de influen ) se stabile te:
b0 ! 3,06 sb0
17
t b 0 3,06 t critic 2,16 , adic nu apartine regiunii critice, adic accept Ho, resping H1, deci parametrul nu este valid statistic y pragul critic P-value b0 = 0,009104< E ! 0,05 pragul de semnifica ie, rezult c parametrul nu este valid statistic limita inferioar a intervalului de ncredere (lower 95% =-10,47289011) este cu acela i semn fa de limita superioar a intervalului (upper 95% =-1,806540075); intervalul de ncredere este - 10,47289011 e F 0 e - 1,806540075 ; y Testarea semnifica iei parametrului F 1 : H0 : F 1 = 0 (panta F 1 este zero, adic F 1 nu este semnificativ diferit de zero, deci F 1 nu este semnificativ statistic) H1 : F 1 { 0, (panta F 1 nu este diferit de zero, adic F 1 este semnificativ diferit de zero, deci F 1 este semnificativ statistic) Deoarece n = 17 30 avem e antion de volum redus i pentru testare vom utiliza testul t. tiind c pragul de semnifica ie este E ! 0,05 i k=3 (exist trei factori de influen ) se stabile te:
b1 ! 3,58 s b1
Regula de decizie: y t c 3,58 " t critic 2,16 , adic apar ine regiunii critice, prin urmare resping H0, accept H1, deci parametrul nu este semnificiativ statistic y pragul critic P-value = 0,003339< E ! 0,05 pragul de semnifica ie , deci parametrul F 1 nu este semnificativ statistic y limita inferioar a intervalului de ncredere (lower 95% =1,420755723) este cu acela i semn ca limita superioar a intervalului (upper 95% =)5,736169757; intervalul de ncredere este 1,420755723 e F 1 e 5,736169757 ;parametrul este semnificativ statistic
4 S se m soare intensitatea leg turii dintre variabile folosind raportul de corela ie, testnd semnifica ia acestuia pentru un nivel de semnifica ie 0,05.
Valoarea calculat a raportului de corela ie o reg sim in urm torul tabel, sub nota ia de Multiple R:
Regression Statistics Multiple R 0,868088264 R Square 0,753577234 Adjusted R Square 0,696710442 Standard Error 0,824063767
18
Observations
17
R= 0,86, raportul de corela ie are o valoare pozitiv legatura dintre variabile este puternica O alt metod de calcul pentru R este urm toarea:
ANOVA df Regression Residual Total 3 13 16
Significance F 0,000299529
R!
Testarea semnifica iei raportului de corela ie, =0,05 Testarea validit ii sau semnifica iei raportului de corela ie const n testarea H0: Raportul de corela ie este nesemnificativ statistic (variabila X nu are influen semnificativ asupra lui Y) cu alternativa H1: Raportul de corela ie este semnificativ statistic (semnificativ diferit de 0, adic variabila X are influen semnificativ asupra lui Y).
R Square = 0,75
19
Daca
testearea
se
realizeaza
la
un
prag
de
semnifica ie
=0,05,
atunci
de variatia
Pentru a afla ponderea din variatia variabilei efect explicate de variatia variabilelor cauz vom utilize coeficientul de determina ie, R square sub forma procentual (coeficientul de determina ie sub forma procentuala). R square(%)= 75%, adic 75% din varia ia variabilei efect(Nr mediu de salariati din sectorul energiei electrice, termice, gaze si apa) este explicat de varia ia variabilelor cauz (Castig salarial din sectorul energiei electrice, termice, gaze si apa (2007), PIB (2007), Populatia din 2007), restul de 25% datorndu-se factorilor aleatori.
20
populatie(sute mii persoane) Mean Standard Error Median Mode Standard Deviation Sample Variance Kurtosis Skewness Range Minimum Maximum Sum Count Confidence Level(95,0%) 5,132353 0,417149 4,75 #N/A 1,719947 2,958219 -1,04211 0,221263 5,82 2,43 8,25 87,25 17 0,884315
PIB(2007)(miliarde lei) Mean Standard Error Median Mode Standard Deviation Sample Variance Kurtosis Skewness Range Minimum Maximum Sum Count Confidence Level(95,0%) 7,852941 0,907247 7 5 3,740675 13,99265 1,956316 1,296038 14 4 18 133,5 17 1,923277
21
SUMMARY OUTPUT Regression Statistics Multiple R 0,868088264 R Square 0,753577234 Adjusted R Square 0,696710442 Standard Error 0,824063767 Observations 17 ANOVA df Regression Residual Total 3 13 16 Coefficients Intercept -6,13971509 Castig salarial (mii 3,57846274 lei) PIB(2007)(miliarde 0,198832498 lei) populatie(sute mii persoane) 0,011611699 RESIDUAL OUTPUT Observation 1 2 3 4 5 6 7 8 9 10 11 12 13 Predicted Numarul mediu de salariati 3,505160734 1,242911734 5,238366967 2,028454977 1,710339277 0,803002617 3,557802108 2,01756998 4,064394 3,351483466 3,282196254 0,688059372 3,598369427 Residuals -0,140160734 -0,008911734 -0,582366967 -0,426454977 -0,747339277 0,272997383 0,295197892 -0,61156998 0,382606 -1,589483466 -0,564196254 0,840940628 1,550630573 Significance SS MS F F 26,99677791 8,99892597 13,25162 0,000299529 8,828054206 0,679081093 35,82483212 Standard Error t Stat P-value Lower 95% Upper 95%
2,005757217 3,061045992 0,009104 10,47289011 1,806540075 0,998767972 3,582876946 0,003339 1,420755723 5,736169757 0,092276007 2,154758361 0,050515 0,000517695 0,398182692 0,19184961 0,060525007 0,952658 0,402854185 0,426077583
22
14 15 16 17
23